-
新闻文本分类数据集-kk0105
新闻文本分类数据集-kk0105 数据来源:互联网公开数据 标签:新闻,文本分类,自然语言处理,机器学习,数据集,情感分析,主题识别,文本分析 数据概述: 该数据集包含了来自不同来源的新闻文本,用于新闻文本分类任务。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于新闻来源,但涵盖了近期的新闻信息。... -
社交媒体灾难事件文本分类数据集SocialMediaDisasterEventTextClassification-qubeet
社交媒体灾难事件文本分类数据集SocialMediaDisasterEventTextClassification-qubeet 数据来源:互联网公开数据 标签:文本分类, 灾难事件, 社交媒体, 自然语言处理, 机器学习, 情感分析, 预训练词向量, 语料库 数据概述:... -
在线评论毒性分类预测数据集OnlineCommentToxicityClassificationPrediction-hhstrand
在线评论毒性分类预测数据集OnlineCommentToxicityClassificationPrediction-hhstrand 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 情感分析, 机器学习, 自然语言处理, 多标签分类, 评论分析, 神经网络 数据概述:... -
语音识别与低阶适配模型数据集WhisperLoRAPackagesDataset-imtiazprio
语音识别与低阶适配模型数据集WhisperLoRAPackagesDataset-imtiazprio 数据来源:互联网公开数据 标签:语音识别,自然语言处理,数据集,低阶适配模型,机器学习,人工智能,语音技术,模型训练 数据概述:... -
奥利维亚搜索数据集OliviaFinderRepoFinalDataset-danielalonsob
奥利维亚搜索数据集OliviaFinderRepoFinalDataset-danielalonsob 数据来源:互联网公开数据 标签:社交媒体,用户画像,文本分析,情感分析,数据集,数据挖掘,自然语言处理,信息检索 数据概述: 该数据集来源于奥利维亚搜索项目,主要记录了社交媒体平台上用户发布的内容,旨在构建用户画像和进行情感分析。主要特征如下:... -
英语相似度评估数据集EnglishSimilarityAssessmentDataset-terrychanorg
英语相似度评估数据集EnglishSimilarityAssessmentDataset-terrychanorg 数据来源:互联网公开数据 标签:自然语言处理,相似度评估,数据集,文本分析,机器学习,语义理解,人工智能,语言模型 数据概述: 该数据集包含用于评估英语文本相似度的数据,记录了不同文本对之间的相似度评分。主要特征如下:... -
阿拉伯语故事文本数据集FinalArabicStoriesDataset-raidouahioune
阿拉伯语故事文本数据集FinalArabicStoriesDataset-raidouahioune 数据来源:互联网公开数据 标签:阿拉伯语,文本数据,故事集,自然语言处理,机器学习,语言研究,文化遗产,文本分析 数据概述: 该数据集包含来自阿拉伯语故事文本的集合,记录了阿拉伯语故事的内容和结构。主要特征如下:... -
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-haphan68
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-haphan68 数据来源:互联网公开数据 标签:越南语, 文本纠错, 自然语言处理, 语言模型, 文本校对, 数据清洗, 机器翻译, 拼写纠错 数据概述: 该数据集包含越南语文本的错误文本及其对应的正确文本,用于越南语文本的纠错任务。主要特征如下:... -
泰卢固语罗马化文本数据集TeluguRomanizedTextDataset-teachingmachine
泰卢固语罗马化文本数据集TeluguRomanizedTextDataset-teachingmachine 数据来源:互联网公开数据 标签:泰卢固语,罗马化,文本数据,自然语言处理,数据集,语言学,机器翻译,文本分析 数据概述: 该数据集包含泰卢固语文本的罗马化转写数据,记录了泰卢固语文本与其对应的罗马字母转写版本。主要特征如下:... -
文本分类情感分析多任务数据集TextClassificationSentimentAnalysisMulti-taskDataset-andreyskok
文本分类情感分析多任务数据集TextClassificationSentimentAnalysisMulti-taskDataset-andreyskok 数据来源:互联网公开数据 标签:文本分类, 情感分析, 多任务学习, 情感识别, 文本语料, 数据集, 自然语言处理, 机器学习 数据概述:... -
烂番茄电影评论数据集RottenTomatoesMovieReviewsDataset-phanmnhcng
烂番茄电影评论数据集RottenTomatoesMovieReviewsDataset-phanmnhcng 数据来源:互联网公开数据 标签:电影,评论,情感分析,自然语言处理,数据集,文本挖掘,电影评论,机器学习 数据概述: 该数据集包含来自烂番茄网站的电影评论数据,记录了电影的评论文本、评分等信息。主要特征如下:... -
邮件清洗数据集EmailCleanedDatasets-ashishgoraniya
邮件清洗数据集EmailCleanedDatasets-ashishgoraniya 数据来源:互联网公开数据 标签:邮件数据,数据清洗,文本分析,自然语言处理,机器学习,垃圾邮件检测,数据预处理,电子邮件 数据概述: 该数据集包含经过清洗处理的电子邮件数据,主要用于文本分析、垃圾邮件检测等研究。主要特征如下:... -
搜狐新闻文本分类标签数据集SohuNewsTextClassificationLabelDataset-lanweixiao
搜狐新闻文本分类标签数据集SohuNewsTextClassificationLabelDataset-lanweixiao 数据来源:互联网公开数据 标签:文本分类, 新闻, 标签, 自然语言处理, 机器学习, 数据标注, 情感分析, 搜狐 数据概述:... -
社交媒体情感分析推文数据集SocialMediaSentimentAnalysisTweets-mohammadalhayajneh
社交媒体情感分析推文数据集SocialMediaSentimentAnalysisTweets-mohammadalhayajneh 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本分类, 自然语言处理, 情感极性, 机器学习, 推文数据, 数据标注 数据概述:... -
医疗对话数据集MedicalDialogueData-snjyor
医疗对话数据集MedicalDialogueData-snjyor 数据来源:互联网公开数据 标签:医疗,对话,数据集,自然语言处理,医学,人工智能,文本分析,问答系统 数据概述: 该数据集包含医疗相关的对话数据,记录了患者与医生或智能医疗系统之间的交流内容。主要特征如下: 时间跨度:数据记录的时间跨度不明确,可能涵盖多个时间段的对话。... -
仇恨言论检测数据集HateDatasetSeparate-nguyenhoangthaik17hl
仇恨言论检测数据集HateDatasetSeparate-nguyenhoangthaik17hl 数据来源:互联网公开数据 标签:自然语言处理,仇恨言论,数据集,文本分类,机器学习,情感分析,社交媒体,数据挖掘 数据概述: 该数据集专注于仇恨言论的检测与分析,记录了来自不同社交媒体平台的文本数据。主要特征如下:... -
药品信息评论与评级分析数据集DrugInformationReviewandRatingAnalysis-mdfaishalahmedrudroo
药品信息评论与评级分析数据集DrugInformationReviewandRatingAnalysis-mdfaishalahmedrudroo 数据来源:互联网公开数据 标签:药品信息, 评论分析, 情感分析, 药物分类, 医疗健康, 用户评价, 数据挖掘, 自然语言处理 数据概述:... -
新闻真伪识别文本数据集NewsCredibilityIdentificationTextDataset-ritchiepulikottil
新闻真伪识别文本数据集NewsCredibilityIdentificationTextDataset-ritchiepulikottil 数据来源:互联网公开数据 标签:新闻, 文本分类, 虚假新闻, 自然语言处理, 机器学习, 标题, 作者, 文本分析, 二元分类 数据概述:... -
法国司法判决文本分析数据集FrenchJudicialRulingTextAnalysis-tournevis
法国司法判决文本分析数据集FrenchJudicialRulingTextAnalysis-tournevis 数据来源:互联网公开数据 标签:司法判决, 法律文本, 法国, 文本分析, 历史数据, 自然语言处理, 案例研究, 法律研究 数据概述: 该数据集包含来自法国司法系统的判决文本,记录了关于案件裁决的详细信息。主要特征如下:... -
尼泊尔新闻数据集NepaliNewsDataset-niranjanshrestha
尼泊尔新闻数据集NepaliNewsDataset-niranjanshrestha 数据来源:互联网公开数据 标签:新闻,尼泊尔,数据集,文本分析,自然语言处理,机器学习,信息提取,新闻分类 数据概述: 该数据集包含来自尼泊尔的新闻数据,记录了尼泊尔国内外的新闻报道和新闻文章。主要特征如下: 时间跨度:数据记录的时间范围从2014年到2020年。...