-
情感识别与文本分析数据集CREMATextCSVDataset-nytgaming
情感识别与文本分析数据集CREMATextCSVDataset-nytgaming 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,文本挖掘,机器学习,情感计算,语言技术,人工智能 数据概述: 该数据集包含来自CREMA-D项目的文本数据,记录了语音情感识别任务中的文本内容及其对应的情感标签。主要特征如下:... -
美国人口普查BERT词嵌入数据集BERTEmbeddingUSPPPDataset-e94076039
美国人口普查BERT词嵌入数据集BERTEmbeddingUSPPPDataset-e94076039 数据来源:互联网公开数据 标签:BERT词嵌入,人口普查,数据集,自然语言处理,机器学习,社会科学研究,人口统计,美国 数据概述:该数据集包含了基于BERT模型生成的人口普查相关词汇的词嵌入,适用于自然语言处理和机器学习任务。主要特征如下:... -
未对齐的标记化数据集CenteredTokenized-2Dataset-enarior
未对齐的标记化数据集CenteredTokenized-2Dataset-enarior 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本处理,机器学习,语言模型,数据标注,文本分类,深度学习 数据概述: 该数据集包含来自未对齐标记化处理过程的文本数据,记录了经过特定标记化方法处理的文本样本。主要特征如下:... -
双语文本对齐数据集BitextDataCollection-imaadhasan
双语文本对齐数据集BitextDataCollection-imaadhasan 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,文本对齐,双语数据,语言技术,数据挖掘,人工智能 数据概述: 该数据集包含来自多个来源的双语文本对齐数据,记录了不同语言之间的文本对应关系。主要特征如下:... -
Quora重复问题数据集QuoraDuplicateQuestionsDataset-ekanshu
Quora重复问题数据集QuoraDuplicateQuestionsDataset-ekanshu 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,问答系统,信息检索,深度学习,语义分析 数据概述: 该数据集包含来自Quora平台的问答数据,记录了平台上用户提出的问题及其标签。主要特征如下:... -
医学问答数据集MedicalQuestionAnsweringDataset-swaranshpatel
医学问答数据集MedicalQuestionAnsweringDataset-swaranshpatel 数据来源:互联网公开数据 标签:医学,问答系统,数据集,人工智能,自然语言处理,健康咨询,机器学习,信息检索 数据概述: 该数据集包含来自医学领域的问答数据,记录了用户提出的医学相关问题及其对应的专家回答。主要特征如下:... -
KaggleREADME文件文档数据集-rejent
KaggleREADME文件文档数据集-rejent 数据来源:互联网公开数据 标签:文档,数据集,Kaggle,元数据,数据清洗,数据分析,机器学习,自然语言处理 数据概述: 该数据集包含Kaggle平台上README文档的元数据和文本内容,用于数据科学和机器学习研究。主要特征如下:... -
客户银行推文主题分析数据集LDA-W2V-D2VTopicsandTweetsCustomerBankingDataset-yixiang
客户银行推文主题分析数据集LDA-W2V-D2VTopicsandTweetsCustomerBankingDataset-yixiang 数据来源:互联网公开数据 标签:客户银行,推文分析,主题建模,文本挖掘,情感分析,自然语言处理,机器学习,社交媒体 数据概述:... -
标题与期刊论文数据集TitleandJournalDataset-boa234
标题与期刊论文数据集TitleandJournalDataset-boa234 数据来源:互联网公开数据 标签:期刊论文,标题分析,数据集,学术研究,文本挖掘,自然语言处理,信息检索,学术资源 数据概述: 该数据集包含来自多个学术期刊的论文标题数据,记录了各类期刊论文的标题信息。主要特征如下: 时间跨度: 数据记录的时间范围从2000年到2022年。... -
焦虑症状Reddit帖子数据集AnxietySymptomsRedditPostsDataset-countmein
焦虑症状Reddit帖子数据集AnxietySymptomsRedditPostsDataset-countmein 数据来源:互联网公开数据 标签:焦虑症状,Reddit,社交媒体,心理健康,数据分析,情感分析,自然语言处理,心理健康研究... -
阿达尼集团相关推文数据集TweetsonAdani10kDataset-vidiptvashist
阿达尼集团相关推文数据集TweetsonAdani10kDataset-vidiptvashist 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,情感分析,舆情监测,机器学习,自然语言处理,商业研究 数据概述: 该数据集包含来自社交媒体平台Twitter(推文)的公开数据,记录了与阿达尼集团(Adani... -
胸腔积液MIMIC影像报告数据集EffusionMIMICReportsDataset-wasifnafee
胸腔积液MIMIC影像报告数据集EffusionMIMICReportsDataset-wasifnafee 数据来源:互联网公开数据 标签:医学影像,胸腔积液,MIMIC数据库,数据集,临床报告,机器学习,自然语言处理,医疗AI 数据概述:... -
Kindle电子书数据集KindleBooksDataset-snathjr
Kindle电子书数据集KindleBooksDataset-snathjr 数据来源:互联网公开数据 标签:电子书,数据集,阅读分析,用户行为,自然语言处理,市场分析,推荐系统,书籍推荐 数据概述: 该数据集包含来自Kindle平台的电子书数据,记录了电子书的详细信息和用户交互数据。主要特征如下:... -
推特产品情感分析数据集-blessondensil294
推特产品情感分析数据集-blessondensil294 数据来源:互联网公开数据 标签:情感分析,推特,产品评价,自然语言处理,文本分类,机器学习,社交媒体,舆情分析 数据概述: 该数据集包含了来自推特平台的产品相关推文,用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围为一段时间内的推文。... -
在线评论立场识别数据集OLIDCleanedDataset-barunikarthika
在线评论立场识别数据集OLIDCleanedDataset-barunikarthika 数据来源:互联网公开数据 标签:自然语言处理,文本分类,立场识别,数据集,机器学习,社交媒体,情感分析,情感计算 数据概述: 该数据集包含来自社交媒体平台的在线评论数据,记录了用户对不同话题的立场和态度。主要特征如下:... -
信息科学582挑战赛数据集-saranga7
信息科学582挑战赛数据集-saranga7 数据来源:互联网公开数据 标签:机器学习,数据集,文本分析,自然语言处理,情感分析,社交媒体,竞赛,新闻 数据概述:该数据集包含来自信息科学582挑战赛的数据,主要记录了与新闻文章相关的文本数据。主要特征如下: 时间跨度:数据记录的时间范围,涵盖了挑战赛期间的新闻文章。... -
大规模机器学习模型测试结果数据集TestOutputsfromFullTrainDataset-karelbecerra
大规模机器学习模型测试结果数据集TestOutputsfromFullTrainDataset-karelbecerra 数据来源:互联网公开数据 标签:机器学习,模型测试,数据集,预测结果,性能评估,自然语言处理,计算机视觉,深度学习 数据概述: 该数据集包含了从完整训练数据集(Full Train... -
达里جة语句子数据集DarijaSentencesDataset-atif10
达里جة语句子数据集DarijaSentencesDataset-atif10 数据来源:互联网公开数据 标签:自然语言处理,语言数据集,文本分类,情感分析,机器学习,人工智能,语言研究,非洲语言 数据概述: 该数据集包含来自摩洛哥达里جة语的真实句子数据,记录了该语言的日常用语和表达。主要特征如下:... -
数据2022年世界杯足球赛推特数据集FIFAWorldCup2022TweetsDataset-alawdisoft
2022年世界杯足球赛推特数据集FIFAWorldCup2022TweetsDataset-alawdisoft 数据来源:互联网公开数据 标签:世界杯,足球,社交媒体,推特,数据分析,自然语言处理,体育研究,社会学 数据概述: 该数据集包含2022年世界杯足球赛期间的推特数据,记录了全球球迷在推特上的讨论和互动。主要特征如下:... -
突尼斯短信垃圾邮件数据集TunisianSMSSpamandHamCollection-mahdibenabdallah
突尼斯短信垃圾邮件数据集TunisianSMSSpamandHamCollection-mahdibenabdallah 数据来源:互联网公开数据 标签:短信,垃圾邮件,文本分类,自然语言处理,机器学习,阿拉伯语,数据集,文本分析 数据概述: 该数据集包含了来自突尼斯的短信数据,用于垃圾短信(Spam)和正常短信(Ham)的分类研究。主要特征如下:...