-
当代美国英语语料库数据集
当代美国英语语料库数据集 数据来源:互联网公开数据 标签:美国英语,语料库,语言学,文本分析,文学,新闻,学术,社交媒体,电影字幕,电视字幕 数据概述:... -
单词难度预测数据集
单词难度预测数据集 数据来源:互联网公开数据 标签:语言学,自然语言处理,单词难度,教育,学习辅助,文本分析,难度评估 数据概述: 本数据集来源于公开的 GitHub 项目,包含来自 I159729.csv... -
阿黛尔新歌EasyOnMe发布首日推特用户情感分析数据集-2021年10月15日
阿黛尔新歌EasyOnMe发布首日推特用户情感分析数据集-2021年10月15日 数据来源:互联网公开数据 标签:阿黛尔,EasyOnMe,推特,社交媒体,情感分析,文本分析,音乐,新歌发布,舆情,话题 数据概述: 本数据集收录了2021年10月15日阿黛尔(Adele)新单曲《Easy On... -
比特币新闻文章文本语料库数据集
比特币新闻文章文本语料库数据集 数据来源:互联网公开数据 标签:比特币,新闻文章,文本分析,情感分析,主题建模,词嵌入,金融分析,数据挖掘 数据概述:... -
Yelp商家评价星级预测文本数据集
Yelp商家评价星级预测文本数据集 数据来源:互联网公开数据 标签:Yelp,商家评价,星级预测,文本分析,自然语言处理,用户评论,情感分析,机器学习 数据概述:... -
移动应用无障碍用户评论情感分析数据集
移动应用无障碍用户评论情感分析数据集 数据来源:互联网公开数据 标签:无障碍,用户评论,情感分析,移动应用,机器学习,文本分析,自然语言处理,软件工程,ASEW 数据概述:... -
中国官方每日新闻报道数据集2016-2023
中国官方每日新闻报道数据集2016-2023 数据来源:互联网公开数据 标签:中国官方新闻,每日新闻,新闻报道,文本分析,主题提取,意见挖掘,新闻研究 数据概述:... -
LLM生成文本检测竞赛数据集
LLM生成文本检测竞赛数据集 数据来源:互联网公开数据 标签:LLM生成文本,人工智能检测,竞赛数据,自然语言处理,文本分析 该数据集专为 “LLM - Detect AI Generated Text” Kaggle 竞赛而构建,内容由大型语言模型(LLMs)生成的英文文章组成。数据基于公开可用的外部语料改写生成,但其原始数据并未包含在 DAIGT... -
电影评论情感分析数据集-Top100电影-评论数据
电影评论情感分析数据集-Top100电影-评论数据 数据来源:互联网公开数据 标签:情感分析, 电影评论, 自然语言处理, NLP, 影评, 文本分析, 情感极性, 机器学习, 电影, 评论 数据概述: 本数据集旨在分析大规模文本输入的情感倾向,主要聚焦于对Top... -
arXiv论文标题-摘要与主题分类数据集-适用于自然语言处理项目
arXiv论文标题-摘要与主题分类数据集-适用于自然语言处理项目 数据来源:互联网公开数据 标签:arXiv,论文,标题,摘要,主题分类,自然语言处理,NLP,文本分析,主题建模 数据概述:... -
哥伦比亚观察家报推文文本数据集-2019至今
哥伦比亚观察家报推文文本数据集-2019至今 数据来源:互联网公开数据 标签:推文,社交媒体,新闻,文本分析,自然语言处理,西班牙语,哥伦比亚,舆情分析 数据概述: 本数据集收录了2019年至今哥伦比亚报纸《观察家报》(El Espectador)的推文文本数据。该数据集源于微软 Power Automate 和 Power BI... -
Reddit平台边缘型人格障碍讨论帖文数据集
Reddit平台边缘型人格障碍讨论帖文数据集 数据来源:互联网公开数据 标签:边缘型人格障碍,BPD,Reddit,社交媒体,心理健康,情感障碍,用户体验,文本分析,情绪分析 数据概述: 本数据集包含5,879篇来自Reddit平台的帖子,这些帖子讨论了边缘型人格障碍(BPD, Borderline Personality... -
在线评论欺骗检测数据集2023
在线评论欺骗检测数据集2023 数据来源:互联网公开数据 标签:在线评论,欺骗检测,文本分析,自然语言处理,机器学习,数据挖掘 数据概述: 本数据集来源于Kaggle,包含了用于欺骗性意见垃圾邮件检测的评论文本记录。数据集包括真实的和欺骗性的在线评论,每个评论都经过标注,可以帮助研究人员和开发者训练和评估文本分析及自然语言处理模型。 数据用途概述:... -
-
社交媒体数据样本
社交媒体数据样本 数据来源:互联网公开数据 标签:社交媒体,Instagram,Facebook,TikTok,YouTube,数据清理,文本分析,用户行为,内容分析 数据概述:... -
WhatsApp谣言传播分析数据集-boatos-org网站谣言文本-时间跨度未知
WhatsApp谣言传播分析数据集-boatos-org网站谣言文本-时间跨度未知 数据来源:互联网公开数据 标签:谣言,WhatsApp,社交媒体,文本分析,自然语言处理,假新闻,舆情分析,巴西,boatos.org,传播规律 数据概述:... -
钦定本圣经旧约与新约章节数据集
钦定本圣经旧约与新约章节数据集 数据来源:互联网公开数据 标签:钦定本圣经,旧约,新约,章节,经文,宗教研究,文本分析,历史文献 数据概述: 本数据集收录了钦定本圣经(King James... -
有声书平台用户评价数据清洗与分析数据集
有声书平台用户评价数据清洗与分析数据集 数据来源:互联网公开数据 标签:有声书,用户评价,数据清洗,SQL,MySQL,用户行为,文本分析,情感分析 数据概述:... -
-
毒性数据集
毒性数据集 数据来源:互联网公开数据 标签:毒性,文本分析,自然语言处理,机器学习,内容审核,社交媒体,网络言论 数据概述: 本数据集收录了多种来源的文本数据,涵盖社交媒体评论、论坛帖子、新闻评论等,主要用于识别和分析其中的毒性内容。数据集标注了不同类型的毒性评论,如侮辱、威胁、歧视等,为研究文本中的不良内容提供了丰富的样本。 数据用途概述:...