-
Yelp商家评价星级预测文本数据集
Yelp商家评价星级预测文本数据集 数据来源:互联网公开数据 标签:Yelp,商家评价,星级预测,文本分析,自然语言处理,用户评论,情感分析,机器学习 数据概述:... -
印度区域语言命名实体识别标注数据集
印度区域语言命名实体识别标注数据集 数据来源:互联网公开数据 标签:命名实体识别,印度语言,数据标注,自然语言处理,Tamil,NER,区域语言 数据概述:... -
移动应用无障碍用户评论情感分析数据集
移动应用无障碍用户评论情感分析数据集 数据来源:互联网公开数据 标签:无障碍,用户评论,情感分析,移动应用,机器学习,文本分析,自然语言处理,软件工程,ASEW 数据概述:... -
LLM生成文本检测竞赛数据集
LLM生成文本检测竞赛数据集 数据来源:互联网公开数据 标签:LLM生成文本,人工智能检测,竞赛数据,自然语言处理,文本分析 该数据集专为 “LLM - Detect AI Generated Text” Kaggle 竞赛而构建,内容由大型语言模型(LLMs)生成的英文文章组成。数据基于公开可用的外部语料改写生成,但其原始数据并未包含在 DAIGT... -
自杀干预情感分析数据集
自杀干预情感分析数据集 数据来源:互联网公开数据 标签:自杀干预,情感分析,心理健康,文本处理,TF-IDF,自然语言处理,情绪分类 数据概述: 本数据集基于“suicide-watch”数据集进行处理和增强,包含经过清洗的文本数据、TF-... -
电影评论情感分析数据集-Top100电影-评论数据
电影评论情感分析数据集-Top100电影-评论数据 数据来源:互联网公开数据 标签:情感分析, 电影评论, 自然语言处理, NLP, 影评, 文本分析, 情感极性, 机器学习, 电影, 评论 数据概述: 本数据集旨在分析大规模文本输入的情感倾向,主要聚焦于对Top... -
arXiv论文标题-摘要与主题分类数据集-适用于自然语言处理项目
arXiv论文标题-摘要与主题分类数据集-适用于自然语言处理项目 数据来源:互联网公开数据 标签:arXiv,论文,标题,摘要,主题分类,自然语言处理,NLP,文本分析,主题建模 数据概述:... -
林肯公园YouTube视频评论情感分析数据集
林肯公园YouTube视频评论情感分析数据集 数据来源:互联网公开数据 标签:林肯公园,YouTube,视频,评论,情感分析,自然语言处理,用户反馈,音乐,社交媒体,文本数据 数据概述: 本数据集包含两部分数据,分别关于YouTube上林肯公园(Linkin... -
哥伦比亚观察家报推文文本数据集-2019至今
哥伦比亚观察家报推文文本数据集-2019至今 数据来源:互联网公开数据 标签:推文,社交媒体,新闻,文本分析,自然语言处理,西班牙语,哥伦比亚,舆情分析 数据概述: 本数据集收录了2019年至今哥伦比亚报纸《观察家报》(El Espectador)的推文文本数据。该数据集源于微软 Power Automate 和 Power BI... -
GRE1300最常用词汇数据集
GRE1300最常用词汇数据集 数据来源:互联网公开数据 标签:GRE,词汇,难度评估,自然语言处理,教育,学习资源 数据概述: 本数据集收录了1300个最常用的GRE词汇,这些词汇从一个在线词汇网站中抓取。数据集使用Beautiful Soup (BS4)和Selenium结合Chrome... -
爱丁堡AI第二学期研讨会1大学笔记数据集
爱丁堡AI第二学期研讨会1大学笔记数据集 数据来源:互联网公开数据 标签:爱丁堡AI,研讨会,大学笔记,RAG,自然语言处理 数据概述: 本数据集包含爱丁堡AI第二学期研讨会1的大学笔记,旨在支持研讨会期间的学习和讨论。数据集涵盖了研讨会的主题内容、讨论要点以及相关资料链接等关键信息,为学生和研究人员提供了深入了解研讨会主题的资源。 数据用途概述:... -
在线评论欺骗检测数据集2023
在线评论欺骗检测数据集2023 数据来源:互联网公开数据 标签:在线评论,欺骗检测,文本分析,自然语言处理,机器学习,数据挖掘 数据概述: 本数据集来源于Kaggle,包含了用于欺骗性意见垃圾邮件检测的评论文本记录。数据集包括真实的和欺骗性的在线评论,每个评论都经过标注,可以帮助研究人员和开发者训练和评估文本分析及自然语言处理模型。 数据用途概述:... -
美国2020民主党辩论2实时推特分析数据集
美国2020民主党辩论2实时推特分析数据集 数据来源:互联网公开数据 标签:2020年民主党辩论,实时推特,公共舆论,候选人表现,情感分析,自然语言处理,社交媒体分析 数据概述:... -
多语言印地语NLP数据集
多语言印地语NLP数据集 数据来源:互联网公开数据 标签:印地语NLP,自然语言处理,机器翻译,情感分析,命名实体识别,文本摘要,语言理解,多语言文本,新闻文章,社交媒体,对话文本 数据概述:... -
印度尼西亚至马来语桑巴斯翻译数据集
印度尼西亚至马来语桑巴斯翻译数据集 数据来源:互联网公开数据 标签:翻译,印度尼西亚语,马来语,桑巴斯语,语言学,自然语言处理,多语言数据集 数据概述: 本数据集包含印度尼西亚语句子及其在马来语(桑巴斯方言)中的翻译。数据集来源于公开的GitHub资源,涵盖了广泛的主题和内容,为语言学研究提供了丰富的语料库。 数据用途概述:... -
Ugam电商产品评论情感分析与主题分类数据集
Ugam电商产品评论情感分析与主题分类数据集 数据来源:互联网公开数据 标签:情感分析,主题分类,评论数据,电商,自然语言处理,机器学习,文本挖掘 数据概述: 本数据集包含电商平台上的产品评论数据,旨在用于情感分析和主题分类研究。 数据集包含训练集和测试集,训练集共6136条评论,测试集共2631条评论。... -
印度就业市场职位信息数据集1963-2021
印度就业市场职位信息数据集1963-2021 数据来源:互联网公开数据 标签:就业市场,职位信息,自然语言处理,机器学习,人力资源,行业分析 数据概述: 本数据集提供了广泛的职位招聘信息,涵盖1963年至2021年间印度多个行业和职位类别的工作广告。数据集分为两个主要部分:job_postings.csv 和... -
Codeforces编程竞赛题目及属性数据集
Codeforces编程竞赛题目及属性数据集 数据来源:互联网公开数据 标签:Codeforces,编程竞赛,算法,题目,难度,标签,数据分析,机器学习,自然语言处理 数据概述:... -
-
WhatsApp谣言传播分析数据集-boatos-org网站谣言文本-时间跨度未知
WhatsApp谣言传播分析数据集-boatos-org网站谣言文本-时间跨度未知 数据来源:互联网公开数据 标签:谣言,WhatsApp,社交媒体,文本分析,自然语言处理,假新闻,舆情分析,巴西,boatos.org,传播规律 数据概述:...