-
印度假新闻检测数据集2023
印度假新闻检测数据集2023 数据来源:互联网公开数据 标签:假新闻,机器学习,自然语言处理,特征工程,社交媒体,新闻验证 数据概述: 本数据集包含4729条独特的新闻记录,每条记录已被标记为真实或虚假。该数据集适用于训练机器学习模型以检测假新闻,为新闻验证和假新闻识别提供了宝贵的数据支持。 数据用途概述:... -
推特情感数据集
推特情感数据集 数据来源:互联网公开数据 标签:推特,情感分析,社交媒体,用户意见,自然语言处理,文本分类,公众情绪 数据概述: 本数据集包含推特用户对某一话题或事件的意见表达,每条推文都经过标注,反映了用户的情感倾向(正面、负面或中性)。数据集旨在为情感分析研究提供样本数据,涵盖多样化的用户观点和情感表达。 数据用途概述:... -
印度汽车视频分析数据集2021
印度汽车视频分析数据集2021 数据来源:互联网公开数据 标签:YouTube数据,汽车比较,用户评论,情感分析,自然语言处理,汽车行业 数据概述: 本数据集来源于YouTube汽车频道视频分析项目,特别聚焦于印度汽车行业的车辆比较视频。数据集包含了一个特定频道内最受欢迎、评论最多和点赞最多的视频——“Kia Sonet vs Nexon vs... -
英译马拉提语数据集
英译马拉提语数据集 数据来源:互联网公开数据 标签:英译马拉提,自然语言处理,神经机器翻译,序列到序列,语言数据,翻译技术 数据概述: 本数据集专注于印度语言马拉提语的翻译任务。数据通过网络抓取技术收集,涵盖常用句子和词汇,旨在为英译马拉提语的研究和应用提供基础数据支持。 数据用途概述:... -
酒店评论情感分析与评分预测数据集
酒店评论情感分析与评分预测数据集 数据来源:互联网公开数据 标签:酒店评论,情感分析,评分预测,自然语言处理,文本挖掘,机器学习,用户体验 数据概述:... -
单词难度预测数据集
单词难度预测数据集 数据来源:互联网公开数据 标签:语言学,自然语言处理,单词难度,教育,学习辅助,文本分析,难度评估 数据概述: 本数据集来源于公开的 GitHub 项目,包含来自 I159729.csv... -
韩国总统文재寅推特数据集2012-2020
韩国总统文재寅推特数据集2012-2020 数据来源:互联网公开数据 标签:韩国总统,文재寅,推特,自然语言处理,NLP,社交媒体分析,时间序列 数据概述:... -
AI相关推文情感分类数据集
AI相关推文情感分类数据集 数据来源:互联网公开数据 标签:AI,推文,情感分析,自然语言处理,机器学习,数据标注,人类评估 数据概述: 本数据集包含经过处理的文本数据,旨在为大型语言模型的训练提供合适的提示。这些提示集成了预期的输出,常用于语言模型的监督微调。提示结构化为明确的输入-... -
PyConIndia提案数据集
PyConIndia提案数据集 数据来源:互联网公开数据 标签:Python, 技术会议, 提案分析, 自然语言处理, 数据可视化, 技术社区, 会议提案 数据概述 本数据集收录了过去四年(2016年至2020年)PyCon India大会的提案信息,PyCon... -
-
阿尔巴尼亚假新闻语料库
阿尔巴尼亚假新闻语料库 数据来源:互联网公开数据 标签:假新闻检测,自然语言处理,阿尔巴尼亚语,文本分类,数据研究,信息真实性评估,新闻传播学 数据概述: 本数据集源自研究论文《Albanian fake news... -
Reddit论坛帖子评论情感分析数据集含毒性标注-探讨日本-辩论与萨尔瓦多监狱话题
Reddit论坛帖子评论情感分析数据集含毒性标注-探讨日本-辩论与萨尔瓦多监狱话题 数据来源:互联网公开数据 标签:Reddit, 评论, 情感分析, 毒性, 文本数据, 自然语言处理, 日本, 辩论, 萨尔瓦多, 监狱 数据概述:... -
Yelp商家评价星级预测文本数据集
Yelp商家评价星级预测文本数据集 数据来源:互联网公开数据 标签:Yelp,商家评价,星级预测,文本分析,自然语言处理,用户评论,情感分析,机器学习 数据概述:... -
印度区域语言命名实体识别标注数据集
印度区域语言命名实体识别标注数据集 数据来源:互联网公开数据 标签:命名实体识别,印度语言,数据标注,自然语言处理,Tamil,NER,区域语言 数据概述:... -
移动应用无障碍用户评论情感分析数据集
移动应用无障碍用户评论情感分析数据集 数据来源:互联网公开数据 标签:无障碍,用户评论,情感分析,移动应用,机器学习,文本分析,自然语言处理,软件工程,ASEW 数据概述:... -
LLM生成文本检测竞赛数据集
LLM生成文本检测竞赛数据集 数据来源:互联网公开数据 标签:LLM生成文本,人工智能检测,竞赛数据,自然语言处理,文本分析 该数据集专为 “LLM - Detect AI Generated Text” Kaggle 竞赛而构建,内容由大型语言模型(LLMs)生成的英文文章组成。数据基于公开可用的外部语料改写生成,但其原始数据并未包含在 DAIGT... -
自杀干预情感分析数据集
自杀干预情感分析数据集 数据来源:互联网公开数据 标签:自杀干预,情感分析,心理健康,文本处理,TF-IDF,自然语言处理,情绪分类 数据概述: 本数据集基于“suicide-watch”数据集进行处理和增强,包含经过清洗的文本数据、TF-... -
电影评论情感分析数据集-Top100电影-评论数据
电影评论情感分析数据集-Top100电影-评论数据 数据来源:互联网公开数据 标签:情感分析, 电影评论, 自然语言处理, NLP, 影评, 文本分析, 情感极性, 机器学习, 电影, 评论 数据概述: 本数据集旨在分析大规模文本输入的情感倾向,主要聚焦于对Top... -
arXiv论文标题-摘要与主题分类数据集-适用于自然语言处理项目
arXiv论文标题-摘要与主题分类数据集-适用于自然语言处理项目 数据来源:互联网公开数据 标签:arXiv,论文,标题,摘要,主题分类,自然语言处理,NLP,文本分析,主题建模 数据概述:... -
林肯公园YouTube视频评论情感分析数据集
林肯公园YouTube视频评论情感分析数据集 数据来源:互联网公开数据 标签:林肯公园,YouTube,视频,评论,情感分析,自然语言处理,用户反馈,音乐,社交媒体,文本数据 数据概述: 本数据集包含两部分数据,分别关于YouTube上林肯公园(Linkin...