-
数据科学与软件开发趋势数据集
数据科学与软件开发趋势数据集 数据来源:互联网公开数据 标签:数据科学,软件开发,趋势分析,博客文章,自然语言处理,机器学习,内容策略 数据概述:... -
IMDB电影数据集2006-2016
IMDB电影数据集2006-2016 数据来源:互联网公开数据 标签:IMDB,电影数据,票房,影评,电影分析,导演,演员,票房趋势,电影推荐,自然语言处理 数据概述:... -
DatabricksDolly15k-基于指令的大型语言模型训练数据集
DatabricksDolly15k-基于指令的大型语言模型训练数据集 数据来源:互联网公开数据 标签:大型语言模型,指令遵循,数据增强,自然语言处理,文本生成,分类,问答,摘要,信息提取,创意写作,开源数据集 数据概述: Databricks Dolly... -
自然故事语料库数据集1963-2021
自然故事语料库数据集1963-2021 数据来源:互联网公开数据 标签:自然语言处理,阅读时间,语料库,低频语法构型,心理学,语言学 数据概述:... -
-
越南餐饮评论情感分析数据集1963-2021
越南餐饮评论情感分析数据集1963-2021 数据来源:互联网公开数据 标签:越南,餐饮评论,情感分析,机器学习,自然语言处理,文本分类,特征提取,推荐系统,跨语言分析 数据概述: 本数据集是两个现有数据集的整合和精选集合,即Taaaan和Vu Duc Thinh编写的《越南情感分析-Foody》以及Cฦฐฦกง Khuแบฅต... -
印度假新闻检测数据集2023
印度假新闻检测数据集2023 数据来源:互联网公开数据 标签:假新闻,机器学习,自然语言处理,特征工程,社交媒体,新闻验证 数据概述: 本数据集包含4729条独特的新闻记录,每条记录已被标记为真实或虚假。该数据集适用于训练机器学习模型以检测假新闻,为新闻验证和假新闻识别提供了宝贵的数据支持。 数据用途概述:... -
推特情感数据集
推特情感数据集 数据来源:互联网公开数据 标签:推特,情感分析,社交媒体,用户意见,自然语言处理,文本分类,公众情绪 数据概述: 本数据集包含推特用户对某一话题或事件的意见表达,每条推文都经过标注,反映了用户的情感倾向(正面、负面或中性)。数据集旨在为情感分析研究提供样本数据,涵盖多样化的用户观点和情感表达。 数据用途概述:... -
印度汽车视频分析数据集2021
印度汽车视频分析数据集2021 数据来源:互联网公开数据 标签:YouTube数据,汽车比较,用户评论,情感分析,自然语言处理,汽车行业 数据概述: 本数据集来源于YouTube汽车频道视频分析项目,特别聚焦于印度汽车行业的车辆比较视频。数据集包含了一个特定频道内最受欢迎、评论最多和点赞最多的视频——“Kia Sonet vs Nexon vs... -
英译马拉提语数据集
英译马拉提语数据集 数据来源:互联网公开数据 标签:英译马拉提,自然语言处理,神经机器翻译,序列到序列,语言数据,翻译技术 数据概述: 本数据集专注于印度语言马拉提语的翻译任务。数据通过网络抓取技术收集,涵盖常用句子和词汇,旨在为英译马拉提语的研究和应用提供基础数据支持。 数据用途概述:... -
酒店评论情感分析与评分预测数据集
酒店评论情感分析与评分预测数据集 数据来源:互联网公开数据 标签:酒店评论,情感分析,评分预测,自然语言处理,文本挖掘,机器学习,用户体验 数据概述:... -
单词难度预测数据集
单词难度预测数据集 数据来源:互联网公开数据 标签:语言学,自然语言处理,单词难度,教育,学习辅助,文本分析,难度评估 数据概述: 本数据集来源于公开的 GitHub 项目,包含来自 I159729.csv... -
韩国总统文재寅推特数据集2012-2020
韩国总统文재寅推特数据集2012-2020 数据来源:互联网公开数据 标签:韩国总统,文재寅,推特,自然语言处理,NLP,社交媒体分析,时间序列 数据概述:... -
AI相关推文情感分类数据集
AI相关推文情感分类数据集 数据来源:互联网公开数据 标签:AI,推文,情感分析,自然语言处理,机器学习,数据标注,人类评估 数据概述: 本数据集包含经过处理的文本数据,旨在为大型语言模型的训练提供合适的提示。这些提示集成了预期的输出,常用于语言模型的监督微调。提示结构化为明确的输入-... -
PyConIndia提案数据集
PyConIndia提案数据集 数据来源:互联网公开数据 标签:Python, 技术会议, 提案分析, 自然语言处理, 数据可视化, 技术社区, 会议提案 数据概述 本数据集收录了过去四年(2016年至2020年)PyCon India大会的提案信息,PyCon... -
-
阿尔巴尼亚假新闻语料库
阿尔巴尼亚假新闻语料库 数据来源:互联网公开数据 标签:假新闻检测,自然语言处理,阿尔巴尼亚语,文本分类,数据研究,信息真实性评估,新闻传播学 数据概述: 本数据集源自研究论文《Albanian fake news... -
Reddit论坛帖子评论情感分析数据集含毒性标注-探讨日本-辩论与萨尔瓦多监狱话题
Reddit论坛帖子评论情感分析数据集含毒性标注-探讨日本-辩论与萨尔瓦多监狱话题 数据来源:互联网公开数据 标签:Reddit, 评论, 情感分析, 毒性, 文本数据, 自然语言处理, 日本, 辩论, 萨尔瓦多, 监狱 数据概述:... -
Yelp商家评价星级预测文本数据集
Yelp商家评价星级预测文本数据集 数据来源:互联网公开数据 标签:Yelp,商家评价,星级预测,文本分析,自然语言处理,用户评论,情感分析,机器学习 数据概述:... -
印度区域语言命名实体识别标注数据集
印度区域语言命名实体识别标注数据集 数据来源:互联网公开数据 标签:命名实体识别,印度语言,数据标注,自然语言处理,Tamil,NER,区域语言 数据概述:...