-
英语到阿萨姆语平行语料库数据集
英语到阿萨姆语平行语料库数据集 数据来源:互联网公开数据 标签:英语,阿萨姆语,平行语料库,自然语言处理,翻译,语言学 数据概述: 本数据集包含大量经过清理的英语到阿萨姆语平行语料库数据,适用于自然语言处理和机器翻译研究。数据集分为两部分:1_eng.txt 包含大量的英语句子,1_assamese.txt...
-
印尼Traveloka应用用户评价与评论数据集
印尼Traveloka应用用户评价与评论数据集 数据来源:互联网公开数据 标签:Traveloka,用户评价,评论数据,在线旅游,酒店预订,机票预订,印尼,情感分析 数据概述: 本数据集包含了用户在印尼版Traveloka应用上的评价与评论信息。Traveloka是专注于印尼国内旅游的在线机票和酒店预订服务提供商,由Ferry...
-
自然语言推理启发式分析数据集
自然语言推理启发式分析数据集 数据来源:互联网公开数据 标签:自然语言推理,启发式分析,无效启发,模型评估,机器学习,人工智能,数据科学 数据概述:...
-
全球产品情感分析数据集2023
全球产品情感分析数据集2023 数据来源:互联网公开数据 标签:产品情感分析,机器学习,自然语言处理,消费者反馈,客户体验,市场研究,产品分类 数据概述:...
-
自动医学诊断系统使用临床笔记数据集
自动医学诊断系统使用临床笔记数据集 数据来源:互联网公开数据 标签:自动诊断,医学诊断,临床笔记,自然语言处理,机器学习,LLM,合成数据,医疗决策支持 数据概述:...
-
航天工程与空间任务对话数据集AstroChat
航天工程与空间任务对话数据集AstroChat 数据来源:互联网公开数据 标签:航天工程,空间任务,对话,LLM,自然语言处理,人工智能,数据集,监督学习,GPT-4,对话生成 数据概述: AstroChat 是一个合成生成的数据集,包含 901 个对话,专门为航天工程和空间任务工程领域设计。该数据集旨在用于监督微调聊天大型语言模型...
-
Snapchat安卓应用用户评论情感分析数据集-GooglePlay商店-时间不限
Snapchat安卓应用用户评论情感分析数据集-GooglePlay商店-时间不限 数据来源:互联网公开数据 标签:社交媒体,Snapchat,用户评论,情感分析,安卓,应用商店,用户反馈,移动应用 数据概述: 本数据集包含了来自Google...
-
尼泊尔健康论坛问答数据集1963-2021
尼泊尔健康论坛问答数据集1963-2021 数据来源:互联网公开数据 标签:尼泊尔,健康论坛,问答,自然语言处理,健康数据,社区健康,趋势监测 数据概述:...
-
罗马尼亚语维基源文学语料库1963-2021
罗马尼亚语维基源文学语料库1963-2021 数据来源:互联网公开数据 标签:罗马尼亚文学,维基源,语料库,自然语言处理,机器学习,古典文学,文本分析 数据概述:...
-
大模型生成文本补充数据集
大模型生成文本补充数据集 数据来源:互联网公开数据 标签:大模型,生成文本,竞争数据,文本检测,提示恢复,Kaggle竞赛,AI生成文本识别 数据概述: 本数据集提供了适用于大模型-centric...
-
孟加拉语YouTube评论情感与情绪分析数据集
孟加拉语YouTube评论情感与情绪分析数据集 数据来源:互联网公开数据 标签:孟加拉语,YouTube,情感分析,情绪识别,多标签,文本数据,社交媒体,自然语言处理 数据概述: 本数据集包含从YouTube上不同类型的孟加拉语视频中收集的评论,用于多标签情感分析和情绪检测。数据包含两个主要文件:Sentiment.csv 和...
-
越南卫生新闻数据集2023
越南卫生新闻数据集2023 数据来源:互联网公开数据 标签:越南新闻,卫生,新闻分类,文本生成,情感分析,假新闻检测 数据概述: 本数据集收录了从2023年越南vnexpress.net网站健康类别中爬取的新闻文章,涵盖新闻的URL、标题、关键词、描述、全文内容、文章长度(字数)和作者信息。数据未经过标准化处理,直接反映了网站的原始数据格式。...
-
-
网络评论建设性分析语料库
网络评论建设性分析语料库 数据来源:互联网公开数据 标签:网络评论,建设性分析,语料库,自然语言处理,机器学习,媒体互动,社会分析 数据概述: 本数据集为Constructive Comments Corpus (C3),包含12,000条评论数据,每条评论均经过人工标注,标注内容包括评论的建设性特征及其相关属性。该数据集是从Simon Fraser...
-
CMU动作捕捉数据集扩展版用于音乐节奏生成研究1963-2021
CMU动作捕捉数据集扩展版用于音乐节奏生成研究1963-2021 数据来源:互联网公开数据 标签:动作捕捉,CMU,音乐节奏生成,舞蹈,步行,慢跑,跳跃 数据概述:...
-
KaggleLLM提示词重写竞赛补充数据集-Claude模型生成
KaggleLLM提示词重写竞赛补充数据集-Claude模型生成 数据来源:互联网公开数据 标签:LLM, 提示词, 重写, 竞赛, Claude, 自然语言处理, Kaggle, 数据集, 模型训练 数据概述:...
-
SST-2情感分类数据集
SST-2情感分类数据集 数据来源:互联网公开数据 标签:情感分析,二分类,自然语言处理,句子级分类,文本数据 数据概述: 本数据集用于全句子的情感分类实验,特别针对正面和负面情感的二分类任务。数据集中舍弃了标记为中性的句子,仅保留明显负面或正面的句子。数据集分为训练集和测试集,适用于自然语言处理和情感分析研究。 数据用途概述:...
-
阅读理解自动生成问题竞赛数据集-儿童阅读理解测试-2024
阅读理解自动生成问题竞赛数据集-儿童阅读理解测试-2024 数据来源:互联网公开数据 标签:阅读理解,问题生成,自然语言处理,教育科技,儿童教育,文本分析,机器学习,FairytaleQA 数据概述: 本数据集源自“The Quest for Quality Questions: Improving Reading Comprehension...
-
编程语言HelloWorld程序代码数据集
编程语言HelloWorld程序代码数据集 数据来源:互联网公开数据 标签:编程,代码,Hello World,语言,程序,文本,入门,学习,示例 数据概述: 本数据集包含了多种编程语言的"Hello...
-
印度废钞行动社交媒体推文情感分析数据集-2016年11月
印度废钞行动社交媒体推文情感分析数据集-2016年11月 数据来源:互联网公开数据 标签:废钞,印度,推特,社交媒体,情感分析,经济,政策,舆情,文本数据 数据概述:...



