-
奥罗莫语句子标注数据集
奥罗莫语句子标注数据集 数据来源:互联网公开数据 标签:奥罗莫语,句子标注,自然语言处理,文本分析,语言识别 数据概述: 本数据集包含78,000条经过清理的奥罗莫语句子,所有句子均无特殊字符和标点符号。数据集由两列组成,其中一列包含句子文本,另一列包含对应的语言标签。该数据集为研究和处理奥罗莫语提供了丰富的语言素材。 数据用途概述:... -
手机产品评论主题分析数据集
手机产品评论主题分析数据集 数据来源:互联网公开数据 标签:用户反馈,亚马逊评论,情感分析,主题建模,词性标注,产品优化,市场调研,自然语言处理 数据概述... -
推特情感分析数据集-推文情感分类数据集
推特情感分析数据集-推文情感分类数据集 数据来源:互联网公开数据 标签:推特,情感分析,自然语言处理,文本挖掘,情感分类,社交媒体,机器学习,数据,推文 数据概述: 本数据集包含101160条推特(Twitter)推文,通过Twitter API收集。每条推文都已进行情感标注,标注结果为0(负面)或4(正面),可用于情感分析任务。 数据字段包括:... -
恐龙星期六情感分析与文本生成研究数据集-2021
恐龙星期六情感分析与文本生成研究数据集-2021 数据来源:互联网公开数据 标签:恐龙星期六,Facebook,情感分析,文本生成,自然语言处理,泰国,社交媒体,文本数据 数据概述:... -
贝叶斯方法与机器学习书籍主题建模数据集
贝叶斯方法与机器学习书籍主题建模数据集 数据来源:互联网公开数据 标签:机器学习,贝叶斯方法,主题建模,文本分析,自然语言处理,书籍,数据挖掘,Bishop 数据概述: 本数据集包含了《模式识别与机器学习》(Pattern Recognition and Machine Learning)一书(作者:Christopher... -
老友记第11季第1集剧本数据集
老友记第11季第1集剧本数据集 数据来源:互联网公开数据 标签:老友记,剧本,聊天机器人,自然语言处理,角色对话,创意项目,娱乐 数据概述:... -
-
推特用户情感分析数据集-社交媒体内容情感分类-多实体-训练验证
推特用户情感分析数据集-社交媒体内容情感分类-多实体-训练验证 数据来源:互联网公开数据 标签:推特,情感分析,自然语言处理,社交媒体,情感分类,机器学习,文本分析,训练集,验证集 数据概述: 本数据集用于推特(Twitter)用户情感分析,旨在对推特消息中针对特定实体的情感倾向进行分类。... -
ChatGPT-4问答训练数据集-多领域问答场景
ChatGPT-4问答训练数据集-多领域问答场景 数据来源:互联网公开数据 标签:ChatGPT, GPT-4, 问答, 语言模型, 训练数据, 自然语言处理, 人工智能, 机器学习, 文本生成 数据概述:... -
Flipkart商品评价情感分析数据集
Flipkart商品评价情感分析数据集 数据来源:互联网公开数据 标签:电商,评论,情感分析,用户评价,文本数据,机器学习,自然语言处理 数据概述:... -
TensorFlow社交媒体推文情感分析数据集-2017-2021
TensorFlow社交媒体推文情感分析数据集-2017-2021 数据来源:互联网公开数据 标签:TensorFlow,推文,社交媒体,自然语言处理,情感分析,机器学习,推特,文本挖掘 数据概述:... -
涅槃乐队歌词数据集
涅槃乐队歌词数据集 数据来源:互联网公开数据 标签:涅槃乐队,歌词,音乐分析,自然语言处理,歌词文本,歌曲分析,音乐研究 数据概述: 本数据集包含从涅槃乐队143首歌曲中提取的歌词文本。数据集结构包括两列:歌曲标题和歌词内容。歌词内容按段落存储在列表中,方便进一步处理和分析。 数据用途概述:... -
SCP幽默文章数据集
SCP幽默文章数据集 数据来源:互联网公开数据 标签:SCP, 幽默, 娱乐, 人工智能, 文本分类, 文本生成, 数据标注, 自然语言处理 数据概述: 本数据集收录了SCP Wiki中的“幽默文章”(Joke... -
高校学生招聘数据文本化数据集
高校学生招聘数据文本化数据集 数据来源:互联网公开数据 标签:校园招聘,学生,就业,文本数据,机器学习,自然语言处理,文本分类,教育,数据挖掘 数据概述: 本数据集包含了XYZ高校学生的招聘数据,这些数据经过处理后转化为文本格式,用于训练大型语言模型(LLM)。原始数据来源于CSV文件,通过数据到文本(data-to-... -
问答一致性研究与文本理解数据集
问答一致性研究与文本理解数据集 数据来源:互联网公开数据 标签:问答任务,一致性评估,自然语言处理,机器学习,问答系统,文本理解,信息检索 数据概述: 本数据集专注于问答一致性研究,包含训练集和验证集两个部分。每个数据样本由三个关键字段组成: 1. 问题(question):用户提出的具体问题。 2. 答案(answer):对应问题的标准答案。 3.... -
-
斯坦福问答数据集SQuAD泰米尔语翻译数据集-问答对-泰米尔语-
斯坦福问答数据集SQuAD泰米尔语翻译数据集-问答对-泰米尔语- 数据来源:互联网公开数据 标签:问答,SQuAD,泰米尔语,自然语言处理,机器翻译,文本分析,数据集,翻译 数据概述: 本数据集是针对“chaii -... -
电子游戏评论情感分析数据集
电子游戏评论情感分析数据集 数据来源:互联网公开数据 标签:电子游戏,评论,情感分析,自然语言处理,NLP,文本分类,用户反馈,游戏行业 数据概述:... -
新闻头条股票情绪分析金融数据集
新闻头条股票情绪分析金融数据集 数据来源:互联网公开数据 标签:新闻头条,股票情绪分析,金融数据,投资决策,机器学习,自然语言处理 数据概述:... -
印地语-英语音译数据集
印地语-英语音译数据集 数据来源:互联网公开数据 标签:印地语,英语,音译,自然语言处理,文本分类,情感分析,机器翻译,跨语言分析 数据概述: 本数据集包含印地语与英语语言对的音译文本数据,旨在促进自然语言处理任务,如文本分类、情感分析和机器翻译。数据集涵盖了不同领域和主题的各种文本样本,从短语到长句不等。数据集中的每个条目由一对印地语-...