-
-
波兰旅行报告数据集1963-2021
波兰旅行报告数据集1963-2021 数据来源:互联网公开数据 标签:旅行报告,波兰,自然语言处理,NLP,用户信息,旅行内容 数据概述:... -
自然语言处理数据增强用反向翻译数据集
自然语言处理数据增强用反向翻译数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,反向翻译,文本分类,多语言,数据集,机器学习,文本生成 数据概述: 本数据集包含了来自Contradictory, My Dear... -
优步推特数据集
优步推特数据集 数据来源:互联网公开数据 标签:优步,推特,社交媒体,情感分析,自然语言处理,用户行为,行业趋势 数据概述: 本数据集收录了截至2022年7月11日所有提及uber或Uber的推特内容,共包含10,000条最近的推文。每条推文记录了用户ID、使用的标签以及其它重要特征,为研究优步在社交媒体上的舆论动态提供了丰富的数据资源。... -
哈威斯员工评价数据集
哈威斯员工评价数据集 数据来源:互联网公开数据 标签:哈威斯,员工评价,工作环境,职业发展,公司文化,工作生活平衡,人力资源,数据科学,自然语言处理,文化分析 数据概述: 哈威斯员工评价数据集汇集了来自Ambition... -
-
LLM科学考试GPT-3-5模型生成答案数据集
LLM科学考试GPT-3-5模型生成答案数据集 数据来源:互联网公开数据 标签:LLM,科学考试,GPT-3.5,自然语言处理,考试数据,人工智能,模型输出,文本生成 数据概述: 本数据集包含了GPT-3.5... -
美国副总统和总统辩论评论数据集
美国副总统和总统辩论评论数据集 数据来源:互联网公开数据 标签:美国辩论,副总统,总统,YouTube评论,情感分析,自然语言处理,数据分析,公众意见 数据概述: 该数据集包含从YouTube上抓取的副总统和总统辩论评论,以及使用TextBlob库计算的情感得分。数据涵盖评论内容和对应的情感倾向,为研究公众对辩论的看法提供了基础。 数据用途概述:... -
孟加拉语仇恨言论检测数据集
孟加拉语仇恨言论检测数据集 数据来源:互联网公开数据 标签:仇恨言论检测,孟加拉语,社交媒体分析,文本分类,自然语言处理,机器学习,语言资源 数据概述: 本数据集(BD-... -
-
社交媒体用户推文情感分析数据集-时间跨度2023年1月至2024年1月
社交媒体用户推文情感分析数据集-时间跨度2023年1月至2024年1月 数据来源:互联网公开数据 标签:推文,社交媒体,情感分析,文本数据,自然语言处理,用户行为,情绪识别,舆情分析 数据概述:... -
编码调试故事讲述科学对话数据集
编码调试故事讲述科学对话数据集 数据来源:互联网公开数据 标签:对话数据集, 编程, 调试, 故事讲述, 科学, 自然语言处理, 聊天机器人, 智能助手 数据概述:... -
英语到阿萨姆语平行语料库数据集
英语到阿萨姆语平行语料库数据集 数据来源:互联网公开数据 标签:英语,阿萨姆语,平行语料库,自然语言处理,翻译,语言学 数据概述: 本数据集包含大量经过清理的英语到阿萨姆语平行语料库数据,适用于自然语言处理和机器翻译研究。数据集分为两部分:1_eng.txt 包含大量的英语句子,1_assamese.txt... -
全球产品情感分析数据集2023
全球产品情感分析数据集2023 数据来源:互联网公开数据 标签:产品情感分析,机器学习,自然语言处理,消费者反馈,客户体验,市场研究,产品分类 数据概述:... -
自动医学诊断系统使用临床笔记数据集
自动医学诊断系统使用临床笔记数据集 数据来源:互联网公开数据 标签:自动诊断,医学诊断,临床笔记,自然语言处理,机器学习,LLM,合成数据,医疗决策支持 数据概述:... -
尼泊尔新闻文章文本分类与摘要数据集
尼泊尔新闻文章文本分类与摘要数据集 数据来源:互联网公开数据 标签:尼泊尔语,新闻文章,文本分类,文本摘要,自然语言处理,NLP,机器学习,文本数据 数据概述: 本数据集包含约7500篇尼泊尔语新闻文章,来源于多个尼泊尔新闻网站。数据集经过清洗,包含相对平衡的训练集和测试集,适用于训练和评估尼泊尔语文本分类模型和文本摘要模型。 数据用途概述:... -
航天工程与空间任务对话数据集AstroChat
航天工程与空间任务对话数据集AstroChat 数据来源:互联网公开数据 标签:航天工程,空间任务,对话,LLM,自然语言处理,人工智能,数据集,监督学习,GPT-4,对话生成 数据概述: AstroChat 是一个合成生成的数据集,包含 901 个对话,专门为航天工程和空间任务工程领域设计。该数据集旨在用于监督微调聊天大型语言模型... -
尼泊尔健康论坛问答数据集1963-2021
尼泊尔健康论坛问答数据集1963-2021 数据来源:互联网公开数据 标签:尼泊尔,健康论坛,问答,自然语言处理,健康数据,社区健康,趋势监测 数据概述:... -
罗马尼亚语维基源文学语料库1963-2021
罗马尼亚语维基源文学语料库1963-2021 数据来源:互联网公开数据 标签:罗马尼亚文学,维基源,语料库,自然语言处理,机器学习,古典文学,文本分析 数据概述:... -
孟加拉语YouTube评论情感与情绪分析数据集
孟加拉语YouTube评论情感与情绪分析数据集 数据来源:互联网公开数据 标签:孟加拉语,YouTube,情感分析,情绪识别,多标签,文本数据,社交媒体,自然语言处理 数据概述: 本数据集包含从YouTube上不同类型的孟加拉语视频中收集的评论,用于多标签情感分析和情绪检测。数据包含两个主要文件:Sentiment.csv 和...