-
哈维飓风2017年推特数据集
哈维飓风2017年推特数据集 数据来源:互联网公开数据 标签:哈维飓风,2017,推特数据,灾害响应,主题建模,自然语言处理,公众感知,情感分析 数据概述:... -
-
开放域问答数据集-问题与答案-2023年
开放域问答数据集-问题与答案-2023年 数据来源:互联网公开数据 标签:问答,自然语言处理,NLP,文本数据,QA,问题解答,知识库,语言模型,机器学习 数据概述: 本数据集包含大量的问题与答案对,旨在为开放域问答(QA, Question... -
动漫数据集适用于NLP项目
动漫数据集适用于NLP项目 数据来源:互联网公开数据 标签:动漫,推荐系统,NLP,文本分析,数据挖掘,自然语言处理,娱乐分析 数据概述: 本数据集主要用于构建著名的动漫推荐系统——Anime Odyssey。数据集涵盖了丰富的动漫信息,包括但不限于动漫名称、简介、类型、评分、评论等内容,为自然语言处理和文本分析提供了宝贵的数据资源。 数据用途概述:... -
Kaggle文本数据竞赛优胜方案分析数据集-2021-2023
Kaggle文本数据竞赛优胜方案分析数据集-2021-2023 数据来源:互联网公开数据 标签:Kaggle,文本数据,竞赛,机器学习,自然语言处理,NLP,解决方案,深度学习,模型,算法,优化器,集成,数据分析 数据概述: 本数据集收录了2021年至2023年间9个Kaggle文本数据竞赛中,每个竞赛前三名优胜方案的详细分析。... -
社交媒体语境下文本毒性评估数据集
社交媒体语境下文本毒性评估数据集 数据来源:互联网公开数据 标签:文本分析,自然语言处理,毒性检测,社交媒体,语境理解,情感分析,机器学习 数据概述:... -
土耳其语情感分析数据集
土耳其语情感分析数据集 数据来源:互联网公开数据 标签:情感分析,土耳其语,推文,文本挖掘,机器学习,自然语言处理,社会媒体分析 数据概述: 本数据集是一个公开的土耳其语情感分析数据集,由Cagla Balli及其父亲Tahsin Balli共同创建。数据集包含两个字段:情感(正面或负面)和推文(土耳其语推文内容)。推文通过Twitter... -
IMDb电影流派分类数据集
IMDb电影流派分类数据集 数据来源:互联网公开数据 标签:电影,流派,分类,IMDb,电影数据库,文本分析,机器学习,自然语言处理 数据概述: 本数据集基于互联网电影数据库(IMDb, Internet Movie Database)构建,包含了大量电影的流派信息。... -
LASIK手术并发症研究数据集1997-2019
LASIK手术并发症研究数据集1997-2019 数据来源:互联网公开数据 标签:LASIK手术,并发症,眼科,时间序列,医疗分析,自然语言处理,趋势分析 数据概述:... -
西班牙语有毒评论分析数据集
西班牙语有毒评论分析数据集 数据来源:互联网公开数据 标签:有毒评论,文本分析,自然语言处理,机器学习,多语言数据,情感分析,社交媒体分析 数据概述: 本数据集由两个原始数据集合并并翻译成西班牙语而成。第一个数据集来自Kaggle的Jigsaw有毒评论分类挑战赛,包含标记为有毒或非有毒的英语评论。第二个数据集来自PAN 21... -
海尔印度员工评论数据集
海尔印度员工评论数据集 数据来源:互联网公开数据 标签:海尔印度,员工评论,职场体验,企业文化,工作生活平衡,职业发展,人力资源,自然语言处理,情感分析,文化分析 数据概述: 海尔印度员工评论数据集汇集了来自海尔印度(一家闻名的消费电子及家电公司)员工在Ambition Box平台上分享的宝贵见解和评论。Ambition... -
Netflix用户社交媒体评论情感分析数据集-Facebook帖子-时间不限
Netflix用户社交媒体评论情感分析数据集-Facebook帖子-时间不限 数据来源:互联网公开数据 标签:Netflix, Facebook, 社交媒体, 评论, 情感分析, 自然语言处理, 大语言模型, 用户反馈 数据概述: 本数据集包含了从 Facebook 上抓取的关于 Netflix 的用户评论。数据来源于用户在 Netflix... -
动漫GPT-San动漫剧情摘要生成模型训练数据集
动漫GPT-San动漫剧情摘要生成模型训练数据集 数据来源:互联网公开数据 标签:动漫,GPT-2,自然语言处理,文本生成,人工智能,机器学习,动漫剧情,摘要生成 数据概述: 本数据集是用于训练动漫GPT-... -
城市研究论文摘要数据集1963-2021
城市研究论文摘要数据集1963-2021 数据来源:互联网公开数据 标签:城市研究,论文摘要,自然语言处理,主题识别,文档聚类,科学出版物,数据可视化 数据概述:... -
阿拉伯短篇故事集5000数据集
阿拉伯短篇故事集5000数据集 数据来源:互联网公开数据 标签:阿拉伯语,短篇故事,内容生成,自然语言处理,宗教,幻想,励志,儿童故事,英雄故事 数据概述:... -
-
智慧印度黑客松挑战问题集数据集
智慧印度黑客松挑战问题集数据集 数据来源:互联网公开数据 标签:智慧印度黑客松,问题陈述,机器学习,数据科学,自然语言处理,趋势分析,推荐系统,协作发现 数据概述:... -
印度机器学习工程师招聘简历筛选数据集2023
印度机器学习工程师招聘简历筛选数据集2023 数据来源:互联网公开数据 标签:招聘,机器学习工程师,简历筛选,自然语言处理,回归分析,公平比较,求职指导 数据概述:... -
英译印语言模型指令数据集-NVIDIAHelpSteer数据集-英译印
英译印语言模型指令数据集-NVIDIAHelpSteer数据集-英译印 数据来源:互联网公开数据 标签:语言模型,自然语言处理,机器翻译,印地语,文本生成,指令,NVIDIA,HelpSteer,数据集 数据概述: 本数据集是NVIDIA... -
arXiv计算机科学论文摘要与结构化文本数据集-2020年
arXiv计算机科学论文摘要与结构化文本数据集-2020年 数据来源:互联网公开数据 标签:arXiv,计算机科学,论文,摘要,引言,结论,文本分析,自然语言处理,研究,学术 数据概述:...