数据集 - 海数据

IMDB电影评论情感分析数据集IMDBMovieReviewsSentimentAnalysisDataset-ahmadialkhatib

2025年4月23日

IMDB电影评论情感分析数据集IMDBMovieReviewsSentimentAnalysisDataset-ahmadialkhatib 数据来源：互联网公开数据标签：电影评论，情感分析，自然语言处理，机器学习，文本分类，数据集，深度学习，IMDB 数据概述：...

ZIP

最后生还者系列游戏评论数据集-2011至2023-lazaro97

2025年4月23日

最后生还者系列游戏评论数据集-2011至2023-lazaro97 数据来源：互联网公开数据标签：视频游戏,评论,游戏评价,玩家反馈,游戏分析,游戏批评,数据挖掘,文本分类,自然语言处理数据概述：...

ZIP

共同基金用户咨询问题分类数据集-aloktantrik

2025年4月23日

共同基金用户咨询问题分类数据集-aloktantrik 数据来源：互联网公开数据标签：共同基金,用户咨询,文本分类,自然语言处理,金融科技,数据分析,机器学习,NLP 数据概述：...

ZIP

医疗技术自然语言推理数据集MedTechSNLI50kDataset-mohamedihebhergli

2025年4月23日

医疗技术自然语言推理数据集MedTechSNLI50kDataset-mohamedihebhergli 数据来源：互联网公开数据标签：医疗技术，自然语言推理，数据集，NLP，机器学习，文本分类，人工智能，医学研究数据概述：该数据集包含来自医疗技术领域的自然语言推理数据，记录了大量的医疗文本及其推理关系。主要特征如下：...

ZIP

波斯语Farsi文本情感分析数据集PersianFarsiTextSentimentDataset-alireza151

2025年4月23日

波斯语Farsi文本情感分析数据集PersianFarsiTextSentimentDataset-alireza151 数据来源：互联网公开数据标签：情感分析，自然语言处理，数据集，机器学习，文本分类，语言学，情感挖掘，波斯语数据概述：...

ZIP

基于T5数据增强的人机交互聊天消息数据集-birdy654

2025年4月23日

基于T5数据增强的人机交互聊天消息数据集-birdy654 数据来源：互联网公开数据标签：人机交互,聊天消息,T5,数据增强,文本分类,人工智能,研究数据数据概述：...

ZIP

垃圾邮件与非垃圾邮件分类数据集MergedSpam-HamDataset-aslantasserdal

2025年4月23日

垃圾邮件与非垃圾邮件分类数据集MergedSpam-HamDataset-aslantasserdal 数据来源：互联网公开数据标签：电子邮件，垃圾邮件，数据集，文本分类，机器学习，自然语言处理，分类算法，网络安全数据概述：该数据集包含来自多个来源的垃圾邮件和非垃圾邮件数据，记录了电子邮件的文本内容和分类标签。主要特征如下：...

ZIP

僧伽罗语新闻标题数据集-nawarathnadeshan

2025年4月23日

僧伽罗语新闻标题数据集-nawarathnadeshan 数据来源：互联网公开数据标签：新闻，文本分析，自然语言处理，僧伽罗语，文本分类，情感分析，数据集，信息检索数据概述：该数据集包含来自僧伽罗语新闻网站的新闻标题数据，记录了各种新闻文章的标题信息。主要特征如下：时间跨度：数据记录的时间范围为特定时间段，具体时间范围取决于数据集的构建时间。...

ZIP

多标签文本分类数据集-bimleshkumar759

2025年4月23日

多标签文本分类数据集-bimleshkumar759 数据来源：互联网公开数据标签：文本分类，多标签，数据集，机器学习，自然语言处理，文本分析，深度学习，NLP 数据概述：该数据集包含用于多标签文本分类任务的文本数据。主要特征如下：时间跨度：数据记录的时间范围不固定，取决于原始数据来源。地理范围：数据覆盖范围不固定，取决于原始数据来源。...

ZIP

土耳其语IMDB电影评论情感分析数据集-yusufgoktas

2025年4月23日

土耳其语IMDB电影评论情感分析数据集-yusufgoktas 数据来源：互联网公开数据标签：情感分析，土耳其语，电影评论，自然语言处理，文本分类，机器学习，NLP，土耳其数据概述：该数据集包含了来自互联网电影数据库（IMDB）的土耳其语电影评论数据，用于情感分析任务。主要特征如下：...

ZIP

多语言自然语言推理与跨语言推理数据集

2025年4月23日

多语言自然语言推理与跨语言推理数据集数据来源：互联网公开数据标签：自然语言推理,跨语言推理,多语言,文本分类,模型训练,迁移学习,句子对分类数据概述：本数据集结合了MNLI（多领域自然语言推理）和XNLI（跨语言自然语言推理）数据集，并扩展了NLI数据，提供了一个丰富的多语言资源，适用于自然语言推理任务的研究和开发。数据集包含多个语言中的前提-...

ZIP

新闻文本分类数据集-priyabratapanda

2025年4月23日

新闻文本分类数据集-priyabratapanda 数据来源：互联网公开数据标签：新闻，文本分类，机器学习，自然语言处理，NLP，数据集，信息检索，舆情分析数据概述：该数据集包含来自多种新闻来源的文本数据，用于新闻文本的分类任务。主要特征如下：时间跨度：数据记录的时间跨度为不固定，涵盖了不同时间段的新闻报道。...

ZIP

乌尔都语情感与讽刺数据集UrduSentimentandSarcasmDatasets-noorsaeed

2025年4月23日

乌尔都语情感与讽刺数据集UrduSentimentandSarcasmDatasets-noorsaeed 数据来源：互联网公开数据标签：自然语言处理，情感分析，讽刺识别，数据集，乌尔都语，文本分类，机器学习，多模态分析数据概述：该数据集包含来自乌尔都语社交媒体平台的文本数据，记录了用户发布的帖子及其情感和讽刺标签。主要特征如下：...

ZIP

性别检测数据集GenderDetectionDataset-subhajournal

2025年4月23日

性别检测数据集GenderDetectionDataset-subhajournal 数据来源：互联网公开数据标签：性别检测，数据集，自然语言处理，机器学习，文本分析，文本分类，社会研究，信息提取数据概述：该数据集包含来自互联网的公开数据，记录了不同用户在社交媒体上的用户名，昵称和相关文本信息，适用于性别检测和分类任务。主要特征如下：...

ZIP

韩语仇恨言论数据集

2025年4月23日

韩语仇恨言论数据集数据来源：互联网公开数据标签：韩语,仇恨言论,文本分类,自然语言处理,社会分析,多分类模型,二分类模型数据概述：本数据集包含韩语仇恨言论文本数据，由从韩国右翼网站“일간베스트”爬取的仇恨和歧视性评论组成。数据集分为两部分： 1. hate-speech-binary-...

ZIP

自然语言处理微调与优化数据集Fine-tuningDatasetforNLPOptimization-inductiveanks

2025年4月23日

自然语言处理微调与优化数据集Fine-tuningDatasetforNLPOptimization-inductiveanks 数据来源：互联网公开数据标签：自然语言处理，微调，文本分类，数据集，机器学习，深度学习，语言模型，模型优化...

ZIP

葡萄牙语文本分类数据集PortugueseTextClassificationDataset-rookiejing

2025年4月23日

葡萄牙语文本分类数据集PortugueseTextClassificationDataset-rookiejing 数据来源：互联网公开数据标签：自然语言处理，文本分类，数据集，语言模型，机器学习，多语言，文本分析，语言学数据概述：该数据集包含来自葡萄牙语互联网的文本数据，专门用于葡萄牙语的文本分类任务。主要特征如下：...