-
情感分析大数据集SentimentAnalysisBigCorpus-esrapolatnevruz
情感分析大数据集SentimentAnalysisBigCorpus-esrapolatnevruz 数据来源:互联网公开数据 标签:情感分析,自然语言处理,大数据,文本分析,机器学习,人工智能,数据挖掘,社会研究 数据概述:... -
电商产品评论数据集YojoE-commerceProductReviewsDataset-yohanesnuwara
电商产品评论数据集YojoE-commerceProductReviewsDataset-yohanesnuwara 数据来源:互联网公开数据 标签:电商,产品评论,数据集,文本分析,情感分析,机器学习,消费者行为,自然语言处理 数据概述: 该数据集包含来自Yojo电商平台的产品评论数据,记录了消费者对各类产品的评价和反馈。主要特征如下:... -
英国广播公司僧伽罗语新闻数据集BBCSinhalaDataset-kawinduwijewardhane
英国广播公司僧伽罗语新闻数据集BBCSinhalaDataset-kawinduwijewardhane 数据来源:互联网公开数据 标签:新闻,数据集,文本分析,自然语言处理,语言学,僧伽罗语,机器学习,舆情分析 数据概述: 该数据集包含来自英国广播公司(BBC)僧伽罗语频道的新闻文章数据,记录了BBC僧伽罗语新闻文章的详细信息。主要特征如下:... -
作家差异识别数据集WriterDifferenceIdentificationDataset-amrrsheta
作家差异识别数据集WriterDifferenceIdentificationDataset-amrrsheta 数据来源:互联网公开数据 标签:笔迹识别,数据集,机器学习,文本分析,人工智能,模式识别,数据分析,教育技术 数据概述: 该数据集包含来自不同作家的笔迹样本数据,用于识别和区分不同作家的书写风格。主要特征如下:... -
行业NLP应用数据集NLPinIndustryDataset-jeanthomasfc
行业NLP应用数据集NLPinIndustryDataset-jeanthomasfc 数据来源:互联网公开数据 标签:自然语言处理,行业应用,数据集,文本分析,机器学习,信息抽取,情感分析,数据挖掘 数据概述: 该数据集包含来自多个行业领域的文本数据,旨在促进自然语言处理(NLP)在实际工业场景中的应用研究。主要特征如下:... -
客户服务分析数据集-nvlkumar
客户服务分析数据集-nvlkumar 数据来源:互联网公开数据 标签:客户服务,文本分析,自然语言处理,情感分析,数据集,机器学习,客户体验,服务质量 数据概述: 该数据集包含来自客户服务交互的数据,记录了客户与服务提供商之间的对话内容。主要特征如下: 时间跨度:数据记录的时间范围为一段时间,具体时间范围依赖于数据集的发布者,可能包含多个月甚至数年。... -
比尔盖茨推特数据集2009年至2023年BillGatesTweetsDatasetfrom2009to2023-muhammadavici
比尔盖茨推特数据集2009年至2023年BillGatesTweetsDatasetfrom2009to2023-muhammadavici 数据来源:互联网公开数据 标签:比尔盖茨,推特,社交媒体,数据集,时间序列,文本分析,社会影响,科技发展... -
Statement1文件数据集-morizin
Statement1文件数据集-morizin 数据来源:互联网公开数据 标签:财务报表,数据集,文本分析,自然语言处理,会计学,金融,机器学习,文本挖掘 数据概述:该数据集包含来自Statement1 文件的财务报表数据,记录了公司的财务状况和业绩表现。主要特征如下: 时间跨度:数据记录的时间范围涵盖多个年度。 地理范围:数据来源于全球范围内的公司。... -
Mistral-7B生成文本数据集-thienanlnguyen
Mistral-7B生成文本数据集-thienanlnguyen 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本生成,机器学习,语言模型,生成式AI,文本分析,人工智能 数据概述: 该数据集包含由 Mistral-7B 语言模型生成的文本数据,用于研究和评估模型的文本生成能力。主要特征如下: 时间跨度:数据生成时间为近期。... -
短信分类数据集SMSClassifierDataset-prasaddablikar
短信分类数据集SMSClassifierDataset-prasaddablikar 数据来源:互联网公开数据 标签:短信分类,数据集,文本分析,机器学习,自然语言处理,分类算法,通信技术,数据挖掘 数据概述: 该数据集包含来自通信运营商的短信数据,记录了各类短信的文本内容和分类标签。主要特征如下:... -
Reddit平台清洁笑话数据集RedditCleanJokesDataset-qwerty29544
Reddit平台清洁笑话数据集RedditCleanJokesDataset-qwerty29544 数据来源:互联网公开数据 标签:笑话,数据集,社交媒体,文本分析,自然语言处理,情感分析,娱乐内容,数据分析 数据概述: 该数据集包含来自Reddit平台的清洁笑话数据,记录了用户发布的无冒犯内容的笑话。主要特征如下:... -
城市词典拼写变体数据集SpellingVariationonUrbanDictionaryDataset-paigema
城市词典拼写变体数据集SpellingVariationonUrbanDictionaryDataset-paigema 数据来源:互联网公开数据 标签:语言研究,数据集,拼写变体,词典学,自然语言处理,词汇学,文本分析,机器学习 数据概述: 该数据集包含来自城市词典(Urban... -
书籍推荐数据集BXBookDataset-alizaynoor
书籍推荐数据集BXBookDataset-alizaynoor 数据来源:互联网公开数据 标签:书籍,图书,推荐系统,数据集,用户行为,文本分析,自然语言处理,机器学习 数据概述: 该数据集包含来自BX Book数据集的书籍和用户行为数据,记录了用户的书籍阅读和评分信息。主要特征如下: 时间跨度:数据记录的时间范围为2002年之前。... -
伊朗波斯语文本数据集PersianDatasetIR-amirali10281
伊朗波斯语文本数据集PersianDatasetIR-amirali10281 数据来源:互联网公开数据 标签:波斯语,文本分析,自然语言处理,数据集,信息检索,情感分析,语言模型,机器学习 数据概述: 该数据集包含来自伊朗的波斯语文本数据,涵盖了多种来源和主题。主要特征如下:... -
代码审查文件数据集OutputChecksFilesDataset-robinlord
代码审查文件数据集OutputChecksFilesDataset-robinlord 数据来源:互联网公开数据 标签:代码审查,代码质量,数据集,软件工程,机器学习,自然语言处理,文本分析,代码分析 数据概述: 该数据集包含了代码审查过程中产生的各种输出文件,主要用于分析代码质量,发现潜在缺陷以及评估代码审查的效果。主要特征如下:... -
Jigsaw评论数据集JigsawCleanedDataV6-moniquebadjemaa
Jigsaw评论数据集JigsawCleanedDataV6-moniquebadjemaa 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,评论,毒性检测,情感分析,机器学习,社交媒体 数据概述: 该数据集由 Jigsaw 团队提供,包含了来自不同在线平台的评论数据,旨在用于毒性检测和情感分析等自然语言处理任务。主要特征如下:... -
保罗-科埃略炼金术士小说文本数据集-stealthtechnologies
保罗-科埃略炼金术士小说文本数据集-stealthtechnologies 数据来源:互联网公开数据 标签:小说,文学,文本分析,数据集,阅读理解,情感分析,自然语言处理,语料库 数据概述: 该数据集包含保罗·科埃略创作的小说《炼金术士》的文本数据,记录了小说的完整内容。主要特征如下: 时间跨度:数据记录的时间范围为小说创作出版至今。... -
CCF金融文本情感分析数据集-danielfme
CCF金融文本情感分析数据集-danielfme 数据来源:互联网公开数据 标签:金融,文本分析,情感分析,自然语言处理,机器学习,数据集,中文,金融科技 数据概述: 该数据集包含来自CCF(中国计算机学会)金融领域的文本数据,主要用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但主要反映金融领域相关的文本信息。... -
GDPR咨询问答测试数据集GDPRQ-ATestDataset-iuliabunescu23
GDPR咨询问答测试数据集GDPRQ-ATestDataset-iuliabunescu23 数据来源:互联网公开数据 标签:数据隐私,GDPR,问答系统,自然语言处理,法律合规,数据保护,机器学习,文本分析 数据概述: 该数据集包含与欧盟通用数据保护条例(GDPR)相关的问答对,用于测试和评估问答系统在数据隐私领域的性能。主要特征如下:... -
GPT生成文本数据集GPT-GeneratedTextDataset-manshanand
GPT生成文本数据集GPT-GeneratedTextDataset-manshanand 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,机器学习,人工智能,语言模型,文本分析,深度学习 数据概述: 该数据集包含由GPT(生成预训练转换器)模型生成的文本数据,记录了模型在不同输入下的输出文本。主要特征如下:...