-
-
基于GPT-3的改写文章数据集
基于GPT-3的改写文章数据集 数据来源:互联网公开数据 标签:GPT-3,文本改写,自然语言处理,摘要,引言,数据增强,机器翻译 数据概述: 本数据集包含由GPT-3语言模型改写的文章标题、摘要和引言部分。原始文章选自Assoc. Prof. Mehmet Erkut Erdem的Google Scholar页面,并通过GPT-3...
-
-
垃圾邮件过滤研究-SpamAssassin邮件数据集
垃圾邮件过滤研究-SpamAssassin邮件数据集 数据来源:互联网公开数据 标签:垃圾邮件,SpamAssassin,邮件,文本分类,自然语言处理,机器学习,贝叶斯,语料库 数据概述:...
-
西班牙语评论文本向量化分析数据集
西班牙语评论文本向量化分析数据集 数据来源:互联网公开数据 标签:西班牙语,文本分析,自然语言处理,情感分析,机器学习,词袋模型,TF-IDF,停用词,分类 数据概述: 本数据集包含722条西班牙语评论文本,用于二元分类问题。数据集经过文本向量化处理,基于词袋模型(BoW)和TF-...
-
阿尔巴尼亚方言语料库数据集2023
阿尔巴尼亚方言语料库数据集2023 数据来源:互联网公开数据 标签:阿尔巴尼亚方言,语料库,社交媒体数据,地缘标签,机器学习,语言学研究 数据概述: 阿尔巴尼亚方言语料库数据集是由ERCAN CANHASI和REXHEP SHIJAKU基于《The Albanian Dialect...
-
-
古兰经分章文本数据集
古兰经分章文本数据集 数据来源:互联网公开数据 标签:古兰经,伊斯兰教,分章文本,英文翻译,宗教研究,文化研究,历史研究 数据概述: 本数据集包含了古兰经的英文翻译文本,按照分章(Surah)的形式整理。每章的内容都被完整地收录其中。数据集基于Talal...
-
土耳其地震推特数据集
土耳其地震推特数据集 数据来源:互联网公开数据 标签:土耳其,地震,社交媒体,推特,灾害分析,自然灾难,公共意见 数据概述: 本数据集收录了关于2023年土耳其大规模地震的每日推特信息,通过tweepy和Twitter...
-
印度尼西亚短信垃圾信息数据集
印度尼西亚短信垃圾信息数据集 数据来源:互联网公开数据 标签:短信,垃圾信息,分类,文本分析,机器学习,印尼语 数据概述: 本数据集来源于https://yudiwbs.wordpress.com/2018/08/05/dataset-klasifikasi-bahasa-indonesia-sms-spam-klasifikasi-teks-...
-
准确医疗翻译数据集
准确医疗翻译数据集 数据来源:互联网公开数据 标签:医疗翻译,准确翻译,自然语言处理,机器学习,跨文化比较,医疗信息交流,全球医疗协作 数据概述: 本数据集是一个全面且可靠的医疗翻译数据集,由yanis...
-
板球IPL2023比赛逐球评论数据集
板球IPL2023比赛逐球评论数据集 数据来源:互联网公开数据 标签:板球比赛,印度,印度超级联赛,IPL,逐球分析,比赛评论,体育数据 数据概述:...
-
撰写过程与质量关联性重建文本数据集
撰写过程与质量关联性重建文本数据集 数据来源:互联网公开数据 标签:撰写过程,文本质量,数据重建,机器学习,比赛数据,文本处理 数据概述: 本数据集包含用于“Linking Writing Processes to Writing Quality”...
-
佐科维推特数据集
佐科维推特数据集 数据来源:互联网公开数据 标签:佐科维,推特,印尼总统,情感分析,自然语言处理,社交媒体数据,机器学习 数据概述: 本数据集包含印度尼西亚第七任总统佐科维在2022年在其官方推特账号上发布的1,000条推文。每条推文都根据其情感被标注为正面、负面或中性。...
-
情绪分类分析数据集2023
情绪分类分析数据集2023 数据来源:互联网公开数据 标签:情绪识别,情感分析,BERT模型,分类任务,数据样本,焦虑,双相,抑郁,恐惧,感激,快乐,悲伤,压力 数据概述:...
-
全球程序员地理分布与标签数据
全球程序员地理分布与标签数据 数据来源:互联网公开数据 数据集说明: 本数据集汇总了 Stack Overflow 平台上用户的位置信息及其最常使用的前 5 个技术标签(tags),用于分析用户的技术兴趣与地域分布之间的关系。标签通常反映用户参与讨论最多的技术领域,如编程语言、框架、工具等。...
-
-
福尔德家族故事集情感分析数据集
福尔德家族故事集情感分析数据集 数据来源:互联网公开数据 标签:情感分析,文本分析,自然语言处理,福尔德家族,故事集,词频分析,情感词典,主题建模,实体识别 数据概述:...
-
虚假新闻类型分类研究数据集
虚假新闻类型分类研究数据集 数据来源:互联网公开数据 标签:虚假新闻,经济,政治,社会,科学,分类模型,数据集,机器学习,自然语言处理 数据概述:...
-
印度动作电影评论数据集1963-2021
印度动作电影评论数据集1963-2021 数据来源:互联网公开数据 标签:动作电影,电影评论,电影评级,NLP,机器学习,影评分析 数据概述: 本数据集包含超过2300条动作电影的评论,涵盖了电影的详细信息,包括评分等关键要素。评论由活跃影评人撰写,为自然语言处理(NLP)任务和机器学习操作提供了丰富且有价值的资源。 数据用途概述:...



