-
孟加拉语新闻文章数据集BanglaNewsArticleDataset-asifahmedshodip
孟加拉语新闻文章数据集BanglaNewsArticleDataset-asifahmedshodip 数据来源:互联网公开数据 标签:新闻文章,数据集,文本分析,自然语言处理,机器学习,新闻分类,多语言,孟加拉语 数据概述: 该数据集包含来自孟加拉语新闻网站和媒体平台的新闻文章数据,记录了各类新闻事件和话题的报道内容。主要特征如下:... -
古兰经文本数据集QuranKareemTextDataset-mohamedeldesouky
古兰经文本数据集QuranKareemTextDataset-mohamedeldesouky 数据来源:互联网公开数据 标签:伊斯兰教,古兰经,文本分析,自然语言处理,宗教研究,阿拉伯语,数据集,语义分析 数据概述: 该数据集包含了古兰经的阿拉伯语原文及其翻译,是研究伊斯兰教文本和进行自然语言处理的重要资源。主要特征如下: 时间跨度:... -
阿拉伯语社交媒体情感分析数据集PAWSS-ArabicVersionDataset-emam2002
阿拉伯语社交媒体情感分析数据集PAWSS-ArabicVersionDataset-emam2002 数据来源:互联网公开数据 标签:阿拉伯语,情感分析,社交媒体,自然语言处理,文本挖掘,机器学习,情感分类,NLP 数据概述: 该数据集包含来自社交媒体的阿拉伯语文本数据,用于情感分析任务。主要特征如下:... -
国际医疗应用评论数据集Reviewsfrom10InternationalMedicalApps-tahmidkarimsaad
国际医疗应用评论数据集Reviewsfrom10InternationalMedicalApps-tahmidkarimsaad 数据来源:互联网公开数据 标签:医疗应用,评论数据,移动医疗,用户评价,自然语言处理,情感分析,医疗健康,应用市场 数据概述:... -
电影剧情摘要数据集-linggarmaretva
电影剧情摘要数据集-linggarmaretva 数据来源:互联网公开数据 标签:电影,剧情,摘要,文本分析,自然语言处理,情感分析,机器学习,电影推荐 数据概述: 该数据集包含来自电影剧情摘要的数据,记录了电影的详细剧情概要信息。主要特征如下: 时间跨度:数据记录的时间范围涵盖了不同年代的电影。 地理范围:数据涵盖了全球范围内的电影作品。... -
自然语言处理乐器评论数据集NLPMusicalInstrumentsReviewDataset-revatishingole
自然语言处理乐器评论数据集NLPMusicalInstrumentsReviewDataset-revatishingole 数据来源:互联网公开数据 标签:自然语言处理,乐器评论,数据集,文本分析,情感分析,机器学习,消费者行为,市场研究 数据概述: 该数据集包含来自乐器类产品的用户评论数据,记录了消费者对各类乐器的评价和反馈。主要特征如下:... -
拼写纠正数据集SpellCorrectionDataset-zerowith
拼写纠正数据集SpellCorrectionDataset-zerowith 数据来源:互联网公开数据 标签:自然语言处理,拼写纠正,数据集,文本处理,机器学习,语言技术,数据挖掘,计算机科学 数据概述: 该数据集专注于拼写纠正任务,包含大量包含拼写错误的文本数据及其对应的正确文本。主要特征如下:... -
Upwork平台数据科学家工作数据集UpworkDatasetforDataScientist-altafk
Upwork平台数据科学家工作数据集UpworkDatasetforDataScientist-altafk 数据来源:互联网公开数据 标签:自由职业,数据科学,Upwork,工作数据,机器学习,自然语言处理,市场分析,职业发展 数据概述: 该数据集包含来自Upwork平台的数据,记录了数据科学领域的工作发布和相关信息。主要特征如下:... -
推特新训练集TweetNewTrainFolds-zzy990106
推特新训练集TweetNewTrainFolds-zzy990106 数据来源:互联网公开数据 标签:推特数据,数据集,文本分析,机器学习,自然语言处理,社交媒体分析,情感分析,信息提取 数据概述:该数据集包含来自推特的新训练数据,记录了大量推文以供文本分析和机器学习任务。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。... -
音乐商店用户评论数据集MusicStoreUserReviewsDataset-theobervanakis
音乐商店用户评论数据集MusicStoreUserReviewsDataset-theobervanakis 数据来源:互联网公开数据 标签:音乐商店,用户评论,数据集,情感分析,自然语言处理,消费者行为,电子商务,市场研究 数据概述: 该数据集包含来自音乐商店的用户评论数据,记录了消费者对音乐产品,服务及体验的反馈。主要特征如下:... -
Internshala实习职位列表数据集-neelambind
Internshala实习职位列表数据集-neelambind 数据来源:互联网公开数据 标签:实习,职位,数据集,招聘,职业发展,数据分析,机器学习,自然语言处理 数据概述: 该数据集包含来自Internshala的实习职位列表数据,记录了不同公司提供的实习机会的详细信息。主要特征如下: 时间跨度:数据记录的时间范围为当前或最近一段时间。... -
古兰经短节选元数据数据集AyatLessThan30SecsMetadataDataset-omartariq612
古兰经短节选元数据数据集AyatLessThan30SecsMetadataDataset-omartariq612 数据来源:互联网公开数据 标签:古兰经,元数据,数据集,文本分析,伊斯兰研究,数据挖掘,宗教文献,自然语言处理 数据概述: 该数据集包含古兰经中时长不超过30秒的经文节选的元数据,记录了这些短节选的详细信息。主要特征如下:... -
泰米尔语二分类推文数据集TamilBinaryClassification1kTweetsLabelsv1-kracekumar
泰米尔语二分类推文数据集TamilBinaryClassification1kTweetsLabelsv1-kracekumar 数据来源:互联网公开数据 标签:自然语言处理,泰米尔语,数据集,情感分析,机器学习,文本分类,社交媒体,二分类 数据概述:... -
科研论文数据分析集ArXiv论文数据集2023-hhgttg
科研论文数据分析集ArXiv论文数据集2023-hhgttg 数据来源:互联网公开数据 标签:科研论文,数据集,机器学习,自然语言处理,学术研究,文本分析,知识图谱,信息检索 数据概述: 该数据集包含来自ArXiv的10000篇科研论文数据,记录了论文的主要信息,包括标题,作者,摘要,主题分类,引用次数等。主要特征如下:... -
新冠疫情推文分类数据集COVID-19TweetClassificationDataset-makhloufsabir
新冠疫情推文分类数据集COVID-19TweetClassificationDataset-makhloufsabir 数据来源:互联网公开数据 标签:社交媒体,文本分类,数据集,机器学习,疫情研究,自然语言处理,公共卫生,情感分析 数据概述:... -
土耳其国防新闻数据集TRTHaberSavunmaNewsDataset-denizhanahin
土耳其国防新闻数据集TRTHaberSavunmaNewsDataset-denizhanahin 数据来源:互联网公开数据 标签:新闻数据,国防领域,数据集,文本分析,机器学习,自然语言处理,新闻监测,安全研究 数据概述: 该数据集包含来自土耳其TRT Haber电视台的国防相关新闻数据,记录了与国防,军事和安全相关的新闻报道。主要特征如下:... -
LLM序列生成任务1千条验证集预测结果数据集LLMSEQGEN-1KValPredsDataset-illidan7
LLM序列生成任务1千条验证集预测结果数据集LLMSEQGEN-1KValPredsDataset-illidan7 数据来源:互联网公开数据 标签:自然语言处理,序列生成,数据集,语言模型,机器学习,文本分析,人工智能,预测任务 数据概述:... -
计算机科学领域论文研究方向数据集DBLP-jakboss
计算机科学领域论文研究方向数据集DBLP-jakboss 数据来源:互联网公开数据 标签:学术研究,计算机科学,论文,数据集,关键词分析,文本挖掘,自然语言处理,信息检索 数据概述:该数据集包含来自DBLP(Digital Bibliography & Library... -
推特情感分析项目数据集TwitterSentimentProjectDataset-anupamapathirana
推特情感分析项目数据集TwitterSentimentProjectDataset-anupamapathirana 数据来源:互联网公开数据 标签:情感分析,社交媒体,数据集,自然语言处理,机器学习,社会研究,舆情监控,公众意见 数据概述:该数据集包含来自推特平台的推文数据,主要用于情感分析任务,记录了用户的公开评论和意见。主要特征如下:... -
英语语言理解能力评估数据集ELI5ScorerTrainDataAdditional-ratthachat
英语语言理解能力评估数据集ELI5ScorerTrainDataAdditional-ratthachat 数据来源:互联网公开数据 标签:自然语言处理,数据集,语言理解,机器学习,文本分析,教育技术,人工智能,模型训练 数据概述: 该数据集包含来自ELI5项目的附加训练数据,用于英语语言理解能力的评估和模型训练。主要特征如下:...