-
SFU观点与评论语料库
2025年6月1日 30 34 12
SFU观点与评论语料库 数据来源:互联网公开数据 标签:观点分析,在线评论,建设性评论,毒性评论,自然语言处理,意见挖掘,语料库,社交媒体分析 数据概述:... -
西班牙语文学作品数据集
2025年6月1日 30 142 1
西班牙语文学作品数据集 数据来源:互联网公开数据 标签:西班牙语文学,文本数据,书籍,短篇故事,语料库,语言学习,文学分析 数据概述: 本数据集包含9000多本西班牙语的书籍、短篇故事和文本,涵盖了丰富多样的文学作品。数据集旨在为西班牙语学习者、研究者和开发者提供一个高质量的文本资源,支持语言学习、文学研究和自然语言处理任务。 数据用途概述:... -
古腾堡诗歌项目诗歌文本数据集-terminate9298
2025年6月1日 30 45 22
古腾堡诗歌项目诗歌文本数据集-terminate9298 数据来源:互联网公开数据 标签:诗歌,文学,文本,古腾堡项目,语料库,自然语言处理,文本分析,诗歌创作,情感分析 数据概述: 本数据集收录了来自古腾堡项目(Gutenberg Project)的诗歌文本,包含2703086行句子。数据集由Allison... -
Coursera数据科学专项课程数据集-文本内容分析-英语语料库
2025年6月1日 30 140 34
Coursera数据科学专项课程数据集-文本内容分析-英语语料库 数据来源:互联网公开数据 标签:自然语言处理,文本分析,机器学习,语料库,Coursera,博客,新闻,推特,英语,数据科学 数据概述: 本数据集是Coursera数据科学专项课程的Capstone项目所使用的数据集,其语料库来源于HC... -
印度语短文本摘要语料库数据集
2025年5月31日 30 87 54
印度语短文本摘要语料库数据集 数据来源:互联网公开数据 标签:印度语,文本摘要,新闻文章,自然语言处理,机器学习,语料库 数据概述: 本数据集包含约330,000篇来自印度新闻网站的文章及其标题,是首个用于基准测试的印度语文本摘要数据集。数据集保留了原文中的标点符号、数字等信息,为研究和开发印度语文本摘要技术提供了丰富的数据基础。 数据用途概述:... -
印度最高法院判决书英汉平行语料库数据集-varuthakari
2025年5月31日 30 184 108
印度最高法院判决书英汉平行语料库数据集-varuthakari 数据来源:互联网公开数据 标签:最高法院,判决书,印度,法律,语料库,翻译,英汉,司法,印度Kanoon, IndicTrans2 数据概述: 本数据集是一个英汉平行语料库,内容源自印度最高法院的判决书。原始判决书从Indian... -
孟加拉国日报BD-Pratidin新闻数据集-2017年12月13日至2020年9月9日-shakirulhasan
2025年5月31日 30 50 8
孟加拉国日报BD-Pratidin新闻数据集-2017年12月13日至2020年9月9日-shakirulhasan 数据来源:互联网公开数据 标签:孟加拉语,新闻,文本,自然语言处理,NLP,文本分析,孟加拉国,BD-Pratidin,语料库 数据概述: 本数据集包含了从2017年12月13日至2020年9月9日期间,孟加拉国日报(BD-... -
问答知识库构建与内容检索数据集QuestionAnsweringKnowledgeBaseConstructionandContentRetrievalD...
2025年5月31日 30 131 37
问答知识库构建与内容检索数据集QuestionAnsweringKnowledgeBaseConstructionandContentRetrievalDataset-ouaillaamiri02 数据来源:互联网公开数据 标签:问答系统, 知识库构建, 内容检索, 自然语言处理, 文本分析, 信息抽取, 机器学习, 语料库 数据概述:... -
语法规则解析与文本片段生成数据集GrammarRuleParsingandTextFragmentGeneration-kiiroi
2025年5月31日 30 57 53
语法规则解析与文本片段生成数据集GrammarRuleParsingandTextFragmentGeneration-kiiroi 数据来源:互联网公开数据 标签:自然语言处理, 语法分析, 文本生成, 规则提取, 语料库, 机器学习, 文本片段, 语言模型 数据概述:... -
写作评估与文本生成数据集WritingEvaluationandTextGenerationDataset-openmihirpatel
2025年5月31日 30 56 25
写作评估与文本生成数据集WritingEvaluationandTextGenerationDataset-openmihirpatel 数据来源:互联网公开数据 标签:文本生成, 写作评估, 论文写作, 情感分析, 自然语言处理, 机器学习, 文本分类, 语料库 数据概述:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-programophile
2025年5月31日 30 92 5
电影评论情感分析数据集MovieReviewSentimentAnalysis-programophile 数据来源:互联网公开数据 标签:情感分析, 自然语言处理, 文本分类, 电影评论, 情感极性, 机器学习, 语料库, 深度学习 数据概述:... -
维基百科评论区毒性文本分类数据集WikipediaCommentToxicityClassificationDataset-vineetkumar98
2025年5月31日 30 195 50
维基百科评论区毒性文本分类数据集WikipediaCommentToxicityClassificationDataset-vineetkumar98 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 情感分析, 自然语言处理, 恶意评论, 维基百科, 机器学习, 语料库 数据概述:... -
IMDB电影评论情感分析数据集IMDBMovieReviewsSentimentAnalysis-ikramulkayes
2025年5月31日 30 119 75
IMDB电影评论情感分析数据集IMDBMovieReviewsSentimentAnalysis-ikramulkayes 数据来源:互联网公开数据 标签:情感分析, 自然语言处理, 文本分类, 电影评论, 机器学习, 情感极性, 数据标注, 语料库 数据概述: 该数据集包含来自IMDB(Internet Movie... -
普拉查泰伊新闻文章语料库67k-2004至2018年-ratthachat
2025年5月31日 30 160 107
普拉查泰伊新闻文章语料库67k-2004至2018年-ratthachat 数据来源:互联网公开数据 标签:普拉查泰伊,新闻文章,语料库,泰语,文本分类,多标签分类,政治,人权,生活质量,国际,社会,环境,经济,文化,劳工,国家安全,ICT,教育 数据概述:... -
社交媒体情感分析文本数据集SocialMediaSentimentAnalysisTextData-dothily
2025年5月31日 30 4 0
社交媒体情感分析文本数据集SocialMediaSentimentAnalysisTextData-dothily 数据来源:互联网公开数据 标签:情感分析, 文本分类, 社交媒体, 自然语言处理, 情绪识别, 数据标注, 机器学习, 语料库 数据概述:... -
视频内容主题分类文本数据集VideoContentTopicClassificationTextDataset-liumail511
2025年5月31日 30 42 23
视频内容主题分类文本数据集VideoContentTopicClassificationTextDataset-liumail511 数据来源:互联网公开数据 标签:文本分类, 视频内容分析, 主题识别, 自然语言处理, 机器学习, 数据清洗, 语料库, 知识图谱 数据概述:... -
越南诗歌内容分析数据集VietnamesePoemsContentAnalysisDataset-nhotin
2025年5月31日 30 75 60
越南诗歌内容分析数据集VietnamesePoemsContentAnalysisDataset-nhotin 数据来源:互联网公开数据 标签:诗歌, 越南语, 文本分析, 内容分析, 情感分析, 诗歌流派, 语料库, 自然语言处理 数据概述:... -
多语言平行文本翻译质量评估数据集MultilingualParallelTextTranslationQualityAssessment-danghoan...
2025年5月31日 30 75 43
多语言平行文本翻译质量评估数据集MultilingualParallelTextTranslationQualityAssessment-danghoangthai1507 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 质量评估, 语料库, 翻译质量, 自然语言处理, 文本对齐, 深度学习 数据概述:...