-
摩洛哥阿拉伯语新闻文章数据集MNAD-jmourad100
2025年5月31日 30 143 54
摩洛哥阿拉伯语新闻文章数据集MNAD-jmourad100 数据来源:互联网公开数据 标签:阿拉伯语,新闻文章,文本分类,自然语言处理,数据挖掘,信息检索,摩洛哥,文本分析 数据概述: MNAD(Moroccan News Articles... -
雅虎问答主题分类数据集-2011至2021年
2025年5月31日 30 90 71
雅虎问答主题分类数据集-2011至2021年 数据来源:互联网公开数据 标签:雅虎问答,主题分类,自然语言处理,信息检索,推荐系统,机器学习,文本分析 数据概述: 本数据集包含从雅虎问答平台收集的有关多个主题的问题及其最佳答案。数据集包括以下几个字段: - topic:问题所属的主题或类别。 - question_title:问题的标题或简短描述。 -... -
土耳其主要新闻网站站点地图信息数据集-2020年5月-eliasdabbas
2025年5月31日 30 4 3
土耳其主要新闻网站站点地图信息数据集-2020年5月-eliasdabbas 数据来源:互联网公开数据 标签:新闻网站,土耳其,站点地图,网页链接,新闻媒体,网络数据,内容聚合,信息检索 数据概述:... -
法律文本问答数据集LegalDocumentQuestionAnswering-ictworld
2025年5月31日 30 107 90
法律文本问答数据集LegalDocumentQuestionAnswering-ictworld 数据来源:互联网公开数据 标签:法律文本, 问答系统, 自然语言处理, 信息检索, 知识库, 文本理解, 越南语, 数据集 数据概述: 该数据集包含来自法律文本的问答对,记录了越南语环境下与法律文件相关的问答内容。主要特征如下:... -
金融文本信息相关性分析数据集FinancialTextInformationRelevanceAnalysis-nguynthlong4912
2025年5月31日 30 136 7
金融文本信息相关性分析数据集FinancialTextInformationRelevanceAnalysis-nguynthlong4912 数据来源:互联网公开数据 标签:金融文本, 文本相关性, 数据挖掘, 机器学习, 自然语言处理, 文本分析, 信息检索, 财务分析 数据概述:... -
印度法院判决书文本摘要数据集IndianCourtJudgmentsTextSummarizationDataset-omsinghchandel
2025年5月31日 30 99 12
印度法院判决书文本摘要数据集IndianCourtJudgmentsTextSummarizationDataset-omsinghchandel 数据来源:互联网公开数据 标签:法律文本, 判决书, 文本摘要, 自然语言处理, 法律分析, 文本分析, 机器学习, 信息检索 数据概述:... -
俄罗斯新闻文本数据分析数据集RussianNewsTextDataAnalysis-asdasdsadasdsasdasd
2025年5月30日 30 172 169
俄罗斯新闻文本数据分析数据集RussianNewsTextDataAnalysis-asdasdsadasdsasdasd 数据来源:互联网公开数据 标签:新闻文本, 俄罗斯, 文本分析, 自然语言处理, 新闻内容, 文本分类, 信息检索, 舆情分析 数据概述:... -
安然公司邮件与财务报告数据集EnronEmailandFinancialReportsDataset-aaadag
2025年5月30日 30 97 66
安然公司邮件与财务报告数据集EnronEmailandFinancialReportsDataset-aaadag 数据来源:互联网公开数据 标签:安然公司, 邮件, 财务报告, 文本分析, 信息检索, 电子邮件, 商业, 数据挖掘 数据概述:... -
学术论文文本摘要分析数据集AcademicPaperTextAbstractAnalysis-ukjadoon
2025年5月30日 30 117 50
学术论文文本摘要分析数据集AcademicPaperTextAbstractAnalysis-ukjadoon 数据来源:互联网公开数据 标签:学术论文, 文本分析, 自然语言处理, 摘要生成, 文本挖掘, 信息检索, 学术研究, 机器学习 数据概述: 该数据集包含来自学术论文的数据,记录了论文的标题、摘要和正文内容。主要特征如下:... -
扎罗人工智能2021法律文本检索数据集ZaloAI2021LegalTextRetrievalDataset-hariwh0
2025年5月30日 30 84 64
扎罗人工智能2021法律文本检索数据集ZaloAI2021LegalTextRetrievalDataset-hariwh0 数据来源:互联网公开数据 标签:法律文本,检索,自然语言处理,数据集,信息检索,语义匹配,越南语,人工智能 数据概述: 该数据集由扎罗人工智能(Zalo... -
芬兰文本语料库2010-2020数据集-haaldrin
2025年5月30日 30 111 110
芬兰文本语料库2010-2020数据集-haaldrin 数据来源:互联网公开数据 标签:文本语料库,自然语言处理,数据集,芬兰语,学术研究,语言学,机器学习,信息检索 数据概述:该数据集包含来自芬兰的文本数据,记录了2010年至2020年期间的多种类型的芬兰语文本。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
维基百科计算机科学文章数据集-mohamedamgad2002
2025年5月30日 30 82 66
维基百科计算机科学文章数据集-mohamedamgad2002 数据来源:互联网公开数据 标签:计算机科学,维基百科,数据集,文本分析,自然语言处理,信息检索,学术研究,知识图谱 数据概述: 该数据集包含了维基百科上关于计算机科学领域的文章数据,旨在为计算机科学领域的研究和应用提供支持。主要特征如下:... -
BERT语义匹配索赔数据集Sim-BERTClaimDataset-hhhurenyuan
2025年5月30日 30 206 35
BERT语义匹配索赔数据集Sim-BERTClaimDataset-hhhurenyuan 数据来源:互联网公开数据 标签:自然语言处理,文本匹配,数据集,机器学习,语义分析,索赔处理,信息检索,人工智能 数据概述:该数据集包含来自多个来源的索赔文本数据,记录了索赔文本及其相似性匹配对,适用于语义匹配和索赔处理任务。主要特征如下:... -
法律领域摘要数据集-valleyy
2025年5月30日 30 71 14
法律领域摘要数据集-valleyy 数据来源:互联网公开数据 标签:法律,数据集,文本摘要,自然语言处理,机器学习,法律文书,信息检索,人工智能 数据概述: 该数据集包含了来自法律领域的文本数据,主要用于文本摘要任务。主要特征如下: 时间跨度: 数据记录的时间范围不限,涵盖了不同时期的法律文书。 地理范围:... -
文本嵌入向量处理数据集-mrwynx
2025年5月30日 30 151 19
文本嵌入向量处理数据集-mrwynx 数据来源:互联网公开数据 标签:自然语言处理,文本分析,嵌入向量,数据集,机器学习,语义分析,信息检索,向量空间 数据概述: 该数据集包含了经过处理的文本嵌入向量,旨在用于各种自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间跨度不限,取决于原始文本数据的时间范围。... -
社交媒体虚假新闻检测数据集SocialMediaFakeNewsDetectionDataset-pornimaveer
2025年5月30日 30 194 72
社交媒体虚假新闻检测数据集SocialMediaFakeNewsDetectionDataset-pornimaveer 数据来源:互联网公开数据 标签:社交媒体,虚假新闻,NLP,文本分类,机器学习,自然语言处理,信息检索,谣言检测 数据概述: 该数据集包含来自社交媒体平台的文本数据,用于虚假新闻的检测与分析。主要特征如下:... -
泰卢固语维基百科数据数据集TeluguWikipediaDataDataset-asrsaiteja
2025年5月30日 30 111 92
泰卢固语维基百科数据数据集TeluguWikipediaDataDataset-asrsaiteja 数据来源:互联网公开数据 标签:维基百科,泰卢固语,文本分析,自然语言处理,数据集,语言学,信息检索,文本挖掘 数据概述: 该数据集包含来自泰卢固语维基百科的文章数据,记录了泰卢固语维基百科中所有文章的详细信息。主要特征如下:... -
印度新闻头条数据集IndiaNewsHeadlineDataset-srsujon
2025年5月30日 30 38 35
印度新闻头条数据集IndiaNewsHeadlineDataset-srsujon 数据来源:互联网公开数据 标签:新闻头条,数据集,自然语言处理,文本分析,情感分析,机器学习,信息检索,媒体研究 数据概述:该数据集包含来自印度主要新闻媒体的新闻头条数据,记录了不同时间段的新闻标题。主要特征如下: 时间跨度:数据记录的时间范围从2013年到2022年。... -
arXiv论文数据集arXivDataset-abhishekydav
2025年5月30日 30 92 35
arXiv论文数据集arXivDataset-abhishekydav 数据来源:互联网公开数据 标签:arXiv, 论文数据, 机器学习, 数据挖掘, 学术研究, 自然语言处理, 科技文献, 信息检索 数据概述:该数据集包含来自arXiv的学术论文数据,记录了大量科学和技术领域的研究论文信息。主要特征如下:... -
俄罗斯新闻文本数据集Lenta-FontankaDataset-hosstell
2025年5月30日 30 44 23
俄罗斯新闻文本数据集Lenta-FontankaDataset-hosstell 数据来源:互联网公开数据 标签:新闻文本,自然语言处理,文本分析,情感分析,俄语,数据集,文本分类,信息检索 数据概述: 该数据集包含了来自Lenta.ru和Fontanka.ru两个俄罗斯新闻网站的文本数据,记录了新闻文章的详细信息。主要特征如下:...