找到594个数据集

分类: 互联网数据 标签: 信息检索

过滤结果
  • 孟加拉语新闻分类数据集1963-2021

    2025年4月14日 60 82 18

    孟加拉语新闻分类数据集1963-2021 数据来源:互联网公开数据 标签:孟加拉语,新闻分类,NLP,机器学习,文本分析,情感分析,信息检索,语言建模 数据概述: 本数据集收录了来自Jamuna...
    packageimg
  • 俄罗斯StackExchange数据集

    2025年6月4日 30 128 92

    俄罗斯StackExchange数据集 数据来源:互联网公开数据 标签:用户贡献的帖子,问答社区,自然语言处理,信息检索,文本分析,数据挖掘,网络数据 数据概述: 本数据集是匿名化的俄罗斯Stack Exchange用户贡献帖子集合,包含了该平台所有用户生成的内容,涵盖问答、讨论、问题解答等多方面信息。 数据用途概述:...
    packageimg
  • 多语言歌词音乐流派分类数据集-mateibejan

    2025年6月1日 30 199 120

    多语言歌词音乐流派分类数据集-mateibejan 数据来源:互联网公开数据 标签:多语言,歌词,音乐流派,文本挖掘,信息检索,语言检测,音乐分类 数据概述:...
    packageimg
  • 维基百科-事物-主题相关页面数据分析数据集

    2025年6月1日 30 156 58

    维基百科-事物-主题相关页面数据分析数据集 数据来源:互联网公开数据 标签:维基百科,事物,知识图谱,文本分析,自然语言处理,主题分类,信息检索 数据概述:...
    packageimg
  • 摩洛哥阿拉伯语新闻文章数据集MNAD-jmourad100

    2025年5月31日 30 105 84

    摩洛哥阿拉伯语新闻文章数据集MNAD-jmourad100 数据来源:互联网公开数据 标签:阿拉伯语,新闻文章,文本分类,自然语言处理,数据挖掘,信息检索,摩洛哥,文本分析 数据概述: MNAD(Moroccan News Articles...
    packageimg
  • 雅虎问答主题分类数据集-2011至2021年

    2025年5月31日 30 79 48

    雅虎问答主题分类数据集-2011至2021年 数据来源:互联网公开数据 标签:雅虎问答,主题分类,自然语言处理,信息检索,推荐系统,机器学习,文本分析 数据概述: 本数据集包含从雅虎问答平台收集的有关多个主题的问题及其最佳答案。数据集包括以下几个字段: - topic:问题所属的主题或类别。 - question_title:问题的标题或简短描述。 -...
    packageimg
  • 土耳其主要新闻网站站点地图信息数据集-2020年5月-eliasdabbas

    2025年5月31日 30 5 3

    土耳其主要新闻网站站点地图信息数据集-2020年5月-eliasdabbas 数据来源:互联网公开数据 标签:新闻网站,土耳其,站点地图,网页链接,新闻媒体,网络数据,内容聚合,信息检索 数据概述:...
    packageimg
  • 法律文本问答数据集LegalDocumentQuestionAnswering-ictworld

    2025年5月31日 30 48 23

    法律文本问答数据集LegalDocumentQuestionAnswering-ictworld 数据来源:互联网公开数据 标签:法律文本, 问答系统, 自然语言处理, 信息检索, 知识库, 文本理解, 越南语, 数据集 数据概述: 该数据集包含来自法律文本的问答对,记录了越南语环境下与法律文件相关的问答内容。主要特征如下:...
    packageimg
  • 金融文本信息相关性分析数据集FinancialTextInformationRelevanceAnalysis-nguynthlong4912

    2025年5月31日 30 87 12

    金融文本信息相关性分析数据集FinancialTextInformationRelevanceAnalysis-nguynthlong4912 数据来源:互联网公开数据 标签:金融文本, 文本相关性, 数据挖掘, 机器学习, 自然语言处理, 文本分析, 信息检索, 财务分析 数据概述:...
    packageimg
  • 印度法院判决书文本摘要数据集IndianCourtJudgmentsTextSummarizationDataset-omsinghchandel

    2025年5月31日 30 102 93

    印度法院判决书文本摘要数据集IndianCourtJudgmentsTextSummarizationDataset-omsinghchandel 数据来源:互联网公开数据 标签:法律文本, 判决书, 文本摘要, 自然语言处理, 法律分析, 文本分析, 机器学习, 信息检索 数据概述:...
    packageimg
  • 俄罗斯新闻文本数据分析数据集RussianNewsTextDataAnalysis-asdasdsadasdsasdasd

    2025年5月30日 30 21 19

    俄罗斯新闻文本数据分析数据集RussianNewsTextDataAnalysis-asdasdsadasdsasdasd 数据来源:互联网公开数据 标签:新闻文本, 俄罗斯, 文本分析, 自然语言处理, 新闻内容, 文本分类, 信息检索, 舆情分析 数据概述:...
    packageimg
  • 安然公司邮件与财务报告数据集EnronEmailandFinancialReportsDataset-aaadag

    2025年5月30日 30 13 0

    安然公司邮件与财务报告数据集EnronEmailandFinancialReportsDataset-aaadag 数据来源:互联网公开数据 标签:安然公司, 邮件, 财务报告, 文本分析, 信息检索, 电子邮件, 商业, 数据挖掘 数据概述:...
    packageimg
  • 学术论文文本摘要分析数据集AcademicPaperTextAbstractAnalysis-ukjadoon

    2025年5月30日 30 76 61

    学术论文文本摘要分析数据集AcademicPaperTextAbstractAnalysis-ukjadoon 数据来源:互联网公开数据 标签:学术论文, 文本分析, 自然语言处理, 摘要生成, 文本挖掘, 信息检索, 学术研究, 机器学习 数据概述: 该数据集包含来自学术论文的数据,记录了论文的标题、摘要和正文内容。主要特征如下:...
    packageimg
  • 扎罗人工智能2021法律文本检索数据集ZaloAI2021LegalTextRetrievalDataset-hariwh0

    2025年5月30日 30 28 12

    扎罗人工智能2021法律文本检索数据集ZaloAI2021LegalTextRetrievalDataset-hariwh0 数据来源:互联网公开数据 标签:法律文本,检索,自然语言处理,数据集,信息检索,语义匹配,越南语,人工智能 数据概述: 该数据集由扎罗人工智能(Zalo...
    packageimg
  • 芬兰文本语料库2010-2020数据集-haaldrin

    2025年5月30日 30 86 70

    芬兰文本语料库2010-2020数据集-haaldrin 数据来源:互联网公开数据 标签:文本语料库,自然语言处理,数据集,芬兰语,学术研究,语言学,机器学习,信息检索 数据概述:该数据集包含来自芬兰的文本数据,记录了2010年至2020年期间的多种类型的芬兰语文本。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 维基百科计算机科学文章数据集-mohamedamgad2002

    2025年5月30日 30 11 8

    维基百科计算机科学文章数据集-mohamedamgad2002 数据来源:互联网公开数据 标签:计算机科学,维基百科,数据集,文本分析,自然语言处理,信息检索,学术研究,知识图谱 数据概述: 该数据集包含了维基百科上关于计算机科学领域的文章数据,旨在为计算机科学领域的研究和应用提供支持。主要特征如下:...
    packageimg
  • BERT语义匹配索赔数据集Sim-BERTClaimDataset-hhhurenyuan

    2025年5月30日 30 131 58

    BERT语义匹配索赔数据集Sim-BERTClaimDataset-hhhurenyuan 数据来源:互联网公开数据 标签:自然语言处理,文本匹配,数据集,机器学习,语义分析,索赔处理,信息检索,人工智能 数据概述:该数据集包含来自多个来源的索赔文本数据,记录了索赔文本及其相似性匹配对,适用于语义匹配和索赔处理任务。主要特征如下:...
    packageimg
  • 法律领域摘要数据集-valleyy

    2025年5月30日 30 133 1

    法律领域摘要数据集-valleyy 数据来源:互联网公开数据 标签:法律,数据集,文本摘要,自然语言处理,机器学习,法律文书,信息检索,人工智能 数据概述: 该数据集包含了来自法律领域的文本数据,主要用于文本摘要任务。主要特征如下: 时间跨度: 数据记录的时间范围不限,涵盖了不同时期的法律文书。 地理范围:...
    packageimg
  • 文本嵌入向量处理数据集-mrwynx

    2025年5月30日 30 206 44

    文本嵌入向量处理数据集-mrwynx 数据来源:互联网公开数据 标签:自然语言处理,文本分析,嵌入向量,数据集,机器学习,语义分析,信息检索,向量空间 数据概述: 该数据集包含了经过处理的文本嵌入向量,旨在用于各种自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间跨度不限,取决于原始文本数据的时间范围。...
    packageimg
  • 社交媒体虚假新闻检测数据集SocialMediaFakeNewsDetectionDataset-pornimaveer

    2025年5月30日 30 10 1

    社交媒体虚假新闻检测数据集SocialMediaFakeNewsDetectionDataset-pornimaveer 数据来源:互联网公开数据 标签:社交媒体,虚假新闻,NLP,文本分类,机器学习,自然语言处理,信息检索,谣言检测 数据概述: 该数据集包含来自社交媒体平台的文本数据,用于虚假新闻的检测与分析。主要特征如下:...
    packageimg