找到594个数据集

标签: 信息检索

过滤结果
  • 新闻数据集Well-ShuffledNewsDataset-nushrathussain

    2025年4月26日   

    新闻数据集Well-ShuffledNewsDataset-nushrathussain 数据来源:互联网公开数据 标签:新闻,数据集,自然语言处理,文本分析,机器学习,信息检索,数据分析,社会科学研究 数据概述: 该数据集包含来自多个来源的新闻文章,记录了不同类型和主题的新闻内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 金融问答多跳推理数据集FinanceQAMultihopDataset-beyondhorizon19

    2025年4月26日   

    金融问答多跳推理数据集FinanceQAMultihopDataset-beyondhorizon19 数据来源:互联网公开数据 标签:金融问答,多跳推理,数据集,自然语言处理,机器学习,问答系统,金融分析,信息检索 数据概述:该数据集包含来自多个金融领域的问答数据,特别适用于需要多步推理的复杂金融问题解答。主要特征如下:...
    packageimg
  • 文本分类数据集TextClassificationData-nbviet

    2025年4月26日   

    文本分类数据集TextClassificationData-nbviet 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,情感分析,主题建模,信息检索,文本挖掘 数据概述: 该数据集包含来自多个来源的文本数据,用于文本分类任务。主要特征如下: 时间跨度:数据记录的时间范围不定,取决于具体来源。...
    packageimg
  • 垃圾邮件分类数据集SpamClassificationData-dkhalidashik

    2025年4月25日   

    垃圾邮件分类数据集SpamClassificationData-dkhalidashik 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,数据集,自然语言处理,机器学习,文本挖掘,邮件过滤,信息检索 数据概述: 该数据集包含用于垃圾邮件分类的文本数据,记录了大量邮件及其对应的标签,用于训练和评估垃圾邮件检测模型。主要特征如下:...
    packageimg
  • 自然语言处理任务问答数据集NewQAT5Dataset-hritik619916

    2025年4月25日   

    自然语言处理任务问答数据集NewQAT5Dataset-hritik619916 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器学习,文本分析,信息检索,深度学习,人工智能 数据概述:该数据集包含来自多个来源的问答对数据,适用于自然语言处理领域的问答系统训练和研究。主要特征如下:...
    packageimg
  • 垃圾邮件分类数据集EmailSpamClassificationDataset-harshsinha1234

    2025年4月25日   

    垃圾邮件分类数据集EmailSpamClassificationDataset-harshsinha1234 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,文本分析,机器学习,自然语言处理,文本挖掘,数据预处理,信息检索 数据概述: 该数据集包含来自互联网的电子邮件数据,用于垃圾邮件的分类研究。主要特征如下:...
    packageimg
  • 虚假新闻检测数据集-habibmrad1983

    2025年4月25日   

    虚假新闻检测数据集-habibmrad1983 数据来源:互联网公开数据 标签:虚假新闻,自然语言处理,文本分类,机器学习,新闻分析,信息检索,数据集,社交媒体 数据概述:该数据集包含来自多个来源的虚假新闻和真实新闻数据,旨在用于虚假新闻的检测和分析。主要特征如下: 时间跨度:数据的时间跨度不固定,涵盖了不同时期的新闻文章。...
    packageimg
  • 罗马新闻文本数据集News-RomanDataset-zeshanali

    2025年4月25日   

    罗马新闻文本数据集News-RomanDataset-zeshanali 数据来源:互联网公开数据 标签:新闻文本,自然语言处理,文本分析,情感分析,信息检索,文本分类,机器学习,意大利语 数据概述: 该数据集包含来自罗马地区新闻网站的文本数据,记录了各类新闻文章的内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 软件使用说明数据集SoftwareInstructionsDataset-omarayman67

    2025年4月25日   

    软件使用说明数据集SoftwareInstructionsDataset-omarayman67 数据来源:互联网公开数据 标签:软件使用说明,数据集,用户手册,技术支持,自然语言处理,机器翻译,信息检索,用户体验 数据概述: 该数据集包含了多种软件的使用说明和用户手册,适用于自然语言处理,机器翻译,信息检索等任务。主要特征如下:...
    packageimg
  • 泰米尔语新闻分类数据集TamilNewsCategoryDataset-vigneshvit

    2025年4月25日   

    泰米尔语新闻分类数据集TamilNewsCategoryDataset-vigneshvit 数据来源:互联网公开数据 标签:新闻分类,泰米尔语,数据集,自然语言处理,文本分析,机器学习,信息检索,语言技术 数据概述: 该数据集包含来自泰米尔语新闻媒体的数据,记录了不同类别的泰米尔语新闻文章。主要特征如下:...
    packageimg
  • 德国邮件XML数据集GermanEmailsinXMLDataset-jordanrich

    2025年4月25日   

    德国邮件XML数据集GermanEmailsinXMLDataset-jordanrich 数据来源:互联网公开数据 标签:电子邮件,数据集,XML格式,文本分析,邮件挖掘,自然语言处理,数据挖掘,信息检索 数据概述: 该数据集包含来自德国的电子邮件数据,记录了各类邮件的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2010年。...
    packageimg
  • 文档摘要对数据集Document-AbstractPairsDataset-sark07

    2025年4月25日   

    文档摘要对数据集Document-AbstractPairsDataset-sark07 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,深度学习,文本生成,机器翻译,信息检索,NLP 数据概述: 该数据集包含文档及其对应的摘要,旨在用于文本摘要生成任务。主要特征如下: 时间跨度: 数据记录的时间范围不固定,取决于原始文档的发布时间。...
    packageimg
  • 印度问答生物医学数据集HindiQnABiomedicalDataset-jaydee29

    2025年4月25日   

    印度问答生物医学数据集HindiQnABiomedicalDataset-jaydee29 数据来源:互联网公开数据 标签:生物医学,问答系统,自然语言处理,印地语,数据集,信息检索,医学,人工智能 数据概述: 该数据集包含来自印度问答系统的数据,主要聚焦于生物医学领域,旨在支持印地语的医学问答任务。主要特征如下:...
    packageimg
  • 路透社新闻文章分类数据集Reuters-21578ArticleClassificationDataset-mateuszkrasinski9

    2025年4月25日   

    路透社新闻文章分类数据集Reuters-21578ArticleClassificationDataset-mateuszkrasinski9 数据来源:互联网公开数据 标签:新闻文本,文本分类,机器学习,自然语言处理,数据集,信息检索,语料库,路透社 数据概述: 该数据集包含来自路透社的新闻文章,主要用于文本分类任务。主要特征如下:...
    packageimg
  • 数据库上下文分析数据集DBContextoDataset-nicolaspuente

    2025年4月25日   

    数据库上下文分析数据集DBContextoDataset-nicolaspuente 数据来源:互联网公开数据 标签:数据库,上下文分析,数据集,数据分析,机器学习,信息检索,数据库管理,数据挖掘 数据概述: 该数据集包含来自多个数据库的上下文信息,记录了数据库操作和查询的相关数据。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • Twitter与谷歌样本搜索数据集TwitterandGoogleSampleSearchesDataset-mnumberej

    2025年4月25日   

    Twitter与谷歌样本搜索数据集TwitterandGoogleSampleSearchesDataset-mnumberej 数据来源:互联网公开数据 标签:社交媒体,搜索引擎,数据集,用户行为,数据分析,机器学习,信息检索,网络分析 数据概述:...
    packageimg
  • 维基百科页面信息数据集WikipediaPageInformationDataset-mugentk

    2025年4月25日   

    维基百科页面信息数据集WikipediaPageInformationDataset-mugentk 数据来源:互联网公开数据 标签:维基百科,数据集,文本分析,自然语言处理,知识图谱,信息检索,数据挖掘,语义分析 数据概述: 该数据集包含来自维基百科的页面信息,记录了维基百科中各个页面的详细信息。主要特征如下:...
    packageimg
  • 乔什-麦肯尼提交数据集1JoshMckenneySubmission1Dataset-jmckenney1

    2025年4月25日   

    乔什-麦肯尼提交数据集1JoshMckenneySubmission1Dataset-jmckenney1 数据来源:互联网公开数据 标签:数据集,提交记录,文本分析,机器学习,数据挖掘,自然语言处理,学术研究,信息检索 数据概述: 该数据集包含来自乔什·麦肯尼提交的记录数据,记录了特定提交内容的相关信息。主要特征如下:...
    packageimg
  • 搜索关键词分类数据集-jahangirraina

    2025年4月25日   

    搜索关键词分类数据集-jahangirraina 数据来源:互联网公开数据 标签:文本分类,关键词分析,自然语言处理,数据集,机器学习,信息检索,数据挖掘,语义分析 数据概述: 该数据集包含大量搜索关键词及其对应的分类标签,用于训练和评估文本分类模型。主要特征如下: 时间跨度:数据无明确的时间范围,通常为近期收集的关键词。...
    packageimg
  • 垃圾邮件过滤数据集SpamData1-dafniskrasniqi

    2025年4月25日   

    垃圾邮件过滤数据集SpamData1-dafniskrasniqi 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,自然语言处理,机器学习,数据集,邮件分析,信息检索,恶意内容检测 数据概述: 该数据集包含了大量电子邮件数据,用于垃圾邮件的检测与过滤。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但涵盖了电子邮件发展早期至今的时期。...
    packageimg