找到594个数据集

标签: 信息检索

过滤结果
  • 安然公司电子邮件数据集20-样本-adriancampos

    2025年5月28日   

    安然公司电子邮件数据集20-样本-adriancampos 数据来源:互联网公开数据 标签:电子邮件,数据集,安然公司,文本分析,自然语言处理,信息检索,欺诈检测,公司治理 数据概述: 该数据集包含来自安然公司(Enron)员工的电子邮件数据,是原始数据集的20%样本。主要特征如下: 时间跨度:数据记录的时间范围主要集中在2000年至2002年之间。...
    packageimg
  • 计算机科学文献引用数据集Dblpv13拆分版-nikitamineev

    2025年5月28日   

    计算机科学文献引用数据集Dblpv13拆分版-nikitamineev 数据来源:互联网公开数据 标签:计算机科学,文献引用,数据集,学术研究,自然语言处理,文本挖掘,信息检索,机器学习 数据概述:该数据集来源于DBLP(Digital Bibliography & Library...
    packageimg
  • 农民查询分析数据集KisanQueryAnalysisDataset-anirudhvadakedath

    2025年5月28日   

    农民查询分析数据集KisanQueryAnalysisDataset-anirudhvadakedath 数据来源:互联网公开数据 标签:农业,数据集,查询分析,自然语言处理,数据挖掘,语义分析,农民服务,信息检索 数据概述: 该数据集包含来自Kisan平台的用户查询数据,记录了农民在平台上提出的各种问题。主要特征如下:...
    packageimg
  • 虚假新闻检测数据集GottobeFakeData-nikhilkottoli

    2025年5月28日   

    虚假新闻检测数据集GottobeFakeData-nikhilkottoli 数据来源:互联网公开数据 标签:虚假新闻,数据集,自然语言处理,文本分析,机器学习,信息检索,新闻媒体,谣言识别 数据概述: 该数据集包含用于虚假新闻检测的数据,记录了新闻文章的真实性标签和相关文本内容。主要特征如下:...
    packageimg
  • 卷积神经网络CNN新闻摘要数据集SmallCNNDailyMailDataset-hoangvanan

    2025年5月28日   

    卷积神经网络CNN新闻摘要数据集SmallCNNDailyMailDataset-hoangvanan 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,卷积神经网络,新闻文章,数据集,深度学习,机器翻译,信息检索 数据概述: 该数据集基于 CNN 和 Daily Mail 新闻文章,用于文本摘要任务。主要特征如下:...
    packageimg
  • 标题:Samthemar 输出总结数据集(Samthemar Outputs Summarization Dataset)

    2025年5月28日   

    标题:Samthemar 输出总结数据集(Samthemar Outputs Summarization Dataset) 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器学习,信息检索,文本分析,深度学习,总结 数据概述:该数据集包含来自Samthemar项目的输出总结数据,记录了各种文本的摘要信息。主要特征如下:...
    packageimg
  • rag-copy数据集-friedeggs01

    2025年5月28日   

    rag-copy数据集-friedeggs01 数据来源:互联网公开数据 标签:自然语言处理,信息检索,文本生成,深度学习,机器学习,人工智能 数据概述: 该数据集包含来自多个公开来源的文本数据,记录了文本生成和信息检索的相关内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。...
    packageimg
  • 检索增强生成数据集Retrieval-AugmentedGenerationDataset-sanjarbek1

    2025年5月28日   

    检索增强生成数据集Retrieval-AugmentedGenerationDataset-sanjarbek1 数据来源:互联网公开数据 标签:自然语言处理,人工智能,数据集,信息检索,文本生成,机器学习,知识增强,语义理解 数据概述: 该数据集包含用于检索增强生成(Retrieval-Augmented...
    packageimg
  • BKAI文档数据集BKAIDocumentDataset-phucnguyenlamp

    2025年5月28日   

    BKAI文档数据集BKAIDocumentDataset-phucnguyenlamp 数据来源:互联网公开数据 标签:BKAI,文档处理,数据集,自然语言处理,机器学习,文本分析,信息检索,人工智能 数据概述:该数据集包含来自BKAI的文档数据,记录了多种类型的文档信息,适用于自然语言处理和机器学习任务。主要特征如下:...
    packageimg
  • 文档检索数据集Retrieval-DocumentDataset-hlv305

    2025年5月28日   

    文档检索数据集Retrieval-DocumentDataset-hlv305 数据来源:互联网公开数据 标签:文档检索,数据集,信息检索,自然语言处理,机器学习,文本分析,人工智能,搜索引擎 数据概述: 该数据集包含来自多个来源的文档数据,记录了文档内容及其相关检索信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 深度排名数据集DeepRankingDataset-asad1m9a9h6mood

    2025年5月28日   

    深度排名数据集DeepRankingDataset-asad1m9a9h6mood 数据来源:互联网公开数据 标签:深度学习,排名,数据集,信息检索,推荐系统,排序算法,机器学习,自然语言处理 数据概述: 该数据集包含用于深度学习排序任务的数据,旨在评估和改进各种排序算法。主要特征如下: 时间跨度:...
    packageimg
  • 新闻处理数据集NewsProcessedDataset-alice6fox

    2025年5月28日   

    新闻处理数据集NewsProcessedDataset-alice6fox 数据来源:互联网公开数据 标签:新闻处理,数据集,文本分析,自然语言处理,机器学习,文本挖掘,数据分析,信息检索 数据概述:该数据集包含经过处理的新闻文章数据,记录了各类新闻报道的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2015年到2020年。...
    packageimg
  • 数据2024年法律文档检索竞赛SOICTHackathon2024法律文档检索数据集SOICTHackathon2024LegalDocumentRetr...

    2025年5月28日   

    2024年法律文档检索竞赛SOICTHackathon2024法律文档检索数据集SOICTHackathon2024LegalDocumentRetrievalDataset-hhhoang 数据来源:互联网公开数据 标签:法律文档,数据集,信息检索,文本挖掘,机器学习,自然语言处理,人工智能,竞赛数据 数据概述:...
    packageimg
  • 越南语问答数据集VietnameseQuestionAnsweringDataset-minhlcnguyn

    2025年5月28日   

    越南语问答数据集VietnameseQuestionAnsweringDataset-minhlcnguyn 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本匹配, 信息检索, 越南语, 语义理解, 数据集构建, 知识库 数据概述: 该数据集包含来自越南语语料库的问答对,旨在用于训练和评估越南语问答系统。主要特征如下:...
    packageimg
  • 问答信息生成与意图识别数据集QuestionGenerationandIntentRecognitionDataset-kharchoufi

    2025年5月26日   

    问答信息生成与意图识别数据集QuestionGenerationandIntentRecognitionDataset-kharchoufi 数据来源:互联网公开数据 标签:问答生成, 意图识别, 自然语言处理, 文本挖掘, 数据标注, 语义理解, 信息检索, 机器学习 数据概述:...
    packageimg
  • 学术论文摘要分析数据集AcademicPaperAbstractAnalysis-aeyazadil123

    2025年5月18日   

    学术论文摘要分析数据集AcademicPaperAbstractAnalysis-aeyazadil123 数据来源:互联网公开数据 标签:学术论文, 摘要分析, 文本挖掘, 自然语言处理, 信息检索, 机器学习, 文本分类, 语料库 数据概述: 该数据集包含来自学术论文的摘要信息,记录了论文的标题和摘要内容。主要特征如下:...
    packageimg
  • 电子邮件内容主题分析数据集EmailContentTopicAnalysis-aseemshehzad

    2025年5月16日   

    电子邮件内容主题分析数据集EmailContentTopicAnalysis-aseemshehzad 数据来源:互联网公开数据 标签:电子邮件, 文本分析, 主题建模, 自然语言处理, 情感分析, 语料库, 文本挖掘, 信息检索 数据概述: 该数据集包含来自电子邮件内容的数据,记录了邮件正文内容。主要特征如下:...
    packageimg
  • IIITBQuora重复问题检测训练数据集IIITBQuoraStackingTrainSet-shourabhpayal

    2025年5月17日   

    IIITBQuora重复问题检测训练数据集IIITBQuoraStackingTrainSet-shourabhpayal 数据来源:互联网公开数据 标签:Quora, 数据集, 自然语言处理, 重复问题检测, 机器学习, 文本分析, 数据挖掘, 信息检索...
    packageimg
  • 健康医疗问答匹配数据集HealthcareQuestionAnsweringMatchingDataset-takiwyr

    2025年5月14日   

    健康医疗问答匹配数据集HealthcareQuestionAnsweringMatchingDataset-takiwyr 数据来源:互联网公开数据 标签:问答匹配, 自然语言处理, 医疗健康, 文本相似度, 信息检索, 越南语, 数据标注, 机器阅读理解 数据概述:...
    packageimg
  • 能源行业电子邮件语料库数据集EnergyIndustryEmailCorpus-rodrigomller

    2025年5月21日   

    能源行业电子邮件语料库数据集EnergyIndustryEmailCorpus-rodrigomller 数据来源:互联网公开数据 标签:电子邮件, 文本分析, 能源行业, Enron, 语料库, 自然语言处理, 词频统计, 信息检索 数据概述: 该数据集包含来自 Enron...
    packageimg