找到594个数据集

标签: 信息检索

过滤结果
  • 包含独立视频和独立图像的网页数据集-phueffer

    2025年5月16日   

    包含独立视频和独立图像的网页数据集-phueffer 数据来源:互联网公开数据 标签:网页数据,视频,图像,视觉分析,数据集,网页结构,多媒体,信息检索 数据概述: 该数据集包含了带有独立视频(IVs)和独立图像(IGVs)的网页数据,旨在促进对网页视觉内容的研究。主要特征如下: 时间跨度: 数据记录的时间范围不限,反映了网页的当前状态。 地理范围:...
    packageimg
  • 相似度判断真值数据集Expect-True-Or-False-By-Similarity-ENDataset-emam2002

    2025年5月16日   

    相似度判断真值数据集Expect-True-Or-False-By-Similarity-ENDataset-emam2002 数据来源:互联网公开数据 标签:自然语言处理,相似度判断,数据集,文本分析,机器学习,语言模型,文本分类,信息检索 数据概述: 该数据集包含用于判断文本相似度真值的标注数据,记录了不同文本对之间的相似度匹配结果。主要特征如下:...
    packageimg
  • TensorFlow2-0问答数据集TensorFlow2-0Question-AnswerDataset-hikarukondo

    2025年5月16日   

    TensorFlow2-0问答数据集TensorFlow2-0Question-AnswerDataset-hikarukondo 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,机器学习,深度学习,信息检索,语言模型,AI应用 数据概述: 该数据集包含来自TensorFlow...
    packageimg
  • 越南法律问答数据集VietnamLegalQuestionAnsweringDataset-dung205

    2025年5月15日   

    越南法律问答数据集VietnamLegalQuestionAnsweringDataset-dung205 数据来源:互联网公开数据 标签:问答系统, 法律咨询, 越南语, 自然语言处理, 信息检索, 文本理解, 语料库, 数据集 数据概述: 该数据集包含来自越南法律领域的问答数据,旨在促进越南语法律信息检索和问答系统的开发。主要特征如下:...
    packageimg
  • 法律文书检索数据集LegalRetrievalCorpus-nhutchung

    2025年5月15日   

    法律文书检索数据集LegalRetrievalCorpus-nhutchung 数据来源:互联网公开数据 标签:法律,检索,数据集,文本分析,自然语言处理,信息检索,语义相似度,司法 数据概述: 该数据集包含来自法律文书的数据,主要用于法律文书的检索和相关研究。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于具体收录的法律文书。...
    packageimg
  • 越南问答语料库数据集VietnameseQuestionAnsweringCorpus-mkhoii08

    2025年5月15日   

    越南问答语料库数据集VietnameseQuestionAnsweringCorpus-mkhoii08 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 信息检索, 语料库, 文本分析, 越南语, 机器阅读理解 数据概述: 该数据集包含来自越南语环境下的问答语料,旨在为自然语言处理和信息检索任务提供支持。主要特征如下:...
    packageimg
  • Quora高级问答数据集QuoraAdvancedDataset-vishnurapps

    2025年5月15日   

    Quora高级问答数据集QuoraAdvancedDataset-vishnurapps 数据来源:互联网公开数据 标签:问答数据,自然语言处理,数据集,文本分析,机器学习,信息检索,人工智能,社交平台 数据概述: 该数据集包含来自Quora平台的高级问答数据,记录了用户在Quora上提出的各种问题和对应的回答。主要特征如下:...
    packageimg
  • 医疗健康问答糖尿病与乳腺癌数据集MedicalHealthQuestionAnswering-Diabetes-BreastCancer-fadwa2019

    2025年5月14日   

    医疗健康问答糖尿病与乳腺癌数据集MedicalHealthQuestionAnswering-Diabetes-BreastCancer-fadwa2019 数据来源:互联网公开数据 标签:医疗健康, 问答系统, 糖尿病, 乳腺癌, 医学知识, 自然语言处理, 文本挖掘, 信息检索 数据概述:...
    packageimg
  • 电影评分数据集MovieLensRatingDataset-zjj213

    2025年5月14日   

    电影评分数据集MovieLensRatingDataset-zjj213 数据来源:互联网公开数据 标签:电影评分,用户行为,数据集,推荐系统,数据挖掘,机器学习,社会网络,信息检索 数据概述: 该数据集来自MovieLens项目,记录了用户对电影的评价数据。主要特征如下: 时间跨度:数据记录的时间范围从1995年到2021年。...
    packageimg
  • 工程领域推特文本数据集-melodious8

    2025年5月14日   

    工程领域推特文本数据集-melodious8 数据来源:互联网公开数据 标签:工程,推特,社交媒体,文本分析,自然语言处理,情感分析,机器学习,信息检索 数据概述: 该数据集包含来自推特平台的工程领域相关推文,记录了工程师、研究人员和相关行业从业者在社交媒体上的公开交流信息。主要特征如下:...
    packageimg
  • 自然语言问答上下文数据集NaturalQuestionsSmall-thedrcat

    2025年5月14日   

    自然语言问答上下文数据集NaturalQuestionsSmall-thedrcat 数据来源:互联网公开数据 标签:自然语言处理, 问答系统, 文本理解, 信息检索, 机器阅读, 语料库, 数据集, 文本分析 数据概述: 该数据集包含来自互联网的自然语言问答数据,记录了用户提出的问题、相关的上下文段落以及答案。主要特征如下:...
    packageimg
  • 新闻真伪识别文本数据集NewsArticleTruthfulnessIdentificationDataset-ramaqubra

    2025年5月14日   

    新闻真伪识别文本数据集NewsArticleTruthfulnessIdentificationDataset-ramaqubra 数据来源:互联网公开数据 标签:新闻真伪, 文本分类, 虚假新闻, 机器学习, 自然语言处理, 文本分析, 数据标注, 信息检索 数据概述:...
    packageimg
  • StackExchange问答社区问题数据集StackExchangeQuestionsDataset-brinliang

    2025年5月14日   

    StackExchange问答社区问题数据集StackExchangeQuestionsDataset-brinliang 数据来源:互联网公开数据 标签:问答社区,数据集,文本分析,自然语言处理,机器学习,信息检索,社区研究,数据挖掘 数据概述: 该数据集包含来自Stack...
    packageimg
  • 跨编码器训练数据2万条-2023年12月数据集-ictworld

    2025年5月13日   

    跨编码器训练数据2万条-2023年12月数据集-ictworld 数据来源:互联网公开数据 标签:自然语言处理,数据集,跨编码器,文本匹配,语义相似度,信息检索,机器学习,文本分析 数据概述: 该数据集包含2万条用于训练跨编码器的文本数据,旨在提升模型在语义相似度计算、文本匹配和信息检索等任务上的表现。主要特征如下:...
    packageimg
  • 虚假新闻检测数据集FakeandRealNewsDetectionDataset-sabriarbishal

    2025年5月13日   

    虚假新闻检测数据集FakeandRealNewsDetectionDataset-sabriarbishal 数据来源:互联网公开数据 标签:新闻,虚假新闻,机器学习,文本分类,自然语言处理,数据集,舆情分析,信息检索 数据概述: 该数据集包含来自不同来源的新闻文章,用于虚假新闻的检测和分析。主要特征如下:...
    packageimg
  • 越南问答语料库数据集VietnameseQuestionAnsweringCorpus-nguyenminh2006

    2025年5月13日   

    越南问答语料库数据集VietnameseQuestionAnsweringCorpus-nguyenminh2006 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本匹配, 信息检索, 语料库, 越南语, 文本分析, 机器阅读理解 数据概述: 该数据集包含来自公开渠道的越南语问答语料,旨在支持越南语问答系统的开发与研究。主要特征如下:...
    packageimg
  • BKAI法律文档检索数据集BKAILegalDocumentRetrievalDataset-littlekai25

    2025年5月13日   

    BKAI法律文档检索数据集BKAILegalDocumentRetrievalDataset-littlekai25 数据来源:互联网公开数据 标签:法律,文档检索,数据集,自然语言处理,文本分类,机器学习,信息检索,人工智能 数据概述: 该数据集由BKAI(BKAV人工智能研究院)提供,专注于法律文档的检索任务。主要特征如下:...
    packageimg
  • 印尼语问答数据集IndonesianQuestion-AnsweringDataset-wirantiiimaripadang

    2025年5月13日   

    印尼语问答数据集IndonesianQuestion-AnsweringDataset-wirantiiimaripadang 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本相似度, 印尼语, 文本理解, 机器学习, 数据标注, 信息检索 数据概述:...
    packageimg
  • 文本处理语料库数据集ProcessedCorpusDataset-colinsmyth001

    2025年5月13日   

    文本处理语料库数据集ProcessedCorpusDataset-colinsmyth001 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,文本分类,语言模型,数据挖掘,信息检索 数据概述: 该数据集包含经过预处理的文本语料库,记录了多种来源的文本数据,经过清洗和标准化处理。主要特征如下:...
    packageimg
  • 问答系统知识库构建测试数据集QuestionAnsweringKnowledgeBaseConstructionTestDataset-andreajaunarena

    2025年5月12日   

    问答系统知识库构建测试数据集QuestionAnsweringKnowledgeBaseConstructionTestDataset-andreajaunarena 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 知识库, 文本匹配, 信息检索, 机器阅读理解, 文本生成, 数据集 数据概述:...
    packageimg