找到594个数据集

标签: 信息检索

过滤结果
  • Quora重复问题数据集QuoraDuplicateQuestionsDataset-ekanshu

    2025年4月24日   

    Quora重复问题数据集QuoraDuplicateQuestionsDataset-ekanshu 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,问答系统,信息检索,深度学习,语义分析 数据概述: 该数据集包含来自Quora平台的问答数据,记录了平台上用户提出的问题及其标签。主要特征如下:...
    packageimg
  • 医学问答数据集MedicalQuestionAnsweringDataset-swaranshpatel

    2025年4月24日   

    医学问答数据集MedicalQuestionAnsweringDataset-swaranshpatel 数据来源:互联网公开数据 标签:医学,问答系统,数据集,人工智能,自然语言处理,健康咨询,机器学习,信息检索 数据概述: 该数据集包含来自医学领域的问答数据,记录了用户提出的医学相关问题及其对应的专家回答。主要特征如下:...
    packageimg
  • 标题与期刊论文数据集TitleandJournalDataset-boa234

    2025年4月24日   

    标题与期刊论文数据集TitleandJournalDataset-boa234 数据来源:互联网公开数据 标签:期刊论文,标题分析,数据集,学术研究,文本挖掘,自然语言处理,信息检索,学术资源 数据概述: 该数据集包含来自多个学术期刊的论文标题数据,记录了各类期刊论文的标题信息。主要特征如下: 时间跨度: 数据记录的时间范围从2000年到2022年。...
    packageimg
  • 关键词提取与文本摘要数据集Keys-TextrankDataset-yojn710

    2025年4月24日   

    关键词提取与文本摘要数据集Keys-TextrankDataset-yojn710 数据来源:互联网公开数据 标签:自然语言处理,文本分析,关键词提取,数据集,机器学习,文本摘要,信息检索,人工智能 数据概述: 该数据集专注于自然语言处理领域,主要记录了文本中的关键词提取和文本摘要任务所需的数据。主要特征如下:...
    packageimg
  • WikiSQLSpider数据集WikiSQLSpiderDataset-charanhu

    2025年4月24日   

    WikiSQLSpider数据集WikiSQLSpiderDataset-charanhu 数据来源:互联网公开数据 标签:SQL查询,数据集,数据库,自然语言处理,信息检索,机器学习,模式匹配,数据分析 数据概述: 该数据集由 WikiSQLSpider 项目提供,主要记录了从自然语言问题到 SQL 查询的转换数据,适用于 SQL...
    packageimg
  • 知识库构建与应用数据集KnowledgeBaseDataset-mariamelseedawy

    2025年4月24日   

    知识库构建与应用数据集KnowledgeBaseDataset-mariamelseedawy 数据来源:互联网公开数据 标签:知识库,数据集,信息检索,自然语言处理,人工智能,机器学习,语义网,知识图谱 数据概述: 该数据集包含用于知识库构建与应用的多领域结构化数据,记录了各类实体,属性及关系信息。主要特征如下: 时间跨度:...
    packageimg
  • 邮件垃圾信息检测数据集EmailSpamDetectionDataset-tridovan

    2025年4月24日   

    邮件垃圾信息检测数据集EmailSpamDetectionDataset-tridovan 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,数据集,自然语言处理,文本分析,机器学习,信息检索,安全 数据概述: 该数据集包含了电子邮件信息,用于垃圾邮件的检测与分类。主要特征如下: 时间跨度:数据记录的时间不明确,但涵盖了收集电子邮件的时间段。...
    packageimg
  • 问答数据集QuestionAnsweringDataset-namphmquang

    2025年4月24日   

    问答数据集QuestionAnsweringDataset-namphmquang 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,机器学习,语言模型,知识库,信息检索,人工智能 数据概述:该数据集包含来自多个来源的问答对数据,记录了用户提出的问题及其对应的答案。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 股票情绪分析新闻标题数据集StockSentimentAnalysisUsingNewsHeadlinesDataset-shivammishra3

    2025年4月24日   

    股票情绪分析新闻标题数据集StockSentimentAnalysisUsingNewsHeadlinesDataset-shivammishra3 数据来源:互联网公开数据 标签:股票情绪分析,新闻标题,数据集,金融分析,自然语言处理,机器学习,投资决策,信息检索 数据概述: 该数据集包含新闻标题,用于分析新闻报道对股票市场情绪的影响。主要特征如下:...
    packageimg
  • 影视元数据数据集MovieMetadataCSVDataset-vikramgunaganti

    2025年4月24日   

    影视元数据数据集MovieMetadataCSVDataset-vikramgunaganti 数据来源:互联网公开数据 标签:影视分析,元数据,数据集,数据挖掘,机器学习,信息检索,文化产业,统计分析 数据概述: 该数据集包含来自电影数据库的元数据,记录了电影作品的关键信息。主要特征如下:...
    packageimg
  • 维基百科句子数据集WikiSentencesV2-ranjitp20

    2025年4月24日   

    维基百科句子数据集WikiSentencesV2-ranjitp20 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,语言模型,文本语料库,信息检索,机器学习,文本摘要 数据概述: 该数据集包含了来自维基百科的句子,旨在为自然语言处理任务提供大规模文本语料库。主要特征如下:...
    packageimg
  • 商业新闻文章数据集BusinessNewsArticlesDataset-talalhassan141

    2025年4月24日   

    商业新闻文章数据集BusinessNewsArticlesDataset-talalhassan141 数据来源:互联网公开数据 标签:新闻,商业,财经,文本分析,自然语言处理,情感分析,信息检索,数据挖掘 数据概述: 该数据集包含来自各类商业新闻网站和媒体的文章,记录了全球范围内的商业和财经新闻。主要特征如下:...
    packageimg
  • 自助文章问题解决与建议数据集-greatcodes

    2025年4月23日   

    自助文章问题解决与建议数据集-greatcodes 数据来源:互联网公开数据 标签:自助,健康,移民,个人护理,问题解决,建议,文本分类,信息检索,内容分析,文本摘要 数据概述:...
    packageimg
  • 谷歌趋势搜索数据集GoogleTrendsSearchDataDataset-angelcc

    2025年4月23日   

    谷歌趋势搜索数据集GoogleTrendsSearchDataDataset-angelcc 数据来源:互联网公开数据 标签:互联网搜索,数据集,趋势分析,用户行为,数据分析,市场研究,信息检索,社会热点 数据概述: 该数据集包含来自谷歌趋势(Google...
    packageimg
  • 越南快讯新闻文章数据集VnExpressNewsArticleDataset-trnnhtminh

    2025年4月23日   

    越南快讯新闻文章数据集VnExpressNewsArticleDataset-trnnhtminh 数据来源:互联网公开数据 标签:新闻文章,越南,自然语言处理,文本分析,数据集,情感分析,主题分类,信息检索 数据概述: 该数据集包含了来自越南新闻网站VnExpress的文章数据,记录了该网站上发布的新闻文章的详细信息。主要特征如下:...
    packageimg
  • 文本摘要生成数据集SESummarizationDataset-rahulshelke98

    2025年4月23日   

    文本摘要生成数据集SESummarizationDataset-rahulshelke98 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器学习,信息检索,文本挖掘,语言学,数据科学 数据概述:该数据集包含来自Stack...
    packageimg
  • BBC新闻分类数据集NewsCategoryofBBCDataset-remyakarthika

    2025年4月23日   

    BBC新闻分类数据集NewsCategoryofBBCDataset-remyakarthika 数据来源:互联网公开数据 标签:新闻分类,数据集,自然语言处理,机器学习,文本分析,信息检索,媒体研究,文本挖掘 数据概述: 该数据集包含来自BBC的新闻文章数据,记录了不同类别的新闻文章内容。主要特征如下:...
    packageimg
  • 邮件分析数据集EmailAnalysisDataset-sanjayyym

    2025年4月23日   

    邮件分析数据集EmailAnalysisDataset-sanjayyym 数据来源:互联网公开数据 标签:邮件分析,文本挖掘,数据集,自然语言处理,情感分析,垃圾邮件检测,信息检索,机器学习 数据概述: 该数据集包含来自互联网的邮件数据,主要用于邮件内容分析,情感分析,垃圾邮件检测等任务。主要特征如下:...
    packageimg
  • 维基百科与MSMARCO问答数据集WikiandMSMARCOQ-ADataset-rangoiv

    2025年4月23日   

    维基百科与MSMARCO问答数据集WikiandMSMARCOQ-ADataset-rangoiv 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,信息检索,机器学习,文本分析,知识图谱,深度学习 数据概述: 该数据集结合了维基百科和MS MARCO的数据,记录了大量的问答对和相关信息检索结果。主要特征如下:...
    packageimg
  • 语义文本相关性数据集SemanticTextualRelatednessData-udvasbasak

    2025年4月23日   

    语义文本相关性数据集SemanticTextualRelatednessData-udvasbasak 数据来源:互联网公开数据 标签:文本分析,语义理解,自然语言处理,机器学习,信息检索,人工智能,语言模型,数据挖掘 数据概述: 该数据集包含来自公开资源的数据,记录了用于衡量文本间语义相关性的文本对。主要特征如下:...
    packageimg