找到594个数据集

标签: 信息检索

过滤结果
  • 英国谷歌新闻数据集GoogleNewsUKDataset2010-2024-victornuez

    2025年4月23日   

    英国谷歌新闻数据集GoogleNewsUKDataset2010-2024-victornuez 数据来源:互联网公开数据 标签:新闻分析,数据集,时间序列,文本挖掘,机器学习,信息检索,媒体研究,社会趋势 数据概述: 该数据集包含来自谷歌新闻英国版的数据,记录了2010年至2024年间英国主流新闻内容的关键信息。主要特征如下:...
    packageimg
  • 卡纳达语新闻分类数据集KannadaNewsCategoryDataset-vigneshvit

    2025年4月23日   

    卡纳达语新闻分类数据集KannadaNewsCategoryDataset-vigneshvit 数据来源:互联网公开数据 标签:新闻分类,卡纳达语,数据集,文本分析,机器学习,自然语言处理,多语言处理,信息检索 数据概述: 该数据集记录了卡纳达语新闻文章的分类信息,适用于新闻分类,文本分析和机器学习任务。主要特征如下:...
    packageimg
  • 开放域问答三语数据集ODQATrilingualDataDataset-aninditabhattacharya

    2025年4月23日   

    开放域问答三语数据集ODQATrilingualDataDataset-aninditabhattacharya 数据来源:互联网公开数据 标签:开放域问答,数据集,三语翻译,自然语言处理,机器学习,信息检索,多语言处理,文本分析...
    packageimg
  • 文章分类数据集ArticlesClassificationDataset-mohamedalqblawi

    2025年4月23日   

    文章分类数据集ArticlesClassificationDataset-mohamedalqblawi 数据来源:互联网公开数据 标签:文本分类,数据集,机器学习,自然语言处理,数据分析,信息检索,内容分析,智能推荐 数据概述: 该数据集包含来自多个来源的文章数据,记录了各类文章的文本内容和分类标签。主要特征如下:...
    packageimg
  • 医疗问答处理数据集MedQuadProcessedDataset-yousouffarooq

    2025年4月23日   

    医疗问答处理数据集MedQuadProcessedDataset-yousouffarooq 数据来源:互联网公开数据 标签:医疗问答,数据集,自然语言处理,医学研究,健康咨询,机器学习,信息检索,文本分析 数据概述:该数据集包含来自MedQuad项目的医疗问答数据,记录了患者与医疗专业人员之间的问答互动。主要特征如下:...
    packageimg
  • 维基百科电影剧情摘要数据集Wiki-PlotsDataset-marcosmartinez

    2025年4月23日   

    维基百科电影剧情摘要数据集Wiki-PlotsDataset-marcosmartinez 数据来源:互联网公开数据 标签:电影,剧情,数据集,文本分析,自然语言处理,信息检索,机器学习,电影研究 数据概述: 该数据集包含来自维基百科的电影剧情摘要数据,记录了大量电影的剧情概要信息。主要特征如下:...
    packageimg
  • 元数据检索优化数据集MetadataRetrievalOptimizationDataset-johnlqd

    2025年4月23日   

    元数据检索优化数据集MetadataRetrievalOptimizationDataset-johnlqd 数据来源:互联网公开数据 标签:信息检索,元数据,数据集,搜索引擎,机器学习,文本分析,数据挖掘,自然语言处理 数据概述:该数据集专注于元数据检索优化,记录了不同信息检索场景下的元数据特征及检索结果。主要特征如下:...
    packageimg
  • 参考数据集DatasetforReference-aravjain007

    2025年4月23日   

    参考数据集DatasetforReference-aravjain007 数据来源:互联网公开数据 标签:参考,数据集,文本分析,数据清洗,自然语言处理,信息检索,数据挖掘,学术研究 数据概述:该数据集包含用于参考和基准测试的文本数据,旨在为各种文本分析任务提供支持。主要特征如下:...
    packageimg
  • 语义分析扩展数据集SemEvalExtensionDataset-viciousaegis

    2025年4月23日   

    语义分析扩展数据集SemEvalExtensionDataset-viciousaegis 数据来源:互联网公开数据 标签:语义分析,自然语言处理,数据集,情感分析,机器学习,文本挖掘,多语言处理,信息检索 数据概述: 该数据集源自语义分析与计算语言学国际研讨会(SemEval)的扩展数据,记录了各类文本数据的语义特征和情感倾向。主要特征如下:...
    packageimg
  • 开放问题论文引用折叠数据集OpenProblemsPaperCitationFoldsDataset-shitovvladimir

    2025年4月23日   

    开放问题论文引用折叠数据集OpenProblemsPaperCitationFoldsDataset-shitovvladimir 数据来源:互联网公开数据 标签:学术论文,引用分析,数据集,自然语言处理,机器学习,文本挖掘,文献计量学,知识图谱,信息检索 数据概述:...
    packageimg
  • 报告使用文件数据集-justingrima

    2025年4月23日   

    报告使用文件数据集-justingrima 数据来源:互联网公开数据 标签:报告,文件,数据集,数据分析,文本挖掘,自然语言处理,信息检索,文档管理 数据概述: 该数据集包含了用于报告的文件数据,记录了报告中涉及的各种文件信息。主要特征如下: 时间跨度:数据记录的时间范围跨度不确定,取决于报告所涵盖的时间段。...
    packageimg
  • 问答系统训练与评估数据集tgif-qna-descriptions-38kDataset-vishnu82

    2025年4月23日   

    问答系统训练与评估数据集tgif-qna-descriptions-38kDataset-vishnu82 数据来源:互联网公开数据 标签:问答系统,数据集,自然语言处理,机器学习,语义理解,信息检索,知识图谱,人工智能 数据概述: 该数据集包含来自tgif问答系统项目的大量问答对数据,记录了用户提问与系统回答的详细信息。主要特征如下:...
    packageimg
  • 突尼斯问答数据集TunisiaQ-ADataset-anismarrouchi

    2025年4月22日   

    突尼斯问答数据集TunisiaQ-ADataset-anismarrouchi 数据来源:互联网公开数据 标签:突尼斯,问答,自然语言处理,文本分析,信息检索,阿拉伯语,数据集,文化 数据概述: 该数据集包含来自突尼斯的问答数据,主要记录了关于突尼斯文化,历史,社会,旅游等领域的问题和答案。主要特征如下:...
    packageimg
  • 法国地理位置自然语言处理数据集FrenchLocationsNLPDataset-waelfezari

    2025年4月22日   

    法国地理位置自然语言处理数据集FrenchLocationsNLPDataset-waelfezari 数据来源:互联网公开数据 标签:自然语言处理,地理位置,数据集,文本分析,机器学习,地理信息系统,语言学,信息检索 数据概述:该数据集包含来自互联网公开资源的法国地理位置相关文本数据,适用于自然语言处理,地理位置信息提取等任务。主要特征如下:...
    packageimg
  • 协同过滤推荐系统数据集CollaborativeSystemDataset-aviskumar

    2025年4月22日   

    协同过滤推荐系统数据集CollaborativeSystemDataset-aviskumar 数据来源:互联网公开数据 标签:推荐系统,协同过滤,数据集,用户行为,数据挖掘,机器学习,个性化推荐,信息检索 数据概述: 该数据集包含用户与物品的交互数据,主要用于构建和评估协同过滤推荐系统。主要特征如下: 时间跨度:...
    packageimg
  • 关键词提取与文本分析数据集PlusKeywordDataset-chaewonjeon1116

    2025年4月22日   

    关键词提取与文本分析数据集PlusKeywordDataset-chaewonjeon1116 数据来源:互联网公开数据 标签:自然语言处理,关键词提取,文本分析,数据集,机器学习,信息检索,文本挖掘,语义分析 数据概述: 该数据集包含来自多个公开来源的文本数据,专注于关键词提取和文本分析任务。主要特征如下:...
    packageimg
  • 美国政府开放数据标题数据集CKANData-govTitlesDataset-saralafia

    2025年4月22日   

    美国政府开放数据标题数据集CKANData-govTitlesDataset-saralafia 数据来源:互联网公开数据 标签:政府数据,开放数据,数据集,标题分析,文本挖掘,数据清洗,信息检索,公共服务 数据概述:...
    packageimg
  • 问题与答案数据集QuestionandAnswerDataset-drishtiagarwal20

    2025年4月22日   

    问题与答案数据集QuestionandAnswerDataset-drishtiagarwal20 数据来源:互联网公开数据 标签:问答系统,数据集,自然语言处理,机器学习,文本分析,知识图谱,信息检索,人工智能 数据概述: 该数据集包含来自互联网的问答对数据,记录了用户提出的问题及其对应的答案。主要特征如下:...
    packageimg
  • VK推荐系统测试数据集VKRecSysTestDataset-saicourse

    2025年4月22日   

    VK推荐系统测试数据集VKRecSysTestDataset-saicourse 数据来源:互联网公开数据 标签:推荐系统,数据集,机器学习,用户行为,数据挖掘,个性化推荐,电商,信息检索 数据概述: 该数据集来源于VK推荐系统测试项目,记录了用户在平台上的行为数据,适用于推荐系统算法的开发,评估与优化。主要特征如下:...
    packageimg
  • 模糊匹配基准数据集FuzzyMatchingBenchmarkDataset-shahrukhkhan

    2025年4月22日   

    模糊匹配基准数据集FuzzyMatchingBenchmarkDataset-shahrukhkhan 数据来源:互联网公开数据 标签:模糊匹配,数据集,基准测试,文本分析,自然语言处理,机器学习,信息检索,数据清洗 数据概述: 该数据集包含来自多个来源的文本数据,用于评估和比较不同模糊匹配算法的性能。主要特征如下:...
    packageimg