找到598个数据集

标签: 信息检索

过滤结果
  • 拉脱维亚语问答数据集LatvianQuestion-AnswerDataset-valdispterisotais

    2025年4月25日   

    拉脱维亚语问答数据集LatvianQuestion-AnswerDataset-valdispterisotais 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,拉脱维亚语,文本分析,机器学习,语言学,信息检索 数据概述: 该数据集包含了拉脱维亚语的问答对,旨在促进拉脱维亚语自然语言处理领域的研究和应用。主要特征如下: 时间跨度:...
    packageimg
  • arXiv计算机科学论文多标签分类数据集-约20万篇-v1

    2025年4月25日   

    arXiv计算机科学论文多标签分类数据集-约20万篇-v1 数据来源:互联网公开数据 标签:arXiv,计算机科学,论文,多标签分类,文本分类,自然语言处理,机器学习,主题建模,信息检索 数据概述:...
    packageimg
  • 网页链接失效检测数据集-abdelazizfaramawy

    2025年4月25日   

    网页链接失效检测数据集-abdelazizfaramawy 数据来源:互联网公开数据 标签:网页链接,失效检测,数据集,网络爬虫,数据清洗,网络安全,信息检索,数据分析 数据概述: 该数据集包含了从互联网上抓取的网页链接,并记录了它们的有效性状态。主要特征如下: 时间跨度: 数据记录的时间跨度不固定,取决于网页抓取的时间。 地理范围:...
    packageimg
  • 主题分类数据集TopicsClassificationDataset-luisfredgs

    2025年4月25日   

    主题分类数据集TopicsClassificationDataset-luisfredgs 数据来源:互联网公开数据 标签:主题分类,数据集,文本分析,机器学习,自然语言处理,信息检索,分类算法,数据分析 数据概述:该数据集包含来自多个来源的文本数据,记录了不同主题的文档或文本片段。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。...
    packageimg
  • 维基百科科学主题条目数据集WikipediaScienceTopicDataset-shams1

    2025年4月25日   

    维基百科科学主题条目数据集WikipediaScienceTopicDataset-shams1 数据来源:互联网公开数据 标签:科学知识,维基百科,数据集,自然语言处理,文本分析,教育研究,信息检索,数据挖掘 数据概述: 该数据集包含来自维基百科的科学主题条目数据,记录了维基百科上关于科学领域的条目信息。主要特征如下:...
    packageimg
  • 关键词URL匹配否定数据集KeywordURLMatchingNegationDataset-yingna667788

    2025年4月25日   

    关键词URL匹配否定数据集KeywordURLMatchingNegationDataset-yingna667788 数据来源:互联网公开数据 标签:自然语言处理,URL匹配,数据集,关键词提取,文本分析,机器学习,信息检索,数据挖掘 数据概述:...
    packageimg
  • 文章分类数据集ArticlesforClassificationDataset-anastasiyanoskina

    2025年4月24日   

    文章分类数据集ArticlesforClassificationDataset-anastasiyanoskina 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,信息检索,计算机科学,数据分析,教育研究 数据概述: 该数据集包含来自多个来源的文章数据,记录了各类文章的文本内容和分类标签。主要特征如下:...
    packageimg
  • 项目文件分析数据集FilestoUseforProjectDataset-justingrima

    2025年4月24日   

    项目文件分析数据集FilestoUseforProjectDataset-justingrima 数据来源:互联网公开数据 标签:项目管理,文件分析,数据集,文本处理,数据挖掘,信息检索,文档管理,软件工程 数据概述: 该数据集包含了用于项目的文件信息,旨在支持项目管理,文件分析和相关研究。主要特征如下:...
    packageimg
  • 数据2024中国计算机学会CCF检索增强生成RAG数据集-yxw666

    2025年4月24日   

    2024中国计算机学会CCF检索增强生成RAG数据集-yxw666 数据来源:互联网公开数据 标签:自然语言处理,检索增强生成,数据集,文本生成,信息检索,机器学习,人工智能,CCF 数据概述: 该数据集由中国计算机学会(CCF)提供,旨在促进检索增强生成(RAG)技术的研究与发展。主要特征如下: 时间跨度:数据记录的时间范围为2024年。...
    packageimg
  • 预处理数据集含停用词-文本处理与分析数据集PreprocessedDatawithStopwords-TextProcessingandAnalysisD...

    2025年4月24日   

    预处理数据集含停用词-文本处理与分析数据集PreprocessedDatawithStopwords-TextProcessingandAnalysisDataset-solomonschwiger 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,停用词,机器学习,数据预处理,文本分析,信息检索 数据概述:...
    packageimg
  • 参数数据-参数信息数据集ParamsDataDataset-phamkhacduy

    2025年4月24日   

    参数数据-参数信息数据集ParamsDataDataset-phamkhacduy 数据来源:互联网公开数据 标签:参数数据,数据集,数据分析,机器学习,特征工程,模型训练,数据挖掘,信息检索 数据概述: 该数据集包含了各种参数的数据,记录了不同类型参数的详细信息。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于具体参数的更新频率。...
    packageimg
  • 图书信息与描述数据集BookswithDescriptionDataset-fakhriabbas

    2025年4月24日   

    图书信息与描述数据集BookswithDescriptionDataset-fakhriabbas 数据来源:互联网公开数据 标签:图书信息,数据集,文本分析,自然语言处理,信息检索,教育研究,出版行业 数据概述:该数据集包含来自公开图书信息库的数据,记录了各类图书的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪到现代。...
    packageimg
  • 用户问题数据集UserQuestionsDataFramesCSVDataset-saijasthi

    2025年4月24日   

    用户问题数据集UserQuestionsDataFramesCSVDataset-saijasthi 数据来源:互联网公开数据 标签:用户问题,数据集,数据分析,机器学习,自然语言处理,数据挖掘,信息检索,文本分析 数据概述: 该数据集包含来自用户问题的数据,记录了用户提出的问题及相关信息。主要特征如下:...
    packageimg
  • 元数据语料库聚合数据集MetaCorpusAggregateDataset-jpmusdata

    2025年4月24日   

    元数据语料库聚合数据集MetaCorpusAggregateDataset-jpmusdata 数据来源:互联网公开数据 标签:数据集,自然语言处理,文本分析,机器学习,信息检索,数据挖掘,语料库,语言模型 数据概述: 该数据集包含来自多个来源的语料库数据,记录了不同领域的文本信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 自然语言处理问答任务数据集ChAIiTrainFixedDataset-zacchaeus

    2025年4月24日   

    自然语言处理问答任务数据集ChAIiTrainFixedDataset-zacchaeus 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器学习,文本分析,深度学习,人工智能,信息检索 数据概述: 该数据集来源于ChAIi问答任务竞赛,专注于自然语言处理领域的问答系统研究。主要特征如下:...
    packageimg
  • 谷歌问答数据集扩展GoogleQUESTQAAdd-onDataset-jasperwang530

    2025年4月24日   

    谷歌问答数据集扩展GoogleQUESTQAAdd-onDataset-jasperwang530 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,机器学习,文本分析,人工智能,语义理解,信息检索 数据概述: 该数据集是谷歌问答数据集的扩展版本,包含来自谷歌问答社区的问答数据,记录了用户提交的问题及其对应的回答内容。主要特征如下:...
    packageimg
  • 多模态文本摘要数据集MT-SummDataset-gsaichaitanya

    2025年4月24日   

    多模态文本摘要数据集MT-SummDataset-gsaichaitanya 数据来源:互联网公开数据 标签:多模态数据,文本摘要,数据集,自然语言处理,深度学习,机器学习,多媒体分析,信息检索 数据概述: 该数据集包含来自多个来源的多模态文本摘要数据,记录了图像和相应文本的摘要信息。主要特征如下:...
    packageimg
  • 地区报纸可视化元数据数据集-nikhilwani

    2025年4月24日   

    地区报纸可视化元数据数据集-nikhilwani 数据来源:互联网公开数据 标签:新闻,可视化,数据集,文本分析,自然语言处理,信息检索,媒体研究,出版物 数据概述: 该数据集包含来自地区报纸的可视化元数据,记录了报纸文章中可视元素的详细信息。主要特征如下: 时间跨度:数据记录的时间范围为未知,具体时间跨度取决于数据集的原始来源。...
    packageimg
  • 科学BERT数据集SciBERTDataset-cse006kongkanbora

    2025年4月24日   

    科学BERT数据集SciBERTDataset-cse006kongkanbora 数据来源:互联网公开数据 标签:科学文献,自然语言处理,数据集,机器学习,深度学习,文本分类,学术研究,信息检索 数据概述:该数据集包含来自多个科学文献的数据,记录了大量科学论文的摘要,文本和相关元数据。主要特征如下:...
    packageimg
  • 文本分类数据集TextClassificationDataset-albellna

    2025年4月24日   

    文本分类数据集TextClassificationDataset-albellna 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,文本分析,信息检索,人工智能,语言模型 数据概述: 该数据集包含来自多个来源的文本数据,记录了不同类别文本的样本,适用于文本分类,情感分析等应用。主要特征如下:...
    packageimg