找到611个数据集

标签: 信息检索

过滤结果
  • 英语语料库词频与逆文档频率数据集EnglishCorpusFrequencyandIDFDataset-nataltiger26

    2025年4月26日   

    英语语料库词频与逆文档频率数据集EnglishCorpusFrequencyandIDFDataset-nataltiger26 数据来源:互联网公开数据 标签:语料库,词频分析,逆文档频率,自然语言处理,数据集,文本挖掘,机器学习,信息检索 数据概述:...
    packageimg
  • 问答系统评估数据集Qwen-AnswersDataset-martintura

    2025年4月26日   

    问答系统评估数据集Qwen-AnswersDataset-martintura 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器学习,人工智能,知识图谱,信息检索,文本生成 数据概述: 该数据集包含来自问答系统Qwen的问答对数据,记录了用户提出的问题和系统生成的答案。主要特征如下:...
    packageimg
  • 计算机科学与人工智能领域学术作者数据集DBLPAuthorsDataset-daniyalshaiq

    2025年4月26日   

    计算机科学与人工智能领域学术作者数据集DBLPAuthorsDataset-daniyalshaiq 数据来源:互联网公开数据 标签:计算机科学,人工智能,数据集,学术研究,作者分析,机器学习,信息检索,数据挖掘 数据概述:...
    packageimg
  • 电影推荐与评分数据集RecommendationMovieRatingDataset-samuelshanthanaraja

    2025年4月26日   

    电影推荐与评分数据集RecommendationMovieRatingDataset-samuelshanthanaraja 数据来源:互联网公开数据 标签:电影推荐,评分数据,数据集,推荐系统,机器学习,数据挖掘,用户行为,信息检索 数据概述: 该数据集记录了用户对电影的评价和推荐行为,主要用于电影推荐系统和用户偏好分析的构建。主要特征如下:...
    packageimg
  • 自然语言处理与词向量训练数据集NLPNBCWord2VecDataset-duydung271

    2025年4月26日   

    自然语言处理与词向量训练数据集NLPNBCWord2VecDataset-duydung271 数据来源:互联网公开数据 标签:自然语言处理,词向量,数据集,文本分析,机器学习,深度学习,语义分析,信息检索 数据概述: 该数据集包含来自自然语言处理领域的NBC新闻文本数据,用于词向量训练和文本分析任务。主要特征如下:...
    packageimg
  • 新闻主题建模数据集NewsArticlesforTopicModellingDataset-aasthavashist

    2025年4月26日   

    新闻主题建模数据集NewsArticlesforTopicModellingDataset-aasthavashist 数据来源:互联网公开数据 标签:新闻分析,主题建模,数据集,文本挖掘,自然语言处理,机器学习,数据分析,信息检索 数据概述: 该数据集包含来自多个新闻源的新闻文章数据,记录了各类新闻主题和内容。主要特征如下:...
    packageimg
  • 新闻文本分类数据集DraupNewsClassificationDataset-shadabhussain

    2025年4月26日   

    新闻文本分类数据集DraupNewsClassificationDataset-shadabhussain 数据来源:互联网公开数据 标签:新闻分类,文本分析,数据集,自然语言处理,机器学习,信息检索,数据挖掘,人工智能 数据概述: 该数据集包含来自Draup平台的新闻文本数据,主要记录了各类新闻文章的文本内容及其分类标签。主要特征如下:...
    packageimg
  • 基于内容的推荐系统数据集Content-BasedFilteringDataset-pushpakgote

    2025年4月26日   

    基于内容的推荐系统数据集Content-BasedFilteringDataset-pushpakgote 数据来源:互联网公开数据 标签:推荐系统,内容过滤,数据集,机器学习,用户偏好,信息检索,自然语言处理,电子商务...
    packageimg
  • 技能提取数据范围综述数据集ScopingReviewofSkillExtractionData-andruonciul

    2025年4月26日   

    技能提取数据范围综述数据集ScopingReviewofSkillExtractionData-andruonciul 数据来源:互联网公开数据 标签:技能提取,数据集,自然语言处理,机器学习,教育技术,人力资源,文本分析,信息检索 数据概述: 该数据集包含来自多个来源的技能提取数据,记录了不同领域中技能信息的识别与提取。主要特征如下:...
    packageimg
  • 文章主题分类数据集ArticleTopicsClassificationDataset-bchadburn

    2025年4月26日   

    文章主题分类数据集ArticleTopicsClassificationDataset-bchadburn 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,信息检索,文本分析,知识图谱,学术研究 数据概述: 该数据集包含来自多个来源的文章主题分类数据,记录了各类文章的主题标签和内容。主要特征如下:...
    packageimg
  • 新闻分类清洗数据集NewsCategoryCleanedDataset-tamoghna96saha

    2025年4月26日   

    新闻分类清洗数据集NewsCategoryCleanedDataset-tamoghna96saha 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,机器学习,自然语言处理,数据挖掘,信息检索,媒体研究 数据概述: 该数据集包含来自公开新闻来源的清洗后数据,记录了各类新闻文章的详细分类信息。主要特征如下:...
    packageimg
  • IMDB电影剧情摘要数据集IMDBMoviePlotSummaryDataset-saugatkannojia

    2025年4月26日   

    IMDB电影剧情摘要数据集IMDBMoviePlotSummaryDataset-saugatkannojia 数据来源:互联网公开数据 标签:电影,剧情分析,数据集,自然语言处理,文本挖掘,情感分析,机器学习,信息检索 数据概述:该数据集包含来自IMDB(互联网电影数据库)的电影剧情摘要数据,记录了数千部电影的剧情简介和相关信息。主要特征如下:...
    packageimg
  • 样本问答数据集SampledQADataDataset-hritik619916

    2025年4月26日   

    样本问答数据集SampledQADataDataset-hritik619916 数据来源:互联网公开数据 标签:问答系统,数据集,自然语言处理,机器学习,信息检索,文本分析,人工智能,数据挖掘 数据概述: 该数据集包含来自公开来源的问答对样本数据,记录了问题与对应答案的配对信息。主要特征如下:...
    packageimg
  • 虚假新闻识别数据集FakeandRealNewsDataset-fedwaalgamdi

    2025年4月26日   

    虚假新闻识别数据集FakeandRealNewsDataset-fedwaalgamdi 数据来源:互联网公开数据 标签:新闻,虚假新闻,真实新闻,自然语言处理,文本分类,机器学习,舆情分析,信息检索 数据概述: 该数据集包含了来自不同来源的虚假新闻和真实新闻数据,用于训练和评估虚假新闻检测模型。主要特征如下:...
    packageimg
  • 事实核查零上下文设置数据集TabFactZero-ContextSettingDataset-shaoruisun0701

    2025年4月26日   

    事实核查零上下文设置数据集TabFactZero-ContextSettingDataset-shaoruisun0701 数据来源:互联网公开数据 标签:事实核查,表格理解,零样本学习,自然语言处理,数据集,信息检索,人工智能,文本分析 数据概述: 该数据集源自TabFact项目,专注于表格事实核查任务,特别是在零上下文设置下进行。主要特征如下:...
    packageimg
  • 垃圾邮件过滤数据集-aymendernani

    2025年4月26日   

    垃圾邮件过滤数据集-aymendernani 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,自然语言处理,机器学习,邮件过滤,数据集,信息检索,人工智能 数据概述: 该数据集包含来自不同来源的邮件数据,用于垃圾邮件过滤任务。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了不同时期的邮件数据。...
    packageimg
  • 相似性数据集SimilarityDataDataset-sagarrathore

    2025年4月26日   

    相似性数据集SimilarityDataDataset-sagarrathore 数据来源:互联网公开数据 标签:相似性分析,数据集,模式识别,机器学习,数据挖掘,信息检索,人工智能,统计分析 数据概述: 该数据集包含来自多个领域的相似性数据,记录了不同对象或特征之间的相似度或关联度。主要特征如下:...
    packageimg
  • 齐夫定律特征数据集Zipf-sLawFeatureDataset-mohamedchakerouari

    2025年4月26日   

    齐夫定律特征数据集Zipf-sLawFeatureDataset-mohamedchakerouari 数据来源:互联网公开数据 标签:文本分析,自然语言处理,齐夫定律,数据集,词频分析,机器学习,语言学,信息检索 数据概述: 该数据集包含文本数据及其对应的齐夫定律特征,用于研究词频分布和文本特征提取。主要特征如下:...
    packageimg
  • 科学文本分类数据集ScientificTextClassificationDataset-chiragb254

    2025年4月26日   

    科学文本分类数据集ScientificTextClassificationDataset-chiragb254 数据来源:互联网公开数据 标签:科学文本,数据集,文本分类,机器学习,自然语言处理,数据挖掘,学术研究,信息检索 数据概述:...
    packageimg
  • 数据1985年阿尔巴尼亚百科全书数据集-ashahini

    2025年4月26日   

    1985年阿尔巴尼亚百科全书数据集-ashahini 数据来源:互联网公开数据 标签:百科全书,历史,文化,阿尔巴尼亚,数据集,语言学,社会学,人文科学,信息检索 数据概述: 该数据集包含来自1985年出版的《阿尔巴尼亚百科全书》的数据,记录了阿尔巴尼亚的历史,文化,地理,人物,事件等信息。主要特征如下:...
    packageimg