数据集 - 海数据

国际新闻分析数据集NewsCountryDataset-emreasln

2025年4月25日

国际新闻分析数据集NewsCountryDataset-emreasln 数据来源：互联网公开数据标签：新闻分析，国际新闻，数据集，文本挖掘，自然语言处理，全球政治，事件检测，信息检索数据概述：该数据集包含来自全球多个主要新闻网站和媒体平台的国际新闻报道，记录了不同国家和地区的重要新闻事件和动态。主要特征如下：...

ZIP

家得宝产品搜索描述数据集HomeDepotProductSearchDescriptionDataset-riteshpatil8998

2025年4月25日

家得宝产品搜索描述数据集HomeDepotProductSearchDescriptionDataset-riteshpatil8998 数据来源：互联网公开数据标签：零售业，产品搜索，数据集，文本挖掘，自然语言处理，信息检索，机器学习，电商数据概述：该数据集包含了家得宝（Home...

ZIP

垃圾邮件与正常邮件数据集Spam-HamEmailDataset-sarthak4u

2025年4月25日

垃圾邮件与正常邮件数据集Spam-HamEmailDataset-sarthak4u 数据来源：互联网公开数据标签：垃圾邮件，正常邮件，电子邮件，文本分类，自然语言处理，机器学习，文本分析，信息检索数据概述：该数据集包含来自公开邮箱的垃圾邮件（Spam）和正常邮件（Ham）数据，用于训练和评估垃圾邮件检测模型。主要特征如下：...

ZIP

BBC新闻数据集BBCNewsDataset-shineucc

2025年4月25日

BBC新闻数据集BBCNewsDataset-shineucc 数据来源：互联网公开数据标签：新闻，数据集，文本分析，自然语言处理，机器学习，媒体研究，情感分析，信息检索数据概述：该数据集包含来自BBC新闻网站的新闻文章数据，记录了不同类别新闻文章的内容。主要特征如下：时间跨度：数据记录的时间范围从2004年到2005年。...

ZIP

新闻文章内容相似度分析矩阵数据集-manishkumar866115

2025年4月25日

新闻文章内容相似度分析矩阵数据集-manishkumar866115 数据来源：互联网公开数据标签：新闻，文本分析，相似度，自然语言处理，机器学习，信息检索，文本挖掘，语义分析数据概述：该数据集包含新闻文章内容相似度分析矩阵数据，记录了不同新闻文章之间的相似度得分。主要特征如下：时间跨度：数据记录的时间范围不明确，取决于新闻文章的发布时间。...

ZIP

俄罗斯新闻文章分类数据集ArticlesClassificationinRussianDataset-anastasiyanoskina

2025年4月25日

俄罗斯新闻文章分类数据集ArticlesClassificationinRussianDataset-anastasiyanoskina 数据来源：互联网公开数据标签：新闻分类，数据集，文本分析，机器学习，自然语言处理，信息检索，语言技术，俄语处理数据概述：...

ZIP

印度新闻摘要数据集InshortsHindiDataTest-shivamsourav2002

2025年4月25日

印度新闻摘要数据集InshortsHindiDataTest-shivamsourav2002 数据来源：互联网公开数据标签：新闻摘要，自然语言处理，文本分析，印度新闻，数据集，机器翻译，文本分类，信息检索数据概述：该数据集包含来自Inshorts平台的印度新闻摘要数据，用于文本摘要，自然语言处理等任务。主要特征如下：...

ZIP

预训练标签数据集Pred-trainTagsDataset-ananyaajoshi

2025年4月25日

预训练标签数据集Pred-trainTagsDataset-ananyaajoshi 数据来源：互联网公开数据标签：预训练，标签，数据集，自然语言处理，文本分类，信息检索，机器学习，深度学习数据概述：该数据集包含了用于预训练的标签数据，旨在支持各种自然语言处理任务，例如文本分类，信息检索等。主要特征如下：时间跨度：...

ZIP

知识竞赛问答数据集Jeopardy-QuestionandAnswerDataset-mattjberry

2025年4月25日

知识竞赛问答数据集Jeopardy-QuestionandAnswerDataset-mattjberry 数据来源：互联网公开数据标签：知识竞赛，问答数据，数据集，自然语言处理，文本挖掘，机器学习，教育技术，信息检索数据概述：该数据集包含来自知识竞赛节目《Jeopardy!》的问答数据，记录了节目中提出的各类问题及其对应的答案。主要特征如下：...

ZIP

跨领域开放域问答数据集COSMOSQADataset-sidop21

2025年4月25日

跨领域开放域问答数据集COSMOSQADataset-sidop21 数据来源：互联网公开数据标签：开放域问答，自然语言处理，数据集，机器学习，对话系统，信息检索，文本理解，知识图谱数据概述：该数据集包含来自COSMOS项目的开放域问答数据，记录了用户提出的各种问题及其对应的答案。主要特征如下：...

ZIP

阿拉伯语新闻分类数据集-essasartawi

2025年4月25日

阿拉伯语新闻分类数据集-essasartawi 数据来源：互联网公开数据标签：新闻分类，数据集，自然语言处理，机器学习，文本分析，阿拉伯语处理，信息检索，文本挖掘数据概述：该数据集包含来自阿拉伯语新闻媒体的新闻文章，旨在用于新闻分类任务。主要特征如下：时间跨度：数据记录的时间范围从2010年到2020年。...

ZIP

图卢维基百科数据转储2023年数据集-moreducks

2025年4月25日

图卢维基百科数据转储2023年数据集-moreducks 数据来源：互联网公开数据标签：维基百科，数据集，自然语言处理，文本分析，机器学习，知识图谱，语言学，信息检索数据概述：该数据集包含来自图卢维基百科的2023年数据转储，记录了图卢维基百科上的文章内容和元数据。主要特征如下：时间跨度：数据记录的时间范围从图卢维基百科创建到2023年。...

ZIP

国际会议论文引用网络数据集ConferencePaperCitationNetworkDataset-pranalisuryavanshi

2025年4月25日

国际会议论文引用网络数据集ConferencePaperCitationNetworkDataset-pranalisuryavanshi 数据来源：互联网公开数据标签：论文引用，数据集，学术研究，文献计量学，网络分析，机器学习，自然语言处理，信息检索数据概述：...

ZIP

内容推荐系统数据集Content-BasedRecommendationDataset-denizmac

2025年4月25日

内容推荐系统数据集Content-BasedRecommendationDataset-denizmac 数据来源：互联网公开数据标签：推荐系统，内容推荐，数据集，机器学习，用户行为，文本分析，信息检索，自然语言处理数据概述：该数据集包含来自多个来源的用户内容互动数据，记录了用户与内容项之间的交互信息。主要特征如下：...

ZIP

电子邮件垃圾邮件检测数据集-salonimourya

2025年4月25日

电子邮件垃圾邮件检测数据集-salonimourya 数据来源：互联网公开数据标签：电子邮件，垃圾邮件，数据集，文本分类，自然语言处理，机器学习，信息检索，数据挖掘数据概述：该数据集包含电子邮件数据，用于垃圾邮件检测。主要特征如下：时间跨度：数据记录的时间范围不明确，但涵盖了电子邮件产生的历史数据。...

ZIP

元数据管理与知识图谱构建数据集MetzooPR2Dataset-eltongas2018

2025年4月25日

元数据管理与知识图谱构建数据集MetzooPR2Dataset-eltongas2018 数据来源：互联网公开数据标签：数据管理，知识图谱，元数据，数据集，信息检索，机器学习，语义分析，数据处理数据概述：该数据集由Metzoo项目提供，专注于元数据管理和知识图谱构建任务。主要特征如下：时间跨度：数据记录的时间范围从2018年到2020年。...

ZIP

有限波斯语信息检索数据集LimitedPersianInformationRetrievalDataset-amirali10281

2025年4月25日

有限波斯语信息检索数据集LimitedPersianInformationRetrievalDataset-amirali10281 数据来源：互联网公开数据标签：信息检索，波斯语，数据集，自然语言处理，机器学习，文本分类，多语言处理，语言技术数据概述：...

ZIP

文档过滤与分类数据集FilteredDocumentsDataset-pragunsrivastava

2025年4月25日

文档过滤与分类数据集FilteredDocumentsDataset-pragunsrivastava 数据来源：互联网公开数据标签：文档处理，数据集，文本分类，自然语言处理，机器学习，信息检索，文本分析，数据挖掘数据概述：该数据集包含经过过滤和分类的文档数据，记录了各类文档的文本内容和分类标签。主要特征如下：时间跨度：...

ZIP

信息检索查询数据集RetrievalQueriesDataset-gsaichaitanya

2025年4月25日

信息检索查询数据集RetrievalQueriesDataset-gsaichaitanya 数据来源：互联网公开数据标签：信息检索，查询分析，数据集，搜索引擎，自然语言处理，数据挖掘，人工智能，机器学习数据概述：该数据集包含了来自多个搜索引擎和在线信息检索系统的用户查询数据，记录了用户在搜索过程中的查询语句及相关信息。主要特征如下：...

ZIP

词向量与文档向量生成数据集WordandDoc2VecDataset-wordroid

2025年4月25日

词向量与文档向量生成数据集WordandDoc2VecDataset-wordroid 数据来源：互联网公开数据标签：自然语言处理，词向量，文档向量，数据集，机器学习，文本分析，向量化，文本挖掘数据概述：该数据集包含用于生成词向量（Word2Vec）和文档向量（Doc2Vec）的数据，记录了文本语料库的词汇和文档特征。主要特征如下：...

ZIP

找到698个数据集

注册成功！