数据集 - 海数据

Web搜索与数据挖掘竞赛WSDMCup数据集WebSearchandDataMiningCompetitionDataset-vicks18

2025年5月29日

Web搜索与数据挖掘竞赛WSDMCup数据集WebSearchandDataMiningCompetitionDataset-vicks18 数据来源：互联网公开数据标签：数据挖掘，搜索引擎，机器学习，文本分析，信息检索，推荐系统，数据集，算法竞赛数据概述：该数据集来自Web搜索与数据挖掘竞赛（WSDM...

ZIP

数据2019年4月至9月搜索Feed新闻聚合数据集RSSFeedApril-September2019fromSearchFeedIME-davidesantangelo

2025年5月29日

2019年4月至9月搜索Feed新闻聚合数据集RSSFeedApril-September2019fromSearchFeedIME-davidesantangelo 数据来源：互联网公开数据标签：新闻聚合，数据集，RSS，文本分析，信息检索，机器学习，媒体研究，网络数据数据概述：...

ZIP

新闻订阅源数据RSSNewsFeedData-kopaldixit

2025年5月29日

新闻订阅源数据RSSNewsFeedData-kopaldixit 数据来源：互联网公开数据标签：新闻，RSS，数据集，自然语言处理，文本分析，信息检索，机器学习，新闻聚合数据概述：该数据集包含来自RSS新闻订阅源的数据，记录了新闻文章的标题、摘要、正文、发布时间、来源网站等信息。主要特征如下：...

ZIP

维基文本清洗数据集第二部分WikitextCleanDataPart2Dataset-yingpengchen

2025年5月29日

维基文本清洗数据集第二部分WikitextCleanDataPart2Dataset-yingpengchen 数据来源：互联网公开数据标签：自然语言处理，文本数据，数据集，文本清洗，机器学习，语言模型，信息检索，文本分析数据概述：该数据集是维基文本清洗数据集的第二部分，包含了从维基百科中提取和清洗过的文本数据。主要特征如下：...

ZIP

Sber银行问答数据集SberQADataset-theerror

2025年5月29日

Sber银行问答数据集SberQADataset-theerror 数据来源：互联网公开数据标签：问答系统，自然语言处理，数据集，机器学习，人工智能，银行服务，客户支持，信息检索数据概述：该数据集由Sber银行提供，包含了一系列用户与银行客服之间的问答对话，适用于自然语言处理和问答系统的研究。主要特征如下：...

ZIP

计算机科学领域论文数据集DBLP-curiousaniruddha

2025年5月29日

计算机科学领域论文数据集DBLP-curiousaniruddha 数据来源：互联网公开数据标签：论文，数据集，计算机科学，学术，出版物，信息检索，数据挖掘，自然语言处理数据概述：该数据集包含来自DBLP（数字图书馆与出版物）的数据，记录了计算机科学领域的学术论文出版信息。主要特征如下：...

ZIP

电商商品问答生成数据集E-commerceQuestionAnsweringGenerationDataset-cosmicrayer

2025年5月29日

电商商品问答生成数据集E-commerceQuestionAnsweringGenerationDataset-cosmicrayer 数据来源：互联网公开数据标签：电商，问答生成，自然语言处理，数据集，文本生成，机器学习，信息检索，商品信息数据概述：该数据集包含电商平台上的商品信息和对应的问答对，用于训练和评估问答生成模型。主要特征如下：...

ZIP

多语言新闻文章数据集Multi-NewsDataset-terrychanorg

2025年5月29日

多语言新闻文章数据集Multi-NewsDataset-terrychanorg 数据来源：互联网公开数据标签：新闻，多语言，数据集，自然语言处理，文本摘要，机器翻译，信息检索，文本分析数据概述：该数据集包含来自不同语言的新闻文章，用于文本摘要和多语言处理任务。主要特征如下：时间跨度：数据记录的时间范围为不确定，取决于新闻来源的更新频率。...

ZIP

电影详情与评分推荐系统数据集MovieDetailsandRatingsforRecommenderSystemsDataset-reetamborgohain

2025年5月29日

电影详情与评分推荐系统数据集MovieDetailsandRatingsforRecommenderSystemsDataset-reetamborgohain 数据来源：互联网公开数据标签：电影评分，推荐系统，数据集，用户行为，数据分析，机器学习，信息检索，娱乐产业数据概述：...

ZIP

维基百科内容数据集WikiDataset-selcukcan

2025年5月29日

维基百科内容数据集WikiDataset-selcukcan 数据来源：互联网公开数据标签：维基百科，数据集，文本分析，自然语言处理，机器学习，信息检索，知识图谱，语义分析数据概述：该数据集包含来自维基百科的文本内容，记录了维基百科上的文章、条目及相关信息。主要特征如下：时间跨度：数据记录的时间范围从维基百科创建至今（动态更新）。...

ZIP

天文学与地质学维基百科文章数据集AstronomyandGeologyWikipediaArticles-abdelrahmanghunemiii

2025年5月29日

天文学与地质学维基百科文章数据集AstronomyandGeologyWikipediaArticles-abdelrahmanghunemiii 数据来源：互联网公开数据标签：维基百科, 天文学, 地质学, 文本分析, 网页抓取, 知识图谱, 信息检索, 自然语言处理数据概述：...

ZIP

印地语和泰米尔语问答数据集HindiandTamilQuestionAnsweringDataset-urstrulysai

2025年5月29日

印地语和泰米尔语问答数据集HindiandTamilQuestionAnsweringDataset-urstrulysai 数据来源：互联网公开数据标签：问答系统, 文本理解, 机器阅读, 印度语言, 印地语, 泰米尔语, 自然语言处理, 信息检索数据概述：...

ZIP

维基百科文章文本数据集WikipediaArticleTextData-tolgaerdogmus

2025年5月29日

维基百科文章文本数据集WikipediaArticleTextData-tolgaerdogmus 数据来源：互联网公开数据标签：维基百科, 文本数据, 自然语言处理, 文本分析, 信息检索, 语料库, 文本挖掘, 数据集数据概述：该数据集包含来自维基百科的文章文本数据，记录了维基百科上收录的各种主题的文章内容。主要特征如下：...

ZIP

学术论文文本分析数据集AcademicPaperTextAnalysisDataset-rishiii20

2025年5月29日

学术论文文本分析数据集AcademicPaperTextAnalysisDataset-rishiii20 数据来源：互联网公开数据标签：学术论文, 文本分析, 自然语言处理, 学术研究, 论文摘要, 文本挖掘, 信息检索, 机器学习数据概述：...

ZIP

文本分类新闻数据集TextClassificationNewsDataset-balatmak

2025年5月29日

文本分类新闻数据集TextClassificationNewsDataset-balatmak 数据来源：互联网公开数据标签：文本分类, 新闻, 自然语言处理, 语料库, 多分类, 机器学习, 文本挖掘, 信息检索数据概述：该数据集包含来自不同新闻来源的文本数据，记录了新闻文章的内容及其所属类别，适用于文本分类、信息检索等任务。主要特征如下：...

ZIP

阿拉伯语问答数据集-真伪判断与文本分析ArabicQuestionAnsweringDataset-TrueorFalseJudgmentandTextA...

2025年5月29日

阿拉伯语问答数据集-真伪判断与文本分析ArabicQuestionAnsweringDataset-TrueorFalseJudgmentandTextAnalysis-ibrahim2002 数据来源：互联网公开数据标签：阿拉伯语, 问答系统, 文本分析, 信息检索, 事实判断, 自然语言处理, 机器阅读理解, 数据集数据概述：...

ZIP

美国国家档案馆政府文件清理数据集GADatasetClean-zhihaozhao777

2025年5月29日

美国国家档案馆政府文件清理数据集GADatasetClean-zhihaozhao777 数据来源：互联网公开数据标签：政府文件，数据集，数据清洗，文本分析，自然语言处理，档案管理，信息检索，历史研究数据概述：该数据集包含来自美国国家档案馆（GA）的政府文件数据，记录了已清理的政府文件文本内容。主要特征如下：...

ZIP

问题映射与分类数据集QuestionMappingandClassificationDataset-ammarmasselhy

2025年5月29日

问题映射与分类数据集QuestionMappingandClassificationDataset-ammarmasselhy 数据来源：互联网公开数据标签：问题分类，数据集，自然语言处理，文本分析，机器学习，信息检索，人工智能，语义理解数据概述：该数据集包含来自多个领域的公开问题数据，记录了各类问题的文本内容及其对应的分类标签。主要特征如下：...

ZIP

安然公司电子邮件数据集EnronEmailDataset-napisarchuk

2025年5月28日

安然公司电子邮件数据集EnronEmailDataset-napisarchuk 数据来源：互联网公开数据标签：电子邮件，数据集，文本分析，自然语言处理，金融，腐败，社交网络，信息检索数据概述：该数据集包含来自美国安然公司（Enron Corporation）员工的电子邮件，记录了该公司在破产前的大量内部通信。主要特征如下：...

ZIP

数据2021年最新新闻数据集LatestNewsDataset2021-newsdataio

2025年5月28日

2021年最新新闻数据集LatestNewsDataset2021-newsdataio 数据来源：互联网公开数据标签：新闻，数据集，文本分析，自然语言处理，机器学习，情感分析，信息检索，数据挖掘数据概述：该数据集包含来自2021年全球各地的新闻数据，记录了各类新闻事件和报道内容。主要特征如下：...

ZIP

找到608个数据集

注册成功！