数据集 - 海数据

巴西新闻文章文本数据集-新闻内容分析-2024

2025年5月31日

巴西新闻文章文本数据集-新闻内容分析-2024 数据来源：互联网公开数据标签：巴西,新闻,文本,自然语言处理,NLP,金融,信息提取,时事,政治,经济,社会数据概述：本数据集包含来自巴西联邦数字图书馆的新闻文章文本，旨在为自然语言处理（NLP）模型构建提供可靠且一致的数据源。数据集涵盖了各种主题的新闻报道，为研究人员提供了丰富的文本数据。...

ZIP

孟加拉国日报BD-Pratidin新闻数据集-2017年12月13日至2020年9月9日-shakirulhasan

2025年5月31日

孟加拉国日报BD-Pratidin新闻数据集-2017年12月13日至2020年9月9日-shakirulhasan 数据来源：互联网公开数据标签：孟加拉语,新闻,文本,自然语言处理,NLP,文本分析,孟加拉国,BD-Pratidin,语料库数据概述：本数据集包含了从2017年12月13日至2020年9月9日期间，孟加拉国日报（BD-...

ZIP

老挝语-越南语机器翻译语料库越南语文本数据集-zuydang

2025年5月31日

老挝语-越南语机器翻译语料库越南语文本数据集-zuydang 数据来源：互联网公开数据标签：机器翻译,语料库,老挝语,越南语,文本,语言学,自然语言处理,ALT 数据概述：本数据集是从ALT（亚洲语言技术）项目中提取的老挝语-...

ZIP

多模态文本图像生成数据集-2023-alenic

2025年5月31日

多模态文本图像生成数据集-2023-alenic 数据来源：互联网公开数据标签：多模态,文本,图像,生成,数据集,分类,预测,模态分析,目标识别数据概述：...

ZIP

视觉问答图像理解数据集-图像与自然语言结合-通用

2025年5月30日

视觉问答图像理解数据集-图像与自然语言结合-通用数据来源：互联网公开数据标签：视觉问答,图像理解,自然语言处理,计算机视觉,人工智能,图像,文本,问答,多模态,场景理解数据概述：本数据集是用于视觉问答（VQA，Visual Question Answering）任务的通用数据集。VQA...

ZIP

多模态情感分析数据集MultimodalSentimentAnalysisDataset-dmitryml

2025年5月29日

多模态情感分析数据集MultimodalSentimentAnalysisDataset-dmitryml 数据来源：互联网公开数据标签：情感分析, 多模态, 文本, 图像, 语音, 情感识别, 机器学习, 数据集数据概述：该数据集包含来自多个来源的多模态情感数据，记录了与情感相关的文本、图像和语音信息，用于情感分析和多模态研究。主要特征如下：...

ZIP

增强型多模态情感识别数据集EnhancedMulti-modalEmotionRecognitionDataset-alexandreazouri

2025年5月28日

增强型多模态情感识别数据集EnhancedMulti-modalEmotionRecognitionDataset-alexandreazouri 数据来源：互联网公开数据标签：情感识别，多模态，数据集，语音，文本，视频，机器学习，人工智能数据概述：该数据集包含增强的多模态情感识别数据，旨在提升情感分析的准确性和鲁棒性。主要特征如下：时间跨度：...

ZIP

堤坝巡逻文本数据集DamPatrolTextCorpus-tunphmnguynanh

2025年5月28日

堤坝巡逻文本数据集DamPatrolTextCorpus-tunphmnguynanh 数据来源：互联网公开数据标签：堤坝, 巡逻, 防洪, 文本, 法律法规, 自然语言处理, 文本分析, 越南语数据概述：该数据集包含来自越南官方文件的文本数据，记录了关于堤坝巡逻和防洪的相关规定和说明。主要特征如下：...

ZIP

医学文本嵌入数据集-kwyrob

2025年5月22日

医学文本嵌入数据集-kwyrob 数据来源：互联网公开数据标签：医学，文本，嵌入，自然语言处理，深度学习，医学信息学，生物医学，语义分析数据概述：该数据集包含用于医学文本嵌入的数据，旨在为医学领域的自然语言处理任务提供支持。主要特征如下：时间跨度：数据记录的时间范围不限，涵盖了医学文献、病例报告、临床试验摘要等多种来源。...

ZIP

数学问题解答文本数据集MathProblemSolvingTextDataset-ibtida01

2025年5月19日

数学问题解答文本数据集MathProblemSolvingTextDataset-ibtida01 数据来源：互联网公开数据标签：数学，问题解答，文本，自然语言处理，竞赛，推理，计算，数据集数据概述：该数据集包含来自数学竞赛的问题文本及解答。主要特征如下：时间跨度：数据未标明具体时间，视作静态数据集使用。...

ZIP

大规模多模态社交媒体推文数据集MMHS150KTweetImageTextDataset-raghav0210

2025年5月19日

大规模多模态社交媒体推文数据集MMHS150KTweetImageTextDataset-raghav0210 数据来源：互联网公开数据标签：社交媒体，推文，图像，文本，多模态，自然语言处理，计算机视觉，机器学习，情感分析数据概述：该数据集包含来自Twitter的推文数据，记录了推文的文本内容和对应的图像。主要特征如下：...

ZIP

宝可梦游戏文本描述数据集PokemonGameTextDescriptionDataset-academic8rb

2025年5月17日

宝可梦游戏文本描述数据集PokemonGameTextDescriptionDataset-academic8rb 数据来源：互联网公开数据标签：宝可梦, 游戏, 文本, 描述, 自然语言处理, 语料库, 文本挖掘, 数据分析数据概述：该数据集包含来自宝可梦游戏系列的文本描述数据，记录了不同宝可梦的详细介绍性文本。主要特征如下：...

ZIP

虚假新闻文本分类数据集FakeNewsTextClassificationDataset-eiosus

2025年5月13日

虚假新闻文本分类数据集FakeNewsTextClassificationDataset-eiosus 数据来源：互联网公开数据标签：虚假新闻, 文本分类, 新闻分析, 舆情监测, 机器学习, 自然语言处理, 标题, 文本数据概述：该数据集包含来自互联网的新闻文章，记录了标题和正文内容，并标注了文章的真实性。主要特征如下：...

ZIP

安然公司邮件语料库EnronEmailCorpus数据集-minalray

2025年5月12日

安然公司邮件语料库EnronEmailCorpus数据集-minalray 数据来源：互联网公开数据标签：邮件, 文本, 语料库, 自然语言处理, 金融, 能源, 文本挖掘, 商业数据概述：该数据集包含来自安然公司（Enron Corporation）内部员工的电子邮件数据，记录了公司运营期间的通信内容。主要特征如下：...

ZIP

电商平台商品信息数据集-sauravmishraa

2025年5月7日

电商平台商品信息数据集-sauravmishraa 数据来源：互联网公开数据标签：电商,商品,产品,描述,属性,文本,数据分析数据概述：本数据集包含了电商平台上商品的详细信息，主要特征如下： PRODUCT_ID：商品唯一标识符。 TITLE：商品的标题，提供商品的基本信息。...

ZIP

电影剧情问答数据集Wikipedia-IMDb-thedevastator

2025年5月4日

电影剧情问答数据集Wikipedia-IMDb-thedevastator 数据来源：互联网公开数据标签：问答,自然语言处理,电影,剧情,Wikipedia,IMDb,文本,机器阅读理解,语义理解数据概述：...

ZIP

国际专利分类标题数据集InternationalPatentClassificationTitles-wenyaohe

2025年5月1日

国际专利分类标题数据集InternationalPatentClassificationTitles-wenyaohe 数据来源：互联网公开数据标签：专利, 分类, 文本, 科技, 知识产权, IPC, 专利分析, 数据挖掘数据概述：该数据集包含来自国际专利分类（IPC）体系的标题数据，记录了不同分类层级的专利主题描述。主要特征如下：...

ZIP

多模态情感识别模型训练数据集MultimodalEmotionRecognitionModelTrainingData-phamtien130102

2025年5月1日

多模态情感识别模型训练数据集MultimodalEmotionRecognitionModelTrainingData-phamtien130102 数据来源：互联网公开数据标签：情感识别, 多模态, 语音, 文本, 图像, 深度学习, 数据集, 模型训练数据概述：...

ZIP

专利分类体系标题数据集PatentClassificationSystemTitleDataset-sherwinng

2025年5月1日

专利分类体系标题数据集PatentClassificationSystemTitleDataset-sherwinng 数据来源：互联网公开数据标签：专利, 分类, 标题, 文本, 知识产权, 科技, 语义分析, 文本挖掘数据概述：该数据集包含来自专利分类体系的标题信息，记录了不同分类层级的专利技术主题描述。主要特征如下：...

ZIP

中国专利分类标题数据集ChinaPatentClassificationTitlesDataset-zhangmaotai

2025年4月30日

中国专利分类标题数据集ChinaPatentClassificationTitlesDataset-zhangmaotai 数据来源：互联网公开数据标签：专利, 分类, 文本, 知识产权, 技术, 行业, 数据挖掘, 自然语言处理数据概述：该数据集包含来自中国专利分类体系的标题数据，记录了不同专利技术领域的分类信息。主要特征如下：...

ZIP

找到80个数据集

注册成功！