数据集 - 海数据

数据2024年互联网文本语料库1024-corpus-2024年互联网文本语料库-dinhnhattruong

2025年5月29日

2024年互联网文本语料库1024-corpus-2024年互联网文本语料库-dinhnhattruong 数据来源：互联网公开数据标签：互联网文本，自然语言处理，语料库，大数据，机器学习，文本分析，人工智能，语言学数据概述：该数据集为2024年互联网公开的文本数据，涵盖了广泛的互联网文本资源，适用于自然语言处理、文本分析等任务。主要特征如下：...

ZIP

越南语文本摘要生成数据集VietnameseTextSummarizationDataset-nguyenvuthanhtung

2025年5月29日

越南语文本摘要生成数据集VietnameseTextSummarizationDataset-nguyenvuthanhtung 数据来源：互联网公开数据标签：文本摘要, 自然语言处理, 越南语, 深度学习, 文本生成, 数据集构建, 机器翻译, 语料库数据概述：该数据集包含越南语文本及其对应的摘要，旨在用于文本摘要生成任务。主要特征如下：...

ZIP

亚马逊商品评论文本情感分析数据集AmazonProductReviewTextSentimentAnalysisDataset-harshalkarangale

2025年5月29日

亚马逊商品评论文本情感分析数据集AmazonProductReviewTextSentimentAnalysisDataset-harshalkarangale 数据来源：互联网公开数据标签：情感分析, 文本挖掘, 评论数据, 自然语言处理, 机器学习, 商品评价, 用户反馈, 消费者行为数据概述：...

ZIP

电影评论情感分析数据集MovieReviewsSentimentAnalysis-mdtanviruddinalif

2025年5月29日

电影评论情感分析数据集MovieReviewsSentimentAnalysis-mdtanviruddinalif 数据来源：互联网公开数据标签：情感分析, 文本分类, 电影评论, 自然语言处理, 情感极性, 机器学习, 数据标注, 语料库数据概述：该数据集包含来自互联网的电影评论文本，记录了每条评论对应的情感极性标签。主要特征如下：...

ZIP

巢式临床试验相似性数据集-aditishere

2025年5月29日

巢式临床试验相似性数据集-aditishere 数据来源：互联网公开数据标签：临床试验，数据集，相似性分析，医学研究，文本挖掘，自然语言处理，医学文献，药物研发数据概述：该数据集包含来自Nest平台的临床试验相关数据，记录了临床试验的详细信息，旨在用于评估临床试验之间的相似性。主要特征如下：...

ZIP

写作过程行为数据与得分预测数据集WritingProcessBehaviorDataandScorePredictionDataset-amanrajbose

2025年5月29日

写作过程行为数据与得分预测数据集WritingProcessBehaviorDataandScorePredictionDataset-amanrajbose 数据来源：互联网公开数据标签：写作行为, 文本分析, 时间序列分析, 行为建模, 机器学习, 自然语言处理, 写作评估, 预测模型数据概述：...

ZIP

新冠疫情期间微博情感分析数据集COVID-19WeiboSentimentAnalysisDataset-raymondcl

2025年5月29日

新冠疫情期间微博情感分析数据集COVID-19WeiboSentimentAnalysisDataset-raymondcl 数据来源：互联网公开数据标签：疫情, 微博, 情感分析, 自然语言处理, 文本分类, 社交媒体, 情感倾向, 中文文本数据概述：...

ZIP

Reddit华尔街赌注帖子数据集RedditWallStreetBetsPostDataset-lactrodectus

2025年5月29日

Reddit华尔街赌注帖子数据集RedditWallStreetBetsPostDataset-lactrodectus 数据来源：互联网公开数据标签：社交媒体，股票市场，投资，数据集，文本分析，情绪分析，自然语言处理，金融数据概述：...

ZIP

文本分类数据集SISTextClassificationDataset-senylar

2025年5月29日

文本分类数据集SISTextClassificationDataset-senylar 数据来源：互联网公开数据标签：文本分类，数据集，自然语言处理，机器学习，文本分析，数据挖掘，信息检索，人工智能数据概述：该数据集为SIS项目的一部分，主要包含用于文本分类任务的文本数据。主要特征如下：...

ZIP

图像问答与视觉推理数据集ImageQuestionAnsweringandVisualReasoningDataset-dotran0101

2025年5月29日

图像问答与视觉推理数据集ImageQuestionAnsweringandVisualReasoningDataset-dotran0101 数据来源：互联网公开数据标签：图像问答, 视觉推理, 多模态, 自然语言处理, 计算机视觉, 图像识别, 问答系统, 数据集数据概述：...

ZIP

科学考试因果关系语言模型奖励建模数据集-kashiwaba

2025年5月29日

科学考试因果关系语言模型奖励建模数据集-kashiwaba 数据来源：互联网公开数据标签：语言模型，因果关系，考试，奖励建模，自然语言处理，数据集，人工智能，教育数据概述：该数据集是用于训练和评估科学考试中因果关系理解的语言模型，并进行奖励建模的数据集。主要特征如下：时间跨度：数据涵盖了不同年份和版本的科学考试题目。...

ZIP

Gemma2模型微调数据集-anshdarji

2025年5月29日

Gemma2模型微调数据集-anshdarji 数据来源：互联网公开数据标签：大语言模型，微调，数据集，自然语言处理，文本生成，机器学习，人工智能，Gemma 数据概述：该数据集包含了用于微调 Gemma 2 模型的数据，旨在提升模型在特定任务上的表现。主要特征如下：时间跨度：数据生成时间随数据集内容而异，涵盖不同时间段的文本信息。...

ZIP

微软大规模机器阅读理解数据集MSMARCO的多元排序MNR数据-jack1019

2025年5月29日

微软大规模机器阅读理解数据集MSMARCO的多元排序MNR数据-jack1019 数据来源：互联网公开数据标签：机器阅读理解，自然语言处理，信息检索，数据集，排序学习，深度学习，问答系统，文本匹配数据概述：该数据集包含来自微软大规模机器阅读理解（MS MARCO）数据集的多元排序（MNR）数据，专门用于信息检索和问答系统的研究。主要特征如下：...

ZIP

英语文本重述与改写数据集EnglishParaphraseandRewritingDataset-terrychanorg

2025年5月29日

英语文本重述与改写数据集EnglishParaphraseandRewritingDataset-terrychanorg 数据来源：互联网公开数据标签：自然语言处理，文本改写，机器学习，数据集，语言模型，文本生成，语义分析，人工智能数据概述：...

ZIP

文字限制采样数据集SampledDataWordLimit190Dataset-amrkhaledsaleh

2025年5月29日

文字限制采样数据集SampledDataWordLimit190Dataset-amrkhaledsaleh 数据来源：互联网公开数据标签：文本分析，数据集，自然语言处理，机器学习，语言学，文本挖掘，文本分类，文本预处理数据概述：该数据集包含了经过采样的文本数据，每段文本的字数限制在190字内，适用于自然语言处理和文本分析任务。主要特征如下：...

ZIP

推特情绪分析数据集TwitterSentimentAnalysisDataset-shivangiag08

2025年5月29日

推特情绪分析数据集TwitterSentimentAnalysisDataset-shivangiag08 数据来源：互联网公开数据标签：社交媒体，情绪分析，自然语言处理，文本挖掘，机器学习，情感分类，数据分析，推特数据概述：该数据集包含来自推特（Twitter）的公开推文数据，记录了推文文本及其对应的情绪标签。主要特征如下：时间跨度：...

ZIP

数据2020年Shopee代码联赛情感分析数据集-rareloto

2025年5月29日

2020年Shopee代码联赛情感分析数据集-rareloto 数据来源：互联网公开数据标签：情感分析，自然语言处理，数据集，机器学习，文本分类，电商，Shopee，中文数据概述：该数据集来自2020年Shopee代码联赛，旨在用于情感分析任务，特别是针对电商平台上的用户评论。主要特征如下：时间跨度：数据记录的时间范围为2020年。...

ZIP

推特用户行为与内容分析数据集3-DatasetsCompiledTwitterData-shaikhsaadali

2025年5月29日

推特用户行为与内容分析数据集3-DatasetsCompiledTwitterData-shaikhsaadali 数据来源：互联网公开数据标签：社交媒体，推特，数据集，用户行为，文本分析，情感分析，机器学习，自然语言处理数据概述：该数据集包含来自推特平台的公开数据，记录了用户行为和推文内容。主要特征如下：...

ZIP

中文语言理解评测数据集CLUEAnswerDataset-prajeshrajbhandari

2025年5月29日

中文语言理解评测数据集CLUEAnswerDataset-prajeshrajbhandari 数据来源：互联网公开数据标签：自然语言处理，文本分类，机器学习，数据集，中文，语言理解，文本分析，人工智能数据概述：该数据集是中文语言理解评测（CLUE）的一部分，主要包含中文文本的分类和标注数据，用于评估和训练自然语言处理模型。主要特征如下：...

ZIP

大规模语言模型预训练数据集LLM-pretrainedDataset-afthesis

2025年5月29日

大规模语言模型预训练数据集LLM-pretrainedDataset-afthesis 数据来源：互联网公开数据标签：自然语言处理，大规模语言模型，预训练，数据集，文本数据，深度学习，语言模型，人工智能数据概述：该数据集包含了用于大规模语言模型（LLM）预训练的文本数据，旨在为模型提供丰富的语言知识和上下文理解能力。主要特征如下：时间跨度：...

ZIP

找到11,679个数据集

注册成功！