-
数据2024年互联网文本语料库1024-corpus-2024年互联网文本语料库-dinhnhattruong
2024年互联网文本语料库1024-corpus-2024年互联网文本语料库-dinhnhattruong 数据来源:互联网公开数据 标签:互联网文本,自然语言处理,语料库,大数据,机器学习,文本分析,人工智能,语言学 数据概述:该数据集为2024年互联网公开的文本数据,涵盖了广泛的互联网文本资源,适用于自然语言处理、文本分析等任务。主要特征如下:... -
越南语文本摘要生成数据集VietnameseTextSummarizationDataset-nguyenvuthanhtung
越南语文本摘要生成数据集VietnameseTextSummarizationDataset-nguyenvuthanhtung 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 越南语, 深度学习, 文本生成, 数据集构建, 机器翻译, 语料库 数据概述: 该数据集包含越南语文本及其对应的摘要,旨在用于文本摘要生成任务。主要特征如下:... -
亚马逊商品评论文本情感分析数据集AmazonProductReviewTextSentimentAnalysisDataset-harshalkarangale
亚马逊商品评论文本情感分析数据集AmazonProductReviewTextSentimentAnalysisDataset-harshalkarangale 数据来源:互联网公开数据 标签:情感分析, 文本挖掘, 评论数据, 自然语言处理, 机器学习, 商品评价, 用户反馈, 消费者行为 数据概述:... -
电影评论情感分析数据集MovieReviewsSentimentAnalysis-mdtanviruddinalif
电影评论情感分析数据集MovieReviewsSentimentAnalysis-mdtanviruddinalif 数据来源:互联网公开数据 标签:情感分析, 文本分类, 电影评论, 自然语言处理, 情感极性, 机器学习, 数据标注, 语料库 数据概述: 该数据集包含来自互联网的电影评论文本,记录了每条评论对应的情感极性标签。主要特征如下:... -
巢式临床试验相似性数据集-aditishere
巢式临床试验相似性数据集-aditishere 数据来源:互联网公开数据 标签:临床试验,数据集,相似性分析,医学研究,文本挖掘,自然语言处理,医学文献,药物研发 数据概述: 该数据集包含来自Nest平台的临床试验相关数据,记录了临床试验的详细信息,旨在用于评估临床试验之间的相似性。主要特征如下:... -
写作过程行为数据与得分预测数据集WritingProcessBehaviorDataandScorePredictionDataset-amanrajbose
写作过程行为数据与得分预测数据集WritingProcessBehaviorDataandScorePredictionDataset-amanrajbose 数据来源:互联网公开数据 标签:写作行为, 文本分析, 时间序列分析, 行为建模, 机器学习, 自然语言处理, 写作评估, 预测模型 数据概述:... -
新冠疫情期间微博情感分析数据集COVID-19WeiboSentimentAnalysisDataset-raymondcl
新冠疫情期间微博情感分析数据集COVID-19WeiboSentimentAnalysisDataset-raymondcl 数据来源:互联网公开数据 标签:疫情, 微博, 情感分析, 自然语言处理, 文本分类, 社交媒体, 情感倾向, 中文文本 数据概述:... -
Reddit华尔街赌注帖子数据集RedditWallStreetBetsPostDataset-lactrodectus
Reddit华尔街赌注帖子数据集RedditWallStreetBetsPostDataset-lactrodectus 数据来源:互联网公开数据 标签:社交媒体,股票市场,投资,数据集,文本分析,情绪分析,自然语言处理,金融 数据概述:... -
文本分类数据集SISTextClassificationDataset-senylar
文本分类数据集SISTextClassificationDataset-senylar 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,文本分析,数据挖掘,信息检索,人工智能 数据概述: 该数据集为SIS项目的一部分,主要包含用于文本分类任务的文本数据。主要特征如下:... -
图像问答与视觉推理数据集ImageQuestionAnsweringandVisualReasoningDataset-dotran0101
图像问答与视觉推理数据集ImageQuestionAnsweringandVisualReasoningDataset-dotran0101 数据来源:互联网公开数据 标签:图像问答, 视觉推理, 多模态, 自然语言处理, 计算机视觉, 图像识别, 问答系统, 数据集 数据概述:... -
科学考试因果关系语言模型奖励建模数据集-kashiwaba
科学考试因果关系语言模型奖励建模数据集-kashiwaba 数据来源:互联网公开数据 标签:语言模型,因果关系,考试,奖励建模,自然语言处理,数据集,人工智能,教育 数据概述: 该数据集是用于训练和评估科学考试中因果关系理解的语言模型,并进行奖励建模的数据集。主要特征如下: 时间跨度:数据涵盖了不同年份和版本的科学考试题目。... -
Gemma2模型微调数据集-anshdarji
Gemma2模型微调数据集-anshdarji 数据来源:互联网公开数据 标签:大语言模型,微调,数据集,自然语言处理,文本生成,机器学习,人工智能,Gemma 数据概述:该数据集包含了用于微调 Gemma 2 模型的数据,旨在提升模型在特定任务上的表现。主要特征如下: 时间跨度:数据生成时间随数据集内容而异,涵盖不同时间段的文本信息。... -
微软大规模机器阅读理解数据集MSMARCO的多元排序MNR数据-jack1019
微软大规模机器阅读理解数据集MSMARCO的多元排序MNR数据-jack1019 数据来源:互联网公开数据 标签:机器阅读理解,自然语言处理,信息检索,数据集,排序学习,深度学习,问答系统,文本匹配 数据概述: 该数据集包含来自微软大规模机器阅读理解(MS MARCO)数据集的多元排序(MNR)数据,专门用于信息检索和问答系统的研究。主要特征如下:... -
英语文本重述与改写数据集EnglishParaphraseandRewritingDataset-terrychanorg
英语文本重述与改写数据集EnglishParaphraseandRewritingDataset-terrychanorg 数据来源:互联网公开数据 标签:自然语言处理,文本改写,机器学习,数据集,语言模型,文本生成,语义分析,人工智能 数据概述:... -
文字限制采样数据集SampledDataWordLimit190Dataset-amrkhaledsaleh
文字限制采样数据集SampledDataWordLimit190Dataset-amrkhaledsaleh 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,机器学习,语言学,文本挖掘,文本分类,文本预处理 数据概述:该数据集包含了经过采样的文本数据,每段文本的字数限制在190字内,适用于自然语言处理和文本分析任务。主要特征如下:... -
推特情绪分析数据集TwitterSentimentAnalysisDataset-shivangiag08
推特情绪分析数据集TwitterSentimentAnalysisDataset-shivangiag08 数据来源:互联网公开数据 标签:社交媒体,情绪分析,自然语言处理,文本挖掘,机器学习,情感分类,数据分析,推特 数据概述: 该数据集包含来自推特(Twitter)的公开推文数据,记录了推文文本及其对应的情绪标签。主要特征如下: 时间跨度:... -
数据2020年Shopee代码联赛情感分析数据集-rareloto
2020年Shopee代码联赛情感分析数据集-rareloto 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本分类,电商,Shopee,中文 数据概述: 该数据集来自2020年Shopee代码联赛,旨在用于情感分析任务,特别是针对电商平台上的用户评论。主要特征如下: 时间跨度:数据记录的时间范围为2020年。... -
推特用户行为与内容分析数据集3-DatasetsCompiledTwitterData-shaikhsaadali
推特用户行为与内容分析数据集3-DatasetsCompiledTwitterData-shaikhsaadali 数据来源:互联网公开数据 标签:社交媒体,推特,数据集,用户行为,文本分析,情感分析,机器学习,自然语言处理 数据概述: 该数据集包含来自推特平台的公开数据,记录了用户行为和推文内容。主要特征如下:... -
中文语言理解评测数据集CLUEAnswerDataset-prajeshrajbhandari
中文语言理解评测数据集CLUEAnswerDataset-prajeshrajbhandari 数据来源:互联网公开数据 标签:自然语言处理,文本分类,机器学习,数据集,中文,语言理解,文本分析,人工智能 数据概述: 该数据集是中文语言理解评测(CLUE)的一部分,主要包含中文文本的分类和标注数据,用于评估和训练自然语言处理模型。主要特征如下:... -
大规模语言模型预训练数据集LLM-pretrainedDataset-afthesis
大规模语言模型预训练数据集LLM-pretrainedDataset-afthesis 数据来源:互联网公开数据 标签:自然语言处理,大规模语言模型,预训练,数据集,文本数据,深度学习,语言模型,人工智能 数据概述: 该数据集包含了用于大规模语言模型(LLM)预训练的文本数据,旨在为模型提供丰富的语言知识和上下文理解能力。主要特征如下: 时间跨度:...