找到933个数据集

标签: 文本数据

过滤结果
  • 创意写作文本清洗数据集-mohamednafea01

    2025年4月25日   

    创意写作文本清洗数据集-mohamednafea01 数据来源:互联网公开数据 标签:文本数据,创意写作,数据清洗,自然语言处理,文本分析,语料库,机器学习,NLP 数据概述: 该数据集包含经过清洗的创意写作文本,旨在为自然语言处理和文本分析任务提供高质量的语料库。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期和类型的创意写作文本。...
    packageimg
  • 马拉地语微调数据集MarathiFine-tuningDataDataset-suramyajadhav

    2025年4月25日   

    马拉地语微调数据集MarathiFine-tuningDataDataset-suramyajadhav 数据来源:互联网公开数据 标签:自然语言处理,文本数据,机器学习,语言模型,数据集,多语言,语言微调,数据训练 数据概述: 该数据集包含马拉地语的文本数据,主要用作自然语言处理任务中的语言模型微调。主要特征如下:...
    packageimg
  • 大型语言模型数据集LlamaDataset-simakov

    2025年4月25日   

    大型语言模型数据集LlamaDataset-simakov 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本数据,语言模型,预训练,人工智能,文本生成 数据概述: 该数据集包含 Llama 项目收集的用于训练大型语言模型的数据,旨在支持文本生成,对话理解等多种自然语言处理任务。主要特征如下:...
    packageimg
  • 西班牙语文本情感分析数据集-suramyajadhav

    2025年4月25日   

    西班牙语文本情感分析数据集-suramyajadhav 数据来源:互联网公开数据 标签:情感分析,西班牙语,文本数据,自然语言处理,机器学习,情绪识别,语言学,文本挖掘 数据概述: 该数据集包含来自西班牙语文本的情感标注数据,用于训练和评估情感分析模型。主要特征如下: 时间跨度: 数据记录的时间范围不明确,但数据涵盖了多个时间段的文本内容。 地理范围:...
    packageimg
  • 互联网电影数据库IMDB电影评论情感分析数据集-swarajkedari

    2025年4月25日   

    互联网电影数据库IMDB电影评论情感分析数据集-swarajkedari 数据来源:互联网公开数据 标签:电影,评论,情感分析,自然语言处理,机器学习,文本数据,情感分类,影评 数据概述: 该数据集包含来自互联网电影数据库(IMDB)的电影评论数据,用于情感分析任务。主要特征如下:...
    packageimg
  • 古兰经阿拉伯语章节数据集-haykelbargougui

    2025年4月25日   

    古兰经阿拉伯语章节数据集-haykelbargougui 数据来源:互联网公开数据 标签:古兰经,阿拉伯语,文本数据,宗教,伊斯兰教,自然语言处理,文本分析,语言学 数据概述: 该数据集包含古兰经的阿拉伯语文本数据,记录了古兰经的各个章节及其对应的经文。主要特征如下: 时间跨度:数据涵盖了古兰经的全部内容,即从古兰经的创作时期至今。...
    packageimg
  • 情感分析二元分类数据集-chathushkajeewantha

    2025年4月25日   

    情感分析二元分类数据集-chathushkajeewantha 数据来源:互联网公开数据 标签:情感分析,二元分类,文本数据,机器学习,自然语言处理,情感极性,数据集,中文 数据概述: 该数据集包含用于情感分析的文本数据,主要用于二元情感分类任务。主要特征如下: 时间跨度:数据记录的时间范围未明确,但包含各类文本数据。...
    packageimg
  • 希伯来语文本情感分析数据集HebrewTextSentimentAnalysisDataset-yazanmeray

    2025年4月25日   

    希伯来语文本情感分析数据集HebrewTextSentimentAnalysisDataset-yazanmeray 数据来源:互联网公开数据 标签:希伯来语,情感分析,文本数据,自然语言处理,机器学习,语言学,数据集,NLP 数据概述: 该数据集包含来自互联网的希伯来语文本数据,用于情感分析任务。主要特征如下: 时间跨度:...
    packageimg
  • 互联网电影数据库IMDB情感分析数据集-rahulgupta55

    2025年4月25日   

    互联网电影数据库IMDB情感分析数据集-rahulgupta55 数据来源:互联网公开数据 标签:自然语言处理,情感分析,文本分类,数据集,机器学习,电影评论,文本数据,情感极性 数据概述: 该数据集包含来自互联网电影数据库(IMDB)的电影评论数据,用于情感分析任务。主要特征如下:...
    packageimg
  • 法语电影评论及英译数据集

    2025年4月25日   

    法语电影评论及英译数据集 数据来源:互联网公开数据 标签:电影评论,法语,情感分析,翻译,自然语言处理,文本数据,电影产业 数据概述: 本数据集包含从法国知名电影网站Allociné收集的法语电影评论及其英文翻译版本。原始数据由Théophile...
    packageimg
  • 多领域问答数据集-包含4万条带上下文信息的数据集

    2025年4月25日   

    多领域问答数据集-包含4万条带上下文信息的数据集 数据来源:互联网公开数据 标签:问答,上下文,多领域,文本数据,自然语言处理,机器学习,数据清洗,数据预处理 数据概述:...
    packageimg
  • 情感分析清洗数据集CleanedSentimentAnalysisData-mustafasaleh21

    2025年4月25日   

    情感分析清洗数据集CleanedSentimentAnalysisData-mustafasaleh21 数据来源:互联网公开数据 标签:情感分析,文本数据,自然语言处理,数据集,情感分类,机器学习,数据清洗,中文文本 数据概述: 该数据集包含经过清洗的中文情感分析数据,主要用于情感分类,文本挖掘等任务。主要特征如下: 时间跨度:...
    packageimg
  • 美国YouTube评论情感分析清洗数据集

    2025年4月25日   

    美国YouTube评论情感分析清洗数据集 数据来源:互联网公开数据 标签:YouTube评论,情感分析,文本数据,自然语言处理,情感分类,机器学习,数据清洗,社交媒体 数据概述:...
    packageimg
  • 大型语言模型训练原始数据集LargeLanguageModelTrainingRawDataset-wanfangyuan

    2025年4月25日   

    大型语言模型训练原始数据集LargeLanguageModelTrainingRawDataset-wanfangyuan 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,深度学习,人工智能,语言模型,文本数据,模型训练 数据概述: 该数据集包含用于训练大型语言模型的原始文本数据,记录了多种来源的文本内容。主要特征如下:...
    packageimg
  • 推特情感分析数据集-情感分类与文本数据清洗-推特文本-

    2025年4月24日   

    推特情感分析数据集-情感分类与文本数据清洗-推特文本- 数据来源:互联网公开数据 标签:推特,情感分析,文本数据,清洗,情感分类,自然语言处理,社交媒体,情绪识别 数据概述: 本数据集源自推特(Twitter)平台,包含经过处理的推特文本数据,用于情感分析研究。 数据集共包含三个主要字段:情感标签、清洗后的推特文本、原始推特文本。...
    packageimg
  • 英印互译数据集EngHindiDataset-abcdef999

    2025年4月24日   

    英印互译数据集EngHindiDataset-abcdef999 数据来源:互联网公开数据 标签:机器翻译,数据集,印地语,英语,自然语言处理,文本数据,跨语言,语言学 数据概述: 该数据集包含了英语和印地语的平行语料,即互译的句子对。主要特征如下: 时间跨度:数据记录的时间范围不限,收录了不同时期,不同来源的文本。...
    packageimg
  • 广告活动数据与大型语言模型训练数据集-datamaster47

    2025年4月24日   

    广告活动数据与大型语言模型训练数据集-datamaster47 数据来源:互联网公开数据 标签:广告,营销,大型语言模型,自然语言处理,文本数据,机器学习,广告效果,数据集 数据概述: 该数据集包含广告活动相关数据,旨在用于训练大型语言模型(LLM)。主要特征如下: 时间跨度:数据记录的时间范围涵盖一段时间内的广告活动数据。...
    packageimg
  • 带时间戳的文本标注数据集-vanniagm

    2025年4月24日   

    带时间戳的文本标注数据集-vanniagm 数据来源:互联网公开数据 标签:文本数据,时间戳,标注,自然语言处理,数据集,文本分析,信息抽取,机器学习 数据概述: 该数据集包含带时间戳的文本数据,记录了文本内容及其对应的时间信息。主要特征如下: 时间跨度:数据记录的时间范围取决于原始文本数据的时间跨度,可能从数小时到数年不等。...
    packageimg
  • 多语言文本数据集Multi-LanguageTextDataset-farouqalzeer

    2025年4月24日   

    多语言文本数据集Multi-LanguageTextDataset-farouqalzeer 数据来源:互联网公开数据 标签:多语言,文本数据,自然语言处理,数据集,机器学习,文本分类,语言翻译,语言技术 数据概述: 该数据集包含来自多个不同语言的文本数据,记录了多种语言的自然语言文本内容。主要特征如下: 时间跨度:...
    packageimg
  • 推特清洗文本数据集TwitterCleanedTextDataset-annadad

    2025年4月24日   

    推特清洗文本数据集TwitterCleanedTextDataset-annadad 数据来源:互联网公开数据 标签:推特,社交媒体,文本数据,数据清洗,自然语言处理,机器学习,情感分析,社会研究 数据概述: 该数据集包含了来自Twitter的推文文本数据,经过清洗处理,适用于自然语言处理,机器学习等任务。主要特征如下:...
    packageimg