找到933个数据集

标签: 文本数据

过滤结果
  • 阿拉伯语推特文本数据集ArabicTwitterTextData-asalhi

    2025年5月29日   

    阿拉伯语推特文本数据集ArabicTwitterTextData-asalhi 数据来源:互联网公开数据 标签:阿拉伯语, 社交媒体, 文本数据, 推特, 自然语言处理, 情感分析, 文本挖掘, 语料库 数据概述: 该数据集包含来自Twitter平台的阿拉伯语推文文本数据,记录了用户发布的推文内容及其对应的URL链接。主要特征如下:...
    packageimg
  • 维基文本清洗数据集第二部分WikitextCleanDataPart2Dataset-yingpengchen

    2025年5月29日   

    维基文本清洗数据集第二部分WikitextCleanDataPart2Dataset-yingpengchen 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,文本清洗,机器学习,语言模型,信息检索,文本分析 数据概述: 该数据集是维基文本清洗数据集的第二部分,包含了从维基百科中提取和清洗过的文本数据。主要特征如下:...
    packageimg
  • 商品标题文本数据集ProductTitleTextData-composto

    2025年5月29日   

    商品标题文本数据集ProductTitleTextData-composto 数据来源:互联网公开数据 标签:商品标题, 文本数据, 商品识别, 文本分析, 巴西市场, 零售商品, 自然语言处理, 命名实体识别 数据概述: 该数据集包含来自巴西市场的商品标题文本,记录了各种商品的名称和对应的商品ID。主要特征如下:...
    packageimg
  • 社交媒体评论文本情感分析数据集SocialMediaCommentSentimentAnalysis-iluxave

    2025年5月29日   

    社交媒体评论文本情感分析数据集SocialMediaCommentSentimentAnalysis-iluxave 数据来源:互联网公开数据 标签:情感分析, 文本数据, 自然语言处理, 评论数据, 情感分类, 机器学习, 文本挖掘, 数据预处理 数据概述: 该数据集包含来自社交媒体平台的评论文本数据,主要用于情感分析任务。主要特征如下:...
    packageimg
  • 文本情感分析数据集TextSentimentAnalysisDataset-haroldlee02

    2025年5月29日   

    文本情感分析数据集TextSentimentAnalysisDataset-haroldlee02 数据来源:互联网公开数据 标签:文本情感分析, 情感分类, 文本数据, 机器学习, 自然语言处理, 数据标注, 情感倾向, 文本语料 数据概述: 该数据集包含来自不同来源的文本数据,记录了用于情感分析任务的文本及其对应的情感标签。主要特征如下:...
    packageimg
  • 情感分析文本数据集SentimentAnalysisTextDataset-vinsshaji12

    2025年5月29日   

    情感分析文本数据集SentimentAnalysisTextDataset-vinsshaji12 数据来源:互联网公开数据 标签:情感分析, 文本分类, 情感倾向, 文本数据, 情感标注, 自然语言处理, 机器学习, 文本语料 数据概述: 该数据集包含用于情感分析任务的文本数据,记录了不同文本片段的情感倾向。主要特征如下:...
    packageimg
  • 新冠疫情社交媒体情感分析数据集COVID-19SocialMediaSentimentAnalysis-mlcovidresearch

    2025年5月29日   

    新冠疫情社交媒体情感分析数据集COVID-19SocialMediaSentimentAnalysis-mlcovidresearch 数据来源:互联网公开数据 标签:新冠疫情, 情感分析, 社交媒体, 文本数据, 情感分类, 自然语言处理, 情绪识别, 舆情分析 数据概述:...
    packageimg
  • 多语言词对翻译数据集MultilingualWordPairTranslationDataset-jaswanth431

    2025年5月29日   

    多语言词对翻译数据集MultilingualWordPairTranslationDataset-jaswanth431 数据来源:互联网公开数据 标签:机器翻译, 词对翻译, 多语言, 文本数据, 印度语言, 文本分析, 自然语言处理, 语言学 数据概述: 该数据集包含来自不同印度语言的词对翻译数据,旨在促进多语言翻译模型的研究与开发。主要特征如下:...
    packageimg
  • 维基百科文章文本数据集WikipediaArticleTextData-tolgaerdogmus

    2025年5月29日   

    维基百科文章文本数据集WikipediaArticleTextData-tolgaerdogmus 数据来源:互联网公开数据 标签:维基百科, 文本数据, 自然语言处理, 文本分析, 信息检索, 语料库, 文本挖掘, 数据集 数据概述: 该数据集包含来自维基百科的文章文本数据,记录了维基百科上收录的各种主题的文章内容。主要特征如下:...
    packageimg
  • 社交媒体事件分析数据集SocialMediaEventAnalysis-swapnikavajrapu

    2025年5月29日   

    社交媒体事件分析数据集SocialMediaEventAnalysis-swapnikavajrapu 数据来源:互联网公开数据 标签:社交媒体, 事件分析, 数据挖掘, 舆情分析, 文本数据, 传播分析, 时间序列, 数据可视化 数据概述: 该数据集包含来自社交媒体的数据,记录了特定事件的传播信息。主要特征如下:...
    packageimg
  • Jigsaw评论文本翻译数据集JigsawTrainTranslatedDataset-ma7555

    2025年5月29日   

    Jigsaw评论文本翻译数据集JigsawTrainTranslatedDataset-ma7555 数据来源:互联网公开数据 标签:文本数据,翻译,评论,自然语言处理,机器学习,多语言,文本分析,情感分析 数据概述: 该数据集来自 Jigsaw 竞赛,主要包含了经过翻译的评论文本,旨在用于多语言环境下的有害评论检测任务。主要特征如下:...
    packageimg
  • 印度语文件数据集HindiLanguageFilesDataset-sherinkk

    2025年5月29日   

    印度语文件数据集HindiLanguageFilesDataset-sherinkk 数据来源:互联网公开数据 标签:印度语,文本数据,数据集,自然语言处理,机器学习,语言研究,文本分析,多语言 数据概述: 该数据集包含来自印度语(Hindi)环境下的各类文本文件,记录了印度语在不同场景下的使用情况。主要特征如下:...
    packageimg
  • LSTM模型预训练数据文件数据集-cristianozhuo

    2025年5月29日   

    LSTM模型预训练数据文件数据集-cristianozhuo 数据来源:互联网公开数据 标签:深度学习,自然语言处理,LSTM,预训练,文本数据,数据集,序列建模,机器学习 数据概述: 该数据集包含用于LSTM(长短期记忆网络)模型预训练的文本数据,旨在为深度学习模型提供基础的语言知识。主要特征如下:...
    packageimg
  • 用户行为分析测试数据集UserBehaviorAnalysisTestingData-markchenncku

    2025年5月29日   

    用户行为分析测试数据集UserBehaviorAnalysisTestingData-markchenncku 数据来源:互联网公开数据 标签:用户行为, 数据分析, 行为预测, 用户画像, 机器学习, 文本数据, 模拟数据, 行为建模 数据概述: 该数据集包含模拟的用户行为数据,记录了用户在特定平台或场景下的活动轨迹。主要特征如下:...
    packageimg
  • 社交媒体情感分析负面情感文本数据集SocialMediaSentimentAnalysisNegativeTextCorpus-mariaeremeeva

    2025年5月28日   

    社交媒体情感分析负面情感文本数据集SocialMediaSentimentAnalysisNegativeTextCorpus-mariaeremeeva 数据来源:互联网公开数据 标签:情感分析, 文本分类, 负面情绪, 社交媒体, 文本数据, 自然语言处理, 机器学习, 数据标注 数据概述:...
    packageimg
  • 越南语-苗语翻译平衡语料库数据集Pho-MTBalanceLabelDataset-baotanguyen

    2025年5月28日   

    越南语-苗语翻译平衡语料库数据集Pho-MTBalanceLabelDataset-baotanguyen 数据来源:互联网公开数据 标签:机器翻译,语料库,越南语,苗语,语言学,自然语言处理,双语数据,文本数据 数据概述: 该数据集包含越南语和苗语的双语平行文本,旨在促进越南语和苗语之间的机器翻译研究。主要特征如下:...
    packageimg
  • 社交媒体情感分析训练数据集SocialMediaSentimentAnalysisTrainingData-arshjat

    2025年5月28日   

    社交媒体情感分析训练数据集SocialMediaSentimentAnalysisTrainingData-arshjat 数据来源:互联网公开数据 标签:情感分析, 文本分类, 社交媒体, 机器学习, 自然语言处理, 情感标注, 文本数据, 舆情分析 数据概述:...
    packageimg
  • 模型预测结果验证数据集ModelPredictionValidationResults-kansukehabano

    2025年5月28日   

    模型预测结果验证数据集ModelPredictionValidationResults-kansukehabano 数据来源:互联网公开数据 标签:模型验证, 预测结果, 机器学习, 文本数据, 数据分析, 评估指标, 预测模型, 数据集 数据概述: 该数据集包含模型预测结果的验证数据,记录了模型对特定任务的预测值。主要特征如下:...
    packageimg
  • 推特用户情感分析训练数据集CombinedTwitterDatasetforTraining-shaikhsaadali

    2025年5月28日   

    推特用户情感分析训练数据集CombinedTwitterDatasetforTraining-shaikhsaadali 数据来源:互联网公开数据 标签:推特,情感分析,文本数据,自然语言处理,机器学习,情感分类,社交媒体,数据集 数据概述:...
    packageimg
  • 基尼亚卢旺达语预训练与微调数据集-kclaude

    2025年5月28日   

    基尼亚卢旺达语预训练与微调数据集-kclaude 数据来源:互联网公开数据 标签:基尼亚卢旺达语,自然语言处理,数据集,预训练,微调,语言模型,文本数据,非洲语言 数据概述: 该数据集包含了用于基尼亚卢旺达语自然语言处理任务的预训练和微调数据。主要特征如下: 时间跨度:数据记录的时间范围没有明确限制,数据集持续更新,涵盖不同时期的文本资料。...
    packageimg