找到9个数据集

标签: 文本清理

过滤结果
  • 鲁迪特与朱吉夫综合清理评论数据集-202X-satyanweshi

    2025年5月31日 30 27 3

    鲁迪特与朱吉夫综合清理评论数据集-202X-satyanweshi 数据来源:互联网公开数据 标签:评论数据,鲁迪特,Ruddit,朱吉夫,Jigsaw,文本清理,数据集,机器学习,自然语言处理,教育 数据概述:...
    packageimg
  • 文本清理数据集CleanedTextDataset-rahulk2197

    2025年4月25日 30 116 1

    文本清理数据集CleanedTextDataset-rahulk2197 数据来源:互联网公开数据 标签:文本清理,数据集,自然语言处理,文本分析,机器学习,文本挖掘,数据预处理,语言学 数据概述:该数据集包含经过清理和标准化处理的文本数据,适用于自然语言处理和文本分析。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 灾难推文清理数据集NLPDisasterTweetsCleanedDataset-garcke

    2025年4月24日 30 42 11

    灾难推文清理数据集NLPDisasterTweetsCleanedDataset-garcke 数据来源:互联网公开数据 标签:自然语言处理,灾难推文,数据集,文本清理,社交媒体,灾害监测,情感分析,机器学习 数据概述:该数据集包含经过清理的推文数据,主要用于灾难监测和情感分析。主要特征如下: 时间跨度:数据记录的时间范围从2015年到2020年。...
    packageimg
  • 对话记录清理数据集TranscriptCleanedDataset-mariamfaroukgadalla

    2025年4月24日 30 25 1

    对话记录清理数据集TranscriptCleanedDataset-mariamfaroukgadalla 数据来源:互联网公开数据 标签:对话记录,文本清理,数据集,自然语言处理,机器学习,文本分析,数据预处理,语言学 数据概述:该数据集包含经过清理的对话记录,适用于自然语言处理,文本分析等任务。主要特征如下:...
    packageimg
  • 新加坡优质地段住房评论数据集-2021年-jyingong

    2025年4月23日 30 29 15

    新加坡优质地段住房评论数据集-2021年-jyingong 数据来源:互联网公开数据 标签:新加坡,住房,公共住房,评论数据,Reddit,数据分析,文本清理 数据概述: 本数据集来源于Reddit,包含对新加坡优质地段住房(Prime Location Housing -...
    packageimg
  • 多主题分类新闻文章数据集1963-2021

    2025年4月18日 30 141 87

    多主题分类新闻文章数据集1963-2021 数据来源:互联网公开数据 标签:主题分类,新闻,文章,评论,情感分析,健康,金融,体育,科学,政治,NLP处理,文本清理,POS标注,词形还原 数据概述:...
    packageimg
  • 印度马拉地语新闻标题清理数据集

    2025年4月15日 30 147 141

    印度马拉地语新闻标题清理数据集 数据来源:互联网公开数据 标签:马拉地语,新闻标题,文本清理,数据处理,自然语言处理,SKlearn,分词,文本分析 数据概述: 本数据集包含约12000条经过清理的马拉地语新闻文章标题,源自iNLTK原始数据集。清理步骤包括罗马化、规范化、去除重复项及使用Indic-NLP-...
    packageimg
  • 情绪预测数据集

    2025年4月14日 30 10 9

    情绪预测数据集 数据来源:互联网公开数据 标签:情绪预测, WhatsApp状态,自然语言处理,情感分析,机器学习,文本清理,情感分类 数据概述:...
    packageimg
  • 航空客户评论数据集

    2025年4月14日 30 14 0

    航空客户评论数据集 数据来源:互联网公开数据 标签:航空,客户评论,自然语言处理,文本清理,词元化,情感分析,预测建模 数据概述: 本数据集包含关于航空公司的客户文本评论,涵盖了乘客对航空公司服务的多方面反馈。数据集为学习、实践或测试初学者到中级的自然语言处理任务提供了丰富的资源,包括文本清理、词元化、情感分析以及基于分析结果的预测建模。...
    packageimg