找到5,747个数据集

标签: 文本分析

过滤结果
  • 阅读理解竞赛数据集

    2025年4月27日   

    阅读理解竞赛数据集 数据来源:互联网公开数据 标签:阅读理解,竞赛,教育,自然语言处理,文本分析,机器学习,英语学习 数据概述:...
    packageimg
  • 泰语语料库数据集

    2025年4月27日   

    泰语语料库数据集 数据来源:互联网公开数据 标签:泰语,语料库,自然语言处理,机器学习,文本分析,泰文字体,分词算法 数据概述:...
    packageimg
  • 文本处理能力提升数据集

    2025年4月27日   

    文本处理能力提升数据集 数据来源:互联网公开数据 标签:文本处理,自然语言处理,编码技能,学习资源,技术培训,数据清洗,特征提取,文本分析,机器学习 数据概述:...
    packageimg
  • IMDB电影类型分类数据集1963-2021

    2025年4月26日   

    IMDB电影类型分类数据集1963-2021 数据来源:互联网公开数据 标签:电影,类型分类,自然语言处理,机器学习,数据可视化,推荐系统,文本分析 数据概述:...
    packageimg
  • UMAP聚类主题作文数据集

    2025年4月26日   

    UMAP聚类主题作文数据集 数据来源:互联网公开数据 标签:UMAP,聚类分析,主题作文,数据分析,机器学习,文本分析 数据概述: 本数据集是基于讨论和主题作文K折交叉验证的预处理CSV文件版本。数据经过清洗和预处理,适用于进一步的聚类分析,特别适合使用UMAP(均匀流形近邻嵌入)算法来进行降维和可视化。 数据用途概述:...
    packageimg
  • 黑客马拉松员工评价数据集

    2025年4月26日   

    黑客马拉松员工评价数据集 数据来源:互联网公开数据 标签:员工评价, 企业评分, 文本分析, 机器学习, 可靠性验证, 招聘网站, 企业测评 数据概述:...
    packageimg
  • CNN新闻文章数据集

    2025年4月26日   

    CNN新闻文章数据集 数据来源:互联网公开数据 标签:新闻媒体,CNN,文本分析,数据清洗,新闻分类,自然语言处理,NLP,新闻内容,新闻主题 数据概述:...
    packageimg
  • 新闻头条阅读量分析数据集Top25NewsDataset-szriz1

    2025年4月26日   

    新闻头条阅读量分析数据集Top25NewsDataset-szriz1 数据来源:互联网公开数据 标签:新闻,阅读量,数据集,自然语言处理,文本分析,舆情分析,新闻推荐,社交媒体 数据概述: 该数据集包含来自多个新闻网站的头条新闻数据,记录了新闻文章的各种信息和阅读量统计。主要特征如下:...
    packageimg
  • 语法错误纠正数据集GrammarErrorCorrectionDataset-pranav082001

    2025年4月26日   

    语法错误纠正数据集GrammarErrorCorrectionDataset-pranav082001 数据来源:互联网公开数据 标签:自然语言处理,语法纠错,数据集,机器学习,文本分析,语言技术,教育技术,人工智能 数据概述: 该数据集包含来自多种来源的文本数据,记录了包含语法错误的句子及其对应的正确句子。主要特征如下:...
    packageimg
  • 耶鲁大学科学论文摘要数据集YaleScientificPaperSummarizationDataset-aishikai

    2025年4月26日   

    耶鲁大学科学论文摘要数据集YaleScientificPaperSummarizationDataset-aishikai 数据来源:互联网公开数据 标签:学术论文,摘要生成,自然语言处理,数据集,文本分析,机器学习,论文写作,人工智能 数据概述: 该数据集包含来自耶鲁大学的科学论文摘要数据,旨在用于文本摘要生成任务。主要特征如下:...
    packageimg
  • 生成负样本数据集GenerateNegativeDataset-maxigitov

    2025年4月26日   

    生成负样本数据集GenerateNegativeDataset-maxigitov 数据来源:互联网公开数据 标签:数据集,负样本生成,机器学习,自然语言处理,数据增强,人工智能,文本分析,深度学习 数据概述: 该数据集包含生成的负样本数据,旨在用于机器学习和自然语言处理任务中的数据增强。主要特征如下:...
    packageimg
  • 航空公司客户评价数据集AirlineReviewData-arjunkrajan

    2025年4月26日   

    航空公司客户评价数据集AirlineReviewData-arjunkrajan 数据来源:互联网公开数据 标签:航空业,客户评价,数据集,文本分析,情感分析,机器学习,服务质量,旅游行业 数据概述: 该数据集包含来自航空公司的客户评价数据,记录了乘客对航班的整体评价和具体反馈。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 垃圾邮件检测数据集SpamDetectionDataset-sriharibhuvi

    2025年4月26日   

    垃圾邮件检测数据集SpamDetectionDataset-sriharibhuvi 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,数据集,自然语言处理,机器学习,文本分析,信息安全,数据挖掘 数据概述: 该数据集包含来自互联网公开邮件的数据,记录了电子邮件的文本内容和标签(是否为垃圾邮件)。主要特征如下:...
    packageimg
  • 普塔卡纳酒店西班牙语评论数据集PuntaCanaHotelsReviewSpanishDataset-beltrewilton

    2025年4月26日   

    普塔卡纳酒店西班牙语评论数据集PuntaCanaHotelsReviewSpanishDataset-beltrewilton 数据来源:互联网公开数据 标签:酒店评论,西班牙语,数据集,文本分析,情感分析,旅游行业,机器学习,自然语言处理 数据概述: 该数据集包含来自普塔卡纳地区酒店的西班牙语评论数据,记录了游客对酒店的评分和反馈。主要特征如下:...
    packageimg
  • 语言学习与自然语言处理数据集LangsData-LanguageLearningandNLPDataset-rookiejing

    2025年4月26日   

    语言学习与自然语言处理数据集LangsData-LanguageLearningandNLPDataset-rookiejing 数据来源:互联网公开数据 标签:语言学习,自然语言处理,数据集,机器学习,翻译技术,文本分析,教育科技,多语言 数据概述:...
    packageimg
  • 论坛讨论数据集ForumDiscussionDataset-amiranasser20

    2025年4月26日   

    论坛讨论数据集ForumDiscussionDataset-amiranasser20 数据来源:互联网公开数据 标签:数据集,论坛,讨论,文本分析,自然语言处理,社交媒体,数据挖掘,信息检索 数据概述: 该数据集包含来自多个在线论坛的讨论数据,记录了用户在论坛中的发帖,回复和互动内容。主要特征如下:...
    packageimg
  • 推特扩展训练数据集ExtendedTrainforTweetDataset-louise2001

    2025年4月26日   

    推特扩展训练数据集ExtendedTrainforTweetDataset-louise2001 数据来源:互联网公开数据 标签:推特,数据集,自然语言处理,文本分析,机器学习,社交媒体,情感分析,信息提取 数据概述:该数据集包含来自推特的扩展训练数据,记录了大量的推文内容,适用于自然语言处理和文本分析任务。主要特征如下:...
    packageimg
  • MASC测试表格数据集MASCTestSheetDataset-amrkhaledsaleh

    2025年4月26日   

    MASC测试表格数据集MASCTestSheetDataset-amrkhaledsaleh 数据来源:互联网公开数据 标签:语言处理,文本分析,数据集,自然语言处理,机器学习,情感分析,学术资源,计算机科学 数据概述: 该数据集包含来自MASC(Minimal Annotated Subcorpus of Canadian...
    packageimg
  • 板球比赛场景解说映射数据集-aniketh12

    2025年4月26日   

    板球比赛场景解说映射数据集-aniketh12 数据来源:互联网公开数据 标签:板球,比赛解说,数据集,自然语言处理,文本分析,机器学习,体育,数据挖掘 数据概述: 该数据集包含了板球比赛的场景描述及其对应的解说文本,旨在用于研究板球比赛的解说生成和理解。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了多个板球比赛季。...
    packageimg
  • 阿拉伯语方言数据集ArabiziDialectDataset-samawel97

    2025年4月26日   

    阿拉伯语方言数据集ArabiziDialectDataset-samawel97 数据来源:互联网公开数据 标签:阿拉伯语,方言,语言学,数据集,文本分析,自然语言处理,机器学习,文化研究 数据概述:该数据集包含来自多个阿拉伯语国家和地区的信息,记录了阿拉伯语方言(Arabizi)的文本数据。主要特征如下:...
    packageimg