找到5,732个数据集

标签: 文本分析

过滤结果
  • 文本编码与TF-IDF权重计算数据集Encode-TFIDFDataset-damvantai

    2025年4月22日   

    文本编码与TF-IDF权重计算数据集Encode-TFIDFDataset-damvantai 数据来源:互联网公开数据 标签:文本处理,TF-IDF,数据集,自然语言处理,特征提取,机器学习,信息检索,文本分析 数据概述: 该数据集专注于文本编码与TF-IDF(词频-逆文档频率)权重计算,记录了文本数据经过处理后的特征向量。主要特征如下:...
    packageimg
  • 数据2021年5月Job-A-Thon竞赛数据集-makrovh

    2025年4月22日   

    2021年5月Job-A-Thon竞赛数据集-makrovh 数据来源:互联网公开数据 标签:招聘,求职,数据集,机器学习,自然语言处理,文本分析,预测模型,人才市场 数据概述: 该数据集包含了2021年5月Job-A-Thon竞赛的相关数据,主要记录了招聘和求职信息,旨在用于构建预测模型。主要特征如下:...
    packageimg
  • Flipkart电商平台用户商品评价数据集-farhakouser

    2025年4月22日   

    Flipkart电商平台用户商品评价数据集-farhakouser 数据来源:互联网公开数据 标签:电商,用户评价,产品反馈,情感分析,市场调研,推荐系统,文本分析 数据概述: 本数据集收录了来自Flipkart电商平台的客户商品评价数据,涵盖了用户对商品的详细反馈。数据集中包含了多个关键字段,旨在全面反映用户的使用体验和评价。具体字段包括:...
    packageimg
  • 意大利讽刺检测数据集ItalianSarcasmDetectionDataset-gioelefanelli

    2025年4月22日   

    意大利讽刺检测数据集ItalianSarcasmDetectionDataset-gioelefanelli 数据来源:互联网公开数据 标签:讽刺检测,自然语言处理,数据集,机器学习,文本分析,社交媒体,人工智能 数据概述:该数据集包含来自意大利社交媒体平台的数据,记录了用户发布的评论及其是否为讽刺的判断结果。主要特征如下:...
    packageimg
  • 互联网新闻摘要数据集HSXLNETSummaryDataset-gayatriilan

    2025年4月22日   

    互联网新闻摘要数据集HSXLNETSummaryDataset-gayatriilan 数据来源:互联网公开数据 标签:新闻摘要,数据集,自然语言处理,文本分析,机器学习,信息检索,媒体研究,互联网新闻 数据概述: 该数据集包含来自互联网新闻网站的新闻文章及其对应的摘要,适用于新闻摘要生成,文本摘要技术研究等任务。主要特征如下:...
    packageimg
  • 放射科报告数据集RadiologyReportDataset-lucario73

    2025年4月22日   

    放射科报告数据集RadiologyReportDataset-lucario73 数据来源:互联网公开数据 标签:医学影像,放射学,数据集,自然语言处理,文本分析,疾病诊断,深度学习,医疗健康 数据概述:该数据集包含来自公开医疗机构的放射科报告,记录了患者的影像学检查结果和医生的诊断意见。主要特征如下:...
    packageimg
  • 法律数据预处理数据集PreprocessingLegalDataDataset-philanpersonal

    2025年4月22日   

    法律数据预处理数据集PreprocessingLegalDataDataset-philanpersonal 数据来源:互联网公开数据 标签:法律数据,预处理,数据集,文本分析,自然语言处理,法律研究,数据清洗,法律文本 数据概述: 该数据集包含经过预处理的法律文本数据,适用于法律研究,文本分析和自然语言处理等任务。主要特征如下:...
    packageimg
  • 命运2游戏论坛热门帖子数据集DestinyTheGameSubredditTop1kPostsDataset-keplaxo

    2025年4月22日   

    命运2游戏论坛热门帖子数据集DestinyTheGameSubredditTop1kPostsDataset-keplaxo 数据来源:互联网公开数据 标签:游戏,数据集,论坛,社区,文本分析,情感分析,自然语言处理,游戏讨论 数据概述: 该数据集包含来自命运2(Destiny...
    packageimg
  • 互联网歌词文本数据集LyricsfromWebDataset-kevinree

    2025年4月22日   

    互联网歌词文本数据集LyricsfromWebDataset-kevinree 数据来源:互联网公开数据 标签:歌词,文本分析,自然语言处理,音乐,数据集,情感分析,机器学习,中文 数据概述: 该数据集包含从互联网上抓取的歌词文本数据,涵盖了不同语言和风格的歌曲。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了从早期歌曲到现代音乐作品。...
    packageimg
  • 精选啤酒品鉴特征与风格数据集-stephenpolozoff

    2025年4月22日   

    精选啤酒品鉴特征与风格数据集-stephenpolozoff 数据来源:互联网公开数据 标签:啤酒,品鉴,风格,评价,文本分析,推荐系统,口味,饮品 数据概述:...
    packageimg
  • 新闻分类数据集NewsCategoryDataset-tanmaypatil3151

    2025年4月22日   

    新闻分类数据集NewsCategoryDataset-tanmaypatil3151 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,机器学习,自然语言处理,信息提取,分类算法,数据挖掘 数据概述: 该数据集包含来自互联网的新闻文章数据,记录了新闻文章的标题,描述,类别等信息。主要特征如下:...
    packageimg
  • Spacy测试数据集SpacyTestDataset-hhhurenyuan

    2025年4月22日   

    Spacy测试数据集SpacyTestDataset-hhhurenyuan 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,NLP,文本分类,语言模型,人工智能 数据概述: 该数据集为 Spacy 项目的测试数据集,主要记录了用于自然语言处理任务的文本数据。主要特征如下: 时间跨度:数据记录的时间范围未知。...
    packageimg
  • 罗马乌尔都语评论数据集RomanUrduReviewsDataset-owaistahir

    2025年4月22日   

    罗马乌尔都语评论数据集RomanUrduReviewsDataset-owaistahir 数据来源:互联网公开数据 标签:文本分析,情感分析,数据集,自然语言处理,机器学习,文本挖掘,社会媒体,网络评论 数据概述: 该数据集包含来自罗马乌尔都语社交媒体和网络平台的评论数据,记录了用户对各种产品,服务和事件的评价。主要特征如下:...
    packageimg
  • 客户聊天数据分析数据集-pankajsoni12

    2025年4月22日   

    客户聊天数据分析数据集-pankajsoni12 数据来源:互联网公开数据 标签:客户服务,聊天数据,文本分析,自然语言处理,情感分析,用户行为,数据挖掘,机器学习 数据概述: 该数据集包含来自客户聊天记录的数据,记录了客户与客服之间的交互信息。主要特征如下: 时间跨度:数据记录的时间范围为[具体时间段,如2022年1月至2023年12月]。...
    packageimg
  • 绝命毒师剧本数据集BreakingBadSeason1-3Episode1-7ScriptDataset-peteremiya

    2025年4月22日   

    绝命毒师剧本数据集BreakingBadSeason1-3Episode1-7ScriptDataset-peteremiya 数据来源:互联网公开数据 标签:绝命毒师,剧本,电视剧,文本分析,数据集,自然语言处理,电视剧研究,文化研究 数据概述: 该数据集包含了美剧《绝命毒师》(Breaking...
    packageimg
  • 数据2023年共和党候选人辩论发言数据集-sc6354

    2025年4月22日   

    2023年共和党候选人辩论发言数据集-sc6354 数据来源:互联网公开数据 标签:共和党,候选人辩论,政治,文本分析,选举,言论,2023年 数据概述: 本数据集包含2023年共和党候选人辩论中每位候选人的发言内容。数据集经过清洗处理,每行记录一个句子或短语。原始演讲记录可通过提供的链接获取。 数据用途概述:...
    packageimg
  • CNN新闻内容数据集CNNNewsContentDataset-interviewturabit

    2025年4月22日   

    CNN新闻内容数据集CNNNewsContentDataset-interviewturabit 数据来源:互联网公开数据 标签:新闻媒体,数据集,文本分析,机器学习,自然语言处理,信息提取,新闻分类,媒体研究 数据概述: 该数据集包含来自CNN的新闻文章数据,记录了大量新闻文本的详细信息。主要特征如下:...
    packageimg
  • 印度语电影字幕数据集HindiLanguageMovieSubtitlesDataset-mogazeyalmogazey

    2025年4月22日   

    印度语电影字幕数据集HindiLanguageMovieSubtitlesDataset-mogazeyalmogazey 数据来源:互联网公开数据 标签:印度语,电影,字幕,自然语言处理,文本分析,语言学,机器翻译,数据集 数据概述: 该数据集包含了印度语电影的字幕数据,记录了大量印度语电影的字幕文本。主要特征如下:...
    packageimg
  • 自然语言处理文本分类数据集NLPProcessingTextClassificationDataset-jasleen234

    2025年4月22日   

    自然语言处理文本分类数据集NLPProcessingTextClassificationDataset-jasleen234 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,深度学习,人工智能,文本分析,语言学 数据概述:该数据集包含来自多个来源的文本数据,主要用于自然语言处理中的文本分类任务。主要特征如下:...
    packageimg
  • 人工智能报告提交数据集AIReportSubmissionDataset-bacharacherif

    2025年4月22日   

    人工智能报告提交数据集AIReportSubmissionDataset-bacharacherif 数据来源:互联网公开数据 标签:人工智能,报告,数据集,评估,机器学习,自然语言处理,文本分析,学术研究,模型评估 数据概述:...
    packageimg