找到5,827个数据集

标签: 文本分析

过滤结果
  • 亚马逊燕麦饼干评论数据集

    2025年4月15日   

    亚马逊燕麦饼干评论数据集 数据来源:互联网公开数据 标签:亚马逊评论,燕麦饼干,产品评价,用户反馈,评分,文本分析,电子商务 数据概述: 本数据集来源于亚马逊优质食品评论数据集,专门选取了关于燕麦饼干的评论。数据涵盖了超过10年的评论记录,总计约913条评论,时间跨度至2012年10月。每条评论包含用户ID、评分和评论文本等关键信息。 数据用途概述:...
    packageimg
  • 多语言仇恨言论分析数据集1963-2021

    2025年4月15日   

    多语言仇恨言论分析数据集1963-2021 数据来源:互联网公开数据 标签:仇恨言论,多语言,法语,意大利语,西班牙语,俄语,土耳其语,英语,葡萄牙语,文本分析,自然语言处理 数据概述:...
    packageimg
  • 自然语言问答数据集QDMR分解结构分析数据集

    2025年4月15日   

    自然语言问答数据集QDMR分解结构分析数据集 数据来源:互联网公开数据 标签:自然语言处理,问答系统,语义分解,QDMR,数据集,文本分析,机器学习,计算机科学 数据概述:...
    packageimg
  • 引言数据集

    2025年4月15日   

    引言数据集 数据来源:互联网公开数据 标签:引言,文本分析,内容推荐系统,自然语言处理,用户偏好,数据分析 数据概述: 本数据集收录了大量引言文本,旨在用于构建基于内容的推荐系统。数据集包括不同来源的引言,涵盖广泛的主题和风格,为文本数据的分析和处理提供了丰富的材料。 数据用途概述:...
    packageimg
  • TREC问题分类数据集

    2025年4月15日   

    TREC问题分类数据集 数据来源:互联网公开数据 标签:问题分类,机器学习,自然语言处理,信息检索,数据集,文本分析,学术研究 数据概述:...
    packageimg
  • 电影数据分析与自然语言处理实践数据集-TMDB电影数据-时间不限

    2025年4月15日   

    电影数据分析与自然语言处理实践数据集-TMDB电影数据-时间不限 数据来源:互联网公开数据 标签:电影,TMDB,电影数据,NLP,自然语言处理,文本分析,情感分析,数据预处理,文本清洗,机器学习 数据概述: 本数据集包含了TMDB(The Movie...
    packageimg
  • 图书分类与评分预测数据集

    2025年4月15日   

    图书分类与评分预测数据集 数据来源:互联网公开数据 标签:图书分类, 文本分析, 评分预测, 自然语言处理, 数据挖掘, 书籍推荐, 作者影响力, 清新阅读 数据概述:...
    packageimg
  • 权力的游戏Reddit社区讨论内容数据集

    2025年4月15日   

    权力的游戏Reddit社区讨论内容数据集 数据来源:互联网公开数据 标签:权力的游戏,Reddit,社交媒体,讨论,评论,帖子,文本分析,情感分析 数据概述: 本数据集收录了从Reddit社交平台r/gameofthrones子版块抓取的全部帖子和评论数据。数据通过Reddit...
    packageimg
  • 西班牙语书籍语料库

    2025年4月15日   

    西班牙语书籍语料库 数据来源:互联网公开数据 标签:西班牙语,语料库,文本分析,词性标注,儿童文学,成人文学,词频统计,文本边界分析 数据概述:...
    packageimg
  • 社区电视节目台词数据集1963-2021

    2025年4月15日   

    社区电视节目台词数据集1963-2021 数据来源:互联网公开数据 标签:社区电视节目,台词,语言模型,文本分析,电视剧研究,文化研究,历史背景 数据概述: 本数据集收录了某社区电视节目的全部台词记录,涵盖了从1963年至2021年间的多个季度和剧集。数据集通过网络爬虫技术收集,为研究该节目提供了全面的台词文本资料,适合进行语言模型训练和文本分析。...
    packageimg
  • Reddit食谱分享与互动分析数据集

    2025年4月15日   

    Reddit食谱分享与互动分析数据集 数据来源:互联网公开数据 标签:食谱,Reddit,社交媒体,文本分析,NLP,烹饪,菜谱,用户互动,数据挖掘 数据概述:...
    packageimg
  • 社交媒体侮辱言论数据集

    2025年4月15日   

    社交媒体侮辱言论数据集 数据来源:互联网公开数据 标签:社交媒体,侮辱言论,文本分析,自然语言处理,情感分析,评论文本 数据概述:...
    packageimg
  • Commonlit阅读理解文章难度评估数据集-2020年8月

    2025年4月15日   

    Commonlit阅读理解文章难度评估数据集-2020年8月 数据来源:互联网公开数据 标签:阅读理解,文本分析,教育,自然语言处理,阅读难度,文本数据,Commonlit,机器学习 数据概述:...
    packageimg
  • Reddit读书建议社区书籍推荐数据集-时间跨度待定

    2025年4月15日   

    Reddit读书建议社区书籍推荐数据集-时间跨度待定 数据来源:互联网公开数据 标签:书籍推荐, Reddit, 社交媒体, 文本分析, 自然语言处理, 情感分析, 图书评论, 读者互动 数据概述: 本数据集来源于Reddit社交平台上的r/booksuggestions子版块,该版块汇集了用户关于书籍的讨论与推荐。数据通过Python Reddit...
    packageimg
  • NASA天文学图片每日一图数据集

    2025年4月15日   

    NASA天文学图片每日一图数据集 数据来源:互联网公开数据 标签:NASA,天文学,图片,每日一图,教育,研究,图像处理,文本分析,关键词提取,实体识别 数据概述: 本数据集包含了NASA自1995年6月以来在其“Astronomy Picture of the...
    packageimg
  • Reddit社区自杀风险帖子检测数据集

    2025年4月15日   

    Reddit社区自杀风险帖子检测数据集 数据来源:互联网公开数据 标签:Reddit,自杀,心理健康,文本分析,情感分析,社交媒体,风险评估,自然语言处理 数据概述:...
    packageimg
  • 中文有毒语言数据集

    2025年4月15日   

    中文有毒语言数据集 数据来源:互联网公开数据 标签:中文,有毒语言,文本分析,机器学习,自然语言处理,伦理问题,多级分类,基准测试 数据概述:...
    packageimg
  • Reddit谎言推特谎言信息传播分析数据集-每周更新

    2025年4月15日   

    Reddit谎言推特谎言信息传播分析数据集-每周更新 数据来源:互联网公开数据 标签:推特,社交媒体,谎言,Reddit,信息传播,时间序列,文本分析 数据概述:...
    packageimg
  • 美剧办公室演员解说播客节目文本数据集

    2025年4月15日   

    美剧办公室演员解说播客节目文本数据集 数据来源:互联网公开数据 标签:播客,剧本,喜剧,办公室,文化,娱乐,音频,文本分析 数据概述: 本数据集包含美国知名情景喜剧《办公室》两位主演Jenna Fischer和Angela Kinsey主持的播客节目《Office...
    packageimg
  • 大英百科全书文章标题数据集

    2025年4月15日   

    大英百科全书文章标题数据集 数据来源:互联网公开数据 标签:大英百科全书,文章标题,科技,艺术,文本分类,NLP,文本分析 数据概述: 本数据集收录了大英百科全书中的“艺术与科技”类目下的文章标题,通过大英百科全书API创建。未来版本将增加其他文章类别。数据集为进行文本分类、自然语言处理(NLP)任务和文本分析提供了丰富的标题样本。 数据用途概述:...
    packageimg