找到5,693个数据集

标签: 文本分析

过滤结果
  • arXiv计算机科学论文摘要与结构化文本数据集-2020年

    2025年4月15日   

    arXiv计算机科学论文摘要与结构化文本数据集-2020年 数据来源:互联网公开数据 标签:arXiv,计算机科学,论文,摘要,引言,结论,文本分析,自然语言处理,研究,学术 数据概述:...
    packageimg
  • 南非语情感词典与停用词数据集

    2025年4月15日   

    南非语情感词典与停用词数据集 数据来源:互联网公开数据 标签:南非语,情感分析,情感词典,停用词,圣经,平行语料库,文本分析 数据概述:...
    packageimg
  • 酒店评论分析数据集

    2025年4月15日   

    酒店评论分析数据集 数据来源:互联网公开数据 标签:酒店评论,客户满意度,文本分析,旅游行业,情感分析,用户反馈,服务质量 数据概述: 本数据集包含10,000条酒店评论,数据来源于 Hotels.com 和 TripAdvisor...
    packageimg
  • 印度尼西亚歌曲歌词情感数据集

    2025年4月15日   

    印度尼西亚歌曲歌词情感数据集 数据来源:互联网公开数据 标签:印度尼西亚,歌曲歌词,情感分析,文本分析,自然语言处理,音乐研究,情感标注 数据概述: 本数据集包含超过300首印度尼西亚歌曲的歌词,并附带情感标签(人工标注)。歌词数据经过精心挑选,覆盖了不同的情感类别,为情感分析和音乐研究提供了丰富的材料。 数据用途概述:...
    packageimg
  • 加密货币新闻事件分析数据集-2019-2023

    2025年4月15日   

    加密货币新闻事件分析数据集-2019-2023 数据来源:互联网公开数据 标签:加密货币,新闻,区块链,比特币,以太坊,情感分析,犯罪活动,机器学习,文本分析 数据概述:...
    packageimg
  • Webtekno新闻情绪反应数据集

    2025年4月15日   

    Webtekno新闻情绪反应数据集 数据来源:互联网公开数据 标签:新闻,情绪分析,Webtekno,社交媒体,情感反应,表情符号,用户互动,文本分析 数据概述:...
    packageimg
  • 亚马逊燕麦饼干评论数据集

    2025年4月15日   

    亚马逊燕麦饼干评论数据集 数据来源:互联网公开数据 标签:亚马逊评论,燕麦饼干,产品评价,用户反馈,评分,文本分析,电子商务 数据概述: 本数据集来源于亚马逊优质食品评论数据集,专门选取了关于燕麦饼干的评论。数据涵盖了超过10年的评论记录,总计约913条评论,时间跨度至2012年10月。每条评论包含用户ID、评分和评论文本等关键信息。 数据用途概述:...
    packageimg
  • 多语言仇恨言论分析数据集1963-2021

    2025年4月15日   

    多语言仇恨言论分析数据集1963-2021 数据来源:互联网公开数据 标签:仇恨言论,多语言,法语,意大利语,西班牙语,俄语,土耳其语,英语,葡萄牙语,文本分析,自然语言处理 数据概述:...
    packageimg
  • 自然语言问答数据集QDMR分解结构分析数据集

    2025年4月15日   

    自然语言问答数据集QDMR分解结构分析数据集 数据来源:互联网公开数据 标签:自然语言处理,问答系统,语义分解,QDMR,数据集,文本分析,机器学习,计算机科学 数据概述:...
    packageimg
  • 引言数据集

    2025年4月15日   

    引言数据集 数据来源:互联网公开数据 标签:引言,文本分析,内容推荐系统,自然语言处理,用户偏好,数据分析 数据概述: 本数据集收录了大量引言文本,旨在用于构建基于内容的推荐系统。数据集包括不同来源的引言,涵盖广泛的主题和风格,为文本数据的分析和处理提供了丰富的材料。 数据用途概述:...
    packageimg
  • TREC问题分类数据集

    2025年4月15日   

    TREC问题分类数据集 数据来源:互联网公开数据 标签:问题分类,机器学习,自然语言处理,信息检索,数据集,文本分析,学术研究 数据概述:...
    packageimg
  • 电影数据分析与自然语言处理实践数据集-TMDB电影数据-时间不限

    2025年4月15日   

    电影数据分析与自然语言处理实践数据集-TMDB电影数据-时间不限 数据来源:互联网公开数据 标签:电影,TMDB,电影数据,NLP,自然语言处理,文本分析,情感分析,数据预处理,文本清洗,机器学习 数据概述: 本数据集包含了TMDB(The Movie...
    packageimg
  • 图书分类与评分预测数据集

    2025年4月15日   

    图书分类与评分预测数据集 数据来源:互联网公开数据 标签:图书分类, 文本分析, 评分预测, 自然语言处理, 数据挖掘, 书籍推荐, 作者影响力, 清新阅读 数据概述:...
    packageimg
  • 权力的游戏Reddit社区讨论内容数据集

    2025年4月15日   

    权力的游戏Reddit社区讨论内容数据集 数据来源:互联网公开数据 标签:权力的游戏,Reddit,社交媒体,讨论,评论,帖子,文本分析,情感分析 数据概述: 本数据集收录了从Reddit社交平台r/gameofthrones子版块抓取的全部帖子和评论数据。数据通过Reddit...
    packageimg
  • 西班牙语书籍语料库

    2025年4月15日   

    西班牙语书籍语料库 数据来源:互联网公开数据 标签:西班牙语,语料库,文本分析,词性标注,儿童文学,成人文学,词频统计,文本边界分析 数据概述:...
    packageimg
  • 社区电视节目台词数据集1963-2021

    2025年4月15日   

    社区电视节目台词数据集1963-2021 数据来源:互联网公开数据 标签:社区电视节目,台词,语言模型,文本分析,电视剧研究,文化研究,历史背景 数据概述: 本数据集收录了某社区电视节目的全部台词记录,涵盖了从1963年至2021年间的多个季度和剧集。数据集通过网络爬虫技术收集,为研究该节目提供了全面的台词文本资料,适合进行语言模型训练和文本分析。...
    packageimg
  • Reddit食谱分享与互动分析数据集

    2025年4月15日   

    Reddit食谱分享与互动分析数据集 数据来源:互联网公开数据 标签:食谱,Reddit,社交媒体,文本分析,NLP,烹饪,菜谱,用户互动,数据挖掘 数据概述:...
    packageimg
  • 社交媒体侮辱言论数据集

    2025年4月15日   

    社交媒体侮辱言论数据集 数据来源:互联网公开数据 标签:社交媒体,侮辱言论,文本分析,自然语言处理,情感分析,评论文本 数据概述:...
    packageimg
  • Commonlit阅读理解文章难度评估数据集-2020年8月

    2025年4月15日   

    Commonlit阅读理解文章难度评估数据集-2020年8月 数据来源:互联网公开数据 标签:阅读理解,文本分析,教育,自然语言处理,阅读难度,文本数据,Commonlit,机器学习 数据概述:...
    packageimg
  • Reddit读书建议社区书籍推荐数据集-时间跨度待定

    2025年4月15日   

    Reddit读书建议社区书籍推荐数据集-时间跨度待定 数据来源:互联网公开数据 标签:书籍推荐, Reddit, 社交媒体, 文本分析, 自然语言处理, 情感分析, 图书评论, 读者互动 数据概述: 本数据集来源于Reddit社交平台上的r/booksuggestions子版块,该版块汇集了用户关于书籍的讨论与推荐。数据通过Python Reddit...
    packageimg