找到5,684个数据集

标签: 文本分析

过滤结果
  • 葡萄牙语假新闻数据集

    2025年4月15日   

    葡萄牙语假新闻数据集 数据来源:互联网公开数据 标签:假新闻,葡萄牙语,新闻分类,文本分析,机器学习,信息真实性,媒体研究 数据概述:...
    packageimg
  • 文档嵌入技术研究数据集

    2025年4月15日   

    文档嵌入技术研究数据集 数据来源:互联网公开数据 标签:文档嵌入,自然语言处理,机器学习,数据可视化,文本分析,技术研究,zstandard压缩 数据概述:...
    packageimg
  • 英国脱欧媒体舆论新闻文本数据集2016-2023

    2025年4月15日   

    英国脱欧媒体舆论新闻文本数据集2016-2023 数据来源:互联网公开数据 标签:英国脱欧,媒体舆论,文本分析,自然语言处理,新闻文本,舆论演变,主题建模 数据概述:...
    packageimg
  • 推特用户MBTI人格类型数据集

    2025年4月15日   

    推特用户MBTI人格类型数据集 数据来源:互联网公开数据 标签:推特用户,MBTI人格类型,文本分析,自然语言处理,机器学习,社交网络分析,行为特征,语言特征,网络特征 数据概述: 本数据集包含了8,328名推特用户的详细信息,这些用户在其个人资料中公开了他们的MBTI人格类型。数据集记录了每名用户的身份特征、行为特征、语言特征和网络特征。 -...
    packageimg
  • 文学作品数字化研究书籍数据集

    2025年4月15日   

    文学作品数字化研究书籍数据集 数据来源:互联网公开数据 标签:数字图书馆,文学作品,文本分析,版权开放,文化研究,文本挖掘,语言学研究,文学史,经典文献,公共领域 数据概述: 本数据集收录了Project...
    packageimg
  • 七十士译本数据集

    2025年4月15日   

    七十士译本数据集 数据来源:互联网公开数据 标签:七十士译本,旧约圣经,希伯来文,希腊文,圣经翻译,NLP,自然语言处理,文本分析 数据概述:...
    packageimg
  • 矛盾侦探瓦森翻译数据集

    2025年4月15日   

    矛盾侦探瓦森翻译数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,翻译,机器学习,文本分析,竞赛数据 数据概述: 本数据集为“Contradictory, My Dear...
    packageimg
  • 预处理抑郁数据集

    2025年4月15日   

    预处理抑郁数据集 数据来源:互联网公开数据 标签:抑郁症,心理健康,文本分析,情感分析,社交媒体,自然语言处理,情感状态 数据概述:...
    packageimg
  • Reddit音乐分享与抑郁情绪关联数据集

    2025年4月15日   

    Reddit音乐分享与抑郁情绪关联数据集 数据来源:互联网公开数据 标签:音乐,Reddit,抑郁,情绪,社交媒体,文本分析,健康,心理学,数据挖掘 数据概述: 本数据集收录了Reddit平台上关于音乐分享行为与抑郁情绪关联的数据。数据集包含两个主要组成部分:songs.csv文件和clustered_posts文件夹。...
    packageimg
  • WordNet反义词数据集-2006

    2025年4月15日   

    WordNet反义词数据集-2006 数据来源:互联网公开数据 标签:反义词,WordNet,语言学,数据,词典,文本分析,自然语言处理 数据概述: 本数据集包含了从WordNet数据库版本3.0中提取的反义词数据。每个反义词组由至少一个反义词构成,不同反义词组之间用 "|" 分隔,同一组内的反义词用 ";"...
    packageimg
  • 奥本海默电影Reddit讨论数据集

    2025年4月15日   

    奥本海默电影Reddit讨论数据集 数据来源:互联网公开数据 标签:奥本海默电影,克里斯托弗诺兰,Reddit讨论,文本分析,情感分析,评论数据,电影评价 数据概述:...
    packageimg
  • 土耳其谚语与俗语数据集

    2025年4月15日   

    土耳其谚语与俗语数据集 数据来源:互联网公开数据 标签:谚语,俗语,土耳其语言,自然语言处理,NLP,文化研究,文本分析 数据概述:...
    packageimg
  • 国际学习表征会议评审数据集2017

    2025年4月15日   

    国际学习表征会议评审数据集2017 数据来源:互联网公开数据 标签:国际会议,机器学习,学术评审,文本分析,决策过程,性别差异研究 数据概述:...
    packageimg
  • Kickstarter真实世界众筹平台运营项目成功预测建模数据集

    2025年4月15日   

    Kickstarter真实世界众筹平台运营项目成功预测建模数据集 数据来源:互联网公开数据 本数据集基于 Web Robots 提供的公开 Kickstarter 数据,每月通过网络抓取方式生成多个 CSV 文件。数据涵盖 2023 年 11 月、12 月及 2024 年 1 月的全部众筹项目信息,并经过整理、清洗和转换,适用于数据分析与预测建模任务。...
    packageimg
  • 巴西葡萄牙语冒犯性语言识别数据集

    2025年4月15日   

    巴西葡萄牙语冒犯性语言识别数据集 数据来源:互联网公开数据 标签:冒犯性语言,巴西葡萄牙语,多任务注释,社交媒体,自然语言处理,文本分析,内容安全 数据概述:...
    packageimg
  • 情感识别与情感分析数据集2023

    2025年4月15日   

    情感识别与情感分析数据集2023 数据来源:互联网公开数据 标签:情感识别,情感分析,NLP,文本分析,用户生成内容,情绪分类,情感尺度,情感强度,情感正负性,情感控制力度 数据概述: 情感识别与情感分析数据集(EmoBank)是一个大规模的数据集,旨在用于自然语言处理(NLP)领域的 sentiment analysis...
    packageimg
  • 世界各地民间故事与童话数据集

    2025年4月15日   

    世界各地民间故事与童话数据集 数据来源:互联网公开数据 标签:民间故事,童话,文化背景,故事分类,地域,文本分析,故事生成,故事总结 数据概述: 本数据集汇集了来自不同文化背景的民间故事和童话,涵盖了从古代传说到奇幻叙事的各种类型。数据集不仅包括通过口头传统流传的民间故事,还包含由作者创作的童话作品,为研究和探索世界各地的故事文化提供了丰富的资源。...
    packageimg
  • 权力的游戏IMDB用户评论数据集

    2025年4月15日   

    权力的游戏IMDB用户评论数据集 数据来源:互联网公开数据 标签:IMDB,用户评论,权力的游戏,电视节目,文本分析,情感分析,nlp,数据清洗,数据探索 数据概述:...
    packageimg
  • Reddit自杀主题帖文分析数据集-2024年3月更新

    2025年4月15日   

    Reddit自杀主题帖文分析数据集-2024年3月更新 数据来源:互联网公开数据 标签:Reddit,自杀,心理健康,文本分析,情感分析,社交媒体,数据挖掘,自然语言处理,情绪识别,网络社区 数据概述:...
    packageimg
  • BBC新闻多领域新闻文章数据集2022-2024

    2025年4月15日   

    BBC新闻多领域新闻文章数据集2022-2024 数据来源:互联网公开数据 标签:新闻媒体,BBC,文本分析,时间序列,信息传播,舆论分析,数据新闻 数据概述:...
    packageimg