找到5,692个数据集

标签: 文本分析

过滤结果
  • Reddit社区自杀风险帖子检测数据集

    2025年4月15日   

    Reddit社区自杀风险帖子检测数据集 数据来源:互联网公开数据 标签:Reddit,自杀,心理健康,文本分析,情感分析,社交媒体,风险评估,自然语言处理 数据概述:...
    packageimg
  • 中文有毒语言数据集

    2025年4月15日   

    中文有毒语言数据集 数据来源:互联网公开数据 标签:中文,有毒语言,文本分析,机器学习,自然语言处理,伦理问题,多级分类,基准测试 数据概述:...
    packageimg
  • Reddit谎言推特谎言信息传播分析数据集-每周更新

    2025年4月15日   

    Reddit谎言推特谎言信息传播分析数据集-每周更新 数据来源:互联网公开数据 标签:推特,社交媒体,谎言,Reddit,信息传播,时间序列,文本分析 数据概述:...
    packageimg
  • 美剧办公室演员解说播客节目文本数据集

    2025年4月15日   

    美剧办公室演员解说播客节目文本数据集 数据来源:互联网公开数据 标签:播客,剧本,喜剧,办公室,文化,娱乐,音频,文本分析 数据概述: 本数据集包含美国知名情景喜剧《办公室》两位主演Jenna Fischer和Angela Kinsey主持的播客节目《Office...
    packageimg
  • 大英百科全书文章标题数据集

    2025年4月15日   

    大英百科全书文章标题数据集 数据来源:互联网公开数据 标签:大英百科全书,文章标题,科技,艺术,文本分类,NLP,文本分析 数据概述: 本数据集收录了大英百科全书中的“艺术与科技”类目下的文章标题,通过大英百科全书API创建。未来版本将增加其他文章类别。数据集为进行文本分类、自然语言处理(NLP)任务和文本分析提供了丰富的标题样本。 数据用途概述:...
    packageimg
  • 推特文本情感分析-种族歧视与非歧视推文分类数据集

    2025年4月15日   

    推特文本情感分析-种族歧视与非歧视推文分类数据集 数据来源:互联网公开数据 标签:推特,文本分析,情感分析,种族歧视,自然语言处理,社交媒体,文本分类,机器学习 数据概述: 本数据集包含推特推文数据,用于种族歧视与非种族歧视言论的分类研究。...
    packageimg
  • 全球高评分电影字幕数据-电影列表字幕文件

    2025年4月15日   

    全球高评分电影字幕数据-电影列表字幕文件 数据来源:互联网公开数据 标签:电影,评分,字幕,影视,娱乐,文化,语言,文本分析,数据挖掘 数据概述:...
    packageimg
  • 泽伦斯基推特数据集2019年至今

    2025年4月15日   

    泽伦斯基推特数据集2019年至今 数据来源:互联网公开数据 标签:泽伦斯基,推特,文本分析,乌克兰政治,言论分析,社交媒体 数据概述: 本数据集包含了2019年至今乌克兰总统泽连斯基在推特平台上发布的所有推文。数据按发布日期降序排列,涵盖了总统的言论内容,为分析其言论风格、政治立场及公众沟通方式提供了丰富的文本材料。 数据用途概述:...
    packageimg
  • 写作过程链接数据集

    2025年4月15日   

    写作过程链接数据集 数据来源:互联网公开数据 标签:写作过程,写作质量,比赛数据,文本分析,教育研究,写作训练,数据分析 数据概述:...
    packageimg
  • 泰米尔语歌曲歌词数据集

    2025年4月15日   

    泰米尔语歌曲歌词数据集 数据来源:互联网公开数据 标签:泰米尔语,歌曲歌词,音乐产业,文本分析,文化研究,自然语言处理 数据概述: 本数据集包含了超过4000首泰米尔语歌曲的歌词信息,每条记录包括电影名称、歌曲名称及完整的歌词内容。数据集为研究泰米尔语音乐文化及歌词特征提供了丰富的数据基础,适用于多种文本分析和文化研究场景。 数据用途概述:...
    packageimg
  • 乌克兰子版块顶级评论数据集

    2025年4月15日   

    乌克兰子版块顶级评论数据集 数据来源:互联网公开数据 标签:乌克兰,战争,Reddit,顶级评论,社会分析,文本分析,视频内容 数据概述:...
    packageimg
  • 阿拉伯语古兰经经文及其注释数据集

    2025年4月15日   

    阿拉伯语古兰经经文及其注释数据集 数据来源:互联网公开数据 标签:古兰经,伊斯兰教,阿拉伯语,经文,注释,宗教研究,文本分析,语义理解 数据概述:...
    packageimg
  • 大学入学考试作文评分数据集

    2025年4月15日   

    大学入学考试作文评分数据集 数据来源:互联网公开数据 标签:作文评分,自然语言处理,教育评估,大学入学考试,巴西高中,文本分析 数据概述:...
    packageimg
  • 吉尔莫女孩电视剧台词数据集

    2025年4月15日   

    吉尔莫女孩电视剧台词数据集 数据来源:互联网公开数据 标签:电视剧,台词,剧情,角色,影视,文化研究,文本分析 数据概述: 本数据集包含了电视剧《吉尔莫女孩》中出现的所有台词(引言)。数据来源于网络爬取,涵盖了该剧的完整剧情对话内容。数据包括每句台词的来源角色、台词内容、所属剧集季数等关键信息。 数据用途概述:...
    packageimg
  • 多语言平行语料库释义数据集-73种语言

    2025年4月15日   

    多语言平行语料库释义数据集-73种语言 数据来源:互联网公开数据 标签:平行语料库,释义,自然语言处理,机器翻译,多语言,文本数据,语言学,文本分析 数据概述: 本数据集收录了73种语言的句子释义语料库,名为TaPaCo。该语料库由Yves...
    packageimg
  • 权力的游戏人物互动关系数据分析数据集

    2025年4月15日   

    权力的游戏人物互动关系数据分析数据集 数据来源:互联网公开数据 标签:权力的游戏,人物关系,社交网络,文本分析,大数据,文学,书籍,互动,关系,文本挖掘 数据概述:...
    packageimg
  • 孟加拉语日常对话数据集

    2025年4月15日   

    孟加拉语日常对话数据集 数据来源:互联网公开数据 标签:孟加拉语,日常对话,语言模型,自然对话,语境感知,人类交流,对话数据集,文本分析,人工智能 数据概述: 本数据集旨在解决为自然、语境感知且类人对话调整语言模型的挑战。数据集包含超过20,000次对话,全面展示了孟加拉国的各种日常生活情境下的交流,涵盖了广泛的社会互动场景。...
    packageimg
  • 宾夕法尼亚大学语料库初步版本数据集

    2025年4月15日   

    宾夕法尼亚大学语料库初步版本数据集 数据来源:互联网公开数据 标签:宾夕法尼亚大学,语料库,自然语言处理,文本分析,语言学 数据概述: 本数据集是宾夕法尼亚大学语料库的初步版本,涵盖了一系列标注的英语文本,适用于自然语言处理和语言学研究。该语料库包含了精心标注的句子结构、词性、依存关系等信息,为研究人员提供了丰富的语言学数据资源。 数据用途概述:...
    packageimg
  • 美国保守派智库-2025计划-政策建议文本数据集

    2025年4月15日   

    美国保守派智库-2025计划-政策建议文本数据集 数据来源:互联网公开数据 标签:政治,政策,保守主义,智库,美国,政府,公共政策,文本分析,机器学习,意识形态 数据概述: 本数据集收录了美国保守派智库传统基金会(The Heritage...
    packageimg
  • 圣经与古兰经情感分析数据集

    2025年4月15日   

    圣经与古兰经情感分析数据集 数据来源:互联网公开数据 标签:圣经,古兰经,情感分析,文本分析,自然语言处理,NLP,宗教文本,情感词典,情感极性,词频统计,词云 数据概述: 本数据集包含了《圣经》(King James Version,...
    packageimg