-
推特文本情感分析-种族歧视与非歧视推文分类数据集
推特文本情感分析-种族歧视与非歧视推文分类数据集 数据来源:互联网公开数据 标签:推特,文本分析,情感分析,种族歧视,自然语言处理,社交媒体,文本分类,机器学习 数据概述: 本数据集包含推特推文数据,用于种族歧视与非种族歧视言论的分类研究。... -
全球高评分电影字幕数据-电影列表字幕文件
全球高评分电影字幕数据-电影列表字幕文件 数据来源:互联网公开数据 标签:电影,评分,字幕,影视,娱乐,文化,语言,文本分析,数据挖掘 数据概述:... -
泽伦斯基推特数据集2019年至今
泽伦斯基推特数据集2019年至今 数据来源:互联网公开数据 标签:泽伦斯基,推特,文本分析,乌克兰政治,言论分析,社交媒体 数据概述: 本数据集包含了2019年至今乌克兰总统泽连斯基在推特平台上发布的所有推文。数据按发布日期降序排列,涵盖了总统的言论内容,为分析其言论风格、政治立场及公众沟通方式提供了丰富的文本材料。 数据用途概述:... -
-
泰米尔语歌曲歌词数据集
泰米尔语歌曲歌词数据集 数据来源:互联网公开数据 标签:泰米尔语,歌曲歌词,音乐产业,文本分析,文化研究,自然语言处理 数据概述: 本数据集包含了超过4000首泰米尔语歌曲的歌词信息,每条记录包括电影名称、歌曲名称及完整的歌词内容。数据集为研究泰米尔语音乐文化及歌词特征提供了丰富的数据基础,适用于多种文本分析和文化研究场景。 数据用途概述:... -
-
阿拉伯语古兰经经文及其注释数据集
阿拉伯语古兰经经文及其注释数据集 数据来源:互联网公开数据 标签:古兰经,伊斯兰教,阿拉伯语,经文,注释,宗教研究,文本分析,语义理解 数据概述:... -
-
吉尔莫女孩电视剧台词数据集
吉尔莫女孩电视剧台词数据集 数据来源:互联网公开数据 标签:电视剧,台词,剧情,角色,影视,文化研究,文本分析 数据概述: 本数据集包含了电视剧《吉尔莫女孩》中出现的所有台词(引言)。数据来源于网络爬取,涵盖了该剧的完整剧情对话内容。数据包括每句台词的来源角色、台词内容、所属剧集季数等关键信息。 数据用途概述:... -
多语言平行语料库释义数据集-73种语言
多语言平行语料库释义数据集-73种语言 数据来源:互联网公开数据 标签:平行语料库,释义,自然语言处理,机器翻译,多语言,文本数据,语言学,文本分析 数据概述: 本数据集收录了73种语言的句子释义语料库,名为TaPaCo。该语料库由Yves... -
权力的游戏人物互动关系数据分析数据集
权力的游戏人物互动关系数据分析数据集 数据来源:互联网公开数据 标签:权力的游戏,人物关系,社交网络,文本分析,大数据,文学,书籍,互动,关系,文本挖掘 数据概述:... -
孟加拉语日常对话数据集
孟加拉语日常对话数据集 数据来源:互联网公开数据 标签:孟加拉语,日常对话,语言模型,自然对话,语境感知,人类交流,对话数据集,文本分析,人工智能 数据概述: 本数据集旨在解决为自然、语境感知且类人对话调整语言模型的挑战。数据集包含超过20,000次对话,全面展示了孟加拉国的各种日常生活情境下的交流,涵盖了广泛的社会互动场景。... -
宾夕法尼亚大学语料库初步版本数据集
宾夕法尼亚大学语料库初步版本数据集 数据来源:互联网公开数据 标签:宾夕法尼亚大学,语料库,自然语言处理,文本分析,语言学 数据概述: 本数据集是宾夕法尼亚大学语料库的初步版本,涵盖了一系列标注的英语文本,适用于自然语言处理和语言学研究。该语料库包含了精心标注的句子结构、词性、依存关系等信息,为研究人员提供了丰富的语言学数据资源。 数据用途概述:... -
美国保守派智库-2025计划-政策建议文本数据集
美国保守派智库-2025计划-政策建议文本数据集 数据来源:互联网公开数据 标签:政治,政策,保守主义,智库,美国,政府,公共政策,文本分析,机器学习,意识形态 数据概述: 本数据集收录了美国保守派智库传统基金会(The Heritage... -
圣经与古兰经情感分析数据集
圣经与古兰经情感分析数据集 数据来源:互联网公开数据 标签:圣经,古兰经,情感分析,文本分析,自然语言处理,NLP,宗教文本,情感词典,情感极性,词频统计,词云 数据概述: 本数据集包含了《圣经》(King James Version,... -
孟加拉语同义句识别基准语料库数据集
孟加拉语同义句识别基准语料库数据集 数据来源:互联网公开数据 标签:同义句检测,孟加拉语,语料库,自然语言处理,文本分析,机器学习,语言模型评估 数据概述: 本数据集是一个用于孟加拉语同义句识别的基准语料库,收录了8,787对人工标注的句子对,这些句子对来源于23家报纸头版在四个类别中的内容。该数据集旨在为孟加拉语同义句检测的研究提供全面的基准。... -
社交媒体平台Reddit上-鸟类并非真实存在-主题讨论数据集
社交媒体平台Reddit上-鸟类并非真实存在-主题讨论数据集 数据来源:互联网公开数据 标签:Reddit,社交媒体,阴谋论,恶搞,鸟类,生成Z世代,文本分析,情感分析,主题建模 数据概述:... -
推特-我们来评价狗狗-用户互动情感分析数据集
推特-我们来评价狗狗-用户互动情感分析数据集 数据来源:互联网公开数据 标签:推特,社交媒体,宠物,狗狗,情感分析,用户互动,数据挖掘,文本分析 数据概述: 本数据集来源于推特(Twitter)上最受欢迎的账号“we rate... -
披萨哥故事数据集
披萨哥故事数据集 数据来源:互联网公开数据 标签:披萨哥,Reddit,社交媒体,文本分析,NLP,娱乐,数据分析 数据概述: 本数据集收录了来自Reddit社区r/TalesFromThePizzaGuy的帖子和评论,时间范围为每日更新。数据集通过Kaggle的定时任务自动收集,涵盖丰富的用户生成内容,包括趣事、幽默故事和日常分享。 数据用途概述:... -
Instagram应用商店用户评价与评分数据集-全球用户反馈
Instagram应用商店用户评价与评分数据集-全球用户反馈 数据来源:互联网公开数据 标签:Instagram,用户评价,应用商店,Appstore,社交媒体,情感分析,文本分析,用户体验,全球视角 数据概述:...