-
巴西葡萄牙语讽刺与讽刺数据集
巴西葡萄牙语讽刺与讽刺数据集 数据来源:互联网公开数据 标签:讽刺,讽刺检测,巴西葡萄牙语,自然语言处理,文本分析,情感分析,社交媒体分析 数据概述: 本数据集是从2021年3月20日Fabio Ricardo Araujo da Silva和Andreia Gentil Bonfante在https://github.com/fabio-... -
说唱歌词NLP数据集
说唱歌词NLP数据集 数据来源:互联网公开数据 标签:说唱,歌词,NLP,文本分析,文本预处理,文本分类,音乐分析 数据概述: 本数据集收录了来自11位不同艺术家的说唱歌词,包括Drake、J. Cole、Kendrick Lamar、Eminem、Nas、Skepta、Rapsody、Nicki... -
土耳其恶意内容推文数据集2023
土耳其恶意内容推文数据集2023 数据来源:互联网公开数据 标签:土耳其,推文,社交媒体,恶意内容,文本分析,语言处理,社会研究 数据概述: 本数据集收录了来自Twitter的土耳其推文,涵盖2023年的推文内容。数据集中约40%的推文包含冒犯性或粗俗的语境,为研究社交媒体上的恶意内容提供了宝贵的材料。每个推文记录了原文、发布时间、推文语言等关键信息。... -
电影类型预测竞赛数据集1963-2021
电影类型预测竞赛数据集1963-2021 数据来源:互联网公开数据 标签:电影类型,预测模型,人工智能竞赛,数据可视化,机器学习,文本分析 数据概述:... -
心理健康与自杀风险评估演示数据集
心理健康与自杀风险评估演示数据集 数据来源:互联网公开数据 标签:心理健康,自杀风险,演示数据,机器学习,情感分析,文本分析,数据挖掘 数据概述:... -
最后生还者全英文更新数据集
最后生还者全英文更新数据集 数据来源:互联网公开数据 标签:最后生还者,英文推文,社交媒体数据,文本分析,情感分析,游戏社区,用户行为,文本挖掘 数据概述:... -
万圣节热门服装亚马逊评论数据集
万圣节热门服装亚马逊评论数据集 数据来源:互联网公开数据 标签:万圣节服装,亚马逊,用户评论,自然语言处理,NLP,文本分析,评分预测,时间序列,产品评价 数据概述:... -
山区命名实体识别数据集
山区命名实体识别数据集 数据来源:互联网公开数据 标签:命名实体识别,山区,自然地理,文本分析,机器学习,自然语言处理 数据概述: 本数据集用于命名实体识别(NER)任务,旨在识别文本中的山区名称。数据集中的每条记录对应一个由OpenAI的ChatGPT生成的推文或句子。数据集包含多种类型的推文/文本,其中包括专注于山区体验的内容,也可能涉及其他主题。... -
印度尼西亚反论语料库数据集2023
印度尼西亚反论语料库数据集2023 数据来源:互联网公开数据 标签:反论,批判性思维,自然语言处理,众包数据,逻辑谬误,学术研究,文本分析 数据概述: 本数据集来源于《Riposte! 大型反论语料库》论文,由Paul Reisert、Benjamin Heinzerling、Naoya Inoue、Shun Kiyono和Kentaro... -
亚马逊评论情感属性分析数据集
亚马逊评论情感属性分析数据集 数据来源:互联网公开数据 标签:亚马逊评论,情感分析,情感属性,NRC词典,文本分析,产品评价,分类标签 数据概述: 本数据集包含了亚马逊平台上客户对产品的评论文本及其对应的情感属性分析结果,覆盖了从评论内容到情感分类的多个维度。数据集包含评论文本(ReviewBody)、七种情感属性(Joy, Surprise,... -
Rawat图书出版物主题分类数据集
Rawat图书出版物主题分类数据集 数据来源:互联网公开数据 标签:图书,出版,学术,人文社科,ISBN,作者,主题分类,文本分析,自然语言处理,Rawat图书 数据概述: 本数据集包含了Rawat图书网站上公开列出的图书信息,涵盖了广泛的学术和人文社科领域。... -
Reddit社区点击诱饵文章摘要数据集-r-SavedYouAClick-TOP1000-ish
Reddit社区点击诱饵文章摘要数据集-r-SavedYouAClick-TOP1000-ish 数据来源:互联网公开数据 标签:Reddit,点击诱饵,文章摘要,社交媒体,文本分析,自然语言处理,TLDR,网络社区 数据概述:... -
英语学习资源网站文本语料库数据集-OneStopEnglish-2024
英语学习资源网站文本语料库数据集-OneStopEnglish-2024 数据来源:互联网公开数据 标签:英语学习,文本语料库,语言学习,英语教学,文本分析,语料库,词汇,语法,阅读理解 数据概述: 本数据集包含OneStopEnglish网站提供的文本语料库,以CSV格式存储。语料库中的文本内容涵盖了小学、初中、高中不同英语水平的材料。... -
来自X的仇恨言论和冒犯性语言数据集
来自X的仇恨言论和冒犯性语言数据集 数据来源:互联网公开数据 标签:仇恨言论,冒犯性语言,社交媒体数据,文本分析,自然语言处理,三元分类,数据清理 数据概述: 本数据集通过名为“Instant Data... -
职位描述分类任务数据集
职位描述分类任务数据集 数据来源:互联网公开数据 标签:职位描述,分类任务,机器学习,自然语言处理,文本分析,人力资源管理 数据概述: 本数据集包含多个职位描述的文本样本,每个样本均标注有对应的分类标签。数据集内容涵盖各种行业和岗位的职位描述,旨在为构建职位描述分类任务提供高质量的训练数据。 数据用途概述:... -
-
降世神通-最后的气宗全集剧本数据集
降世神通-最后的气宗全集剧本数据集 数据来源:互联网公开数据 标签:降世神通,角色台词,文本分析,剧情研究,娱乐产业,文化研究 数据概述 本数据集包含了热门动画剧集《降世神通:最后的气宗》(Avatar: The Last Airbender)的完整剧本内容,数据来源为 fandom wiki... -
-
Reddit印度板块帖子标签预测数据集-2024
Reddit印度板块帖子标签预测数据集-2024 数据来源:互联网公开数据 标签:Reddit,印度,社交媒体,文本分析,机器学习,自然语言处理,标签预测,内容分类,PRAW API 数据概述: 本数据集来源于Reddit社交平台上的r/india子版块,通过PRAW... -
科学文献关键词分析数据集1963-2021
科学文献关键词分析数据集1963-2021 数据来源:互联网公开数据 标签:科学文献,关键词,作者关键词,自动关键词,Web of Science,文本分析,自然语言处理 数据概述: 本数据集包含了从Web of Science...