-
僧伽罗语新闻文章数据集
僧伽罗语新闻文章数据集 数据来源:互联网公开数据 标签:僧伽罗语,新闻,多分类,文本数据,机器学习,自然语言处理,斯里兰卡新闻,开源数据集 数据概述: 本数据集基于斯里兰卡知名新闻网站Hiru... -
图鲁语YouTube视频评论情感分析数据集
图鲁语YouTube视频评论情感分析数据集 数据来源:互联网公开数据 标签:图鲁语,YouTube,评论,情感分析,自然语言处理,文本数据,情感分类 数据概述:... -
新生命版圣经西班牙语数据集
新生命版圣经西班牙语数据集 数据来源:互联网公开数据 标签:圣经,新生命版,西班牙语,宗教,基督教,文本数据,圣经研究 数据概述: 本数据集包含从https://www.bibliavida.com/ntv/抓取的新生命版圣经(西班牙语)的完整文本。数据以CSV文件格式呈现,包括书名、章节数、节编号以及相应节的文本内容,适用于宗教研究、圣经分析等场景。... -
社交媒体金融话题讨论热度分析数据集-2020年10月11日至2020年11月11日
社交媒体金融话题讨论热度分析数据集-2020年10月11日至2020年11月11日 数据来源:互联网公开数据 标签:社交媒体,金融,Facebook,舆情分析,文本数据,时间序列,财经,市场情绪 数据概述:... -
ChatGPT移动端应用用户评论情感分析数据集-iOS平台-2023年7月
ChatGPT移动端应用用户评论情感分析数据集-iOS平台-2023年7月 数据来源:互联网公开数据 标签:ChatGPT, 移动应用, 用户评论, 情感分析, iOS, 应用评估, 用户体验, 文本数据 数据概述:... -
推特情感分析STS-Gold数据集
推特情感分析STS-Gold数据集 数据来源:互联网公开数据 标签:推特,情感分析,文本数据,社交媒体,情感极性,机器学习,自然语言处理 数据概述: 本数据集由Saif等人(2013)创建,包含2026条推文及其对应的ID和情感极性标签。这些推文用于训练情感分析模型。若使用本数据集,请引用原论文。 原论文引用:Saif, H., Fernandez,... -
Reddit问答社区AskReddit帖子及评论数据集
Reddit问答社区AskReddit帖子及评论数据集 数据来源:互联网公开数据 标签:Reddit, AskReddit, 问答, 社区, 帖子, 评论, 文本数据, 情感分析, 话题分析 数据概述:... -
碧昂歌词数据集
碧昂歌词数据集 数据来源:互联网公开数据 标签:碧昂,歌词,音乐分析,专辑,歌曲,文本数据,音乐研究 数据概述: 本数据集包含了碧昂从2003年至2022年发行的多张专辑的歌词记录,具体包括《Dangerously In Love》、《B'Day》、《I Am…Sasha... -
WebMD健康问答平台问题与解答数据集
WebMD健康问答平台问题与解答数据集 数据来源:互联网公开数据 标签:健康,医疗,问答,WebMD,医学,文本数据,自然语言处理,信息检索 数据概述:... -
欧洲杯赛事社交媒体讨论内容情感分析数据集-2020年Reddit平台
欧洲杯赛事社交媒体讨论内容情感分析数据集-2020年Reddit平台 数据来源:互联网公开数据 标签:欧洲杯,足球,社交媒体,Reddit,情感分析,赛事讨论,文本数据,体育,舆情分析 数据概述: 本数据集收录了2020年欧洲杯期间Reddit平台r/Euro2020子版块内的帖子和评论数据。数据来源于Reddit官方API,使用Python... -
烹饪平台用户评论与互动信息食谱评论与评分反馈数据集
数据来源 互联网公开数据 数据字段 Recipe_Name(食谱名称):用户评价所对应的食谱标题。 Recipe_Rank(食谱排名):食谱在平台前100名榜单中的排名情况。 Recipe_ID(食谱代码):每个食谱的唯一标识符。 User_ID(用户ID):用户的唯一身份标识。 User_Name(用户名):注册用户的显示名称。... -
互联网公开数据集多源文本标注数据集
标题:互联网公开数据集多源文本标注数据集 数据内容:该数据集包含了来自多个来源的文本数据,每个文本都经过标注处理,具有明确的分类标签。数据集中包含文本内容、标签以及数据来源三个主要字段。具体字段统计信息如下: text: 290,390 种不同文本内容 label: 3 种不同的分类标签 src: 11 种不同的数据来源 数据来源:互联网公开数据... -