-
Skillbox教育VKontakte官方账号帖子内容数据集-2016-2020年
Skillbox教育VKontakte官方账号帖子内容数据集-2016-2020年 数据来源:互联网公开数据 标签:社交媒体, VKontakte, 帖子, Skillbox, 教育, 数据分析, 内容分析, 文本数据 数据概述:...
-
Allociné法国电影评论情感分析数据集
Allociné法国电影评论情感分析数据集 数据来源:互联网公开数据 标签:情感分析, 法语, 电影评论, 文本数据, 机器学习, 自然语言处理 数据概述: 本数据集源自Allociné电影评论,用于法国电影评论的情感分析研究。数据集由Theophile Blard创建并收集,包含约20万条电影评论,其中训练集约占80%,验证集和测试集各占10%。...
-
Phoronix科技新闻文章标题与内容数据集
Phoronix科技新闻文章标题与内容数据集 数据来源:互联网公开数据 标签:科技新闻,NLP,文本分析,自然语言处理,新闻文章,Phoronix,文章标题,文本数据,数据挖掘 数据概述:...
-
英国广播公司BBC新闻文章文本数据集
英国广播公司BBC新闻文章文本数据集 数据来源:互联网公开数据 标签:新闻文章,文本数据,BBC,媒体,内容分析,自然语言处理,文本挖掘,英国 数据概述: 本数据集包含英国广播公司(BBC)发布的新闻文章文本内容。数据以CSV格式存储,原始数据为TXT格式。数据集涵盖了BBC新闻文章的标题、正文以及可能包含的发布日期、所属类别等元数据。 数据用途概述:...
-
谷歌应用商店App评论情感分析数据集-时间不限
谷歌应用商店App评论情感分析数据集-时间不限 数据来源:互联网公开数据 标签:谷歌应用商店,App评论,情感分析,用户反馈,文本数据,自然语言处理,移动应用,数据挖掘 数据概述: 本数据集包含了从谷歌应用商店抓取并清洗后的App数据和评论信息。 数据集涵盖了大量App的详细信息以及用户对其的评价内容,为进行情感分析提供了丰富的数据基础。...
-
印度尼西亚社交媒体新冠疫情情绪分析数据集-2020年至今
印度尼西亚社交媒体新冠疫情情绪分析数据集-2020年至今 数据来源:互联网公开数据 标签:新冠疫情,社交媒体,推特,情绪分析,印度尼西亚,文本数据,机器学习,舆情监测 数据概述:...
-
北极猴乐队歌曲歌词数据集
北极猴乐队歌曲歌词数据集 数据来源:互联网公开数据 标签:音乐,歌词,北极猴乐队,歌曲分析,专辑,文本数据,流行音乐 数据概述: 本数据集收录了英国摇滚乐队北极猴(Arctic...
-
CounselChat心理咨询对话数据集
CounselChat心理咨询对话数据集 数据来源:互联网公开数据 标签:心理咨询,对话,NLP,自然语言处理,情感分析,文本数据,CounselChat,语料库 数据概述: 本数据集收录了从 CounselChat 网站抓取的心理咨询对话数据。 CounselChat...
-
情感分析抑郁情绪识别数据集
情感分析抑郁情绪识别数据集 数据来源:互联网公开数据 标签:情感分析,抑郁,情绪识别,文本数据,机器学习,自然语言处理,情感标签 数据概述: 本数据集包含文本数据,其中“text_id”列用于存储情感文本,而“is_depression”列则作为标签,用于指示该情感是否被归类为抑郁情绪。如果情感被判定为抑郁,则标签值为1;否则,标签值为0。...
-
Reddit宗教文本分类数据集
Reddit宗教文本分类数据集 数据来源:互联网公开数据 标签:Reddit, 宗教, 文本分类, 自然语言处理, 社交媒体, 文本数据, 宗教信仰 数据概述:...
-
伊斯兰教圣训集锦رياضالصالحين圣训数据集中英双语版
伊斯兰教圣训集锦رياضالصالحين圣训数据集中英双语版 数据来源:互联网公开数据 标签:圣训,伊斯兰教,宗教,经典,阿拉伯语,英语,文本数据,Hadith,Riyad as-Saliheen,GPT-3,GPT-4 数据概述: 本数据集收录了《 رياض الصالحين》(Riyad as-Saliheen)...
-
英语-法语翻译数据集
英语-法语翻译数据集 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,英语,法语,文本数据,语言对,翻译模型 数据概述: 本数据集包含138,000对英语-法语翻译的句子对。每对数据由一个英语句子及其对应的法语翻译构成。数据集提供了丰富的翻译实例,涵盖了多种主题和语言风格。 数据用途概述:...
-
Mixtral8x7B模型生成AI写作检测竞赛模拟论文数据集
Mixtral8x7B模型生成AI写作检测竞赛模拟论文数据集 数据来源:互联网公开数据 标签:人工智能,LLM,Mixtral,论文生成,写作风格模仿,AI检测,竞赛,文本数据 数据概述: 本数据集旨在用于大型语言模型(LLM)生成的文本检测,特别针对“AI写作检测”竞赛。数据集包含约4000篇由Mixtral...
-
马拉雅拉姆电影评论情感分析数据集1963-2021
马拉雅拉姆电影评论情感分析数据集1963-2021 数据来源:互联网公开数据 标签:电影评论,马拉雅拉姆语言,情感分析,NLP,文本数据,电影产业,观众反馈 数据概述:...
-
Reddit抑郁主题清理文本数据集-2021
Reddit抑郁主题清理文本数据集-2021 数据来源:互联网公开数据 标签:Reddit,抑郁,文本生成,数据清理,心理健康,社交媒体,文本数据 数据概述:...
-
南方公园主要角色台词数据集
南方公园主要角色台词数据集 数据来源:互联网公开数据 标签:南方公园,台词,角色分析,文本数据,剧集台词,角色对话 数据概述: 本数据集包含了《南方公园》从首集到最新集数的所有剧集台词,共计收录了卡特曼、斯坦、克yle、肯尼、巴特曼斯、温蒂、克莱格和特维克这八个主要角色的所有台词。数据集为研究角色性格、剧情发展提供了详实的文本基础。 数据用途概述:...
-
Reddit平台政治观点讨论分析数据集-自由派与保守派-13000条帖子
Reddit平台政治观点讨论分析数据集-自由派与保守派-13000条帖子 数据来源:互联网公开数据 标签:Reddit,政治,观点分析,自由派,保守派,文本数据,社交媒体,NLP,自然语言处理 数据概述:...
-
推特情感分析情感分类数据集
推特情感分析情感分类数据集 数据来源:互联网公开数据 标签:情感分析,推特,社交媒体,文本数据,情感分类,情绪识别,CrowdFlower 数据概述:...
-
伊斯兰圣训分享平台推特文本数据集-包含圣训-传播者-出处等信息-自2022年至今
伊斯兰圣训分享平台推特文本数据集-包含圣训-传播者-出处等信息-自2022年至今 数据来源:互联网公开数据 标签:圣训,伊斯兰,推特,社交媒体,文本数据,宗教,传播者,出处,经典 数据概述:...
-
印度新闻文章数据集
印度新闻文章数据集 数据来源:互联网公开数据 标签:印度新闻,文章分析,文本数据,新闻作者,发布日期,社会研究,数据采集 数据概述: 本数据集包含了印度新闻网站Firstpost.com发布的新闻文章,数据范围涵盖了文章的主要内容,以及每篇文章的作者、链接、发布日期等关键信息。该数据集为研究印度新闻生态、社会动态提供了宝贵的数据资源。 数据用途概述:...



