-
网络安全BERT模型训练数据集-网络安全文本数据-多源文本-通用
网络安全BERT模型训练数据集-网络安全文本数据-多源文本-通用 数据来源:互联网公开数据 标签:网络安全,BERT,NLP,威胁检测,文本分类,恶意软件分析,漏洞,网络安全威胁,文本数据,机器学习 数据概述: Cyber-... -
推特用户评论情感分析数据集
推特用户评论情感分析数据集 数据来源:互联网公开数据 标签:推特,用户评论,情感分析,文本数据,自然语言处理,情感分类,客户反馈 数据概述: 本数据集包含数千条推特用户评论(输入文本)及其对应的情感标签(输出标签),旨在用于情感分析模型的训练。数据通过使用关键词从Twitter... -
谷歌应用商店用户评论情感分析数据集
谷歌应用商店用户评论情感分析数据集 数据来源:互联网公开数据 标签:情感分析,用户评论,应用商店,文本数据,自然语言处理,情感极性,评论分析,机器学习 数据概述:... -
巴西疫情调查委员会听证会发言记录数据集-2021年
巴西疫情调查委员会听证会发言记录数据集-2021年 数据来源:互联网公开数据 标签:巴西,疫情,调查委员会,CPI,听证会,政治,数据分析,文本数据 数据概述: 本数据集收录了巴西疫情调查委员会(CPI da... -
Netflix平台用户社交媒体评论文本数据集-Facebook平台-2024年
Netflix平台用户社交媒体评论文本数据集-Facebook平台-2024年 数据来源:互联网公开数据 标签:Netflix,社交媒体,Facebook,用户评论,情感分析,LLM,自然语言处理,文本数据 数据概述:... -
-
开放域问答数据集-问题与答案-2023年
开放域问答数据集-问题与答案-2023年 数据来源:互联网公开数据 标签:问答,自然语言处理,NLP,文本数据,QA,问题解答,知识库,语言模型,机器学习 数据概述: 本数据集包含大量的问题与答案对,旨在为开放域问答(QA, Question... -
Kaggle文本数据竞赛优胜方案分析数据集-2021-2023
Kaggle文本数据竞赛优胜方案分析数据集-2021-2023 数据来源:互联网公开数据 标签:Kaggle,文本数据,竞赛,机器学习,自然语言处理,NLP,解决方案,深度学习,模型,算法,优化器,集成,数据分析 数据概述: 本数据集收录了2021年至2023年间9个Kaggle文本数据竞赛中,每个竞赛前三名优胜方案的详细分析。... -
TripAdvisor酒店评论情感分析数据集-2万条评论
TripAdvisor酒店评论情感分析数据集-2万条评论 数据来源:互联网公开数据 标签:酒店评论,情感分析,TripAdvisor,用户评价,文本数据,情感评分,旅游,大数据 数据概述:... -
ChatGPT-GPT3-GPT4相关推文每日采集数据集-2023年4月3日-2023年5月13日
ChatGPT-GPT3-GPT4相关推文每日采集数据集-2023年4月3日-2023年5月13日 数据来源:互联网公开数据 标签:推文,社交媒体,Twitter,ChatGPT,GPT3,GPT4,自然语言处理,情感分析,数据分析,文本数据 数据概述:... -
Reddit评论情感倾向与冒犯性评分数据集
Reddit评论情感倾向与冒犯性评分数据集 数据来源:互联网公开数据 标签:Reddit,评论,情感分析,冒犯性,自然语言处理,文本数据,社交媒体,评分数据 数据概述:... -
洋葱新闻讽刺文章数据集
洋葱新闻讽刺文章数据集 数据来源:互联网公开数据 标签:讽刺新闻,洋葱,媒体分析,文本数据,图像数据,新闻趋势,幽默文化 数据概述: 本数据集收录了来自《洋葱》(The... -
权力的游戏全季剧本数据集
权力的游戏全季剧本数据集 数据来源:互联网公开数据 标签:权力的游戏, 剧本, 季节, 对话分析, 文本挖掘, 文本数据, 剧情研究 数据概述: 本数据集收录了《权力的游戏》(Game of... -
Commonlit阅读理解文章难度评估数据集-2020年8月
Commonlit阅读理解文章难度评估数据集-2020年8月 数据来源:互联网公开数据 标签:阅读理解,文本分析,教育,自然语言处理,阅读难度,文本数据,Commonlit,机器学习 数据概述:... -
手机评论数据集
手机评论数据集 数据来源:互联网公开数据 标签:手机评论,情感分析,文本数据,评分系统,自然语言处理,数据清洗,机器学习 数据概述: 本数据集包含手机评论的原始数据,覆盖了从旧款到新款手机的用户反馈,每条评论均配有1到5星的评分。数据集以原始形式呈现,包含缺失值、异常值以及重复数据。这些原始数据为后续的数据处理和分析提供了基础。 数据用途概述:... -
Flipkart手机用户评论情感分析数据集
Flipkart手机用户评论情感分析数据集 数据来源:互联网公开数据 标签:手机评论,情感分析,用户反馈,电商,文本数据,自然语言处理,产品评价 数据概述: 本数据集包含了来自 Flipkart... -
阿拉伯语故事生成数据集
阿拉伯语故事生成数据集 数据来源:互联网公开数据 标签:MSA,叙事生成,阿拉伯语故事,故事生成,文本数据,自然语言处理,机器学习,故事创作 数据来源: 本数据集由不列颠哥伦比亚大学自然语言处理小组(UBC-NLP)整理发布,详细信息可参考其GitHub仓库:https://github.com/UBC-NLP/arastories.git。作者包括... -
多语言平行语料库释义数据集-73种语言
多语言平行语料库释义数据集-73种语言 数据来源:互联网公开数据 标签:平行语料库,释义,自然语言处理,机器翻译,多语言,文本数据,语言学,文本分析 数据概述: 本数据集收录了73种语言的句子释义语料库,名为TaPaCo。该语料库由Yves... -
印尼语评论情感分析数据集SERFEE
印尼语评论情感分析数据集SERFEE 数据来源:互联网公开数据 标签:情感分析,印尼语,文本数据,机器学习,自然语言处理,评论,情感分类 数据概述: 本数据集专为印尼语情感分析任务设计,通过整合“indonlu”和“google-play-... -
Reddit论坛帖子评论情感分析数据集含毒性标注-探讨日本-辩论与萨尔瓦多监狱话题
Reddit论坛帖子评论情感分析数据集含毒性标注-探讨日本-辩论与萨尔瓦多监狱话题 数据来源:互联网公开数据 标签:Reddit, 评论, 情感分析, 毒性, 文本数据, 自然语言处理, 日本, 辩论, 萨尔瓦多, 监狱 数据概述:...