-
通用大型语言模型预训练文本与元数据数据集-ThePileSmall-thedevastator
通用大型语言模型预训练文本与元数据数据集-ThePileSmall-thedevastator 数据来源:互联网公开数据 标签:文本数据,元数据,自然语言处理,预训练,机器学习,情感分析,文本摘要,数据集,NLP 数据概述: 本数据集“The Pile...
-
VK社交网络社区小组墙帖和评论数据集
VK社交网络社区小组墙帖和评论数据集 数据来源:互联网公开数据 标签:VK社交网络,社区小组,墙帖,评论,文本数据,社交媒体分析,用户行为研究,情感分析 数据概述: 本数据集来源于俄罗斯社交网络VKontakte上的多个社区小组,包含墙帖及其公开评论的文本内容。数据结构清晰,每个文件名以群组标识符开头,并以文本类型结尾,例如: -...
-
WhatsApp应用用户在GooglePlay商店评论数据集-2015-2023
WhatsApp应用用户在GooglePlay商店评论数据集-2015-2023 数据来源:互联网公开数据 标签:WhatsApp,社交,移动应用,评论,用户反馈,情感分析,应用市场,Google Play,文本数据 数据概述: 本数据集收录了2015年至2023年期间,WhatsApp应用在Google...
-
Reddit足球论坛帖子与评论数据-r-Soccer-时间不限-curiel
Reddit足球论坛帖子与评论数据-r-Soccer-时间不限-curiel 数据来源:互联网公开数据 标签:足球,Reddit,社交媒体,帖子,评论,文本数据,体育,舆情分析,社区互动 数据概述:...
-
俄乌战争社交媒体推文数据集65天-2022年1月1日至2022年3月6日
俄乌战争社交媒体推文数据集65天-2022年1月1日至2022年3月6日 数据来源:互联网公开数据 标签:俄乌战争,乌克兰,俄罗斯,推特,社交媒体,战争,舆情分析,时事热点,文本数据 数据概述:...
-
新冠疫情全球推特讨论数据集-2020
新冠疫情全球推特讨论数据集-2020 数据来源:互联网公开数据 标签:新冠疫情,推特,社交媒体,舆情分析,文本数据,疫情传播,情感分析,公共卫生,国际合作 数据概述:...
-
电影剧情数据集-10万部以上电影-sidhantyadav
电影剧情数据集-10万部以上电影-sidhantyadav 数据来源:互联网公开数据 标签:电影,剧情,电影分析,文本数据,文化研究,娱乐 数据概述: 本数据集包含超过10万部电影的剧情描述,存储在CSV文件中。数据集涵盖了多种类型的电影,每个记录包括电影的标题、年份和剧情描述等关键信息,为电影研究和分析提供了丰富的内容基础。 数据用途概述:...
-
AOSSIE有毒上下文点击诱饵分类模型训练数据集-ad6398
AOSSIE有毒上下文点击诱饵分类模型训练数据集-ad6398 数据来源:互联网公开数据 标签:AOSSIE,点击诱饵,分类模型,训练数据,文本数据,新闻网站,数据集 数据概述: 本数据集用于AOSSIE组织在GSoC'19期间训练点击诱饵分类模型。数据集包含来自多个来源的原始数据,包括Click...
-
Yelp商家评价情感分析二元分类数据集-训练与测试-yacharki
Yelp商家评价情感分析二元分类数据集-训练与测试-yacharki 数据来源:互联网公开数据 标签:Yelp,评价,情感分析,二元分类,文本数据,机器学习,自然语言处理,情感极性 数据概述:...
-
网络评论中仇恨言论检测数据集-2023年-cabmarcos
网络评论中仇恨言论检测数据集-2023年-cabmarcos 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,自然语言处理,数据清理,文本数据,社交网络,情感分析,数据预处理 数据概述:...
-
美国Yelp2018商家评价分类数据集-luisfredgs
美国Yelp2018商家评价分类数据集-luisfredgs 数据来源:互联网公开数据 标签: Yelp, 文档分类, 多分类, 神经网络, 用户评价, 商家评论, 星级评分, 文本数据 数据概述: 本数据集包含约500万条完整的 Yelp 用户评价文本数据,来源于2018年 Yelp...
-
亚马逊商品评论情感细粒度分析数据集-训练与测试集
亚马逊商品评论情感细粒度分析数据集-训练与测试集 数据来源:互联网公开数据 标签:亚马逊,商品评论,情感分析,文本数据,机器学习,自然语言处理,训练集,测试集 数据概述:...
-
-
安然公司电子邮件通信数据集-安然公司邮件-2000-2002-rcmonteiro
安然公司电子邮件通信数据集-安然公司邮件-2000-2002-rcmonteiro 数据来源:互联网公开数据 标签:电子邮件,安然公司,通信,文本数据,商业,腐败,调查,邮件分析 数据概述:...
-
法尔斯新闻网站新闻文章数据集-2021至2023年
法尔斯新闻网站新闻文章数据集-2021至2023年 数据来源:互联网公开数据 标签:法尔斯新闻,新闻文章,伊朗,伊朗媒体,新闻分类,新闻时间,文本数据 数据概述: 本数据集包含从法尔斯新闻网站(Tabnak)抓取的新闻文章数据,涵盖了2021年至2023年期间发布的文章。数据集包括新闻标题、文章正文、分类标签和发布时间等核心字段。字段定义如下:...
-
文本分类情感分析数据集TextClassificationSentimentAnalysis-quoniammm
文本分类情感分析数据集TextClassificationSentimentAnalysis-quoniammm 数据来源:互联网公开数据 标签:情感分析, 文本分类, 机器学习, 自然语言处理, 情感极性, 数据标注, 文本数据, 情感识别 数据概述: 该数据集包含用于情感分析任务的文本数据,记录了文本内容及其对应的情感标签。主要特征如下:...
-
实验心理学行为数据分析数据集ExperimentalPsychologyBehavioralDataAnalysis-ariakh
实验心理学行为数据分析数据集ExperimentalPsychologyBehavioralDataAnalysis-ariakh 数据来源:互联网公开数据 标签:心理学实验, 行为数据, 实验设计, 数据分析, 认知科学, 文本数据, 数据集, 实验结果 数据概述:...
-
代码仓库Python项目代码数据集CodeRepositoryPythonProjectCode-dodiyaparth
代码仓库Python项目代码数据集CodeRepositoryPythonProjectCode-dodiyaparth 数据来源:互联网公开数据 标签:Python, 代码, 软件工程, 机器学习, 自然语言处理, 代码分析, 文本数据, 开源项目 数据概述:...
-
密码安全分析与泄露数据集PasswordSecurityAnalysisandLeakageDataset-babaralijamali
密码安全分析与泄露数据集PasswordSecurityAnalysisandLeakageDataset-babaralijamali 数据来源:互联网公开数据 标签:密码安全, 密码泄露, 密码分析, 安全审计, 文本数据, 统计分析, 数据挖掘, 信息安全 数据概述:...
-
文本情感分析伪标签数据集TextSentimentAnalysisPseudo-labelDataset-abdulkadirguner
文本情感分析伪标签数据集TextSentimentAnalysisPseudo-labelDataset-abdulkadirguner 数据来源:互联网公开数据 标签:情感分析, 文本分类, 伪标签, 机器学习, 自然语言处理, 文本数据, 情感评分, 数据增强 数据概述:...



