数据集

社交媒体谣言识别评论文本数据集SocialMediaRumorDetectionCommentTextDataset-latapangtey

数据来源：互联网公开数据

标签：谣言检测, 社交媒体, 文本分析, 情感分析, 观点挖掘, 自然语言处理, 数据标注, 机器学习

数据概述：该数据集包含来自社交媒体平台上的文本数据，记录了关于新闻事件的原始文本、用户评论回复、以及相关的情感和标签信息，主要用于谣言识别和情感分析研究。主要特征如下：时间跨度：数据未明确标明时间，可视为静态文本数据集。地理范围：数据来源覆盖范围未知，但内容涉及全球新闻事件。数据维度： id：唯一标识符。 source_text：原始新闻文本。 reply_text：用户评论回复文本。 label：评论标签，例如“comment”（评论）。 label_number：标签对应的数值编码。 source_top_emotions：原始文本的情感标签，如信任、积极、消极等。 reply_top_emotions：回复文本的情感标签。 source_sentiment：原始文本的情感极性，如中性。 reply_sentiment：回复文本的情感极性。 source_sentiment_vector：原始文本的情感向量。 reply_sentiment_vector：回复文本的情感向量。 alignment：文本对齐信息。 cleaned_source_text：清洗后的原始文本。 cleaned_reply_text：清洗后的回复文本。 concatenated_column_source_first：原始文本拼接信息。 concatenated_column_reply_first：回复文本拼接信息。数据格式：CSV格式，文件名为new_file_testcsv和new_file_traincsv，便于数据分析和模型训练。数据来源于社交媒体平台，并经过了清洗和标注。该数据集适合用于谣言检测、情感分析和观点挖掘等相关领域的研究。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于自然语言处理、社交媒体分析等领域的学术研究，如谣言识别模型构建、情感分析方法研究等。行业应用：为社交媒体平台、新闻媒体提供数据支持，用于提升内容审核效率、优化用户体验。决策支持：支持舆情分析、风险评估，帮助企业和机构及时了解公众观点和情绪。教育和培训：作为自然语言处理、文本挖掘等课程的实训材料，帮助学生和研究人员熟悉文本数据处理流程。此数据集特别适合用于探索用户评论与新闻内容之间的关系，预测谣言传播趋势，以及分析公众情感变化。

数据与资源

versions_1741594499.zipZIP
0.90 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.9 MiB
最后更新	2025年4月29日
创建于	2025年4月29日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

社交媒体谣言识别评论文本数据集SocialMediaRumorDetectionCommentTextDataset-latapangtey

数据与资源

附加信息

注册成功！