数据集

政治新闻虚假信息生成数据集PoliticalNewsMisinformationGenerationDataset-shreymalvi

数据来源：互联网公开数据

标签：虚假信息, 政治新闻, 文本生成, 机器学习, 自然语言处理, 谣言检测, 数据合成, 语言模型

数据概述：该数据集包含由GPT-3.5-Turbo模型生成的关于政治新闻的虚假信息文本。主要特征如下：时间跨度：数据未明确标注生成时间，可视为静态数据集。地理范围：数据与政治新闻相关，涉及全球范围内的政治事件和议题。数据维度：数据集包含多个CSV文件，主要字段包括： label：标注，指示文本是否为虚假信息（数值型）。 prompt：用于生成虚假信息的提示文本。 synthetic misinformation：由模型生成的虚假信息文本。 news_id：新闻ID（仅在部分文件中）。 news_text：新闻文本（仅在部分文件中）。 lang：新闻语言（仅在部分文件中）。 theme：新闻主题（仅在部分文件中）。数据格式：CSV格式，包含三个文件，分别为synthetic-gpt-3.5-turbo_politifact_hallucination_processed.csv、synthetic-gpt-3.5-turbo_politifact_paraphrase_generation_processed.csv、synthetic-gpt-3.5-turbo_politifact_partially_arbitrary_generation_politics_rumors_processed.csv，便于文本分析和模型训练。数据来源：数据由GPT-3.5-Turbo模型生成，已进行一定程度的处理。该数据集适合用于虚假信息检测、文本生成、谣言分析等领域的研究。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：可用于研究虚假信息的生成机制、检测方法，以及评估语言模型在生成虚假信息方面的表现。行业应用：为内容审核、社交媒体平台、新闻网站等提供数据支持，用于提升虚假信息识别能力。决策支持：可用于构建风险评估模型，辅助决策者识别和应对虚假信息传播。教育和培训：作为自然语言处理、机器学习等课程的教学材料，帮助学生理解虚假信息检测和文本生成技术。此数据集特别适合用于探索虚假信息在政治新闻中的传播规律，以及提高对虚假信息的识别和防范能力。

数据与资源

政治新闻虚假信息生成数据集PoliticalNewsMisinformationGenerat...ZIP
0.65 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.65 MiB
最后更新	2025年5月16日
创建于	2025年5月16日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

政治新闻虚假信息生成数据集PoliticalNewsMisinformationGenerationDataset-shreymalvi

数据与资源

附加信息

注册成功！