印度尼西亚新闻门户网站头条数据集

印度尼西亚新闻门户网站头条数据集 数据来源:互联网公开数据 标签:印度尼西亚,新闻头条,新闻门户,文本分析,情感分析,NLP,媒体监测,时间序列分析 数据概述: 本数据集收录了2025年2月23日通过网页抓取从20个主要的印度尼西亚新闻门户网站收集的新闻头条。数据集包含三个关键组成部分:新闻来源、头条标题和发布时间。通过整合来自多个来源的头条,该数据集提供了印尼不同媒体机构当前热门话题的全面概览,适用于各种分析和研究目的,如趋势分析、情感分析和自然语言处理(NLP)应用。 数据用途概述: 研究人员可利用此数据集跟踪公众情绪,识别新闻报道中的常见主题,并训练机器学习模型进行文本分类、关键词提取和摘要等任务。此外,该数据集适合用于媒体监测,研究媒体偏见,以及比较不同新闻平台对相似话题的报道方式。数据集还适用于时间序列分析,帮助用户观察新闻趋势随时间的变化。 数据集包含1,174行和3列,无缺失值,确保其适用于数据分析和建模。三个可用变量为:source(新闻发布来源,表示新闻头条发布所在的新闻门户名称);title(新闻标题,包含新闻文章的实际头条);date(发布日期,表示每篇新闻的发布时间)。这些变量使得进行媒体监测、研究媒体偏见和比较不同新闻平台的报道成为可能。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.03 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。