伊朗时事新闻爬虫数据集-1384至1401年-amirpourmand

伊朗时事新闻爬虫数据集-1384至1401年-amirpourmand 数据来源:互联网公开数据 标签:伊朗新闻,阿斯里兰,波斯语,爬虫数据,时事分析,社区支持,数据集 数据概述: 本数据集包含了2005年1月1日至2022年4月24日期间伊朗新闻网站阿斯里兰(Asriran)发布的330,000篇新闻文章,数据以波斯语呈现。数据爬取工作历时较长,由于网站对频繁请求有限制,爬虫未采用并行请求方式,以避免IP被封禁。 数据用途概述: 该数据集适用于伊朗时事分析、波斯语自然语言处理、舆情监控、跨文化交流研究等多种场景。研究人员可以利用此数据集进行文本挖掘、情感分析、主题建模等研究;语言学家可以借助数据集进行波斯语语料库建设;政策制定者可以参考数据了解伊朗社会动态。同时,该数据集也为学术界和研究社区提供了宝贵的数据资源,助力相关领域的研究与发展。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 259.17 MiB
最后更新 2025年5月6日
创建于 2025年5月6日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。