乌兹别克斯坦新闻数据集

乌兹别克斯坦新闻数据集 数据来源:互联网公开数据
标签:新闻,乌兹别克斯坦,媒体,文本分析,分类,时间序列,新闻分类,内容分析

数据概述:
本数据集通过网络爬取乌兹别克斯坦新闻网站Daryo.Uz上的新闻数据,包含共计175,217条新闻信息。数据集涵盖多个新闻类别,包括“Mahalliy”(本地新闻)、“Dunyo”(国际新闻)、“Pul”(经济)、“Sport”(体育)、“Layfstayl”(生活方式)和“Madaniyat”(文化)。每条新闻记录包含新闻标题(title)、新闻正文(content)和新闻类别(target)三个字段,为新闻内容的分析和分类提供了全面的数据支持。

数据用途概述:
该数据集适用于新闻内容分析、文本分类、情感分析、主题建模、新闻趋势研究等多种场景。研究人员可利用此数据集进行新闻分类算法的开发与评估,探索乌兹别克斯坦媒体内容的特征与趋势;企业可借助数据进行市场分析,了解乌兹别克斯坦社会关注热点;教育机构可将其用于自然语言处理课程的教学与实践。此外,数据集也适合用于新闻内容的语义分析和多语言模型的训练,为跨语言信息处理提供支持。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 81.27 MiB
最后更新 2025年4月26日
创建于 2025年4月26日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。