找到3个数据集

标签: 多语言新闻

过滤结果
  • BhashaHMPV_Based印度区域语言HMPV多语言新闻与事实核查数据集

    2026年1月20日 30 180 21

    数据集概述 本数据集包含印度区域语言的HMPV相关多语言新闻和事实核查文章,覆盖孟加拉语、英语、古吉拉特语等11种语言。通过Splinter框架采集Google新闻文章,利用Google Fact-Check API获取事实核查文章,经预处理和词干提取后整理为结构化文件,可用于多语言医疗文本分析研究。 文件详解...
    packageimg
  • 新闻信息传播数据集

    2025年12月11日 30 197 111

    数据集概述 该数据集围绕体育(FIFA世界杯)、自然灾害(地震)、气候变化(全球变暖)三大领域的新闻信息传播展开,包含多语言新闻文章及元数据,为研究不同事件的信息传播特征提供支持。 文件详解 核心数据文件(CSV格式): FIFAWorldCup - Metadata.csv:FIFA世界杯事件的元数据文件 Earthquake -...
    packageimg
  • 多语言新闻文章数据集Multi-NewsDataset-terrychanorg

    2025年5月29日 30 103 8

    多语言新闻文章数据集Multi-NewsDataset-terrychanorg 数据来源:互联网公开数据 标签:新闻,多语言,数据集,自然语言处理,文本摘要,机器翻译,信息检索,文本分析 数据概述: 该数据集包含来自不同语言的新闻文章,用于文本摘要和多语言处理任务。主要特征如下: 时间跨度:数据记录的时间范围为不确定,取决于新闻来源的更新频率。...
    packageimg