找到4个数据集

标签: 文档标识

过滤结果
  • MID_Based_俄罗斯外交部2003_2019年新闻文件集合数据

    2026年1月25日 30 197 68

    数据集概述 本数据集为从俄罗斯外交部官网mid.ru抓取的2003年1月至2019年12月的新闻文件集合,包含部长讲话、副部长讲话、电话交谈、简报会等七类文件,共一万一千八百五十七份文档,每份文档对应一行数据,记录了文档的标识、日期、标题、类型、全文、来源链接等信息。 文件详解 数据文件 文件名称:MID.rds 文件格式:RDS...
    packageimg
  • 格拉纳达兄弟会虔诚研究文献来源目录2022_2023

    2025年12月22日 30 27 6

    数据集概述 本数据集是关于西班牙格拉纳达兄弟会虔诚研究的文献来源目录,包含十六至二十世纪间民事与教会机构产生的相关文档描述,涉及兄弟会的管理、组织及文化宗教表现等内容,为历史、艺术等领域研究提供支持。 文件详解 BBDD_COFRADIAS.mdb:Microsoft Access格式数据库文件,存储兄弟会相关文献的结构化数据。...
    packageimg
  • 芬兰1800_1920年教会簿册迁移记录数据集

    2025年12月16日 30 171 148

    数据集概述 本数据集包含从芬兰教会簿册中自动提取的1800至1920年迁移记录,共计六百二十万条记录,来源于四百六十八个教区的两千七百八十一册教会簿册,为研究该时期芬兰人口迁移提供数据支持。 文件详解 文件名称: migration-data-csv-release-v1-metadata.tsv 文件格式: TSV (.tsv) 字段示例:...
    packageimg
  • 多语言文档标识符数据集MultilingualDocumentIdentifierDataset-fredriknguyenepfl0

    2025年4月29日 30 114 107

    多语言文档标识符数据集MultilingualDocumentIdentifierDataset-fredriknguyenepfl0 数据来源:互联网公开数据 标签:文档标识, 多语言, 文本数据, 语料库, 语言识别, 数据清洗, 信息检索, 机器翻译 数据概述: 该数据集包含来自不同语言的文档标识符,记录了多种语言文档的唯一编号。主要特征如下:...
    packageimg