找到3,084个数据集

标签: 文本挖掘

过滤结果
  • 希尔德斯海姆药房历史文献数据集1924_1947

    2025年12月13日 30 67 26

    数据集概述 该数据集包含1924至1948年间的历史问卷、索引卡片及部分相关附件,内容聚焦德国希尔德斯海姆地区药房的历史,通过Kalliope门户网站进行编目,为研究德国药房历史提供了一手档案资料。 文件详解 文件名称: 73067.tiff,格式:TIFF,类型:栅格文件,可能为历史文献的扫描图像 文件名称:...
    packageimg
  • BIOMAT_MONER语料库训练与验证集

    2025年12月13日 30 13 11

    数据集概述 该数据集为BIOMAT-MONER语料库的训练(750篇文档)与验证(100篇文档)集,用于生物材料领域科学文献中制造对象相关实体的命名实体识别(NER)模型开发,聚焦生物材料实验或应用中的制造对象及属性标注。 文件详解 文件名称: BIOMAT-MONER_Train_Set.zip 文件格式: .zip(压缩包) 内容说明:...
    packageimg
  • 德国安普芬圣马丁药房历史档案集

    2025年12月13日 30 32 14

    数据集概述 本数据集包含德国安普芬圣马丁药房的历史档案,主要为1924年和1948年的历史问卷、索引卡片及部分附属材料,通过Kalliope门户网站进行编目,反映该药房的历史发展情况。 文件详解 文件名称: 08084.pdf:PDF格式文档文件,可能包含药房历史问卷、索引卡片或附属材料的数字化内容。 文件名称:...
    packageimg
  • COVID_19相关生物医学自然语言处理词典与标注语料库工具包

    2025年12月13日 30 36 21

    数据集概述 本数据集为生物医学自然语言处理任务提供工具包,包含COVID-19相关的英文词典、标注语料库及代码工作流。词典覆盖疾病、病毒、变异株等术语,用于从CORD-19数据集提取信息,构建大型银标准语料库,辅以人工标注的金标准语料库,支持命名实体识别等文本分析任务。 文件详解...
    packageimg
  • 波兰地下出版物书目记录数据集

    2025年12月13日 30 169 86

    数据集概述 该数据集是波兰国家图书馆开展的复古数字化与数字策展项目成果,收录1976-1989年波兰流通的非许可非连续出版物的书目记录,包含作品、系列、机构实体等多维度结构化数据及数据模型示意图。 文件详解 CSV数据文件(共6个):...
    packageimg
  • pk_mk_qk_Based_文档内容分析完整数据

    2025年12月12日 30 29 24

    数据集概述 本数据集包含1个PDF格式的文档文件,核心内容未提供详细描述,整体结构单一,未进行训练测试、数据标签或原始处理数据的拆分。 文件详解 文件名称: summary.pdf 文件格式: PDF (.pdf) 内容说明: 未提供具体字段或内容描述,为单一文档文件 适用场景 文档内容分析: 基于PDF文档内容开展文本挖掘或主题分析 格式转换研究:...
    packageimg
  • Kalliope_Gumbinnen_Zur_Altstadt_Apotheke_Based_药房历史档案数字化完整数据

    2025年12月12日 30 41 26

    数据集概述 该数据集包含与Gumbinnen Zur Altstadt Apotheke相关的历史档案,主要为1924年和1948年的历史问卷、索引卡片及部分附属文件,通过Kalliope门户编目,记录该德国药房的历史信息。 文件详解 文件名称: 18730.tiff,文件格式: TIFF,为栅格图像文件,可能包含历史档案的扫描图像 文件名称:...
    packageimg
  • 德国君茨堡上药房历史文献数据集

    2025年12月12日 30 203 199

    数据集概述 本数据集收录了德国君茨堡上药房(Günzburg Obere Apotheke)的历史文献,包含1924至1948年的历史问卷、索引卡片及部分精选附件,通过Kalliope门户进行编目,反映该药房的历史沿革。 文件详解 文件名称: 18735.pdf 文件格式: PDF 内容说明: 可能包含药房历史问卷、索引卡片或相关附件的数字化文档...
    packageimg
  • 盖尔登药房历史文献数据集

    2025年12月12日 30 73 35

    数据集概述 该数据集包含德国盖尔登药房的历史文献,主要为1924/1948年的历史问卷、索引卡及部分附件,通过Kalliope门户网站编目,记录药房历史相关信息。 文件详解 文件名称: 18513.tiff,文件格式: TIFF,为光栅图像文件,可能包含药房历史文献的扫描图像 文件名称: 18513.pdf,文件格式:...
    packageimg
  • 埃德米森药店历史档案数据集

    2025年12月12日 30 119 2

    数据集概述 该数据集包含德国埃德米森药店的历史档案,核心内容为1924年和1948年的历史问卷、索引卡片及部分公开附录材料,通过Kalliope门户进行编目,记录了药店的发展历史。 文件详解 文件名称: 18117.tiff:TIFF格式文件,可能为历史档案的扫描图像 文件名称:...
    packageimg
  • 德国药房历史档案数据集_Gommern_Hindenburg_Apotheke

    2025年12月12日 30 184 114

    数据集概述 本数据集包含与德国Gommern Hindenburg Apotheke药房历史相关的历史问卷(1924/1948年)、索引卡片及部分选定附件,通过Kalliope门户编目,记录该药房的历史资料。 文件详解 18627.pdf:PDF格式文档文件,可能包含药房历史问卷、索引卡片或附件的数字化文本内容...
    packageimg
  • 霍恩堡_马格德堡阿德勒药房历史档案数据集1924_1948

    2025年12月12日 30 137 124

    数据集概述 本数据集包含德国霍恩堡/马格德堡阿德勒药房的历史档案,核心为1924至1948年的历史问卷、索引卡及部分公开附录材料,通过Kalliope门户编目,反映该药房的历史沿革。 文件详解 文件名称: 19081.pdf:PDF格式文档文件,可能包含药房历史相关的问卷或文本记录 文件名称:...
    packageimg
  • 世界宪法初步阅读数据集

    2025年12月12日 30 26 14

    数据集概述 本数据集是一个名为"curated-world_constitutions-other"的远距离阅读(Distant Reader)研究单元,收集了从Constitute网站获取的世界各国宪法文本,为世界宪法的初步分析提供基础数据支持。 文件详解 文件名称: index.zip 文件格式: ZIP (.zip) 文件内容:...
    packageimg
  • 敦煌早期禪宗文獻四部TEI標記XML數據集

    2025年12月12日 30 38 31

    数据集概述 本数据集为ZIP压缩包,包含支撑《敦煌早期禪宗文獻四部——以TEI標記重訂敦煌寫卷》印刷版的XML数据、模式、样式表及相关材料,涵盖四十八件敦煌寫卷中的四部早期禪宗文獻,为禪宗文献研究提供结构化数据支持。 文件详解 文件名称: 4earlyChanTextsFromDunhuang-aTEIbasedEdition_2017.zip...
    packageimg
  • 本内肯斯坦阿德勒药房历史档案数据集

    2025年12月12日 30 191 172

    数据集概述 该数据集包含德国本内肯斯坦阿德勒药房的历史档案,主要为1924年和1948年的历史问卷、索引卡片及部分公开附录材料,通过Kalliope门户编目,记录药房历史相关信息。 文件详解 文件名称:08205.pdf,文件格式:PDF,可能包含药房历史问卷或附录的数字化文档内容...
    packageimg
  • M_S_CORNELIS_PRINS航运日志第一部分_法规1968_1981

    2025年12月12日 30 54 24

    数据集概述 该数据集为1968至1981年间记录的M.S.CORNELIS PRINS航运日志第一部分,包含前50页的德、荷、法三语法规内容,已数字化供文本研究,后续日志部分将逐步开放。 文件详解 1202.pdf:PDF格式文档,为M.S.CORNELIS PRINS航运日志第一部分的数字化文件,包含1968-1981年间的德、荷、法三语法规内容。...
    packageimg
  • 德国Grossen_Linden_Linden药房历史档案数据集

    2025年12月12日 30 160 61

    数据集概述 该数据集包含德国Grossen-Linden Linden药房的历史档案,核心为1924年、1948年的历史问卷及索引卡片,部分含相关附件,通过Kalliope门户编目,记录药房历史发展相关信息。 文件详解 18698.tiff:TIFF格式文件,可能为药房历史档案的图像扫描件...
    packageimg
  • Hervest_Glückauf药房历史文献数据集1924_1948

    2025年12月12日 30 136 6

    数据集概述 该数据集包含德国Hervest Glückauf药房的历史文献,主要为1924至1948年间的历史问卷、索引卡片及部分公开附录材料,记录了药房的历史信息,通过Kalliope门户进行编目。 文件详解 文件名称: 19007.tiff:TIFF格式的栅格文件,可能为历史文献的图像扫描件 文件名称:...
    packageimg
  • 瑞士联邦翻译人员招聘公告语料库2016_2023

    2025年12月12日 30 134 48

    数据集概述 该数据集为瑞士联邦语言服务部门翻译人员招聘公告语料库,包含2016-2023年250份法语版公告(共七万零三百三十七个词),经NVivo手动标注能力要求与任务,可分析招聘需求及常见任务。 文件详解 READ-ME_job announcements corpus_SWIFT.pdf:PDF格式,详细描述资源的说明文档 CORPUS_raw...
    packageimg
  • 德国波利茨赫希药房历史档案集1924_1947

    2025年12月11日 30 88 70

    数据集概述 该数据集包含德国波利茨赫希药房的历史档案,主要为1924至1948年间的历史问卷、索引卡片及部分附随材料,通过Kalliope门户编目,记录了该药房的历史信息。 文件详解 文件名称: 20380.pdf:该文件为PDF格式,包含德国波利茨赫希药房的历史问卷、索引卡片及部分附随材料,具体内容可通过文件查阅。 数据来源 Kalliope门户...
    packageimg