找到15个数据集

标签: 荷兰语

过滤结果
  • Common_Voice_11_0_Spoken_NER_Dataset

    2026年1月22日 30 198 16

    数据集概述 本数据集是基于Common Voice 11.0构建的口语命名实体识别(Spoken NER)数据集,包含荷兰语、英语和德语三种语言的口语命名实体识别数据,共3个JSON格式文件,无目录结构,未划分训练/测试集、数据/标签集或原始/处理集。 文件详解 荷兰语口语命名实体识别数据文件 文件名称:cv_nl_dataset.json...
    packageimg
  • AuCoPro_Semantics_Based_复合词语义自动分析数据集

    2026年1月22日 30 152 81

    数据集概述 本数据集用于复合词的自动语义分析,包含荷兰语和南非荷兰语的语义标注名词-名词复合词(NN),每种语言分两轮标注,标注指南基于Ó Séaghdha(2008)的标准;还包含荷兰语其他名词性复合词(XN),采用新开发的标注方案。数据集以压缩包形式提供,共1个文件。 文件详解 文件名称:AUCOPRO.Semantics.zip 文件格式:ZIP...
    packageimg
  • Qualitative_Interview_Data_肌电上肢假肢用户与治疗师感知访谈数据_公开版

    2026年1月7日 30 129 128

    数据集概述 本数据集为2016-2017年通过半结构化访谈收集的定性数据,访谈对象包括肌电多功能上肢假肢用户及治疗师,核心内容为用户对假肢设备的满意度及使用假肢完成的活动。访谈语言为荷兰语和德语,共包含十八份文件,其中四位有模式识别控制经验用户的数据未公开。 文件详解 访谈文档 文件名称:包含Interview 2.docx、Interview...
    packageimg
  • Flemish_Archaeological_Texts_佛兰芒地区考古文献量化研究数据_2017

    2026年1月7日 30 98 25

    数据集概述 本数据集对1945-2017年比利时佛兰芒地区的荷兰语考古文献进行量化分析,涵盖专著、期刊文章、发掘报告等4500余份文献,共5100余万字。为避免版权问题,去除连词、冠词及4字母以下词汇,包含元数据、文本匹配结果、停用词表及处理后数据压缩包,支持研究复现。 文件详解 METADATA.xlsx 文件格式:XLSX...
    packageimg
  • Multilingual_Dynamics_Based_中世纪佛兰德斯多语言文学手稿元数据_2024版

    2026年1月2日 30 23 13

    数据集概述 本数据集是“中世纪佛兰德斯多语言文学动态”项目的一部分,包含2539份现存中世纪佛兰德斯手稿(约1200-1500年)的元数据,涵盖荷兰语、法语和拉丁语文学文本,涉及手稿的基本信息、文本特征、来源、抄本学、装饰和书写体等6类主题,为研究该地区多语言文学文化的生产与接受提供基础数据。 文件详解 文件名称:Dataset...
    packageimg
  • Historical_Corpus_of_Dutch_Based荷兰语历史时期动词簇语序变异研究数据集

    2026年1月2日 30 138 37

    数据集概述 本数据集为荷兰语历史动词簇语序变异研究的核心数据,包含对早期至晚期近代荷兰语中动词簇语序变异的影响因素分析数据,涉及社会语言学变量(时间、地域、文本体裁)与结构变量(过去分词形态、助动词类型等),支持相关语言学研究。 文件详解 文件名称:data_volgordevariatie_BTFG.xlsx 文件格式:XLSX...
    packageimg
  • KBNL03000040140_Entangled_Histories_乌得勒支地区公告集转录数据1856

    2025年12月31日 30 97 35

    数据集概述 本数据集为《Mr. Johan van de Water's Groot plakkaatboek 'slands van...
    packageimg
  • 沿海环境享受_访问时长与健康关系研究数据集

    2025年12月18日 30 129 22

    数据集概述 本数据集围绕沿海环境享受、连接感与游客心理健康、感知健康结果的关系展开,探究日常访问时长和停留访问时长是否对上述关系存在调节作用。包含调查数据、代码本、分析代码及多语言调查文档,为相关研究提供支持。 文件详解 该数据集包含六个文件,具体说明如下: - 代码文件: - Coastal environment enjoyment,...
    packageimg
  • 数据15世纪中荷兰语祈祷书与微型画数据集

    2025年12月15日 30 210 161

    数据集概述 该数据集包含15世纪中荷兰语祈祷书及其微型画的数字化内容,涵盖三维模型文件与预览图片,为研究中世纪祈祷书的艺术风格与内容提供视觉化数据支持。 文件详解 三维模型文件: daa90ac002ec4edb86d76489a7122bdb.glb: GLB格式三维模型文件,记录祈祷书的三维数字化信息 预览图片文件:...
    packageimg
  • 法语和荷兰语系动词结构行为特征分析复现数据集

    2025年12月11日 30 86 59

    数据集概述 本数据集是研究法语和荷兰语系动词(含半系动词)结构行为特征分析的复现数据,包含原始研究的核心数据文件、分析代码及说明文档,可支持相关研究结果的重复验证与扩展分析。 文件详解 数据文件: 01a_Final_dataset_prototypical_copularity.xlsx:Excel格式,包含原型系动词性的最终数据集...
    packageimg
  • ICDAR2003非正式在线单词识别竞赛数据集_Unipen_ICROW_03基准集_V0_0

    2025年12月9日 30 47 34

    数据集概述 本数据集是ICDAR2003非正式在线单词识别竞赛的基准集,包含来自不同平板设备、国籍和语言的孤立在线自由手写(手写体、混合体、草书)单词数据,支持ASCII字符集标签,可用于评估“即学即用”识别性能。 文件详解 文件名称: _README.txt 文件格式: TXT 内容:...
    packageimg
  • 多语言合成出院小结数据集_基于心力衰竭临床病例

    2025年12月6日 30 57 7

    数据集概述 该数据集包含一千份心脏病学临床病例报告及其对应的多语言合成出院小结,覆盖英语、西班牙语和荷兰语三种语言。小结由GPT-4o-mini通过零样本提示生成并翻译,旨在为临床自然语言处理系统提供训练与评估数据支持。 文件详解 根目录文件: MultiSynDS.zip: 压缩文件,包含数据集所有内容 子目录结构:...
    packageimg
  • NIOD战争信件手写文本识别模型数据集1935_1950

    2025年12月6日 30 194 42

    数据集概述 本数据集包含基于荷兰NIOD研究所1935-1950年战争信件档案训练的手写文本识别(HTR)模型,训练数据来自968份荷兰语手写信件的真实转录文本,涵盖儿童、士兵等多群体的私人通信,为手写历史文献数字化提供技术支持。 文件详解 文件名称: Examples_HTR_Model.zip 文件格式: ZIP 内容说明:...
    packageimg
  • 命名实体识别西班牙语与荷兰语数据集NamedEntityRecognitionSpanishandDutchDataset-orlandc

    2025年4月29日 30 115 100

    命名实体识别西班牙语与荷兰语数据集NamedEntityRecognitionSpanishandDutchDataset-orlandc 数据来源:互联网公开数据 标签:命名实体识别, NLP, 自然语言处理, 西班牙语, 荷兰语, 文本标注, 语言学, BERT 数据概述:...
    packageimg
  • 荷兰谚语数据集DutchProverbsDataset-levrex

    2025年4月23日 30 124 102

    荷兰谚语数据集DutchProverbsDataset-levrex 数据来源:互联网公开数据 标签:谚语,数据集,语言学,文化研究,荷兰语,智慧,民俗学,社会学 数据概述:该数据集包含来自荷兰的谚语,记录了荷兰人民世代相传的智慧和经验。主要特征如下: 时间跨度:数据记录的时间范围从16世纪到现代。 地理范围:数据涵盖了荷兰全国及部分荷兰海外社区。...
    packageimg