找到24个数据集

标签: 词汇使用

过滤结果
  • Oupoco_Based_法语十四行诗库_文学创作数据

    2026年1月30日 30 67 40

    数据集概述 本数据集是Oupoco项目框架下开发的法语十四行诗库,包含四千八百七十首十四行诗,主要来自十九世纪至二十世纪初。涵盖七百六十七位作者,其中男性作者六百六十位(四千四百一十二首)、女性作者一百零七位(四百三十九首),另有十九首作者性别未明确。数据可免费复用,支持文学研究、语料库分析等多场景应用。 文件详解 文件名称:oupoco.dtd...
    packageimg
  • APOSCRIPTA_Based_教皇书信统一语料库研究数据

    2026年1月29日 30 31 19

    数据集概述 本数据集为APOSCRIPTA数据库,收录罗马教皇自起源至近代的书信、庄严法令、教规及教令集等文献的文本与元数据,涵盖各类手稿传统。由CIHAM于2017年发起,目标建成关联开放数据资源,目前包含超25000份文献,持续更新中。 文件详解 文件名称:APOSCRIPTA database. Unified Corpus of Papal...
    packageimg
  • La_Pola_Siero_阿斯图里亚斯地图第4问口语语料数据

    2026年1月29日 30 209 42

    数据集概述 本数据集包含与“阿斯图里亚斯地图:第4问”相关的La Pola Siero地区口语语料,核心为1份docx格式文档,未区分训练/测试、数据/标签或原始/处理数据,无额外目录层级,文件类型单一。 文件详解 文件名称:Mapa de Asturias.Pregunta4.docx 文件格式:docx...
    packageimg
  • IN01027_Based_Hiresakuna梵语授权文书数字化数据

    2026年1月26日 30 201 126

    数据集概述 本数据集为IN01027号Hireśakuna授权文书的梵语XML文件,记录了Mṛgeśavarman统治第八年的授权内容,未包含元数据。数据集仅含一个文件,用于古文献数字化保存与研究。 文件详解 文件名称:IN01027.xml 文件格式:XML...
    packageimg
  • ElarArchive_dk0071_Dalabon语言占位词使用偏好数据

    2026年1月21日 30 101 31

    数据集概述 本数据集来自Ponsonnet的Dalabon语料库,记录了澳大利亚Gunwinyguan语系Dalabon语言中占位词keninjhbi及其变体的使用实例,用于研究该语言中占位词使用的个体偏好特征,包含2个数据文件。 文件详解 文件名称:Ponsonnet data set 2401026.ods 文件格式:ODS...
    packageimg
  • Janecka_基于捷克视角_失语症患者言语与手势关系研究_故事复述转录数据

    2026年1月20日 30 53 46

    数据集概述 本数据集为Wernicke失语症男性患者复述卡通《小羊肖恩》故事的转录文本,用于从捷克视角探索失语症患者言语与手势的关系。数据以单一文档形式呈现,聚焦患者的语言表达记录。 文件详解 文件名称:transcription_male_wernicke_aphasia_1_Janecka.docx 文件格式:DOCX...
    packageimg
  • CONTRAST_IT_Based意大利语新闻语料库数据集2011_2012

    2026年1月20日 30 135 47

    数据集概述 本数据集为CONTRAST-IT多语言语料库的意大利语部分,包含2011-2012年从意大利三家电子日报(repubblica.it、lastampa.it、corriere.it)采集的531篇真实新闻文章,总计约三十万字,覆盖政治、体育、科技等多个主题,用于多语言对比语言学研究。 文件详解 意大利语新闻文章文件...
    packageimg
  • El_habla_de_La_Pola_Siero_阿斯图里亚斯地图问题1语料

    2026年1月19日 30 79 38

    数据集概述 本数据集为拉波拉谢罗方言语料,围绕阿斯图里亚斯地图问题1展开,包含1个文档文件,无训练/测试、数据/标签、原始/处理数据的划分,文档类型单一,无额外说明或预览内容。 文件详解 文件名称:Mapa de Asturias.Pregunta1.docx 文件格式:DOCX...
    packageimg
  • Broca_aphasia_捷克视角_语言手势关系研究_失语症患者语言转录数据

    2026年1月19日 30 56 39

    数据集概述 本数据集为一名Broca失语症男性患者的语言转录文本,内容基于其对卡通《小羊肖恩》故事的复述,旨在从捷克语视角探索失语症患者语言与手势的关系。数据集仅包含一个文档文件。 文件详解 文件名称:transcription_male_broca_aphasia_1_Janecka.docx 文件格式:DOCX...
    packageimg
  • Broca_Aphasia_Based_捷克Broca失语症患者语音转录研究数据

    2026年1月19日 30 84 11

    数据集概述 本数据集为捷克视角下探究失语症患者言语与手势关系研究的一部分,内容是一名Broca失语症男性患者复述卡通《小羊肖恩》故事的语音转录文件,共包含1个文档文件,用于支持失语症相关的言语特征分析。 文件详解 文件名称:transcription_male_broca_aphasia_2_Janecka.docx 文件格式:DOCX...
    packageimg
  • Wernicke_aphasia_Based_捷克视角失语症患者语言手势关系研究转录数据

    2026年1月13日 30 138 12

    数据集概述 本数据集为Wernicke失语症男性患者的语言转录文件,内容基于患者对卡通《小羊肖恩》的故事复述,用于从捷克视角探索失语症患者语言与手势的关系研究。数据集仅包含一个文档文件。 文件详解 文件名称:transcription_male_wernicke_aphasia_2_Janecka.docx 文件格式:docx...
    packageimg
  • 关于_小羊肖恩_Shaun_the_Sheep_的转录研究_无失语症男性患者的捷克语视角

    2026年1月13日 30 159 25

    数据集概述 本数据集为男性非失语者对卡通《小羊肖恩》故事复述的语言转录文本,用于从捷克视角探索失语症患者语言与手势关系的研究。数据集仅包含一个文档文件,记录了相关语言表达内容。 文件详解 文件名称:transcription of males without aphasia_Janecka.DOCX 文件格式:DOCX...
    packageimg
  • KBNL03000178388_基于荷兰格尔德兰地区的法律文献转录数据集_纠缠的历史项目成果

    2026年1月12日 30 10 1

    数据集概述 本数据集为1783年出版的荷兰法律文献《Gelrische landt- en stadt-rechten in het Overquartier van Ruremonde》的转录成果,源自荷兰国家图书馆(KB)馆藏副本,是“Entangled...
    packageimg
  • Narada_Momotaro_Based_奈良田方言桃太郎故事音声文字化数据_20240502

    2026年1月8日 30 9 8

    数据集概述 本数据集包含山梨县早川町奈良田方言翻译的传统故事《桃太郎》开头部分的音声及文字化内容,记录了该地方言对经典文本的演绎形式,为方言文化研究提供原始素材。 文件详解 文件名称:narada_momotaro_20240502.zip 文件格式:ZIP...
    packageimg
  • IN01028_Sanskrit_Based_Kadamba国王Malavalli铭文梵语文本数据

    2026年1月7日 30 104 25

    数据集概述 本数据集包含编号为IN01028的古印度Kadamba国王Malavalli铭文的梵语XML文件。该文件记录了铭文的梵语文本内容,未包含元数据,是研究Kadamba王朝历史、古印度铭文和梵语文学的数字化资料。数据集仅含一个文件。 文件详解 文件名称:IN01028.xml 文件格式:XML...
    packageimg
  • bilingual_assimilation_Based_双语同化项目数据与分析脚本_v1_0_0

    2026年1月6日 30 189 19

    数据集概述 本数据集为Carbajal等人双语同化项目的首次发布,包含项目的应用数据、词汇问卷及分析脚本,对应OSF项目https://osf.io/52z9g/,数据及脚本截至2018年3月22日,以压缩包形式提供。 文件详解 文件名称:juliacarbajal/bilingual_assimilation-v1.0.0.zip 文件格式:ZIP...
    packageimg
  • Schriftbelege_Hunsrik_xraywe_Lindenfelser_书面证据分析数据

    2026年1月4日 30 201 62

    数据集概述 本数据集为论文“Hunsrik xraywe”的分析语料,包含Facebook群组“Hunsrik Xprooch – Plat Taytx”中一周(2021年7月)的350条帖子及评论,共2250个词元,为Hunsrik语言的书面证据分析提供结构化数据支持。 文件详解...
    packageimg
  • 波洛利苏姆古罗马墓地墓碑铭文数据集

    2025年12月22日 30 186 97

    数据集概述 本数据集包含1868年在古罗马城市波洛利苏姆(POROLISSVM)墓地发现的墓碑铭文资料,涵盖拉丁原文、罗马尼亚语翻译及相关文件,为研究古罗马丧葬文化和铭文提供基础数据。 文件详解 核心模型文件: 3b52721198094b478866d6fa1a073d9b.glb: GLB格式3D模型文件,可能包含墓碑的三维模型数据 图片文件:...
    packageimg
  • Shimkevich_Nazarenko_Skot4_Based_俄语文献词源分析完整数据

    2025年12月14日 30 118 6

    数据集概述 本数据集为2022年6月9日莫斯科俄罗斯语言研究所会议报告,聚焦俄语词汇“скотъ4”(意为“金钱、税收”)的词源及使用情况,对比分析19世纪语言学家Shimkevich与现代学者Nazarenko的研究,探讨其与古诺尔斯语的关联及在古诺夫哥罗德方言中的使用特点。 文件详解 数据集包含一个PDF格式的文档文件,具体如下: - 文件名称:...
    packageimg
  • YZQ讲述的羌族笑话录音与转写数据集_YH_066

    2025年12月12日 30 78 31

    数据集概述 该数据集包含由YZQ讲述的一则羌族笑话的录音及转写文件,以YH-066为标识,涵盖音频、转写标注、预览网页等多种格式文件,为羌族语言文化相关研究提供原始资料支持。 文件详解 文件名称: YH-066.eaf,文件格式: EAF (.eaf),可能为音频转写标注文件,用于记录笑话内容的文本与音频时间对齐信息 文件名称:...
    packageimg