-
塞尔维亚语动词派生名词注释数据库
2025年12月20日 30 124 121
数据集概述 本数据集包含塞尔维亚语中动词派生名词的注释数据,通过对CLASSLA-web.sr语料库中动词“očekivati(期待)”后接名词的例句进行人工标注,分析其形态、词缀、基动词及补语等特征,为研究动词派生名词的语言特性提供支持。 文件详解 文件名称: Annotated database of deverbal...
-
爱尔兰语法庭口译员报纸参考文献数据集1796_1922
2025年12月19日 30 210 95
数据集概述 本数据集为包含1796-1922年提及爱尔兰语法庭口译员的报纸摘录转录语料库,相关信息曾用于Mary Phelan所著《Irish Speakers, Interpreter and the Courts》(2019)一书。 文件详解 文件名称:Newspaper references to Irish language court...
-
语法正字法之旅_元书写理由语料库
2025年12月15日 30 173 63
数据集概述 该数据集为包含四十次语言治疗会话的语料库,涉及四名儿童与三名语言治疗师,每人十次会话。核心围绕语言治疗师与儿童的互动分析,聚焦成人支持方式、儿童言语表达及使用数字短语构建应用时的元书写推理过程,用于研究元语言教学序列、专家成人支持特征及随会话的演变。 文件详解 文件名称:...
-
Kara_Nonopai故事板启发式记录数据集
2025年12月18日 30 75 74
数据集概述 本数据集包含Kara Nonopai语言使用者基于“John na Lassey”故事板图片的描述音频及转录文件,同时收录故事板相关的图片与视频文件,为研究该语言的口语表达及视觉描述能力提供支持。 文件详解 该数据集包含六个文件,具体说明如下: - 音频文件: - Kara_Nonopai_storyboard.WAV:...
-
德国联邦宪法法院官方判决汇编语料库2025_08_20
2025年12月13日 30 169 59
数据集概述 该数据集是德国联邦宪法法院官方判决汇编(BVerfGE)的数字化集合,包含截至2025年8月20日官方网站链接的所有判决。提供PDF、CSV等多格式文件,附说明手册,支持定量研究与传统法学工作,需注意与其他同类数据集区分。 文件详解 核心语料库文件:...
-
皮质动力学中语法类别涌现的计算理论数据集
2025年12月17日 30 141 89
数据集概述 本数据集围绕“皮质动力学中语法类别涌现的计算理论”研究构建,包含训练模型的语料库、语法解析输出、语法标签、词类别信息及模型测试结果等文件,为探索语法类别在皮质动力学中的涌现机制提供数据支持。 文件详解 语料库与解析文件: Corpora.txt(.txt格式):训练模型的语料库,源自wiki-...
-
扬_斯韦林克管风琴作品带注释乐谱语料库
2025年12月7日 30 21 14
数据集概述 本数据集为扬·斯韦林克管风琴作品的带注释乐谱语料库,源自DCML语料库计划,包含乐谱文件及结构化标注数据,支持音乐学实证研究,需通过指定文档页面获取使用说明。 文件详解 压缩包文件:...
-
数据2020年灾难推文语料库
2025年12月7日 30 88 50
数据集概述 该数据集包含2020年收集的、覆盖10类灾难共48起事件的推文数据,每条推文标注了是否与对应灾难相关。数据以平衡正负样本的文件形式组织,旨在为灾难相关推文过滤算法提供基准测试支持。 文件详解 文件名称:disaster-tweet-filtering-tranquil-tweets.zip 文件格式:ZIP压缩包...
-
COVID_19新闻发布会语料库
2025年12月16日 30 168 90
数据集概述 该数据集是一个机器可读的文本语料库,收集了全球各国政府及世界卫生组织在新冠疫情期间的每日新闻发布会内容,涵盖疫情状态更新、政策决策等信息,目前包含英国、苏格兰、威尔士、北爱尔兰及世界卫生组织的多场发布会记录。 文件详解 文件名称: Covid19_Press_Briefings_Corpus.zip 文件格式: ZIP(压缩包格式)...
-
古典与文学汉语学习者可靠词汇表原始频率数据集
2025年12月16日 30 81 49
数据集概述 该数据集包含古典与文学汉语学习者词汇表的原始频率计数,基于三个语料库(Micheal Loewe早期中文文本、正史、六部小说)构建,为汉语词汇研究提供基础数据支持。 文件详解 压缩包文件:...
-
拉赫玛尼诺夫_科雷利主题变奏曲_Op_42带注释乐谱语料库
2025年12月16日 30 129 56
数据集概述 该数据集为谢尔盖·拉赫玛尼诺夫《科雷利主题变奏曲》Op.42的带注释乐谱语料库,包含一套打包的乐谱文件,为音乐研究与分析提供支持。 文件详解 文件名称: DCMLab/rachmaninoff_piano-v2.4.zip 文件格式: ZIP压缩包 (.zip) 内容说明:...
-
斯洛文尼亚语含次级未完成体语素调整的Lec型名物化数据集
2025年12月16日 30 154 98
数据集概述 该数据集基于Arsenijević等人2024年的数据集衍生,核心记录斯洛文尼亚语中Lec型名物化(原数据集标注为lc-)的次级未完成体语素调整现象,包含调整后语素的名物化形式及其在国家语料库Gigafida 2.0中的出现频率。 文件详解 说明文档:Instructions for_Lec-nominalizations with an...
-
莫里斯_拉威尔钢琴作品注释乐谱语料库
2025年12月16日 30 16 13
数据集概述 该数据集为莫里斯·拉威尔钢琴作品的注释乐谱语料库,包含一个压缩文件,未提供详细描述,文件结构简单,无训练测试、数据标签或原始处理数据的划分。 文件详解 压缩文件: DCMLab/ravel_piano-v2.6.zip: 压缩文件格式,包含莫里斯·拉威尔钢琴作品的注释乐谱语料库,具体字段及内容需解压后查看,无预览信息。 适用场景...
-
曼加拉姆佛教梵语词典数据集
2025年12月15日 30 66 10
数据集概述 该数据集包含曼加拉姆研究中心开发的两个佛教梵语在线词典的词汇数据,分别是人工编纂的视觉词典与词库、全自动语料库词典,均基于曼加拉姆佛教梵语文本语料库构建,为佛教梵语词汇研究提供支持。 文件详解 核心数据文件:...
-
古希腊语到英语翻译对齐标注指南与黄金标准数据集
2025年12月15日 30 173 90
数据集概述 该数据集包含古希腊语文本与英语翻译对齐的标注指南及黄金标准,标注覆盖荷马史诗、雅典散文、柏拉图对话等文本,经测试标注者间一致性达百分之八十及以上,可用于翻译对齐的执行、评估及自动化模型训练。 文件详解 文件名称: eng.txt 文件格式: TXT (.txt) 内容说明:...
-
开放教育资源馆员职位描述语料库
2025年12月15日 30 32 11
数据集概述 本数据集为一份开放教育资源(OER)馆员职位描述的语料库保存副本,对应IJOER期刊文章的配套数据,聚焦学术图书馆中新兴的开放教育馆员角色相关职位描述内容。 文件详解 文件名称: LarsonAmandaLibraryPositionDescriptions2017to2019corpus.pdf 文件格式: PDF (.pdf)...
-
乌德穆尔特语空间格变化研究数据集
2025年12月15日 30 8 3
数据集概述 本数据集包含乌德穆尔特语空间格(源格:离格、出格;目标格:入格、终格)变化的人工标注数据及配套R分析代码,用于研究地标属性、动词形式等变量对格选择的影响,支持相关语言现象的定量分析。 文件详解 该数据集包含数据文件、R代码文件及文档,具体如下: - 数据文件(CSV格式):共6个,用于分析空间格选择的影响因素 -...
-
阿尔坎杰罗_科雷利三重奏鸣曲标注乐谱语料库
2025年12月14日 30 47 12
数据集概述 本数据集为阿尔坎杰罗·科雷利三重奏鸣曲的标注乐谱语料库,包含第二乐章待审内容,记录了第12、14小节的问题及提交详情,以压缩包形式存储核心乐谱文件。 文件详解 文件名称:DCMLab/corelli-v2.9.zip 文件格式:ZIP(压缩包)...
-
ERRATAS历史书信印刷版编辑原则与实践数据库2023
2025年12月14日 30 126 31
数据集概述 本数据集是ERRATAS项目的核心成果,基于早期英语书信语料库(CEEC-400)的来源文献,系统性调查历史书信印刷版的编辑原则、实践及相关人员工作情况,为研究历史文献编辑规范提供结构化数据支持。 文件详解 数据文件 (.xlsx 格式): ERRATAS-database 2023.xlsx:...
-
社会科学方法教育德语开放教育资源概述2024
2025年12月6日 60 179 135
数据集概述 本数据集是关于社会科学研究方法的德语开放教育资源(OER)及类OER的语料库,包含识别出的资源及分类编码,数据更新至2024年7月,供二次使用、扩展和修订。 文件详解 文件名称: GERMAN LANGUAGE OER FOR SOCIAL SCIENCE METHODS EDUCATION 2024.pdf 文件格式: PDF...



