-
CuneiML_Based_楔形文字机器学习数据集
2026年2月9日 30 44 29
数据集概述 本数据集为楔形文字机器学习研究提供支持,包含38,947张楔形文字泥板照片的元数据、边界框信息,以及对应文本的音译和楔形文字Unicode编码。数据结构涵盖泥板正反两面的文字内容、地理来源、时间年代和文本类型等信息,适用于楔形文字的图像识别与文本分析任务。 文件详解 文件名称:CuneiMLv1.2.json 文件格式:JSON...
-
IASL_德国大学阅读书单数据与代码2025
2026年2月1日 30 165 48
数据集概述 本数据集为德国文学社会史国际档案馆(IASL)收录的德语大学阅读书单相关研究成果的数据与代码集合,核心内容围绕德国大学阅读书单作为文本类型及学术经典化机制展开,包含1个压缩文件,用于支持相关学术分析。 文件详解 文件名称:Leselisten_IASL_2025.zip 文件格式:ZIP...
-
SBL_2020_撒母耳记下拉丁旁注文本案例完整数据
2026年1月31日 30 123 69
数据集概述 本数据集是为2020年SBL会议论文《撒母耳记下的拉丁旁注(LaM)文本案例》收集的结构化数据,包含撒母耳记下卷中所有拉丁旁注文本案例的整理结果,为圣经文本批评与拉丁旁注研究提供标准化参考资料。数据集仅包含一个文件。 文件详解 文件名称:Marginal_Latin_cases_1.0.xlsx 文件格式:XLSX 字段映射介绍:作为SBL...
-
NICKLE_Based_韩国英语学习者中介语语料库数据
2026年1月30日 30 22 5
数据集概述 本数据集为NICKLE(Neungyule韩国英语学习者中介语语料库),含约100万词,包含书面和口语内容(比例约9:1),按主题和交际语境分为不同文本类型。语料库未明确标注 proficiency 水平,主要涵盖基础至中级水平,部分含高级文本,可通过来源大学名称或文本长度识别。 文件详解 文件名称:Basic statistical...
-
PePSIC_SciELO_Based_心理学期刊编辑政策数据_2018版
2026年1月21日 30 61 5
数据集概述 本数据集为2018年10月至12月收集的Excel表格,记录PePSIC和SciELO数据库收录的心理学领域期刊编辑政策信息,涵盖期刊基本信息、收录标准、出版规范等核心内容,为学术出版研究提供结构化参考。 文件详解 文件名称:Políticas editoriais de periódicos de psicologia indexados...
-
TEI_XML_Based_法国国家图书馆法语文献24432号编码规则数据
2026年1月21日 30 34 26
数据集概述 本数据集为法国国家图书馆法语文献24432号的TEI-XML编码数据,记录了该古籍的编码原则,包括对古籍结构、文本类型、特殊标记、文本变体等内容的编码规则,通过标准化标签实现古籍内容的结构化呈现,共包含一个XML文件。 文件详解 文件名称:BnF 24432 v20.xml 文件格式:XML 字段映射介绍:采用TEI-...
-
马丁_路德语域现象研究语料库0_1
2025年12月21日 30 152 135
数据集概述 该数据集为马丁·路德语域现象研究语料库(RegiL v0.1),含7个子语料库、72篇文档及179,996个文本标记,基于人工归一化进行词性和词形标注,转换为ANNIS格式,旨在通过文本类型/体裁近似不同语域,支撑路德作品中语域模式的研究。 文件详解 文件名称: Documentation RegiL v01.pdf 文件格式: PDF...
-
广告文本中作为文体特征的典故数据集
2025年12月11日 30 128 3
数据集概述 本数据集围绕广告文本中的典故作为文体特征展开,包含一篇相关研究文档,为分析广告文本的语言风格与典故运用的关联性提供资料支持。 文件详解 文件名称:Artikov Azamatjon Xolmurodovich.pdf 文件格式:PDF(.pdf) 文件内容:可能为探讨广告文本中典故作为文体特征的研究文档,具体内容需查阅文档全文 适用场景...
-
佛教梵语词汇语义标注数据集
2025年12月6日 30 191 68
数据集概述 本数据集围绕佛教梵语词汇“saṃjñā”(想)展开,包含未校对的语料库索引行、语义标注CSV文件及研究预印本PDF文档,为探究术语模型与佛教梵语词汇翻译提供数据支持。 文件详解 文件名称: Lugli_Samjna_wordsOrTerms_Concordances.xml:XML格式文件,包含从Sketch...



