-
古典藏语标注语料库第二部分_词性标注版
2025年12月22日 30 169 152
数据集概述 本数据集是基于佛教数字资源中心(BDRC)数字化文本集构建的古典藏语词性标注语料库第二部分,使用TiMBL的基于记忆的标注器(Memory-Based Tagger)完成标注,未经过后处理或人工校正。 文件详解 压缩文件集(共12个,均为.zip格式):...
-
乌兹别克语生态相关文档_Anvarbekov_Islombek
2025年12月21日 30 172 40
数据集概述 该数据集包含一份以乌兹别克语撰写的、主题与生态学相关的文档,文档标题为“O'RMONCHILIKNING EKOLOGIYA UCHUN AHAMIYATI”,可能探讨林业在生态方面的重要性。 文件详解 该数据集包含一个PDF格式的文档文件,具体如下: - 文件名称: Anvarbekov Islombek.pdf - 文件格式: PDF...
-
中文隐喻语料库
2025年12月21日 30 73 27
数据集概述 该数据集为中文隐喻语料库,包含一个压缩文件,未提供训练/测试、数据/标签、原始/处理数据的划分,主要用于隐喻相关的自然语言处理研究与应用。 文件详解 文件名称: ChineseMetaphorCorpus-metaphor.zip 文件格式: ZIP(压缩文件) 内容说明:...
-
意大利语动词情感推理词典
2025年12月14日 30 95 55
数据集概述 本数据集是用于情感推理的意大利语动词词典,包含动词的句法框架、极性、语义效果、关系及示例等信息,部分动词通过同义词框架引用关联,为意大利语文本的情感分析提供结构化动词语义标注支持。 文件详解 文件名称: clicl.pdf 文件格式: PDF 内容说明: 提供数据集理论背景与构建方法的相关论文,解释动词规范的理论基础。 文件名称:...
-
土佐日记现代日语及英语翻译数据集
2025年12月12日 30 210 174
数据集概述 本数据集是《土佐日记》的现代日语及英语翻译文本集合,包含原文及对应翻译内容,以JSON格式存储,涵盖标题、作者、段落文本、假名注音、直译与意译等多维度信息,为古典文学翻译与研究提供结构化资源。 文件详解 该数据集包含一个压缩文件,具体说明如下: - 文件名称: yamagen/tosa-translation-v1.0.0.zip -...
-
汉乌英三种语言中抽象名词的语义解读数据集
2025年12月9日 30 117 35
数据集概述 本数据集聚焦于中文、乌兹别克语和英语三种语言中抽象名词的语义解读研究,以单一PDF文档形式呈现相关研究内容,为跨语言词汇语义对比分析提供资料支持。 文件详解 文件名称: Jabborov Azamat Ashirkul oʽgʽli.pdf 文件格式: PDF (.pdf) 文件内容:...



