找到204个数据集

标签: 多语言处理

过滤结果
  • 芬兰独立战争档案访谈记录数据集VAPSA

    2025年12月23日   

    数据集概述 该数据集包含芬兰国家档案馆收录的约六千份与芬兰独立战争相关的访谈记录数据,基于两次世界大战期间收集并归档的独立战争访谈记录建立,覆盖受访者个人信息及访谈相关档案信息。 文件详解 文档类文件(PDF格式): arkivenheter.pdf:档案单元说明文档 kaytetyt_arkistoyksikot.pdf:使用的档案单元说明文档...
    packageimg
  • 多语言多领域文本属性数据集

    2025年12月22日   

    数据集概述 该数据集专为真实文档中的词级文本属性识别设计,包含1623张真实文档图像(涵盖法律通知、土地记录等多领域),覆盖8种语言,提供1117716个词级标注,标注类型包括粗体、斜体等文本属性及正常文本。 文件详解 测试集文件:MMTAD-TESTSET.zip,格式为ZIP,包含测试集数据 模型文件:TEXTAR-...
    packageimg
  • 开发机构开放研究策略实施的补充材料1

    2025年12月21日   

    数据集概述 本数据集为研究论文的补充材料,内容是关于开发机构实施开放研究策略的提案的法语翻译版本,为理解相关研究的多语言呈现提供支持。 文件详解 文件名称: oo_85278.pdf 文件格式: PDF 文件内容: 研究提案的法语翻译文档,对应论文《Exploring the opportunities and challenges of...
    packageimg
  • 现代语言学中人名地名特异性研究数据集

    2025年12月21日   

    数据集概述 本数据集聚焦现代语言学领域,以不同语言体系为研究材料,探讨人名(Anthroponyms)与地名(Toponyms)的特异性。数据以PDF文档形式呈现,为语言学中相关术语的特征分析提供文献支持。 文件详解 文件名称: Sharipova Malokhat Saidzhanovna.pdf 文件格式: PDF(.pdf) 内容说明:...
    packageimg
  • 声调与基因分析数据集

    2025年12月21日   

    数据集概述 本数据集为论文《Tone and genes: new cross-linguistic data and methods support the weak negative effect of the "derived" allele of ASPM on tone, but not of...
    packageimg
  • NFDI4ING_Based_工程科学RDM社区调查完整数据

    2025年12月21日   

    数据集概述 本数据集包含2024年NFDI4ING社区调查的问卷及匿名原始结果,调查时间为2024年9月27日至12月31日,核心内容围绕研究数据管理(RDM)的知识应用、服务需求、数据软件、工作流程策略、治理概念及社会经济信息展开,为了解工程科学领域RDM现状提供数据支持。 文件详解 调查结果文件(CSV格式): NFDI4ING-results-...
    packageimg
  • 乌兹别克斯坦语言医学疾病治疗最新进展与创新文档

    2025年12月21日   

    数据集概述 本数据集包含一份乌兹别克斯坦语言的文档,内容聚焦于疾病治疗领域的最新进展与创新,为相关医学主题的研究提供资料支持。 文件详解 文件名称: Xolboyev Muxtor Shodi ogli.pdf 文件格式: PDF (.pdf) 内容说明: 单篇PDF文档,具体字段未提供,推测包含疾病治疗最新进展与创新相关的文本内容。 适用场景...
    packageimg
  • 德语历时词汇使用图谱数据集

    2025年12月21日   

    数据集概述 该数据集包含针对德语的历时词汇使用图谱(Diachronic Word Usage Graphs,WUGs),提供了词汇使用随时间变化的结构化数据。数据集以压缩包形式存储,可通过相关网站获取数据格式说明、处理代码及更多资源。 文件详解 文件名称: dwug_de.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 语言列表数据集

    2025年12月21日   

    数据集概述 本数据集包含一个PDF格式的语言列表文档,核心内容围绕语言相关信息展开,为语言研究或参考提供基础资料支持。 文件详解 文件名称: Language List.pdf 文件格式: PDF 内容说明: 包含语言相关信息的列表文档 适用场景 语言学基础研究: 作为语言名称或分类的参考资料 语言教育资源: 用于语言学习或教学中的词汇列表参考...
    packageimg
  • 生物伦理研究问题与生物伦理学科形成_乌兹别克语

    2025年12月20日   

    数据集概述 该数据集包含一篇关于生物伦理研究问题及生物伦理学科形成的乌兹别克语文档,聚焦生物伦理领域的核心议题与学科发展脉络,为相关研究提供基础文献资料。 文件详解 文件名称: Po’latova Dilafruz Ravshanbek qizi.pdf 文件格式: PDF 内容说明: 乌兹别克语文档,主题围绕生物伦理研究问题及生物伦理学科的形成展开...
    packageimg
  • 乌兹别克语沐浴设施说明文档

    2025年12月20日   

    数据集概述 该数据集包含一份乌兹别克语文档,主题为面向学龄儿童的沐浴设施说明,具体涉及空气浴与日光浴相关内容。 文件详解 文件名称: Cho’poonova Sharifa Bozor qizi.pdf 文件格式: PDF (.pdf) 文件内容: 文档标题为“MAKTABGACHA TA'LIM YOSHIDAGI BOLALAR UCHUN...
    packageimg
  • 乌兹别克语_芬兰语_英语语音系统及三种语言元音差异数据集

    2025年12月19日   

    数据集概述 本数据集聚焦乌兹别克语、芬兰语、英语的语音系统,核心内容为三种语言元音差异的对比分析,以PDF文档形式呈现相关研究内容。 文件详解 文件名称: Shodiyev Fakhriddin Teshaevich.pdf 文件格式: PDF 内容概述: 包含乌兹别克语、芬兰语、英语语音系统的描述,以及三种语言元音差异的对比分析内容 适用场景...
    packageimg
  • BOBURNOMA翻译中的语言问题数据集

    2025年12月19日   

    数据集概述 该数据集聚焦于"BOBURNOMA"翻译过程中出现的语言问题,包含一份相关的PDF文档,为研究翻译语言现象提供基础资料。 文件详解 该数据集包含一个PDF格式的文档文件,具体如下: - 文件名称: Sayyora Shodmonova .pdf - 文件格式: PDF (.pdf) - 内容说明:...
    packageimg
  • 教育研究_MILLIY_TARBIYA_G_OYASINING_民族教育理念历史教育基础分析完整数据

    2025年12月19日   

    数据集概述 该数据集包含一份PDF格式文档,主题为MILLIY TARBIYA G'OYASINING TARIXIY-PEDAGOGIK ASOSLARI,未提供具体描述,推测与教育理念的历史和教育基础相关。 文件详解 文件名称: Abduvaliyeva Shodiya.pdf 文件格式: PDF (.pdf) 内容说明: 文档主题为MILLIY...
    packageimg
  • Objaverse_Mask_Based_面具多语言类别数字化分析完整数据

    2025年12月19日   

    数据集概述 该数据集围绕“Mask”主题,包含与面具相关的文件,涉及ansiktsmask、mask、Máscara antropomórfica等类别,以图片和3D模型文件形式呈现,可用于面具相关的视觉分析或3D模型研究。 文件详解 文件类型及分布:...
    packageimg
  • Gigatrue斯洛伐克语抽象摘要数据集

    2025年12月19日   

    数据集概述 本数据集为合成Gigaword数据集的斯洛伐克语翻译版本,基于Gigatrue数据集通过SeamlessM4T-v2工具翻译生成,专注于抽象摘要任务,为斯洛伐克语文本摘要研究提供数据支持。 文件详解 文件名称: Gigatrue Slovak abstractive summarisation dataset.pdf 文件格式: PDF...
    packageimg
  • 英俄谚语中_智慧_愚蠢_概念对立比较研究

    2025年12月19日   

    数据集概述 本数据集围绕英俄两种语言中表达"智慧/愚蠢"概念对立的谚语展开比较研究,核心内容为相关学术研究的文档资料,为探究跨语言文化中智慧与愚蠢概念的谚语表达差异提供支持。 文件详解 文件名称:M.G. Khoshimov.pdf 文件格式:PDF(.pdf)...
    packageimg
  • 乌兹别克语与英语网络行话调查数据集

    2025年12月19日   

    数据集概述 本数据集围绕乌兹别克语与英语网络行话展开调查研究,核心内容为相关主题的分析资料,以单一PDF文档形式呈现,为研究两种语言网络行话的特征与关联提供数据支持。 文件详解 文件名称: Nurqulova Gavhar.pdf 文件格式: PDF (.pdf) 文件内容: 该文档为乌兹别克语与英语网络行话调查的研究资料,具体内容需通过PDF文档查看...
    packageimg
  • 双语学生与教师知识提升相关文档

    2025年12月19日   

    数据集概述 本数据集包含一份关于双语学生与教师知识提升主题的PDF文档,核心围绕俄语标题内容展开,为相关教育研究提供基础资料支持。 文件详解 文件名称: Имамкулов Бекназар Рахманович.pdf 文件格式: PDF 内容说明: 该文档以俄语呈现,主题为双语学生与教师的知识提升相关内容,具体字段或详细内容需通过PDF阅读器查看。...
    packageimg
  • Objaverse_Source_Korean_Telugu_Holy_Bible_Based_韩泰双语圣经多格式数字资源完整数据

    2025年12月18日   

    数据集概述 该数据集包含韩语和泰卢固语圣经相关的数字资源,由5个JPEG格式的图片文件和1个GLB格式的三维模型文件组成,未提供数据预览或说明文档。 文件详解 图片文件: 共5个JPEG格式文件,文件名称为thumb0.jpeg、thumb1.jpeg、thumb2.jpeg、thumb3.jpeg、thumb4.jpeg 文件格式: JPEG...
    packageimg