数据集概述
本数据集为WOKIE项目“FAIR in allen Sprachen”的附录数据,包含基于LLM的SKOS叙词表自动化翻译系统相关文件,涉及多语言翻译结果、翻译详情及原始叙词表等内容,共10个文件,用于支持该翻译系统的相关研究与应用。
文件详解
- RDF格式文件(80.0%)
- 文件名称:unesco_reduced_en-backtranslated.rdf、unesco_reduced_ar-backtranslated.rdf、defc_de-removed.rdf、defc_de-backtranslated.rdf、defc.rdf、unesco_reduced_en-removed.rdf等
- 文件格式:RDF
- 字段映射介绍:包含SKOS叙词表的多语言翻译结果、回译结果及移除处理后的叙词表数据,涉及叙词表的概念、标签等核心信息
- XLSX格式文件(20.0%)
- 文件名称:defc_de-translation-details.xlsx、unesco_reduced_ar-translation-details.xlsx
- 文件格式:XLSX
- 字段映射介绍:记录SKOS叙词表翻译过程中的详细信息,可能包含翻译内容、源语言、目标语言、翻译状态等字段
数据来源
WOKIE项目论文“Anhang zu WOKIE - FAIR in allen Sprachen: Ein automatisiertes LLM-gestütztes Übersetzungssystem für SKOS-Thesauri”
适用场景
- 多语言叙词表构建:利用翻译结果快速生成多语言SKOS叙词表,支持跨语言信息组织
- 翻译系统性能评估:通过回译结果和翻译详情,分析LLM在SKOS叙词表翻译任务中的准确性与可靠性
- 叙词表管理优化:基于移除处理后的叙词表数据,研究SKOS叙词表的精简与质量提升方法
- 自然语言处理研究:为LLM在专业领域(如叙词表翻译)的应用提供实证数据支持