-
用于流行病学事件提取的多语言数据集_LREC_2020
2026年1月30日 30 170 141
数据集概述 本数据集是LREC 2020论文《A Dataset for Multi-lingual Epidemiological Event Extraction》配套数据,包含多语言流行病学事件抽取语料,支持自然语言处理领域相关研究,以压缩包形式提供,仅含一个文件。 文件详解...
-
MappingTemplate_Based_语言无关知识图谱创建映射模板
2026年1月22日 30 22 13
数据集概述 本数据集为用于知识图谱创建的语言无关映射模板,提供标准化的映射规则框架,支持跨语言知识图谱构建流程。数据集包含一个文件,聚焦于知识图谱映射模板的结构化设计,适用于需要统一映射逻辑的知识图谱开发场景。 文件详解 文件名称:Template_SciKnow.xlsx 文件格式:XLSX...
-
Reproduction_Package_多语言跨语言剽窃检测评估复现数据
2026年1月21日 30 10 3
数据集概述 本数据集为学士学位论文《Multi-Language and Cross-Language Plagiarism Detection》的复现包,包含论文评估所用全部数据,可确保论文结果的持续复现。内容涵盖修改版JPlag工具、评估用数据集及自动化运行脚本,支持多语言和跨语言剽窃检测的技术验证与结果复现。 文件详解...
-
Spanish_Workers_Statute_Based_双语问答数据集
2026年1月21日 30 137 50
数据集概述 本数据集为西班牙语劳动法关键文件的双语问答数据集,包含150个问题及其对应答案,答案形式为西班牙《工人法规》130个部分中的条款编号及相关摘录。数据集支持信息检索与问答任务,共包含3个文件。 文件详解 Extracted Terminology of Spanish Worker Statute.txt 文件格式:TXT...
-
语音转换挑战赛2020听力测试数据集
2025年12月22日 30 95 65
数据集概述 本数据集包含2020年语音转换挑战赛(VCC 2020)中,用于跨语言语音转换任务的众包感知评估音频文件及原始听力测试评分,支持语音转换系统性能的主观评价研究。 文件详解 文件名称: nii-yamagishilab/VCC2020-listeningtest-v1.0.1.zip 文件格式: ZIP压缩包(.zip) 内容说明:...
-
欧洲语言社会科学叙词表2024
2025年12月22日 30 121 118
数据集概述 该数据集为欧洲语言社会科学叙词表(ELSST),覆盖政治学、社会学等十余门核心社会科学学科,包含约三千四百个概念,由欧洲社会科学数据档案联盟及其服务提供商发布,用于跨语言、跨资源的数据发现与访问。 文件详解 文件名称:ELSST_R5.ttl,格式:TTL,RDF三元组格式的叙词表数据文件...
-
跨语言缺陷定位数据集
2025年12月16日 30 41 8
数据集概述 该数据集是一个名为BuGL的跨语言缺陷定位数据集,主要用于缺陷定位相关研究。数据集以压缩包形式存储,未划分训练/测试集、数据/标签集或原始/处理数据,为相关领域提供了统一的跨语言缺陷定位数据支持。 文件详解 文件名称: BuGL.zip 文件格式: ZIP (.zip) 文件内容:...
-
不同语言系统谚语中女性形象解读数据集
2025年12月8日 30 135 134
数据集概述 本数据集聚焦不同语言系统谚语中的女性形象解读,通过单一PDF文档呈现相关研究内容,为分析跨语言文化中谚语对女性形象的建构提供资料支持。 文件详解 文件名称:Jumayeva Umida Aburahim kizi.pdf 文件格式:PDF(.pdf) 文件内容:包含关于不同语言系统谚语中女性形象解读的研究内容,具体结构需通过文档阅读确认...
-
跨语言数词系统构成结构数据集2025
2025年12月4日 30 155 127
数据集概述 该数据集呈现了2025年Rubehn等人关于跨语言数词系统构成结构的研究成果,包含数词系统构成结构的标注与推理相关数据,为计算语言类型学和多语言自然语言处理研究提供支持。 文件详解 文件名称:numeralbank/cosinus-v1.1.zip 文件格式:ZIP压缩包(.zip)...



