-
ACA_多语言核心论元标注数据库
2026年2月12日 30 39 7
数据集概述 本数据集包含英语、老挝语和俄语三种语言的及物从句语料库示例,标注了作为句法主语和宾语(A和P)的核心论元。数据集采用与Alena Witzlack-Makarevich共同开发的编码方案,包含数据库描述文档和三种语言的标注文本文件,总计四个文件,为跨语言句法结构研究提供结构化标注资源。 文件详解 数据库描述文档...
-
Amazon_MT_Based手机多语言评论数据
2026年2月9日 30 177 102
数据集概述 本数据集包含亚马逊平台上的手机评论数据,涵盖英语、希腊语和意大利语三种语言,其中非英语评论为机器翻译版本。数据集以单一压缩文件形式呈现,未划分训练/测试集、数据/标签集或原始/处理集,可用于多语言文本分析及电商评论研究。 文件详解 文件名称:ACPMR.zip 文件格式:ZIP...
-
Bejay_多语言翻译_水主题Tsombiach编织图案数据
2026年1月29日 30 186 110
数据集概述 本数据集包含Bejay创作的以水为主题的Tsombiach编织图案的多语言翻译数据,涉及西班牙语、Kämentza语和英语三种语言。数据集以单一Excel文件形式呈现,无其他目录结构或文件类型,主要用于记录不同语言对编织图案的翻译内容。 文件详解 文件名称:Bejay:Agua:Water-pictograms-...
-
WMT16_Based_Scielo生物医学翻译任务单语数据集
2026年2月8日 30 81 47
数据集概述 本数据集为第一届机器翻译会议(WMT'16)生物医学翻译任务提供的Scielo单语数据,包含英语、西班牙语、葡萄牙语、法语4种语言的生物医学相关文本,源自Scielo数据库,共7个XML文件,无目录层级划分。 文件详解 英文生物医学文件 文件名称:en-health.xml、en-biological.xml 文件格式:XML...
-
Zenodo_Storytelling_Nora古墓地叙事数据
2026年2月8日 30 28 7
数据集概述 本数据集为Nora(意大利普拉)西北腓尼基与布匿古墓地的叙事数据,用于考古公园旅游体验的Web应用开发。古墓地自公元前8世纪腓尼基时期至公元前3-6世纪布匿时期持续使用。数据集包含多语言叙事文本(意大利语、英语)及专业演员录制的对应音频,共6个文件,涵盖古墓地景点及实物元素的叙事内容。 文件详解 压缩文件组(Archive files)...
-
CLICS_2_0_Based_坦桑尼亚语言调查数据集
2026年1月30日 30 174 0
数据集概述 本数据集为CLICS 2.0的一部分,来源于20世纪70年代初开展的坦桑尼亚语言调查(TLS),涵盖约100种坦桑尼亚语言的词汇统计数据,基于斯瓦希里语和英语平行列的1079个条目翻译表整理而成,支持语言关系与词汇共性研究。 文件详解 文件名称:tls.zip 文件格式:ZIP...
-
Surrage_Ghezzi_免疫相关新闻视频编码数据
2026年1月31日 30 172 102
数据集概述 本数据集为论文“Use of immunology in news and YouTube videos in the context of COVID-19: politicization and information bubbles”的原始数据,包含意大利语和英语中与COVID-19免疫相关的新闻文章和视频的编码信息,共1个文件。...
-
English_Yoruba_英语到约鲁巴语翻译数据集
2026年1月31日 30 105 21
数据集概述 本数据集为英语到约鲁巴语的翻译数据,适用于Android手机的短消息服务语音和文本翻译场景,包含1个文件,无目录结构,主要文件格式为.xlsx。 文件详解 文件名称:Updated Translation Datasets.xlsx 文件格式:XLSX...
-
吉马市青少年药物使用与健康风险因素调查报告_2019年
2026年1月30日 30 142 91
数据集概述 本数据集为2019年针对埃塞俄比亚Jimma镇青少年开展的物质使用与风险因素研究相关资料,包含三种语言版本的访谈指南,旨在探究青少年使用阿拉伯茶、酒精、香烟及非法药物等精神活性物质的情况及其影响因素,为公共卫生干预提供基础参考。 文件详解 阿姆哈拉语访谈指南 文件名称:Interview_guide_Amharic_version.docx...
-
SPICE_Based_艺术与情感多语言用户反馈实验数据集
2026年1月29日 30 76 56
数据集概述 本数据集是欧盟SPICE项目下收集的艺术与情感研究数据,包含芬兰语、英语、西班牙语、希伯来语、意大利语5种语言的用户反馈,涉及12件来自都灵GAM博物馆的艺术品。数据记录了用户个人信息及对每件艺术品的5个开放式问题回答,用于训练和测试情感检测模型,共7个文件。 文件详解 多语言用户反馈文件...
-
Wikidata_Based_多语言业务信息RDF转储数据
2026年1月29日 30 204 202
数据集概述 本数据集是通过wdumps工具生成的Wikidata业务相关RDF转储数据,包含韩语和英语两种语言的业务信息。数据集包含4个文件,涉及实体、标签、描述等结构化信息,可用于多语言业务数据的检索与分析。 文件详解 info.json 文件格式:JSON...
-
坦桑尼亚_混合式医疗管理系统对医护人员工作体验的定性案例研究
2026年1月29日 30 127 31
数据集概述 本数据集是坦桑尼亚一项定性案例研究的成果,聚焦医护人员对混合纸质/数字健康管理信息系统的使用体验,以及他们对数字化替代方案的看法,研究主题围绕围产期数据管理。数据集包含57个文档文件,均为访谈记录类资料,无目录结构,文件类型单一。 文件详解 访谈记录文件 文件名称:包含DRCH、DMO、NM、OBGYN等标识及编号的文档,如DRCH 06...
-
PeriodO_EAMENA_历史时期多语言数据库数据2021
2026年1月28日 30 183 159
数据集概述 本数据集由EAMENA项目于2021年创建,包含226个历史时期的多语言(英语和阿拉伯语)数据,托管于PeriodO LOD地名录,具有唯一ARK标识符。数据以单一JSON文件存储,无目录结构或数据拆分。 文件详解 文件名称:periodo-authority-m64td.json 文件格式:JSON...
-
Bolt_Food_2020_2023年Telegram消息数据
2026年1月28日 30 149 73
数据集概述 本数据集包含2020年1月至2023年12月期间,Bolt Food在Telegram平台向其快递员发送的4513条文本消息。消息内容以拉脱维亚语和英语撰写,覆盖了该时间段内的通知信息。数据集提供了一个Excel文件,记录了这些消息的详细内容。 文件详解 文件名称:Bolt Food push notifications...
-
HornMT_Based_非洲之角多语言机器翻译基准平行语料数据集
2026年1月27日 30 144 135
数据集概述 本数据集是针对非洲之角语言的机器翻译基准平行语料库,包含阿法尔语、阿姆哈拉语、英语、奥罗莫语、索马里语、提格雷尼亚语6种语言的新闻片段平行文本,以及每条文本对应的元数据(如新闻范围、类别、来源等),支持多语言机器翻译研究与系统开发。 文件详解 核心数据文件 目录名称:data/...
-
FireXPosts_Based_X平台消防检测标注数据_2024
2026年1月27日 30 158 148
数据集概述 本数据集为FireXPosts消防检测数据,包含希腊语和英语两种语言的X平台帖子数据,通过标注指南对帖子进行消防相关标注,同时提供图像和概念检测结果,用于支持应急响应人员的消防事件检测工作,共包含6个文件。 文件详解 数据文件(JSON格式)...
-
CSI_COP_Task_T4_2_公民科学家智能设备应用调查数据集
2026年1月27日 30 66 29
数据集概述 本数据集为CSI-COP项目工作包4任务T4.2的公开成果,记录了公民科学家对智能设备中应用的调查结果。数据通过Excel表格整理,包含应用类型、语言等可筛选信息,助力用户探索公民科学家记录的应用相关内容。 文件详解 文件名称:CSI-COP Citizen Scientists App investigations_final.xlsx...
-
Phenopackets_Based_多语言基因医学案例集_自动更新版
2026年1月26日 30 23 14
数据集概述 本数据集包含基于Phenopackets生成的多语言基因医学案例集,支持捷克语、中文、荷兰语、英语、德语、意大利语、日语、西班牙语和土耳其语共9种语言,用于LLM研究,会随Phenopacket Store更新自动同步最新HPO翻译和案例数据。 文件详解 压缩文件(ZIP)...
-
EASIN_GBIF_Based_比利时外来陆生软体动物登记清单数据
2026年1月25日 30 62 43
数据集概述 本数据集是比利时外来陆生软体动物登记清单,由比利时皇家自然科学研究所的Thierry Backeljau维护,包含1800年以来比利时野外发现的29种非本地陆生软体动物信息,基于文献调查和RBINS内部信息编制,可用于外来软体动物研究与管理或区域/国家外来物种登记编制。 文件详解 alien_mollusca_checklist.xlsx...
-
Zenodo_Based_诺拉埃斯科拉庇俄斯圣所叙事数据集_旅游应用支持
2026年1月22日 30 203 64
数据集概述 本数据集为诺拉(普拉,CA)埃斯蒙/埃斯科拉庇俄斯圣所的叙事数据,该圣所自腓尼基时代至罗马晚期均有使用。数据集为考古公园旅游应用开发而构建,包含圣所景点叙事文本、建筑元素叙事文本及对应的意大利语和英语专业录音。 文件详解 音频文件 文件名称:SDE-audio_ITA_storytelling-wav.zip、SDE-...



