数据集 - 海数据

数据集概述本数据集为TalentCLEF2025竞赛语料库，包含多语言职位匹配（任务A）与职位技能预测（任务B）的训练、验证及测试数据，用于开发人力资本管理相关模型，支持人才匹配、技能发展与技能缺口检测等应用。文件详解数据集包含4个ZIP压缩文件，具体说明如下： - 压缩文件: - TaskA.zip:...

ZIP

火山危机演练调查问卷与原型清单数据集

数据集概述本数据集围绕火山危机演练评估展开，包含多语言版本的开放式与多选题调查问卷，以及基于调查结果提炼的原型清单，用于指导未来火山危机演练设计，支持火山观测机构、民防部门等提升应急响应能力。文件详解问卷文件（共4份，均为PDF格式）： OMCF_Questionnaire_english.pdf：英文版本的火山危机演练调查问卷...

ZIP

乌兹别克语土壤条件下肥料类型及其标准对土壤有机质影响的文档

数据集概述本数据集包含一份PDF文档，内容围绕乌兹别克语土壤条件下使用的肥料类型、相关标准及其对土壤有机质的影响展开，为相关农业或土壤研究提供参考资料。文件详解文件名称: Аҳмаджонова Гулноза Анваржоновна.pdf 文件格式: PDF (.pdf) 文件内容:...

ZIP

漫画与教育调查_COST_ICOnMICs_WG5验证数据集2021

数据集概述本数据集为COST ICOnMICs行动第五工作组（WG5）开展的“漫画与教育”主题调查的验证成果，包含匿名化验证结果、标准化调查文件及相关会议展示材料，支持漫画教育领域的研究与实践参考。文件详解英文调查数据文件：ENG IConMICs WG5 Survey Education and Comics ANONIMO...

ZIP

英语和俄语交际中副语言停顿及其功能研究文档

数据集概述本数据集聚焦英语和俄语交际场景，研究副语言停顿的类型及其在沟通中的功能。内容以单一PDF文档呈现，为语言对比分析、副语言学研究提供直接资料。文件详解文件名称：З.А.Рахматуллаева.pdf 文件格式：PDF（.pdf）...

ZIP

荷兰博客圈网络收藏数据集2018

数据集概述本数据集为2018年形成的荷兰博客圈（NL-blogosfeer）网络收藏，包含手动添加元数据的2018年博客网站集合、2018年荷兰语收藏描述文档，以及2020年从网络档案提取并自动添加元数据的博客网站集合，记录博客基本信息、主题、状态等内容。文件详解文件名称：NL Blogosfeer web collection 2018...

ZIP

十诫表格_卡纳达语

数据集概述该数据集包含以卡纳达语呈现的十诫文本，同时提供了对应的英文说明。数据以图像文件和三维模型文件形式存储，涵盖了十诫的核心内容，为研究宗教文本的多语言呈现提供支持。文件详解图像文件（共5个，.jpeg格式）：...

ZIP

大数据分析驱动的制造企业优化数据集

数据集概述该数据集包含一项调查结果，旨在识别大数据分析对制造企业转型的影响。数据涵盖一百五十四名制造企业员工的参与记录，其中一百三十三名完成了所有问题。数据集提供原始德语版本和翻译后的英语版本，编码格式为UTF8，支持多语言分析需求。文件详解说明文档：...

ZIP

ARASAAC彩色象形图第八部分_共十六部分

数据集概述本数据集为ARASAAC彩色象形图系列的第八部分，包含一千张由Sergio Palao创作的黑白象形图，覆盖生物学、医学、图像视觉、自然语言处理、音频等领域的语义主题，可用于多场景的视觉符号表达。文件详解核心文件组： 1000个.png格式文件：所有文件均为PNG图像格式，无目录层级结构...

ZIP

社交媒体气候安全原始与处理数据集2014_2023

数据集概述本数据集涵盖2014年1月至2023年5月期间Twitter平台上与气候安全相关的对话数据，包含原始及处理后的多类型文件，为研究社交媒体中气候安全议题的传播提供支持。文件详解文档与说明文件： readme.pdf：PDF格式，提供数据集相关说明文档...

ZIP

CT_FAN多语言假新闻检测数据集2022

数据集概述该数据集为多语言假新闻检测任务设计，包含2010-2022年英文和德文新闻文章，标注其真实性评级（假、部分假、真、其他）及主题领域，支持跨语言迁移学习研究，适用于构建多语言假新闻分类模型。文件详解文件名称：FakeNews_Task3_2022.zip 文件格式：ZIP压缩包内部数据字段： ID：新闻文章唯一标识符...

ZIP

罗曼语族体貌转换初步研究补充材料数据集

数据集概述本数据集是《罗曼语族体貌转换初步研究》论文的补充材料，包含两项实验研究的相关文件，涉及法语、意大利语和罗马尼亚语三种罗曼语族语言，为探究不同无定代词引发体貌转换的能力及跨语言表现提供实验数据支持。文件详解实验数据文件（CSV格式）：...

ZIP

否定协调词数据库参考文献

数据集概述本数据集为否定协调词数据库的参考文献列表，包含一份覆盖二百五十种语言样本的参考文献文档，为语言学领域中否定协调词相关研究提供文献支持。文件详解文件名称：References_to_full_250-languge_sample.pdf 文件格式：PDF (.pdf)...

ZIP

圣乔治礼拜堂_加泰罗尼亚政府宫数据集

数据集概述该数据集包含圣乔治礼拜堂（位于加泰罗尼亚政府宫）的多语言描述文本及相关文件。礼拜堂建于1432-1434年，后经多次改建，数据提供了其历史背景与位置信息，支持建筑历史与文化遗产研究。文件详解文件名称: 17ac134428b24eda892557de6406a93f.glb 文件格式: GLB (.glb) 内容说明:...

ZIP

敏捷实践集_仓库

数据集概述该数据集为包含敏捷实践相关内容的仓库，核心文件为敏捷实践翻译样本PDF文档，提供了关于敏捷实践的参考资料。文件详解文件名称: Agile_Practices_Translated_Sample.pdf 文件格式: PDF (.pdf) 文件内容: 敏捷实践相关内容的翻译样本文档适用场景敏捷方法论研究:...

ZIP

梵高_星夜_多语言标题与图像数据集