-
TalentCLEF2025人力资本管理技能与职位智能语料库
数据集概述 本数据集为TalentCLEF2025竞赛语料库,包含多语言职位匹配(任务A)与职位技能预测(任务B)的训练、验证及测试数据,用于开发人力资本管理相关模型,支持人才匹配、技能发展与技能缺口检测等应用。 文件详解 数据集包含4个ZIP压缩文件,具体说明如下: - 压缩文件: - TaskA.zip:...
-
火山危机演练调查问卷与原型清单数据集
数据集概述 本数据集围绕火山危机演练评估展开,包含多语言版本的开放式与多选题调查问卷,以及基于调查结果提炼的原型清单,用于指导未来火山危机演练设计,支持火山观测机构、民防部门等提升应急响应能力。 文件详解 问卷文件(共4份,均为PDF格式): OMCF_Questionnaire_english.pdf:英文版本的火山危机演练调查问卷...
-
乌兹别克语土壤条件下肥料类型及其标准对土壤有机质影响的文档
数据集概述 本数据集包含一份PDF文档,内容围绕乌兹别克语土壤条件下使用的肥料类型、相关标准及其对土壤有机质的影响展开,为相关农业或土壤研究提供参考资料。 文件详解 文件名称: Аҳмаджонова Гулноза Анваржоновна.pdf 文件格式: PDF (.pdf) 文件内容:...
-
漫画与教育调查_COST_ICOnMICs_WG5验证数据集2021
数据集概述 本数据集为COST ICOnMICs行动第五工作组(WG5)开展的“漫画与教育”主题调查的验证成果,包含匿名化验证结果、标准化调查文件及相关会议展示材料,支持漫画教育领域的研究与实践参考。 文件详解 英文调查数据文件:ENG IConMICs WG5 Survey Education and Comics ANONIMO...
-
英语和俄语交际中副语言停顿及其功能研究文档
数据集概述 本数据集聚焦英语和俄语交际场景,研究副语言停顿的类型及其在沟通中的功能。内容以单一PDF文档呈现,为语言对比分析、副语言学研究提供直接资料。 文件详解 文件名称:З.А.Рахматуллаева.pdf 文件格式:PDF(.pdf)...
-
荷兰博客圈网络收藏数据集2018
数据集概述 本数据集为2018年形成的荷兰博客圈(NL-blogosfeer)网络收藏,包含手动添加元数据的2018年博客网站集合、2018年荷兰语收藏描述文档,以及2020年从网络档案提取并自动添加元数据的博客网站集合,记录博客基本信息、主题、状态等内容。 文件详解 文件名称:NL Blogosfeer web collection 2018...
-
十诫表格_卡纳达语
数据集概述 该数据集包含以卡纳达语呈现的十诫文本,同时提供了对应的英文说明。数据以图像文件和三维模型文件形式存储,涵盖了十诫的核心内容,为研究宗教文本的多语言呈现提供支持。 文件详解 图像文件(共5个,.jpeg格式):...
-
大数据分析驱动的制造企业优化数据集
数据集概述 该数据集包含一项调查结果,旨在识别大数据分析对制造企业转型的影响。数据涵盖一百五十四名制造企业员工的参与记录,其中一百三十三名完成了所有问题。数据集提供原始德语版本和翻译后的英语版本,编码格式为UTF8,支持多语言分析需求。 文件详解 说明文档:...
-
ARASAAC彩色象形图第八部分_共十六部分
数据集概述 本数据集为ARASAAC彩色象形图系列的第八部分,包含一千张由Sergio Palao创作的黑白象形图,覆盖生物学、医学、图像视觉、自然语言处理、音频等领域的语义主题,可用于多场景的视觉符号表达。 文件详解 核心文件组: 1000个.png格式文件:所有文件均为PNG图像格式,无目录层级结构...
-
社交媒体气候安全原始与处理数据集2014_2023
数据集概述 本数据集涵盖2014年1月至2023年5月期间Twitter平台上与气候安全相关的对话数据,包含原始及处理后的多类型文件,为研究社交媒体中气候安全议题的传播提供支持。 文件详解 文档与说明文件: readme.pdf:PDF格式,提供数据集相关说明文档...
-
CT_FAN多语言假新闻检测数据集2022
数据集概述 该数据集为多语言假新闻检测任务设计,包含2010-2022年英文和德文新闻文章,标注其真实性评级(假、部分假、真、其他)及主题领域,支持跨语言迁移学习研究,适用于构建多语言假新闻分类模型。 文件详解 文件名称:FakeNews_Task3_2022.zip 文件格式:ZIP压缩包 内部数据字段: ID:新闻文章唯一标识符...
-
罗曼语族体貌转换初步研究补充材料数据集
数据集概述 本数据集是《罗曼语族体貌转换初步研究》论文的补充材料,包含两项实验研究的相关文件,涉及法语、意大利语和罗马尼亚语三种罗曼语族语言,为探究不同无定代词引发体貌转换的能力及跨语言表现提供实验数据支持。 文件详解 实验数据文件(CSV格式):...
-
否定协调词数据库参考文献
数据集概述 本数据集为否定协调词数据库的参考文献列表,包含一份覆盖二百五十种语言样本的参考文献文档,为语言学领域中否定协调词相关研究提供文献支持。 文件详解 文件名称:References_to_full_250-languge_sample.pdf 文件格式:PDF (.pdf)...
-
圣乔治礼拜堂_加泰罗尼亚政府宫数据集
数据集概述 该数据集包含圣乔治礼拜堂(位于加泰罗尼亚政府宫)的多语言描述文本及相关文件。礼拜堂建于1432-1434年,后经多次改建,数据提供了其历史背景与位置信息,支持建筑历史与文化遗产研究。 文件详解 文件名称: 17ac134428b24eda892557de6406a93f.glb 文件格式: GLB (.glb) 内容说明:...
-
敏捷实践集_仓库
数据集概述 该数据集为包含敏捷实践相关内容的仓库,核心文件为敏捷实践翻译样本PDF文档,提供了关于敏捷实践的参考资料。 文件详解 文件名称: Agile_Practices_Translated_Sample.pdf 文件格式: PDF (.pdf) 文件内容: 敏捷实践相关内容的翻译样本文档 适用场景 敏捷方法论研究:...
-
梵高_星夜_多语言标题与图像数据集
数据集概述 本数据集包含文森特·梵高作品《星夜》的多语言标题信息及相关图像文件,涵盖不同格式的缩略图和3D模型文件,为艺术作品数字化展示与研究提供基础素材。 文件详解 文件名称及格式: 4ba76c4b60444be2a0bf75435f3889b2.glb: GLB格式3D模型文件...
-
印度泰米尔-英语文本情感分析数据集2021
印度泰米尔-英语文本情感分析数据集2021 数据来源:互联网公开数据 标签:情感分析,泰米尔语,英语,多语言处理,社交媒体评论,文本分类,自然语言处理 数据概述: 本数据集包含从YouTube视频评论中收集的15,744条泰米尔-...
-
情感分析越南语翻译文本数据集
情感分析越南语翻译文本数据集_Sentiment_Analysis_Vietnamese_Translated_Text 数据来源:互联网公开数据 标签:情感分析, 文本翻译, 越南语, 多语言处理, 情感分类, 机器翻译, 数据标注, 自然语言处理 数据概述:...
-
YouTube越南语评论数据集YouTubeVietnameseNLPDataset-tommyngx
YouTube越南语评论数据集YouTubeVietnameseNLPDataset-tommyngx 数据来源:互联网公开数据 标签:自然语言处理,数据集,越南语,文本分析,机器学习,情感分析,社交媒体,多语言处理 数据概述: 该数据集包含来自YouTube平台的越南语评论数据,记录了用户对视频内容的评论信息。主要特征如下:...
-
印地语和泰米尔语维基文本数据集HindiandTamilWikiTextDataset-starkking07
印地语和泰米尔语维基文本数据集HindiandTamilWikiTextDataset-starkking07 数据来源:互联网公开数据 标签:自然语言处理,语言模型,文本分类,印地语,泰米尔语,数据集,机器学习,多语言处理 数据概述: 该数据集包含来自维基百科的印地语和泰米尔语文本数据,记录了两门语言的维基百科文章内容。主要特征如下:...



