-
从语音到容器_文本转Docker数据集
数据集概述 该数据集包含三千一百九十二个不同的Docker命令样本,每个样本配有对应的自然语言描述(称为"prompt")。数据分为英语版本(含训练、验证、测试集)和西班牙语版本(仅测试集),以压缩包形式提供,为文本转Docker命令的研究提供数据支持。 文件详解 文件名称: data.zip 文件格式: ZIP压缩包 内容说明:...
-
现代科学中公共关系文本类型_信息载体及体裁系统数据集
数据集概述 本数据集聚焦现代科学视角下的公共关系(PR)文本,分析其现有类型划分、差异及格式变化趋势,为理解PR文本的结构与发展提供学术参考。 文件详解 文件名称: Аминова Азиза Хамзаевна.pdf 文件格式: PDF 内容说明:...
-
乌兹别克英语学习者语音教学的语音挑战数据集
数据集概述 该数据集围绕乌兹别克英语学习者在语音学习中面临的挑战展开,聚焦语音教学领域的相关研究内容,为了解特定学习者群体的语音学习难点提供参考。 文件详解 文件名称:G.X. Djumabaev .pdf 文件格式:PDF 内容说明:文档围绕乌兹别克英语学习者在语音学习中的挑战展开,可能包含教学策略、学习者常见语音难点分析等内容 适用场景...
-
Objaverse_19_Al_Aliim_Based_宗教术语阿拉伯文与英文对照完整数据
数据集概述 本数据集包含与“19-Al'Aliim اَلاسْمَاءُ الْحُسناى”相关的文件,涉及阿拉伯文宗教术语及对应的英文释义,主要文件类型为图片(JPEG)和三维模型(GLB),为相关主题的视觉化或模型化研究提供基础数据。 文件详解 图片文件(.jpeg格式,共5个):...
-
语音转灯具语音数据集
数据集概述 该数据集包含一千零六十个音频文件,总时长约一点一八小时,收录了五名受试者(两名女性、三名男性)用英语和西班牙语朗读“文本转灯具”数据集测试样本提示语的语音录音,数据采集符合伦理规范与数据保护法规。 文件详解 核心文件: data.zip:压缩包格式,包含所有加密的音频文件,需使用指定脚本解密 解密工具:...
-
瑞士新冠疫情主流媒体词汇与命名实体分析数据集
数据集概述 本数据集通过自定义解析器和自然语言处理(NLP)流程,分析2020年1月至2021年5月主流媒体中德、法、意、英四种语言的瑞士新冠疫情相关新闻,提取词汇(Lemmas)和命名实体的出现频率,反映疫情信息传播趋势。 文件详解 metadata.xlsx: Excel格式文件,包含新闻文章检索策略、数量等元数据信息 export.zip:...
-
WiLI_2018_Wikipedia_Based_多语言文本识别基准数据集
数据集概述 该数据集是Wikipedia语言识别基准数据集,包含235种语言的235000个段落,数据分布均衡,并提供训练集和测试集的划分。 文件详解 文件名称: wili-2018.zip 文件格式: ZIP压缩包(.zip) 内容说明: 压缩包内包含数据集的完整内容,具体字段及结构需解压后查看原始文件 适用场景 自然语言处理研究:...
-
莱布尼茨语言中心MAIN叙事语料库
数据集概述 本数据集是莱布尼茨普通语言学中心收集的叙事语料库,包含俄语-德语、土耳其语-德语双语儿童基于MAIN工具的口语叙事转录,覆盖幼儿园至小学三年级的纵向数据,采用CHAT格式存储,支持叙事能力的宏微观结构分析。 文件详解 压缩文件: Leibniz-ZAS_narrative_corpus_MAIN_0.1.0.zip:...
-
鱼刮鳞器数据集
数据集概述 该数据集包含用于描述鱼刮鳞器的多语言文本说明和相关文件,介绍了鱼刮鳞器的材质、结构、尺寸及使用方法,为了解该工具的特征与应用提供基础资料。 文件详解 3D模型文件:68eba40bd7b44ff282d2872845f4e80e.glb,格式为.glb,可能包含鱼刮鳞器的三维模型数据...
-
基于Yang2011年_Lalo_Regional_Varieties_的CLDF数据集
数据集概述 本数据集是基于Yang于2011年发表的《Lalo Regional Varieties》构建的CLDF格式数据集,围绕Lalo方言的系统发育、方言计量学和社会语言学研究内容展开,为相关语言学分析提供标准化数据支持。 文件详解 文件名称: lexibank/yanglalo-v4.0.zip 文件格式: ZIP (.zip) 文件内容:...
-
数字生态系统表征有用性评估研究问卷与材料
数据集概述 该数据集包含用于评估数字生态系统表征有用性的研究问卷与材料,提供原始德语版本及对应的英文翻译版本,共4个PDF文件,为相关研究提供标准化的调查工具支持。 文件详解 文件名称:Study Questionnaire - English.pdf 文件格式:PDF 内容:英文版本的研究问卷,用于收集关于数字生态系统表征有用性的评估数据...
-
ARASAAC黑白象形图数据集第3部分_共14部分
数据集概述 该数据集是ARASAAC黑白象形图系列的第3部分(共14部分),包含九百九十九张黑白象形图,由Sergio Palao创作,涉及音乐、身份、摄影等多个主题,所有文件均为PNG格式,无目录层级划分,未提供训练测试或数据标签拆分。 文件详解 核心文件组: 九百九十九个.png格式文件,占比百分之百,均为栅格图像文件...
-
开罗瓦斯特巴拉德地区伊芙琳阿拉伯语及法语录音描述与评论转录数据集20130529
数据集概述 本数据集包含2013年5月29日于埃及开罗瓦斯特巴拉德地区采集的录音转录文本,涉及参与者伊芙琳对自身双耳录音路线的描述与评论,提供阿拉伯语原文及法语译文版本,支持城市声音感知相关研究。 文件详解 压缩文件:Archive Word docs Arabic & French transcript of description and...
-
德国蝴蝶监测公民科学项目问卷数据集
数据集概述 该数据集包含德国蝴蝶监测公民科学项目参与者的问卷结果,涵盖英文和德文版本的问卷文档及结构化数据文件,为了解参与者对该项目的反馈提供基础数据支持。 文件详解 该数据集包含三个文件,具体说明如下: - 问卷文档文件: - Questionnaire_TMD_english.pdf:PDF格式,英文版本的蝴蝶监测项目问卷文档 -...
-
学校文化素养学习的对话与论证多语言数据集
数据集概述 该数据集是DIALLS项目的多语言语料库,包含英国、葡萄牙等七个参与国家5至15岁学生的课堂互动转录文本,涵盖七种语言,部分转录有英文翻译,围绕学校儿童通过对话和论证培养文化素养的主题。 文件详解 文件名称:DIALLS_Multilingual_Corpus_description.V2.pdf 文件格式:PDF...
-
多语言定性分析结果摘要数据集
数据集概述 本数据集展示了针对多语言样本的定性分析结果摘要,覆盖三十九种语言相关内容,以文档形式呈现结构化的分析总结。 文件详解 文件名称: Appendix_results_qual_analysis_summarized_40_languages.pdf 文件格式: PDF 内容说明:...
-
Catalejo望远镜模型与预览图数据集
数据集概述 该数据集包含与“Catalejo”(望远镜)相关的模型文件和预览图片,涉及西班牙语与英语的望远镜术语,提供了3D模型及配套的预览图像资源。 文件详解 3D模型文件: 3f9453f258744d13a2c4a23ff709e42c.glb: GLB格式的3D模型文件,可能为Catalejo(望远镜)的三维模型 预览图片文件:...
-
英语与乌兹别克语旅游术语语义和结构分析
数据集概述 本数据集包含一份关于英语与乌兹别克语旅游术语的语义和结构分析文档,聚焦两种语言中旅游相关术语的语言学特征研究,为跨语言旅游术语对比分析提供资料支持。 文件详解 文件名称: Sh.M Xalilova.pdf 文件格式: PDF (.pdf) 内容说明: 该文档围绕英语与乌兹别克语旅游术语展开语义和结构分析,具体内容需查阅PDF文档内容获取。...
-
开罗居民萨尔玛城市声音记录描述与评论的阿拉伯语及法语转录文本20120926
数据集概述 该数据集包含2012年9月26日,埃及开罗居民萨尔玛对其使用双耳麦克风记录的城市日常旅程声音的描述与评论的转录文本,涵盖原始阿拉伯语版本及法语翻译版本,为研究城市声音感知提供质性数据支持。 文件详解 阿拉伯语转录文件: Arabic transcript of description and comments Salma...
-
科隆基茨德语语料库2023
数据集概述 本数据集是记录科隆地区城市青年语言变体“基茨德语”的语料库,包含约三小时非正式对话的音频文件及转录文本。数据采集自科隆某技术与媒体类职业学院的十七至二十岁男性学生,分为单语者、多语者及混合三组,覆盖学校、饮食、宗教等日常话题,为研究城市青年语言使用提供实证基础。 文件详解 转录文件(PDF格式): 02_G1 - Multilingual...



