找到288个数据集

标签: 阿拉伯语

过滤结果
  • CMIF_Based_利比亚研究中心战争书信元数据_2023

    2026年1月29日 30 161 49

    数据集概述 本数据集为从利比亚的黎波里利比亚研究中心收集出版的诗歌集中提取的书信元数据集合,包含诗歌集《圣战诗歌》(1995年出版)的关联元数据,数据集仅有1个文件,聚焦于书信相关信息的结构化记录。 文件详解 文件名称:رسائل الحرب-2023-02-20T10_31_00.921-01_00.xml 文件格式:XML...
    packageimg
  • PeriodO_EAMENA_历史时期多语言数据库数据2021

    2026年1月28日 30 167 12

    数据集概述 本数据集由EAMENA项目于2021年创建,包含226个历史时期的多语言(英语和阿拉伯语)数据,托管于PeriodO LOD地名录,具有唯一ARK标识符。数据以单一JSON文件存储,无目录结构或数据拆分。 文件详解 文件名称:periodo-authority-m64td.json 文件格式:JSON...
    packageimg
  • Compound_words_Based_阿拉伯语中文复合词样本数据

    2026年1月27日 30 67 15

    数据集概述 本数据集包含阿拉伯语与中文复合词相关的样本数据,聚焦两种语言复合词的对比研究场景,为语言学领域的复合词结构、构成规则等分析提供基础样本支持,数据集由单一文件构成。 文件详解 文件名称:Arabic & Chinese samples.xlsx 文件格式:XLSX...
    packageimg
  • Jordanian_Arabic_Adjectives_情感规范数据

    2026年1月26日 30 183 9

    数据集概述 本数据集包含98个约旦阿拉伯语形容词在效价(Valence)、唤醒度(Arousal)和熟悉度(Familiarity)三个维度的规范数据,为阿拉伯语情感计算和语言学研究提供结构化参考。数据集仅包含一个文档文件。 文件详解 文件名称:Datafinal.docx 文件格式:DOCX...
    packageimg
  • Invisible_East_Based_中世纪阿富汗及周边多语言文献JSON数据集

    2026年1月18日 30 157 74

    数据集概述 本数据集为Invisible East Digital Corpus的JSON格式版本,包含公元4/10世纪至7/13世纪中世纪阿富汗及周边地区的多语言文献,涵盖新波斯语、中古波斯语、阿拉伯语等语言,提供高清图像、转录及翻译内容,适用于计算分析与数字保存。 文件详解 文件名称:iedc_2025-08-07_18-07.json...
    packageimg
  • Arabic_Dataset_阿拉伯语疾病命名实体识别多标注方案数据集

    2026年1月22日 30 92 83

    数据集概述 本数据集为阿拉伯语自然语言处理社区提供了专门用于疾病命名实体识别任务的标注数据。包含超六万个单词,由两位独立标注者采用IO方案手动标注,标注一致性达95.14%。此外还包含IOE、IOB等六种额外标注方案及词性标签、停用词等五种语言学特征,填补了阿拉伯语多标注方案研究的空白。 文件详解 文件名称:dataset.zip 文件格式:ZIP...
    packageimg
  • ARAFA_Generated_Based_阿拉伯语大规模事实核查数据集

    2026年1月21日 30 200 4

    数据集概述 本数据集是面向阿拉伯语自然语言处理的大规模事实核查数据集ARAFA,通过大语言模型自动化框架构建,包含181,976条标注为支持、反驳或信息不足的主张-证据对,可用于阿拉伯语自动事实核查模型训练与评估。 文件详解 文件名称:ARAFA.json 文件格式:JSON...
    packageimg
  • ELRAP_Sketchfab_Based考古叙事阿拉伯语用户体验问卷数据

    2026年1月21日 30 92 75

    数据集概述 本数据集为ELRAP项目(Edom Lowlands Regional Archaeology Project)Sketchfab页面非线性考古叙事的阿拉伯语约旦受访者问卷反馈,已翻译为英文。数据记录受访者对该数字考古叙事的体验情况,包含一份文件,用于研究数字考古叙事的用户体验。 文件详解 文件名称:Supplemental...
    packageimg
  • 阿英德三种语言名词性句子比较分析数据集

    2025年12月20日 30 207 17

    数据集概述 该数据集包含一篇关于阿拉伯语、英语和德语名词性句子的比较分析文档,旨在探索三种语言名词性句子的相似性与差异,为语言结构对比研究提供资料支持。 文件详解 文件名称:Kholmatova Elnura Sherali qizi.pdf 文件格式:PDF...
    packageimg
  • 阿里_伊本_萨阿德墓碑三维模型数据集

    2025年12月23日 30 120 75

    数据集概述 该数据集包含阿里·伊本·萨阿德墓碑的三维模型及相关图片。墓碑起源于埃及(可能为福斯塔特),年代为公元835年阿拔斯王朝时期,材质为大理石,尺寸为高58厘米、宽46.3厘米,语言为阿拉伯语。数据集提供三维模型文件与缩略图,支持对该文物的数字化研究。 文件详解 三维模型文件:...
    packageimg
  • Objaverse_Al_Adziim_Based_壮丽至高阿拉伯语词汇多媒体完整数据

    2025年12月22日 30 1 0

    数据集概述 该数据集包含与“Al Adziim(العَظِيمُ)”相关的文件,涉及阿拉伯语词汇及对应英文释义“The Magnificent, The Supreme”,以图片和三维模型文件形式呈现。 文件详解 文件名称及格式: 768d8098ac1642c3b68bec1b2c4e04be.glb:GLB格式三维模型文件...
    packageimg
  • 乌兹别克语与阿拉伯语马匹词汇组对比研究文档

    2025年12月19日 30 204 135

    数据集概述 该数据集包含一份文档,核心内容为乌兹别克语与阿拉伯语中“马匹”相关词汇组的对比研究,围绕两种语言中马匹词汇的语义、结构或文化关联展开分析。 文件详解 文件名称:O’rinova Bonu O’tkir qizi.pdf 文件格式:PDF(.pdf)...
    packageimg
  • Objaverse_Al_Mudillu_Based_真主尊名数字资源完整数据

    2025年12月19日 30 53 1

    数据集概述 该数据集包含与“25-Al Mudillu”相关的文件,对应阿拉伯语“اَلاسْمَاءُ الْحُسناى”(真主的九十九个尊名之一),包含图片文件和3D模型文件,具体内容未提供预览。 文件详解 图片文件(共5个,格式为.jpeg):...
    packageimg
  • 开罗Bashtil地区Mona的双耳录音描述与评论的阿拉伯语及法语转录文本2011

    2025年12月18日 30 2 0

    数据集概述 该数据集包含2011年10月26日在埃及开罗Bashtil地区收集的双耳录音相关转录文本,是“Mics in the Ears”双耳实验的一部分,记录了参与者Mona对自身录制的城市声音路线的描述与评论,包含原始阿拉伯语及法语翻译版本。 文件详解 文件名称: Arabic transcript of description and...
    packageimg
  • 阿拉伯语动词变位规则要求文件

    2025年12月18日 30 37 15

    数据集概述 该数据集包含一份关于阿拉伯语动词变位规则要求的文档,以PDF格式呈现,为学习或研究阿拉伯语动词变位提供参考资料。 文件详解 文件名称: Мансур Жуманиёзов.pdf 文件格式: PDF (.pdf) 文件内容: 文档内容围绕阿拉伯语动词变位的规则要求展开,具体字段或详细内容需查看PDF文件内部获取 适用场景 阿拉伯语语言学习:...
    packageimg
  • 开罗达巴尔阿赫马尔哈桑1号阿拉伯语与法语录音描述及评论转录数据集2011

    2025年12月14日 30 105 23

    数据集概述 本数据集包含2011年10月埃及开罗达巴尔阿赫马尔地区居民哈桑的双耳录音描述及评论的转录文件,涵盖原始阿拉伯语转录与法语翻译版本,为研究城市声音感知提供定性数据支持。 文件详解 压缩文件: Archive Word docs Arabic & French transcript of description and comments...
    packageimg
  • 中世纪阿拉伯语历史著作及其方向数据集

    2025年12月10日 30 70 1

    数据集概述 该数据集围绕中世纪阿拉伯语历史著作展开,聚焦其核心方向与内容,为研究中世纪阿拉伯历史文献提供资料支持。 文件详解 数据集包含一个PDF格式的文档文件,具体如下: - 文件名称: С.Х.Умматалиев.pdf - 文件格式: PDF (.pdf) - 文件内容:...
    packageimg
  • 阿拉伯语开放可持续发展目标数据集

    2025年12月16日 30 1 0

    数据集概述 本数据集为阿拉伯语开放可持续发展目标(OSDG)相关数据,以单一压缩文件形式存储,未进行训练/测试、数据/标签或原始/处理数据的划分,具体内容需解压后查看。 文件详解 文件名称: OSDG2.0_Ar.zip 文件格式: ZIP (.zip) 文件内容:...
    packageimg
  • 阿拉伯语语音命令数据集

    2025年12月16日 30 191 68

    数据集概述 该数据集包含12000条阿拉伯语语音命令数据对(语音信号与对应关键词),覆盖40个关键词,每个关键词300条音频(30位参与者×10次录制)。音频为1秒时长、16kHz采样率的WAV格式,另有独立背景噪声文件,适用于语音识别领域的关键词检测任务。 文件详解 主数据压缩包: 文件名称: abdulkaderghandoura/arabic-...
    packageimg
  • 埃塞俄比亚提格雷州韦尔凯特地区1939年地名列表

    2025年12月15日 30 119 71

    数据集概述 本数据集基于20世纪30年代民族志学者Giovanni Ellero的田野笔记,提取并整理了1939年埃塞俄比亚提格雷州韦尔凯特地区的574个地名。这些地名多源自提格雷尼亚语,少数为奥罗莫语、法拉沙语、阿拉伯语或圣经来源,仅不到十个地名属阿姆哈拉语。 文件详解 文件名称: List of place names Welkait v1...
    packageimg