-
古兰经语言学多层标注数据集
2025年11月29日 30 131 60
数据集概述 该数据集为古典阿拉伯语(CA)自然语言处理提供计算可访问的综合语言资源,包含古兰经的正字法、形态学、句法学三层标注,共约十三万二千七百三十六个词元,经专家验证,助力CA NLP研究与应用。 文件详解 文件名称:Quranic.rar 文件格式:RAR压缩包 内容说明:压缩包内包含古兰经的多层标注数据,采用扩展CoNLL-...
-
古兰经纯净文本数据集无阿拉伯语重音符号1963-2021
2025年4月15日 30 137 47
古兰经纯净文本数据集无阿拉伯语重音符号1963-2021 数据来源:互联网公开数据 标签:古兰经,伊斯兰教,宗教文本,纯净文本,阿拉伯语,重音符号去除,宗教研究 数据概述: 本数据集包含古兰经的纯净版本文本,使用阿拉伯语,为古兰经的原生语言。该文本版本经过Tanzil项目专家团队的精心制作、高度验证和持续监控,确保了文本的准确性和可靠性。...



