找到1个数据集

标签: 语言识别数据库

过滤结果
  • WiLI_2018_Wikipedia_Based_多语言文本识别基准数据集

    2025年12月12日 30 142 49

    数据集概述 该数据集是Wikipedia语言识别基准数据集,包含235种语言的235000个段落,数据分布均衡,并提供训练集和测试集的划分。 文件详解 文件名称: wili-2018.zip 文件格式: ZIP压缩包(.zip) 内容说明: 压缩包内包含数据集的完整内容,具体字段及结构需解压后查看原始文件 适用场景 自然语言处理研究:...
    packageimg