找到2个数据集

格式: ZIP 标签: 语言归一化

过滤结果
  • PINJOL_OJK_Based印尼非法网络借贷平台促销风险模式标注数据2025

    2026年1月15日 30 54 7

    数据集概述 本数据集包含印尼金融服务管理局(OJK)2025年3月黑名单中的非法网络借贷(PINJOL)平台网站及移动应用的促销短语,经语言归一化和主题合成处理,形成33个标准化风险模式标签,每个标签通过频率四分位分析赋予1-4分风险评分,支持数字金融促销的法律风险研究。 文件详解 文件名称:Klasifikasi pola promosi -...
    packageimg
  • LangReg多语言情境下语内变异语料库2021_2022

    2025年12月8日 30 166 155

    数据集概述 该数据集是记录跨语言及不同情境功能语境下语内变异的多语言语料库,包含德语、波斯语、库尔德语、爪哇语四种语言,收集了2021至2022年的数据,涵盖六种情境下的语言产出,支持口语与书面语模式比较。 文件详解 综合压缩包: LangReg-complete.zip: 完整语料库压缩包,包含所有语言数据 单语言压缩包: German.zip:...
    packageimg