找到2个数据集

分类: 互联网数据 标签: 文本简化

过滤结果
  • 俄罗斯法制文本平行语料库2008-2022

    2025年4月18日 30 10 7

    俄罗斯法制文本平行语料库2008-2022 数据来源:互联网公开数据 标签:俄罗斯法律,文本简化,平行语料库,法律文本,自然语言处理,法律历史,动态主题建模 数据概述: 本数据集收录了2008年12月31日至2022年11月28日期间的俄罗斯法制文本及其简化版本,包含2963对原始文档和简化文档。数据来源于俄罗斯政府官方报纸Rossiyskaya...
    packageimg
  • 词语难度评估数据集

    2025年4月14日 30 131 105

    词语难度评估数据集 数据来源:互联网公开数据 标签:词语难度,语言学,文本简化,深度学习,特征工程,自然语言处理,词频分析,二分类问题 数据概述 本数据集包含40,481条数据记录,主要用于评估词语的难度。数据集的每个实例包含多个特征,包括词语本身、词长、词频、词频的对数变换、平均反应时间(Mean...
    packageimg