找到2个数据集

标签: 标记化

过滤结果
  • 印地语验证标记数据集HindiValidationTokensDataset-pranav51286

    2025年4月26日 30 19 7

    印地语验证标记数据集HindiValidationTokensDataset-pranav51286 数据来源:互联网公开数据 标签:自然语言处理,印地语,标记化,数据集,语言模型,机器学习,文本处理,多语言 数据概述: 该数据集包含来自印地语语料库的验证标记数据,主要用于语言模型训练和评估。主要特征如下:...
    packageimg
  • 艾森民歌数据库MIDI转换与标记化数据集

    2025年4月17日 30 55 54

    艾森民歌数据库MIDI转换与标记化数据集 数据来源:互联网公开数据 标签:音乐信息检索,民歌,MIDI,标记化,音乐分析,文本生成,NLP,艾森民歌数据库 数据概述: 本数据集包含约8500个.mid音乐文件,这些文件是源自艾森民歌数据库(Essen Folksong Database,KernScores...
    packageimg