找到4个数据集

标签: 计算机语言学

过滤结果
  • TextGrid_CC_BY_3_0授权_XML格式语料库数据

    2026年1月28日 30 31 11

    数据集概述 本数据集为XML格式的文本语料库压缩包,所有文本源自TextGrid平台,由Katrin Dennerlein博士整理。语料库采用CC-BY 3.0协议授权,相关研究在《席勒-克莱斯特不确定性原理》中被提及,可用于计算机语言学或文本分析相关研究。 文件详解 文件名称:XML.zip 文件格式:ZIP(压缩包)...
    packageimg
  • XML_corpus_Based_文学文本XML语料库数据

    2026年1月30日 30 60 34

    数据集概述 本数据集为XML格式的文学文本语料库,包含席勒、莱辛、克莱斯特、歌德、蒂克等作家的作品,共56个XML文件,无目录层级结构,未划分训练/测试、数据/标签或原始/处理集,所有文件均为XML格式,其中5个含XML元数据。 文件详解 核心文件:...
    packageimg
  • 计算机语言学的起源及其当代重要性

    2025年12月22日 30 165 121

    数据集概述 该数据集包含一份关于计算机语言学起源及其当代重要性的文档,围绕计算机语言学领域的发展背景与当前价值展开内容,以PDF格式呈现,为相关研究提供参考资料。 文件详解 文件名称: Askarova Umidaxon Maxamadjon qizi.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 词性标注数据集POSTaggingDataset-hiuanh

    2025年4月22日 30 11 1

    词性标注数据集POSTaggingDataset-hiuanh 数据来源:互联网公开数据 标签:自然语言处理,词性标注,数据集,文本分析,机器学习,语言模型,文本挖掘,计算机语言学 数据概述: 该数据集专注于词性标注任务,包含大量文本样本及其对应的词性标签。主要特征如下: 时间跨度:数据记录的时间范围未明确,但数据集内容通常反映通用语言特征。...
    packageimg