找到5个数据集

标签: 斯洛伐克语

过滤结果
  • Variations_Based_斯洛伐克语附着词位置变异研究数据集

    2026年1月23日 30 31 22

    数据集概述 本数据集为论文“Variations on positioning of clitics in Slovak (on the basis of corpus and experimental data)”配套数据,核心内容围绕斯洛伐克语中附着词的位置变异展开,基于语料库和实验数据构建,包含一个文件,用于支撑相关语言学研究分析。 文件详解...
    packageimg
  • Gigatrue_Cleaned_英文摘要清理数据集

    2025年12月23日 30 130 97

    数据集概述 该数据集是对Harvard/gigaword数据集的清理版本,添加了生成的数值,并使用truecase工具进行了大小写标准化处理。数据集包含1个PDF文件,无训练/测试、数据/标签或原始/处理数据的拆分,为摘要任务研究提供基础数据。 文件详解 文件名称: Gigatrue Slovak abstractive summarisation...
    packageimg
  • 现代标准斯拉夫语支平行文本数据集

    2025年12月22日 30 45 28

    数据集概述 本数据集包含克罗地亚语、斯洛伐克语、斯洛文尼亚语三种现代标准斯拉夫语支的平行文本,以《约翰福音》为内容,通过平行文本设计抵消体裁影响,为语言比较研究提供基础数据。 文件详解 文件名称:Gospel.Croatian.txt;格式:TXT;内容:克罗地亚语版《约翰福音》文本,基于伊万·沙里奇的新约译本...
    packageimg
  • Gigatrue斯洛伐克语抽象摘要数据集

    2025年12月19日 30 127 84

    数据集概述 本数据集为合成Gigaword数据集的斯洛伐克语翻译版本,基于Gigatrue数据集通过SeamlessM4T-v2工具翻译生成,专注于抽象摘要任务,为斯洛伐克语文本摘要研究提供数据支持。 文件详解 文件名称: Gigatrue Slovak abstractive summarisation dataset.pdf 文件格式: PDF...
    packageimg