找到6个数据集

标签: 语料

过滤结果
  • El_habla_de_La_Pola_Siero_阿斯图里亚斯地图问题1语料

    2026年1月19日 30 169 26

    数据集概述 本数据集为拉波拉谢罗方言语料,围绕阿斯图里亚斯地图问题1展开,包含1个文档文件,无训练/测试、数据/标签、原始/处理数据的划分,文档类型单一,无额外说明或预览内容。 文件详解 文件名称:Mapa de Asturias.Pregunta1.docx 文件格式:DOCX...
    packageimg
  • Early_Warning_System_Based_高等教育学生接受度定性研究数据

    2026年1月14日 30 50 1

    数据集概述 本数据集为高等教育学生对人工智能驱动的早期预警系统接受度的定性研究数据,基于21次半结构化访谈(21,761词语料),经混合归纳演绎编码分析,涵盖11个主题、52个子主题及396个编码片段,可用于探究学生对教育科技工具的使用体验与接受度差异。 文件详解 编码树及示例文件(Resumen de codificación según...
    packageimg
  • 斯洛文尼亚网络文本类型识别数据集-GINCO1-0训练-测试集

    2025年4月14日 30 90 59

    斯洛文尼亚网络文本类型识别数据集-GINCO1-0训练-测试集 数据来源:互联网公开数据 标签:文本分类,自然语言处理,语料库,斯洛文尼亚语,网络文本,文本类型识别,机器学习,GINCO 1.0,语料 数据概述: 本数据集是基于斯洛文尼亚网络文本类型识别语料库GINCO 1.0构建的训练集和测试集,按照80:20的比例划分。GINCO...
    packageimg
  • SST (Stanford Sentiment Treebank)

    2024年11月10日 90 42 37

    斯坦福情感库是一个带有完全标记的解析树的语料库,可以全面分析情感在语言中的构成影响。该语料库基于 Pang 和 Lee (2005) 引入的数据集,由从电影评论中提取的 11,855 个单句组成。它使用斯坦福解析器进行解析,包括来自这些解析树的总共 215,154 个独特的短语,每个短语由 3...
    packageimg
  • 综合性食谱语料库

    2024年11月10日 30 77 6

    完整的食谱语料库包含1,520,327种中国食谱。其中,1,242,206食谱属于30,060菜肴。一道菜平均有41.3个食谱。食谱的平均长度是224个字符。最大长度为62,722个字符,最小长度为10个字符。食谱由415,272位作者贡献。其中,最有生产力的作者上传5,394食谱。
    packageimg
  • Douban Conversation Corpus豆瓣会话语料库

    2024年11月10日 90 29 3

    豆瓣会话语料库,这是第一个用于基于检索的聊天机器人的人工标记测试集。
    packageimg