找到3个数据集

标签: SpaCy

过滤结果
  • Tibetan_SpaCy_Based_藏语语言模型工具包_ver1_0_0_1

    2026年1月15日 30 205 98

    数据集概述 本数据集为适用于SpaCy环境的藏语语言模型工具包,由James Engels开发,属于伦敦大学亚非学院与莱比锡大学联合项目Divergent Discourses。模型使用Botok分词器处理藏语,替换音节分隔符为空格,包含停用词列表,当前版本对标准词汇处理效果良好,正开发更复杂版本,共含3个文件。 文件详解...
    packageimg
  • Social_Work_Scopus_Based_2016_2024研究SDGs及世界区域关系数据

    2026年1月6日 30 49 41

    数据集概述 本数据集包含2016至2024年Scopus收录的社会工作相关研究文献,通过特定检索条件筛选获取。数据补充了每项研究与可持续发展目标(SDGs)的关联关系(由Aurora-SDG分类器模型生成)及与世界区域的关联关系(由SpaCy NER库分析生成)。数据集仅包含一个文件。 文件详解...
    packageimg
  • 自然语言处理与Python编程结合数据集NLPwithSpaCyandPythonDataset-flaviagg

    2025年4月24日 30 111 90

    自然语言处理与Python编程结合数据集NLPwithSpaCyandPythonDataset-flaviagg 数据来源:互联网公开数据 标签:自然语言处理,SpaCy,Python编程,数据集,文本分析,机器学习,语言模型,计算语言学 数据概述:...
    packageimg