-
Tibetan_SpaCy_Based_藏语语言模型工具包_ver1_0_0_1
2026年1月15日 30 205 98
数据集概述 本数据集为适用于SpaCy环境的藏语语言模型工具包,由James Engels开发,属于伦敦大学亚非学院与莱比锡大学联合项目Divergent Discourses。模型使用Botok分词器处理藏语,替换音节分隔符为空格,包含停用词列表,当前版本对标准词汇处理效果良好,正开发更复杂版本,共含3个文件。 文件详解...
-
Social_Work_Scopus_Based_2016_2024研究SDGs及世界区域关系数据
2026年1月6日 30 49 41
数据集概述 本数据集包含2016至2024年Scopus收录的社会工作相关研究文献,通过特定检索条件筛选获取。数据补充了每项研究与可持续发展目标(SDGs)的关联关系(由Aurora-SDG分类器模型生成)及与世界区域的关联关系(由SpaCy NER库分析生成)。数据集仅包含一个文件。 文件详解...
-
自然语言处理与Python编程结合数据集NLPwithSpaCyandPythonDataset-flaviagg
2025年4月24日 30 111 90
自然语言处理与Python编程结合数据集NLPwithSpaCyandPythonDataset-flaviagg 数据来源:互联网公开数据 标签:自然语言处理,SpaCy,Python编程,数据集,文本分析,机器学习,语言模型,计算语言学 数据概述:...



