找到20个数据集

标签: 语义关联

过滤结果
  • 曼布里诺数字图书馆_意大利骑士文学系列第13卷第5册_希腊的斯法拉蒙迪_第五部分数字学术版数据资料

    2026年1月7日 30 209 111

    数据集概述 本数据集是意大利骑士文学作品《13/5 Sferamundi di Grecia. Quinta parte》的数字学术版本,包含转录及评注的XML-TEI文件、多格式电子书和用于计算分析的纯文本文件,属于Mambrino数字图书馆项目,由维罗纳大学开发,支持古典文学的数字化研究。 文件详解 转录及评注文件...
    packageimg
  • Colexifications_Pain_Disgust_Joy_Interjections_研究数据集

    2025年12月31日 30 27 9

    数据集概述 本数据集为研究疼痛、厌恶与喜悦感叹词共现现象的专用数据,包含5个文件,涵盖说明文档、来源信息、核心数据等内容。数据支持语言学领域对感叹词语义关联及跨语言共现模式的分析,文件类型以CSV为主,辅以XLSX格式,无目录层级划分。 文件详解 说明文档文件 文件名称:Ponsonnet IntjColex_read me_250128.csv...
    packageimg
  • 美索不达米亚神名Fast_Text_分析数据集2023

    2025年12月20日 30 3 2

    数据集概述 本数据集为《美索不达米亚神名的Fast(Text)分析》研究配套数据,包含用于自然语言处理分析的文本、词向量、可视化结果及致谢文件等,支撑相关学术研究成果。 文件详解 README.md:Markdown格式说明文件,介绍数据集背景、来源及使用说明 WordVectors.zip:压缩文件,存储Fast(Text)模型生成的词向量数据...
    packageimg
  • 检索与分析Lexibank味觉共指数据及代码

    2025年12月24日 30 23 6

    数据集概述 本数据集是研究《Retrieving and analyzing taste colexifications from Lexibank》的配套数据与代码,包含味觉共指分析的相关数据文件、结果图表及运行代码,为复现研究提供支持。 文件详解 文档与说明文件: LICENSE:无格式,可能为数据集使用许可文件...
    packageimg
  • ARASAAC黑白象形图数据集14之2

    2025年12月23日 30 113 1

    数据集概述 该数据集是ARASAAC项目的一部分,包含一千张由Sergio Palao创作的黑白象形图。图像内容涵盖多种主题,无明显命名模式,所有文件均为PNG格式,未划分训练/测试集、数据/标签集或原始/处理集,为视觉符号相关研究提供基础素材。 文件详解 核心文件集合:...
    packageimg
  • PropBank数据库与SentenceBERT嵌入数据集

    2025年12月22日 30 42 27

    数据集概述 本数据集是包含SentenceBERT嵌入的PropBank数据库,用于论文“CALAMR: Component ALignment for Abstract Meaning Representation”。数据库涵盖角色、角色集等PropBank数据及示例、描述、函数等嵌入信息,支持独立使用或通过zensols.propbankdb...
    packageimg
  • 乌兹别克语残奥会相关词汇单位结构特征研究文档

    2025年12月20日 30 77 44

    数据集概述 该数据集为单一PDF文档,聚焦乌兹别克语中与残奥会相关的词汇单位,研究其结构特征。文档可能包含残奥会领域专用词汇的形态、构成方式等语言结构分析内容。 文件详解 文件名称: Islomova Maftuna Yusuf qizi.pdf 文件格式: PDF (.pdf) 内容概述:...
    packageimg
  • 乌兹别克语与阿拉伯语马匹词汇组对比研究文档

    2025年12月19日 30 26 22

    数据集概述 该数据集包含一份文档,核心内容为乌兹别克语与阿拉伯语中“马匹”相关词汇组的对比研究,围绕两种语言中马匹词汇的语义、结构或文化关联展开分析。 文件详解 文件名称:O’rinova Bonu O’tkir qizi.pdf 文件格式:PDF(.pdf)...
    packageimg
  • ARASAAC黑白象形图数据集第9部分

    2025年12月18日 30 38 28

    数据集概述 该数据集为ARASAAC项目的黑白象形图资源,包含一千张PNG格式的图片,由Sergio Palao创建,涉及生物、实验、医疗、图像视觉、音频等多领域语义关键词,无目录结构,可直接用于相关研究或应用场景。 文件详解 文件类型:.png格式图片文件,共1000个,占比百分之百...
    packageimg
  • OLOV_VA_SU_V_INGLIZ_VA_O_ZBEK_LINGVOMADANIYATIDA_BINAR_KONSEPTLAR_VA_ULARNING...

    2025年12月16日 30 23 10

    数据集概述 该数据集包含一篇PDF格式的文档,核心内容围绕英语和乌兹别克语语言文化中“火与水”这一对二元概念及其象征意义展开研究,为探究不同语言文化背景下二元概念的符号学内涵提供资料支持。 文件详解 文件名称: Axmedov Jahongirbek G’anijon o’g’li.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 跨语言共现词数据库CLICS3

    2025年12月14日 30 104 22

    数据集概述 该数据集为CLICS3(跨语言共现词数据库第三版),包含跨语言词汇共现现象的相关数据,支持对跨语言多义性的可重复分析,为语言学领域研究词汇语义关联提供数据基础。 文件详解 文件名称: clics3-v1.1.zip 文件格式: ZIP (.zip) 内容说明:...
    packageimg
  • ARASAAC黑白象形图数据集第一部分_共十四部分

    2025年12月14日 30 185 28

    数据集概述 本数据集包含由Sergio Palao为ARASAAC创建的黑白象形图,共一千张PNG格式图片,无目录层级结构。图片覆盖信息公告、职业、日期、节日等主题,为图像识别、辅助沟通等场景提供视觉素材。 文件详解 核心文件组:...
    packageimg
  • CLICS_4跨语言共现数据库

    2025年12月13日 30 108 92

    数据集概述 本数据集为CLICS 4跨语言共现数据库(版本0.5),是一个改进后的跨语言共现研究数据库。该数据库聚焦于不同语言中词汇共现现象的收集与整理,为跨语言词汇关系、语义演变等研究提供结构化数据支持。 文件详解 文件名称:clics/clics4-v0.5.zip 文件格式:.zip(压缩包) 内容说明:包含CLICS...
    packageimg
  • 哈利波特语义数据集及应用

    2025年12月11日 30 47 10

    数据集概述 本数据集围绕哈利波特主题构建,包含语义数据集和相关应用文件。数据以压缩包(.zip)和语义网格式(.ttl)存储,为哈利波特相关内容的语义分析与应用开发提供数据支持。 文件详解 tfg.zip:压缩包格式,具体内容未提供预览 datahpmovies.ttl:TTL格式(语义网RDF序列化格式),可能包含哈利波特电影相关的结构化语义数据...
    packageimg
  • GesisDataSeachKG_Based_社会科学数据语义搜索知识图谱完整数据

    2025年12月9日 30 128 21

    数据集概述 该数据集是gesisDataSeachKG项目的资源集合,将Gesis Data Search中的11,965个数据集元数据(基于DDI标准)转换为RDF/S模型,包含多语言数据、11个研究组、1966-2023年的发布日期,涵盖33个语义属性和53万条三元组,支持语义搜索功能。 文件详解 文件名称: ddi_metadata_v2.zip...
    packageimg
  • 基于地区名称构建词汇语义场数据集

    2025年12月7日 30 81 78

    数据集概述 该数据集围绕基于地区名称构建词汇语义场的主题展开,包含一份相关的PDF文档,为研究词汇语义场的构建方法提供基础资料。 文件详解 文件名称:Sobirova Feruza Islomjon qizi.pdf 文件格式:PDF 内容说明:文档围绕“基于地区名称构建词汇语义场”的主题展开,具体内容需查阅文档获取 适用场景...
    packageimg
  • 企业气候变化影响报告文本挖掘分析数据集

    2025年12月7日 30 138 98

    数据集概述 该数据集为研究2010年美国SEC气候变化报告指引对企业10-K filings影响的文本挖掘分析数据,涵盖2000-2019年21.8万份SEC文件,通过语义关联文本挖掘方法,分析企业气候相关报告变化及内容差异,支持环境政策与企业行为研究。 文件详解 README.txt:文本格式,说明数据集为论文《What Do Firms Say...
    packageimg
  • 法语与乌兹别克语劳动和职业谚语的词汇语义与动机分析

    2025年12月6日 30 202 185

    数据集概述 本数据集聚焦法语与乌兹别克语中关于劳动和职业主题的谚语,通过词汇语义与动机分析框架展开研究,为探究不同语言文化中劳动观念的表达差异提供定性分析资料。 文件详解 文件名称: Juraeva Mohinur Najmiddin qizi.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 跨语言共现数据库LOGOS数据集1_0

    2025年12月5日 30 142 46

    数据集概述 该数据集为跨语言共现数据库(CLICS)的LOGOS数据版本1.0,由List等人于2014年发布,记录跨语言词汇共现现象,为语言比较研究提供基础数据支持。 文件详解 文件名称: lexibank/logos-v4.0.zip:压缩文件格式,包含跨语言共现数据库的LOGOS数据,具体字段需解压后查看,未提供预览内容。 数据来源 List,...
    packageimg
  • 专利文本语义关联分析数据集PatentTextSemanticAssociationAnalysis-hakase1

    2025年4月29日 30 73 24

    专利文本语义关联分析数据集PatentTextSemanticAssociationAnalysis-hakase1 数据来源:互联网公开数据 标签:专利, 文本分析, 语义关联, 文本挖掘, 机器学习, 专利分类, 文本相似度, 数据集 数据概述:...
    packageimg