找到6个数据集

标签: 语句数据

过滤结果
  • 知识图谱_Wikidata_Q7561196数据

    2026年2月1日 30 87 39

    数据集概述 本数据集是通过wdumps工具生成的Wikidata实体Q7561196的非弃用RDF转储数据,包含实体、语句、三元组等语义网格式的结构化信息,共4个文件,覆盖JSON、压缩文件、N-Triples等格式,可用于知识图谱相关的语义分析与应用开发。 文件详解 核心文件列表 文件名称:info.json 文件格式:JSON...
    packageimg
  • Wikidata_Based_Wikidata实体RDF转储数据

    2026年1月28日 30 130 31

    数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF格式转储数据,包含4个文件,涵盖实体、语句及三元组相关元信息与具体数据文件。数据可用于Wikidata语义网络结构分析、实体关系研究等场景。 文件详解 info.json 文件格式:JSON...
    packageimg
  • Wikidata_Dump_基于wdumps生成的RDF转储数据

    2026年1月28日 30 60 47

    数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF格式转储数据,包含实体、语句及三元组相关元信息与配置文件,共4个文件,涵盖JSON、NT、GZ等格式,可用于Wikidata语义数据的存储与解析参考。 文件详解 info.json 文件格式:JSON...
    packageimg
  • Wikidata_TextRobustness_RDF转储_英文数据集

    2026年1月26日 30 148 9

    数据集概述 本数据集是通过wdumps工具生成的Wikidata英文RDF转储,包含4个文件,覆盖JSON、GZ压缩、NT格式。数据聚焦于文本鲁棒性研究场景,提供Wikidata实体、语句等相关数据的结构化记录,支持文本处理领域的鲁棒性分析与验证。 文件详解 info.json 文件格式:JSON...
    packageimg
  • Wikidata_Dump_businessmen_人物数据_导出数据

    2026年1月22日 30 18 0

    数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF导出数据,聚焦于商人(businessmen)实体,包含英文和韩文两种语言版本。数据总计包含4个文件,涵盖实体、语句和三元组信息,可用于研究商人相关的结构化知识。 文件详解 文件名称:info.json 文件格式:JSON...
    packageimg
  • 维基百科中文语句数据集-terrychanorg

    2025年5月5日 30 139 14

    维基百科中文语句数据集-terrychanorg 数据来源:互联网公开数据 标签:维基百科,中文,语句数据,自然语言处理,文本分析,语言学,数据集 数据概述: 本数据集包含从维基百科中文版提取的1258282句语句数据。这些语句涵盖了广泛的主题和领域,包括但不限于历史、科学、技术、文化和社会。数据集旨在为自然语言处理和文本分析提供丰富的语料库资源。...
    packageimg