找到4个数据集

标签: 日语文本

过滤结果
  • AntConc_Based_关键词索引文件数据

    2026年2月1日 30 28 5

    数据集概述 本数据集包含通过AntConc工具结合自定义停用词表生成的15个KWIC(关键词上下文)相关文件,覆盖德语、日语、非洲、女性等主题,包含文本文件、配置文件和表格文件三类,主要用于展示关键词在文本中的左右上下文信息。 文件详解 文档文件(.txt格式,13个)...
    packageimg
  • CEOML_Based_职业参与度机器学习分类器开发数据

    2026年1月30日 30 104 45

    数据集概述 本数据集包含CEOML(职业参与度机器学习分类器)开发过程中的原始数据、代码及模型文件,总计11个文件。核心内容为用于量化职业参与度上下文的文本数据、分类模型文件、训练配置及分析代码,支持对职业参与度分类模型的复现与研究。 文件详解 模型相关文件...
    packageimg
  • 日本虚假新闻数据集

    2025年12月24日 30 61 5

    数据集概述 该数据集为日本虚假新闻相关数据,包含一个压缩文件,未提供具体内容预览,可通过项目页面获取更多细节。 文件详解 文件名称: J-fakenews_v1.zip 文件格式: ZIP (.zip) 文件内容: 未提供具体内容预览,为压缩格式的数据集文件 适用场景 虚假新闻检测研究: 可用于训练和测试针对日语文本的虚假新闻识别模型...
    packageimg
  • 日本常用词形频率数据集-2021-rtatman

    2025年4月21日 30 187 130

    日本常用词形频率数据集-2021-rtatman 数据来源:互联网公开数据 标签:日语,词形,频率,语料库,词频分析,日语文本,日本语言学,词性分布,跨语言比较 数据概述:...
    packageimg