找到3个数据集

分类: 公开数据 标签: 词向量

过滤结果
  • Islamophobic_Hate_Speech_Based社交媒体强弱仇恨言论检测数据2019

    2026年1月11日 30 118 96

    数据集概述 本数据集为2019年发表的“Detecting weak and strong Islamophobic hate speech on social media”研究配套数据,包含数据、代码及标注指南,共9个文件。涵盖社交媒体伊斯兰恐惧症仇恨言论的检测相关资源,可用于分析不同强度仇恨言论的特征与识别方法。 文件详解 文档文件...
    packageimg
  • 美索不达米亚神名Fast_Text_分析数据集2023

    2025年12月20日 30 22 9

    数据集概述 本数据集为《美索不达米亚神名的Fast(Text)分析》研究配套数据,包含用于自然语言处理分析的文本、词向量、可视化结果及致谢文件等,支撑相关学术研究成果。 文件详解 README.md:Markdown格式说明文件,介绍数据集背景、来源及使用说明 WordVectors.zip:压缩文件,存储Fast(Text)模型生成的词向量数据...
    packageimg
  • Stanford_GloVe_6B_Based_多维度词向量预训练完整数据

    2025年12月21日 30 11 1

    数据集概述 本数据集为GloVe 6B词向量,基于维基百科2014和Gigaword 5语料(共60亿个词元)训练生成,包含40万个词汇,提供50维、100维、200维、300维四种维度的词向量,已转换为gensim二进制格式并压缩为ZIP文件。 文件详解...
    packageimg