SemEval_2020任务1无监督词汇语义变化检测后评估数据集

数据集概述

本数据集为SemEval-2020任务1“无监督词汇语义变化检测”的后评估数据,包含任务起始工具包、测试数据真实值、评分程序、评估阶段结果(含团队排名、提交文件、结果概览及分析图表)等内容,支持该任务相关研究与分析。

文件详解

  • 文件名称:semeval2020_ulscd_posteval.zip
  • 文件格式:ZIP压缩包
  • 压缩包内包含内容:
  • 任务起始工具包:含数据下载示例、竞赛基线模型
  • test_data_truth/目录:子任务1目标词的真实二元变化分数、子任务2的真实分级变化分数
  • scoring_program/目录:评估及后评估阶段用于评分的程序
  • results/目录:含团队最终排名(rankings_teams.csv)、各团队提交文件(submissions/)、提交结果概览(submissions_results.csv)
  • plots/目录:含per_target/(目标词真实分数与预测误差关联频率/多义性统计图表)、per_team/(团队最佳提交模型预测关联统计及预测相似度图表)

适用场景

  • 自然语言处理研究:分析无监督词汇语义变化检测模型的性能表现
  • 语义变化检测任务:复现或扩展SemEval-2020任务1的评估实验
  • 模型对比分析:基于团队提交结果比较不同检测模型的效果差异
  • 语义变化影响因素研究:通过目标词频率、多义性与预测误差的关联分析,探究语义变化的相关影响因素
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 4.04 MiB
最后更新 2025年12月22日
创建于 2025年12月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。