IV_NLP因果方法理解深度学习模型行为数据集

数据集概述

本数据集是论文《IV-NLP: A Methodology to understand the behavior of DL models and its Application from a Causal Approach》的关联数据,基于2023年发布的V3版本扩展而来(V4)。包含原始数据集和GPT-3.5-turbo-0125生成的合成数据集,为通过因果方法研究深度学习模型行为提供数据支持。

文件详解

  • 原始数据集文件:
  • df_originales.xlsx(Excel格式):含4015条记录,字段包括Id(0-4014自动序列)、Tweet_Checked(推文文本)、Fecha(发布日期)、Clase_Argumento(0/1标签)
  • 合成数据集文件:
  • df_gpt35.xlsx(Excel格式):含3966条记录,字段包括Id(0-3965自动序列)、Tweet_Checked(合成推文文本)、Original_Id(对应原始数据Id)、Fecha(发布日期)、Clase_Argumento(0/1标签)

适用场景

  • 深度学习模型行为分析:基于因果方法探究模型决策逻辑
  • 自然语言处理研究:验证合成文本数据在模型训练或评估中的应用效果
  • 因果推断应用:探索因果方法论在NLP任务中的实践价值
  • 模型可解释性研究:分析深度学习模型对文本数据的处理机制
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.64 MiB
最后更新 2025年11月27日
创建于 2025年11月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。