Multi_label_Text_Classification_Research_Datasets

数据集概述

本数据集包含论文《Adapting Transformers for Multi-Label Text Classification》中使用的三个多标签文本分类数据集,分别为AAPD、Reuters-21578和MFHAD,用于支持多标签文本分类模型的研究与评估。

文件详解

  • AAPD Dataset
  • 文件名称:AAPD.zip
  • 文件格式:ZIP
  • 字段映射介绍:ArXiv学术论文数据集,具体字段未提供
  • Reuters-21578 Dataset
  • 文件名称:Reuters-21578.zip
  • 文件格式:ZIP
  • 字段映射介绍:路透社文本分类数据集,可通过https://archive.ics.uci.edu/ml/datasets/reuters-21578+text+categorization+collection获取更多信息
  • MFHAD Dataset
  • 文件名称:MFHAD.zip
  • 文件格式:ZIP
  • 字段映射介绍:多标签法语HAL摘要数据集,具体字段未提供

数据来源

论文《Adapting Transformers for Multi-Label Text Classification》

适用场景

  • 多标签文本分类模型研究: 用于训练和评估基于Transformer的多标签文本分类模型
  • 自然语言处理算法对比: 支持不同多标签文本分类算法的性能比较与分析
  • 学术论文分类研究: 利用AAPD数据集进行学术论文的多标签分类研究
  • 法语文本分类研究: 通过MFHAD数据集开展法语文本的多标签分类研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 26.07 MiB
最后更新 2026年1月6日
创建于 2026年1月6日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。