数据集概述
本数据集包含论文《Adapting Transformers for Multi-Label Text Classification》中使用的三个多标签文本分类数据集,分别为AAPD、Reuters-21578和MFHAD,用于支持多标签文本分类模型的研究与评估。
文件详解
- AAPD Dataset
- 文件名称:AAPD.zip
- 文件格式:ZIP
- 字段映射介绍:ArXiv学术论文数据集,具体字段未提供
- Reuters-21578 Dataset
- 文件名称:Reuters-21578.zip
- 文件格式:ZIP
- 字段映射介绍:路透社文本分类数据集,可通过https://archive.ics.uci.edu/ml/datasets/reuters-21578+text+categorization+collection获取更多信息
- MFHAD Dataset
- 文件名称:MFHAD.zip
- 文件格式:ZIP
- 字段映射介绍:多标签法语HAL摘要数据集,具体字段未提供
数据来源
论文《Adapting Transformers for Multi-Label Text Classification》
适用场景
- 多标签文本分类模型研究: 用于训练和评估基于Transformer的多标签文本分类模型
- 自然语言处理算法对比: 支持不同多标签文本分类算法的性能比较与分析
- 学术论文分类研究: 利用AAPD数据集进行学术论文的多标签分类研究
- 法语文本分类研究: 通过MFHAD数据集开展法语文本的多标签分类研究