-
PAN16_Based_作者身份识别文档聚类测试训练数据
2026年1月30日 30 154 153
数据集概述 本数据集为PAN16作者身份识别聚类任务的文档集合,包含至多一百篇单作者文档,所有文档语言与体裁一致,但主题或文本长度可能不同。数据集未明确说明包含的不同作者数量,旨在用于识别文档间的作者身份关联及同一作者的文档分组。 文件详解 文件名称:pan16-author-clustering-test-and-training.zip...
-
数据17世纪法国戏剧合作作者身份评估补充材料
2025年12月9日 30 115 112
数据集概述 本数据集为论文《“Psyché”作为罗塞塔石碑?评估17世纪法国戏剧的合作作者身份》的补充材料,包含研究相关的存档文件与文档文件,为理解17世纪法国戏剧合作创作模式提供数据支持。 文件详解 psyche_supplementary.zip: 压缩包格式,包含研究相关的补充数据或资源 Psyche_CHR2021.pdf:...
-
作者身份识别推文数据集
2025年4月14日 30 42 7
作者身份识别推文数据集 数据来源:互联网公开数据 标签:文本数据,推文,作者身份,作者归属,自然语言处理,机器学习,文本分类,社交媒体分析 数据概述: 本数据集包含了推文内容及其对应的作者姓名,旨在为构建作者身份识别模型提供基准数据集。 数据集包含不同作者发布的推文文本,可用于训练模型来识别推文的作者。 数据用途概述:...
-
亚马逊商业评论数据集
2025年4月14日 30 161 87
亚马逊商业评论数据集 数据来源:互联网公开数据 标签:亚马逊评论,作者身份识别,文本分析,分类算法,用户行为分析,自然语言处理 数据概述:...



