-
PAN13_Text_Alignment_原创性检测_文本复用识别训练语料
2026年1月21日 30 152 107
数据集概述 本数据集为PAN13项目的文本对齐原创性检测训练语料,包含成对文档数据,其中一方可能复用另一方文本,且复用文本经自动混淆处理以隐藏复用痕迹。数据集用于支持自然语言处理领域的文本原创性检测研究,仅含一个压缩文件。 文件详解 文件名称:pan13-text-alignment-test-and-training.zip 文件格式:ZIP...
2026年1月21日 30 152 107