-
arXiv_1707_06525_Based_在线社交系统主题一致性研究数据
2026年1月20日 30 114 11
数据集概述 本数据集用于支持在线社交系统主题一致性的研究,包含社交网络中的标签共现、社区结构、用户标签使用情况及关注好友关系等数据,共5个文件,涵盖文本和JSON格式,为分析社交系统内的主题关联与用户行为提供基础数据。 文件详解 标签共现图文件 文件名称:cooccurrence.txt 文件格式:TXT...
-
PAN24_CLEF2024_Based多作者写作风格变化检测数据集
2026年1月23日 30 122 1
数据集概述 本数据集为PAN@CLEF2024共享任务“多作者写作风格分析”的专用数据,包含三种难度(Easy、Medium、Hard)的英文文档,任务为段落级内在风格变化检测。数据集分为训练集、验证集和测试集,训练集和验证集含真实标签,测试集无标签,用于算法开发与评估。 文件详解 文件名称:pan24-multi-author-...
-
Paired_Human_and_LLM_free_text_survey_data
2026年1月18日 30 7 2
数据集概述 本数据集包含两组配对数据,模拟公众咨询场景。人类数据集涵盖约一千名英国居民对五个类公众咨询问题的自由文本回答,包含受访者自标主题标签及三名众包工作者的标注;LLM数据集基于人类回答生成,包含同一问题下的合成回复,由预设主题、角色设定及人类回答示例引导生成。 文件详解 人类调查数据文件...



