-
OpenLLMText_多源文本数据基于大语言模型文本分析完整数据
2025年12月12日 30 77 67
数据集概述 该数据集包含约三十万条文本条目,来源于人类及ChatGPT、PaLM、LLaMA、GPT2-XL四个大语言模型。其中人类文本取自2019年前Reddit用户生成内容,其余模型文本为对人类文本的逐段改写或直接适配,覆盖不同生成式模型的文本特征。 文件详解...
-
Reddit神秘话题探索数据集-WTF子板块2011至2023年
2025年4月15日 30 36 30
Reddit神秘话题探索数据集-WTF子板块2011至2023年 数据来源:互联网公开数据 标签:Reddit,WTF,子板块,话题,情感分析,用户互动,社区研究,公开数据集 数据概述:...



