-
OpenLLMText_多源文本数据基于大语言模型文本分析完整数据
2025年12月12日 30 22 16
数据集概述 该数据集包含约三十万条文本条目,来源于人类及ChatGPT、PaLM、LLaMA、GPT2-XL四个大语言模型。其中人类文本取自2019年前Reddit用户生成内容,其余模型文本为对人类文本的逐段改写或直接适配,覆盖不同生成式模型的文本特征。 文件详解...
-
LLM软件架构知识比较分析复现包
2025年12月10日 30 33 15
数据集概述 本数据集是论文《LLMs for Software Architecture Knowledge: A Comparative Analysis among Seven LLMs》的复现包,包含用于复现研究的相关材料,支持验证七种LLM在软件架构知识查询任务中的性能差异。 文件详解 文件名称:OnlineMaterial.zip...
-
大规模语言模型开源项目LMSYS的快速版LLaMA数据集LMSYSOpen-sourceFastLLaMADataset-rushali98
2025年4月23日 30 143 58
大规模语言模型开源项目LMSYS的快速版LLaMA数据集LMSYSOpen-sourceFastLLaMADataset-rushali98 数据来源:互联网公开数据 标签:自然语言处理,大型语言模型,数据集,LLaMA,开源,文本生成,机器学习,预训练 数据概述:...



