-
HTR_Based_中世纪拉丁及法语手稿文档识别模型数据集
2026年1月30日 30 129 111
数据集概述 本数据集用于训练和评估适用于拉丁及法语中世纪文档手稿的手写文本识别(HTR)模型,包含12-15世纪的宪章、登记簿等手稿数据,涉及1855页、12万行文本及近100万字符,整合了Alcar-HOME、e-NDP、Himanis三个开源真实语料库,支持多语言多字体识别,可用于中世纪文献的数字化处理。 文件详解 GT_list:...
-
ThoughtSource大型语言模型推理数据中心数据集快照
2025年12月4日 30 64 26
数据集概述 本数据集是ThoughtSource平台的公开数据快照,ThoughtSource是针对大型语言模型(LLMs)思维链推理的元数据集与软件库。快照包含公开可用的推理数据资源,为研究LLM推理机制提供数据支持。 文件详解 文件名称: Dataset-licenses.pdf 文件格式: PDF 内容说明: 记录数据集相关的许可协议文件...



