-
Gigatrue_Cleaned_英文摘要清理数据集
2025年12月23日 30 56 41
数据集概述 该数据集是对Harvard/gigaword数据集的清理版本,添加了生成的数值,并使用truecase工具进行了大小写标准化处理。数据集包含1个PDF文件,无训练/测试、数据/标签或原始/处理数据的拆分,为摘要任务研究提供基础数据。 文件详解 文件名称: Gigatrue Slovak abstractive summarisation...
-
SNEMI3D电子显微镜图像神经突三维分割数据集
2025年12月20日 30 19 2
数据集概述 本数据集为SNEMI3D挑战赛所用,包含电子显微镜(EM)图像堆栈,用于训练机器学习算法实现神经突的自动化三维分割。图像存在各向异性特征,由专家手动标注神经突,旨在评估自动化分割方法的性能。 文件详解 文件名称: snemi.zip 文件格式: ZIP压缩包 内容说明:...
-
Gigatrue斯洛伐克语抽象摘要数据集
2025年12月19日 30 81 44
数据集概述 本数据集为合成Gigaword数据集的斯洛伐克语翻译版本,基于Gigatrue数据集通过SeamlessM4T-v2工具翻译生成,专注于抽象摘要任务,为斯洛伐克语文本摘要研究提供数据支持。 文件详解 文件名称: Gigatrue Slovak abstractive summarisation dataset.pdf 文件格式: PDF...



