-
SARS_ANI_Based_动物宿主分类数据_v1_1
2026年1月30日 30 34 19
数据集概述 本数据集为SARS-ANI数据集的v1.1版本,主要包含动物宿主的分类信息。通过R包taxize对原始宿主名称进行分类验证,新增7个与动物宿主识别相关的字段,旨在解决原始数据中宿主名称拼写错误和分类错误问题,便于与其他数据集整合。 文件详解 文件名称:sars-ani-v1.1.zip 文件格式:ZIP...
-
Modified_Based_Uropygi分类模拟数据集
2026年1月29日 30 7 4
数据集概述 本数据集基于Museu Paraense Emilio Goeldi的Uropygi Collection数据集(2023版)修改而来,通过转换为Excel格式并引入三类故意错误(属名、目名、界名拼写错误),用于测试pytaxon工具的分类学错误检测与纠正能力,仅包含一个文件。 文件详解 文件名称:Uropygi...
-
Interviews_transcriptions_情感研究访谈转录完整数据集
2026年1月19日 30 65 40
数据集概述 本数据集为情感研究相关访谈的完整转录集合,包含十七份访谈文档。数据用于评估情感研究内容、识别原始研究未覆盖的兴趣领域,以及为测试怀旧与负面情感考古环境中情感触发理论的数字考古游戏提供支持。转录经手写与多次审核,但可能因录音连接问题或语言理解困难存在语法及拼写错误,包含受访者真实姓名。 文件详解 访谈转录文件 文件名称:包括Dr. Ian...
-
西班牙临床过敏笔记语料库
2025年12月23日 30 125 107
数据集概述 该数据集是首个西班牙语临床过敏笔记语料库,包含西班牙阿尔科尔孔基金会大学医院过敏科及急诊科197名患者的828篇临床文本,涉及病历模板多样,含拼写错误、缩写等非正式临床书写特征,为西班牙语过敏领域NLP研究提供数据支持。 文件详解 文件名称: HUFA corpus annotation guidelines.pdf 文件格式: PDF...
-
世界蠓科目录勘误表数据集
2025年12月20日 30 14 11
数据集概述 该数据集包含《世界蠓科(双翅目:蠓科)目录》的勘误信息,列出了自Borkent等人2022年版本后的命名修正内容,涉及物种名称、发表日期、页码、作者拼写等多项分类学数据的更正。 文件详解 文件名称: table.html 文件格式: HTML 内容说明: 以表格形式呈现勘误条目,包含两列核心内容 Previous name:...
-
本体驱动约束测试器应用数据集_SAREF智能能源设备
2025年12月18日 30 20 14
数据集概述 本数据集包含本体驱动约束测试器(ODCT)在SAREF及SAREF4ENER本体下对智能能源设备合规性验证的资源,含合规数据集、带错误的修改数据集、SHACL形状文件、性能报告及演示视频,用于保障智能设备语义互操作性。 文件详解 该数据集包含多种类型文件,具体说明如下: - 数据集文件(JSON格式): -...
-
阿拉伯语拼写错误平行语料库数据集
2025年6月4日 30 182 44
阿拉伯语拼写错误平行语料库数据集 数据来源:互联网公开数据 标签:阿拉伯语,拼写错误,语料库,语言研究,拼写检查,纠错系统 数据概述:...
-
印度城市名称拼写错误数据集IndianCitieswithTypoDataset-anirbanacharya
2025年5月30日 30 64 35
印度城市名称拼写错误数据集IndianCitieswithTypoDataset-anirbanacharya 数据来源:互联网公开数据 标签:城市名称,数据集,拼写错误,数据处理,地理信息,数据清洗,自然语言处理,机器学习 数据概述: 该数据集包含来自印度各城市的名称数据,记录了城市名称中常见的拼写错误及正确名称。主要特征如下:...
-
越南语拼写错误数据集VietnameseMisspellDataset-khanglehoang
2025年4月23日 30 116 54
越南语拼写错误数据集VietnameseMisspellDataset-khanglehoang 数据来源:互联网公开数据 标签:越南语,拼写错误,数据集,自然语言处理,机器学习,语言学研究,文本分析,错误检测 数据概述: 该数据集包含越南语中的拼写错误数据,记录了越南语文本中的错误拼写及其正确形式。主要特征如下:...
-
新闻标题拼写错误数据集100万条
2025年4月23日 30 123 53
新闻标题拼写错误数据集100万条 数据来源:互联网公开数据 标签:拼写错误,新闻标题,自然语言处理,数据生成,拼写校正模型,机器学习,文本处理 数据概述: 本数据集包含通过nlpaug库生成的100万条新闻标题的拼写错误数据。这些标题原本应为正确拼写,但经过处理引入了不同类型的拼写错误,为构建和评估拼写校正模型提供了丰富的训练和测试材料。...
-
名人姓名拼写错误数据集
2025年4月14日 30 165 92
名人姓名拼写错误数据集 数据来源:互联网公开数据 标签:名人,拼写错误,语言学研究,数据可视化,互动实验,语法分析 数据概述: 本数据集收录了15位著名名人姓名的拼写及拼写错误情况,数据来源于The Pudding的互动实验《The Gyllenhaal...



