-
Gemein_Nachrichten_Based_1805年利夫兰地区摩拉维亚教会传教报告转录数据
2026年1月7日 30 207 200
数据集概述 本数据集包含1805年利夫兰地区(今拉脱维亚)摩拉维亚教会传教士Freytag夫妇的报告转录内容,源自Unitätsarchiv Herrnhut提供的《Gemein-Nachrichten》文献。数据集涵盖XML-TEI格式的多版本转录文件及标准化文本文件,用于宗教历史研究与文本分析。 文件详解 文件名称:00404_01.xml...
-
曼布里诺数字图书馆_意大利骑士文学系列第13卷第5册_希腊的斯法拉蒙迪_第五部分数字学术版数据资料
2026年1月7日 30 149 88
数据集概述 本数据集是意大利骑士文学作品《13/5 Sferamundi di Grecia. Quinta parte》的数字学术版本,包含转录及评注的XML-TEI文件、多格式电子书和用于计算分析的纯文本文件,属于Mambrino数字图书馆项目,由维罗纳大学开发,支持古典文学的数字化研究。 文件详解 转录及评注文件...
-
阿坎语特维方言阿桑特变体短语动词使用数据集2018
2025年12月10日 30 139 38
数据集概述 本数据集是2018年柏林洪堡大学“城市田野调查”研讨会的项目成果,聚焦加纳阿坎语特维方言阿桑特变体中(emu)ye den、(emu)ye duru和(emu)ye hare三个短语动词的使用情况,包含相关注释语句、斯瓦迪士核心词表词汇及配套调查材料。 文件详解 该数据集包含16个文件,具体说明如下: - 文档类文件(PDF格式): -...
-
巴黎与耶路撒冷地图文本数据集
2025年12月16日 30 145 79
数据集概述 本数据集包含八十二份来自巴黎与耶路撒冷历史城市地图的标注样本,以JSON和PKL格式存储地图文本的多边形坐标、转录内容及质量标签(如是否截断、难以辨认),适用于地图文本检测、识别与序列分析任务。 文件详解 核心标注文件:...
-
圣维森特岛佛得角克里奥尔语数据集2019
2025年12月13日 30 95 70
数据集概述 本数据集为“2019年科隆城市田野调查”项目成果,包含圣维森特岛佛得角克里奥尔语的语言录音、文本转录及社会语言学分析资料,涵盖原始音频、标注文件、参与者信息与研究说明,为克里奥尔语研究提供多类型数据支持。 文件详解 该数据集包含11个文件,按类型分类说明如下: - PDF文档类(共4个): -...
-
巴黎圣母院教务会议登记册数字化协作项目中世纪手稿手写文本识别基准数据集1326_1504
2025年12月5日 30 145 143
数据集概述 本数据集为e-NDP项目产出的中世纪手稿手写文本识别(HTR)基准数据,包含1326-1504年巴黎圣母院教务会议登记册的512页标注内容,涵盖文本转录与版面分割信息,支持中世纪草书手写文本识别模型训练与评估。 文件详解 主压缩文件: e-NDP_dataset.zip: ZIP格式压缩包,包含数据集所有内容...
-
TranscriboQuest古希腊团队数据集2024
2025年12月5日 30 187 38
数据集概述 本数据集是2024年九月十一日至十三日在里昂举办的TranscriboQuest活动期间,由古希腊团队生成的数据集,包含活动相关的文档、配置文件和数据压缩包,具体信息可参考README文件。 文件详解 README.md: MD格式文件,包含项目介绍、团队信息、数据描述、指南和致谢等内容 Guidelines.pdf:...
-
卡拉布里亚发声物体研究_访谈与田野笔记_皮塔节
2025年12月4日 30 137 85
数据集概述 该数据集包含卡拉布里亚地区传统发声物体研究的民族音乐学数据,源于欧盟资助的LoMus项目(Local Sound for a New Musicality)。数据涵盖访谈录音、田野笔记、视频、图片及文本转录文件,为研究当地声学实践与音乐参与提供多维度资料支持。 文件详解 音频文件:...
-
孟加拉诺阿卡利语语音识别数据集
2025年10月7日 30 103 52
孟加拉诺阿卡利语语音识别数据集_Noakhali_Bengali_Speech_Recognition_Dataset 数据来源:互联网公开数据 标签:语音识别, 孟加拉语, 诺阿卡利语, 语音信号, 文本转录, 语料库, 声学模型, 深度学习 数据概述:...
-
阿拉伯语语音对话情感分析数据集
2025年9月25日 30 102 14
阿拉伯语语音对话情感分析数据集_Arabic_Speech_Dialogue_Emotion_Analysis 数据来源:互联网公开数据 标签:语音识别, 情感分析, 阿拉伯语, 语音数据集, 文本转录, 声学特征, 情绪识别, 多模态数据 数据概述:...
-
多语言语音识别文本数据集
2025年9月13日 30 171 93
多语言语音识别文本数据集_Multilingual_Speech_Recognition_Text_Dataset 数据来源:互联网公开数据 标签:语音识别, 文本转录, 多语言, 语音数据, 机器学习, 声学模型, 自然语言处理, 数据集 数据概述: 该数据集包含来自多个来源的多语言语音数据,记录了语音片段及其对应的文本转录。主要特征如下:...
-
语音通话欺诈检测数据集
2025年9月3日 30 129 44
语音通话欺诈检测数据集_Voice_Call_Fraud_Detection_Dataset 数据来源:互联网公开数据 标签:语音识别, 欺诈检测, 语音数据, 文本转录, 语音分析, 自然语言处理, 机器学习, 声纹识别 数据概述: 该数据集包含来自模拟语音通话的数据,记录了语音文件及其对应的文本转录,旨在用于欺诈检测相关的研究与应用。主要特征如下:...
-
白俄罗斯语有声语音数据集BelarusianSpeechAudioDataset-siarheys
2025年5月30日 30 194 77
白俄罗斯语有声语音数据集BelarusianSpeechAudioDataset-siarheys 数据来源:互联网公开数据 标签:语音识别, 声学模型, 语音合成, 文本转录, 语言学, 白俄罗斯语, 语音数据, 数据集 数据概述: 该数据集包含来自互联网的白俄罗斯语语音数据,记录了白俄罗斯语的语音片段及其对应的文本转录。主要特征如下:...
-
印度多语种文本转录数据集IndianMulti-languageTextTransliterationDataset-jaswanth431
2025年5月30日 30 167 134
印度多语种文本转录数据集IndianMulti-languageTextTransliterationDataset-jaswanth431 数据来源:互联网公开数据 标签:文本转录, 多语言, 印度语言, 机器翻译, 自然语言处理, 语料库, 语言学, 深度学习 数据概述:...
-
诺阿卡利语语音识别数据集NoakhaliSpeechRecognitionDataset-kaggletrailjawad
2025年5月30日 30 118 15
诺阿卡利语语音识别数据集NoakhaliSpeechRecognitionDataset-kaggletrailjawad 数据来源:互联网公开数据 标签:语音识别, 诺阿卡利语, 语音数据集, 声学模型, 语言学, 文本转录, 语音转文本, 深度学习 数据概述:...
-
Aditi1024文本转录数据集-donutkashvi
2025年5月29日 30 21 14
Aditi1024文本转录数据集-donutkashvi 数据来源:互联网公开数据 标签:文本转录,语音识别,数据集,印度语,转录质量,自然语言处理,音频分析,机器学习 数据概述: 该数据集包含来自Aditi 1024项目收集的印度语音频及其相应的文本转录。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含了不同时间段的音频数据。...
-
言语障碍检测语音数据集SpeechDatasetforDysarthriaDetection-rewithjai
2025年5月29日 30 92 33
言语障碍检测语音数据集SpeechDatasetforDysarthriaDetection-rewithjai 数据来源:互联网公开数据 标签:言语障碍, 构音障碍, 语音识别, 语音分析, 声音信号, 文本转录, 医疗健康, 机器学习 数据概述:...
-
语音转录文本数据分析数据集SpeechTranscriptionTextDataAnalysis-liumail511
2025年5月29日 30 146 94
语音转录文本数据分析数据集SpeechTranscriptionTextDataAnalysis-liumail511 数据来源:互联网公开数据 标签:语音识别, 文本转录, Whisper模型, 语音分析, 文本校对, 数据清洗, 声学模型, 自然语言处理 数据概述:...
-
音视频转录文本数据集Audio-to-TextTranscriptionDataset-yumoan
2025年5月29日 30 95 69
音视频转录文本数据集Audio-to-TextTranscriptionDataset-yumoan 数据来源:互联网公开数据 标签:语音识别, 文本转录, 语音转文本, 音频分析, 深度学习, 自然语言处理, 数据标注, 机器翻译 数据概述: 该数据集包含来自公开音视频资源的转录文本数据,主要用于训练和评估语音转文本(STT)模型。主要特征如下:...
-
文本转录及大纲数据集TranscriptswithOutlinesDataset-sriyakalyan
2025年5月28日 30 54 51
文本转录及大纲数据集TranscriptswithOutlinesDataset-sriyakalyan 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,转录,大纲,内容摘要,语义分析,机器学习 数据概述: 该数据集包含文本转录及其对应的大纲信息,旨在促进文本分析和自然语言处理领域的研究。主要特征如下:...



