找到78个数据集

标签: 转录文本

过滤结果
  • 缅甸森林边缘地带的本地视角_生态系统服务与贸易权衡_访谈数据

    2026年2月8日 30 189 17

    数据集概述 本数据集包含缅甸森林前沿景观生态系统服务权衡研究的46份半结构化访谈及焦点小组讨论转录文本,辅以访谈概述和编码信息表,共48个文件,支撑相关学术研究,为理解当地生态系统服务权衡的地方视角提供原始资料。 文件详解 访谈转录文件(document_files)...
    packageimg
  • 医学学生远程学习研究焦点小组访谈记录数据

    2026年2月2日 30 102 99

    数据集概述 本数据集包含针对医学学生开展的三组焦点小组访谈转录内容,核心主题为医学学生使用Elearning材料的体验。数据集仅包含一个文件,记录了医学学生对Elearning材料的使用感受、反馈及相关经历,为了解医学教育中Elearning应用情况提供一手质性数据。 文件详解 文件名称:Transcripts_elearning.docx...
    packageimg
  • Gwalther_Based手写体真实数据

    2026年2月2日 30 119 59

    数据集概述 本数据集是鲁道夫·格瓦尔特(1519-1586)手写体的真实数据,来源于其著作《Lateinische Gedichte》(1540-1580年)。数据包含142张图像及对应的转录文本,涵盖4037行、26088个单词,语言为拉丁语,可用于手写体识别研究。 文件详解 文件名称:bullinger-digital/gwalther-...
    packageimg
  • 硕士论文_美国总统大选副总统辩论会的性别影响研究数据

    2026年1月31日 30 126 8

    数据集概述 本数据集包含硕士论文《Does She Talk Differently?》的原始数据、分析生成的表格图表及七场美国总统和副总统辩论的编码转录文本,共10个文件。核心内容为辩论文本及性别相关编码数据,用于探究政治辩论中的性别差异及其影响。 文件详解 辩论转录文件(共7个) 文件名称:如September 26, 2016_ Clinton...
    packageimg
  • Annexe_22_翻译口译用户半结构化访谈转录文本数据

    2026年1月30日 30 210 119

    数据集概述 本数据集为Annexe 22,包含针对23位翻译或口译实际及潜在用户开展的半结构化访谈转录文本,记录了用户对语言服务的使用体验与需求相关内容,为语言服务研究提供原始访谈资料支持。 文件详解 文件名称:Annexe 22.docx 文件格式:DOCX...
    packageimg
  • ALV_Based_人工生成讲座视频片段与真实标注数据集

    2026年1月30日 30 178 54

    数据集概述 本数据集包含300个人工生成的讲座视频转录文本及其对应的片段化真实标注,用于评估讲座视频片段化技术。转录文本源自VideoLectures.NET的1498个学术讲座转录文件,涵盖计算机科学、数学、医学等多领域。每个讲座由20个时长4-8分钟的片段拼接而成,总时长约600小时。 文件详解 压缩包内容:...
    packageimg
  • Annexe_21_翻译与口译用户半结构化访谈转录文本数据

    2026年1月29日 30 114 58

    数据集概述 本数据集为Annexe 21,包含对23名翻译或口译服务的实际及潜在用户开展的半结构化访谈转录文本,记录了用户对翻译与口译服务的使用情况及相关反馈,是研究语言服务用户需求的原始资料。 文件详解 文件名称:Annexe 21.docx 文件格式:DOCX...
    packageimg
  • 关于2023年iSURF暑期本科生研究项目元认知反馈试点研究的通知

    2026年1月27日 30 90 69

    数据集概述 本数据集为内华达州立大学2023年iSURF暑期本科生科研项目的元认知与反馈循环试点研究配套数据,包含12名学生的小组元认知实践(SGMP)干预自由回应转录、双编码者主题分析数据、编码者信度计算及11名参与者的项目末匿名调查数据,共5个文件。 文件详解 小组元认知实践(SGMP)干预数据 文件名称:transcription.docx...
    packageimg
  • Annexe_22_翻译或口译服务真实及潜在用户半结构化访谈转录文本

    2026年1月27日 30 143 25

    数据集概述 本数据集为Annexe 22文档,内容是针对翻译或口译服务的真实及潜在用户开展的半结构化访谈转录文本。数据记录了用户相关的访谈内容,可用于分析用户对翻译或口译服务的需求、使用体验等情况,数据集包含一份文件。 文件详解 文件名称:Annexe 22.docx 文件格式:DOCX...
    packageimg
  • chilPollMorpho_Based_智利花粉孢子形态识别数据集

    2026年1月27日 30 46 9

    数据集概述 本数据集用于智利花粉和孢子的识别,形态描述简化自Heusser(1971)的原始记录,包含将文本转录为TXT文件后,对形态特征进行编码的系列列数据。数据集仅含一个文件,无训练/测试、数据/标签、原始/处理数据的拆分。 文件详解 文件名称:dicot.data2.xlsx 文件格式:XLSX...
    packageimg
  • eCAPE_Based_智能供暖技术用户行为与日常生活影响研究访谈数据

    2026年1月26日 30 202 151

    数据集概述 本数据集包含eCAPE研究项目中8份半结构化定性访谈的转录文本,以及访谈指南(丹麦语和英语版)、研究参与者招募启事(丹麦语和英语版),共11个文件。访谈于2019-2020年开展,聚焦智能供暖技术对用户日常生活、能源消费习惯的影响,所有文件均为DOCX格式。 文件详解 访谈转录文件 文件名称:Interview...
    packageimg
  • Fongbe_Speech_Dataset_贝宁Fongbe语言语音数据集

    2026年1月21日 30 154 92

    数据集概述 本数据集为贝宁主要使用的Fongbe语言语音数据集,包含语音音频文件、对应转录文本、数据集文档及元数据文件,用于支持Fongbe语言相关的语音技术研究与应用开发。 文件详解 压缩包文件 文件名称:Fongbe_Speech_Dataset.zip 文件格式:ZIP 字段映射介绍:压缩包内包含三个核心部分:...
    packageimg
  • Kannada_Based情态意义故事板录音与ELAN标注数据集2023

    2026年1月21日 30 33 1

    数据集概述 本数据集包含达罗毗荼语系Kannada语言的录音资料,聚焦情态表达,基于《Tom and Mittens》和《Chore Girl》两个故事板制作。数据由音频文件及ELAN格式的转录、部分翻译和注释组成,是2023年杜塞尔多夫大学"城市语言田野调查"课程的成果,可用于Kannada情态语义及类型学研究。 文件详解...
    packageimg
  • Hofdiarium_1665_Based德累斯顿宫廷日记库兰特手写体基准数据集

    2026年1月19日 30 161 45

    数据集概述 本数据集为17世纪萨克森库兰特手写体的手写文本识别(HTR/OCR)基准数据集,包含《选帝侯约翰·格奥尔格二世1665年宫廷日记》(SLUB Mscr.Dresd.K.80)的10页(fol.85r-89v)基准数据,采用eScriptorium完成图像与文本对齐,提供多种格式文件及转录指南。 文件详解 压缩包文件...
    packageimg
  • Chinese_Speech_to_Text_Based中文学习者语音样本与转录数据

    2026年1月18日 30 189 142

    数据集概述 本数据集包含31名学习者的中文语音样本(单词语音),以及对应的转录文本和准确率评分,用于支持中文语音转文字相关的研究与应用。数据集仅包含一个文件,无训练/测试、数据/标签或原始/处理数据的划分。 文件详解 文件名称:Dataset Chinese Speech to Text.xlsx 文件格式:XLSX...
    packageimg
  • Venice_Source_1808拿破仑地籍Sommarioni登记簿转录与地理空间数据

    2026年1月12日 30 42 27

    数据集概述 本数据集包含1808年威尼斯拿破仑地籍Sommarioni登记簿的结构化转录与地理空间映射数据,整合了地块编号、所有者、用途等地籍信息,以及基于27张原始地籍图的地理参考矢量几何数据,支持空间、社会与历史分析,是研究威尼斯现代转型前城市结构的基础资源。 文件详解 文件名称:README.md 文件格式:MD...
    packageimg
  • Supplementary_Materials_Based_欧洲议会英德翻译句法研究补充数据

    2026年1月17日 30 51 17

    数据集概述 本数据集为Languages期刊投稿论文的补充材料,包含欧洲议会英文演讲及其德语笔译、口译文本的句法研究相关文件,涵盖转录文本、词性频率数据、口译员识别数据、统计分析脚本及可视化图表,以压缩包形式提供。 文件详解 压缩包文件 文件名称:SupMat.zip 文件格式:ZIP 包含内容:...
    packageimg
  • Lausanne_Based_19世纪人口普查手写文本识别训练数据集_2023版

    2026年1月15日 30 142 108

    数据集概述 本数据集包含三万四千九百一十三条人工转录的文本片段,用于历史文献(如人口普查表格)的手写文本识别训练。数据基于瑞士洛桑市1805至1898年的八十九页人口普查档案,主要语言为法语,含部分日耳曼姓名及地名。 文件详解 README.md 文件格式:MD 字段映射介绍:包含数据集作者、机构、发布日期、描述等元信息 Images.zip...
    packageimg
  • RIMES_Based_ICDAR_2011法语手写识别竞赛行片段数据集_2024公开版

    2026年1月13日 30 179 122

    数据集概述 本数据集为2011年ICDAR法语手写识别竞赛第二任务的行片段数据,是RIMES数据库的子集。包含12111行手写文本图像及12107条转录文本,覆盖超87k个单词实例,按标准划分训练、验证和测试集,用于支持手写文本识别研究。 文件详解 文件名称:RIMES-2011-Lines.zip 文件格式:ZIP(压缩包)...
    packageimg
  • Transcripts_User_Study_双大屏混合在场实验转录文本数据_2023Q4

    2026年1月13日 30 191 6

    数据集概述 本数据集为2023年第四季度开展的双大屏混合在场用户研究的转录文本,包含自动转录(必要时翻译)并标注到个人的对话内容,配套相关论文使用。数据记录了实验中不同条件下用户的互动对话,可用于分析双大屏交互场景下的用户行为与协作模式。 文件详解 文件名称:transcripts-combined.xlsx 文件格式:XLSX...
    packageimg