-
文本转录及大纲数据集TranscriptswithOutlinesDataset-sriyakalyan
2025年5月28日 30 55 19
文本转录及大纲数据集TranscriptswithOutlinesDataset-sriyakalyan 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,转录,大纲,内容摘要,语义分析,机器学习 数据概述: 该数据集包含文本转录及其对应的大纲信息,旨在促进文本分析和自然语言处理领域的研究。主要特征如下:... -
语音识别与转录数据集KS0709V-01WhisperOutsDataset-liumail511
2025年4月26日 30 155 124
语音识别与转录数据集KS0709V-01WhisperOutsDataset-liumail511 数据来源:互联网公开数据 标签:语音识别,数据集,转录,人工智能,自然语言处理,机器学习,语音技术,数据科学 数据概述: 该数据集包含来自KS0709V-01项目的语音识别与转录数据,记录了不同场景下的语音内容及其对应的文本转录。主要特征如下:... -
医疗转录数据集MedicalTranscriptionSamplesDataset-oyesaurav
2025年4月24日 30 168 138
医疗转录数据集MedicalTranscriptionSamplesDataset-oyesaurav 数据来源:互联网公开数据 标签:医疗,转录,临床,文本分析,自然语言处理,数据集,健康,医学 数据概述: 该数据集包含来自MT Samples的临床转录数据,记录了医疗领域的各种临床报告和病历。主要特征如下:... -
视频制作拍摄板文本信息识别数据集-madisoncourtney
2025年4月24日 30 194 0
视频制作拍摄板文本信息识别数据集-madisoncourtney 数据来源:互联网公开数据 标签:拍摄板,文本识别,视频制作,机器训练,元数据,转录,图像识别,美国公共广播档案,计算机视觉 数据概述: 本数据集旨在用于训练和测试机器学习系统,以从视频制作中的拍摄板(又称场记板或打板)或屏幕文本中提取信息。... -
医疗转录报告网站MTSamples样本数据分析-2024-willianoliveiragibin
2025年4月22日 30 204 198
医疗转录报告网站MTSamples样本数据分析-2024-willianoliveiragibin 数据来源:互联网公开数据 标签:医疗转录,医疗报告,医学,转录,医疗保健,教育,样本数据,文本数据 数据概述:... -
漫威电影宇宙对话数据集2008至2019-pdunton
2025年4月22日 30 167 74
漫威电影宇宙对话数据集2008至2019-pdunton 数据来源:互联网公开数据 标签:漫威,电影,对话,脚本,数据集,MCU,剧本,转录,教育,分析 数据概述: 本数据集包含了漫威电影宇宙(MCU)多部电影中的对话记录。数据来源于原始剧本和转录文本,原始剧本PDF文件由Script Slug提供,转录文本则来自Fandom的Transcripts... -
本诺阿莱曼配音摩根弗里曼法语有声数据集
2025年4月20日 30 108 23
本诺阿莱曼配音摩根弗里曼法语有声数据集 数据来源:互联网公开数据 标签:语音,配音,法语,摩根弗里曼,本诺阿莱曼,语音克隆,有声书,转录 数据概述: 本数据集包含约230段法语音频,并附带一个CSV文件,其中包含每个音频的转录文本。这些音频来自有声书《Après, quand l'au-delà nous fait... -
TED演讲文本数据集-演讲内容与结构分析-2024年9月12日
2025年4月16日 30 91 34
TED演讲文本数据集-演讲内容与结构分析-2024年9月12日 数据来源:互联网公开数据 标签:TED演讲,文本,转录,演讲稿,自然语言处理,文本分析,主题分割,内容分析 数据概述:... -
印度次大陆嘻哈歌曲创作与语言应用数据集
2025年4月14日 30 117 72
印度次大陆嘻哈歌曲创作与语言应用数据集 数据来源:互联网公开数据 标签:嘻哈,歌词,创意写作,自然语言处理,机器翻译,情感分析,转录,印度,DHH,Desi Hip Hop 数据概述:... -
Vox今日解读播客节目文本数据集
2025年4月14日 30 7 3
Vox今日解读播客节目文本数据集 数据来源:互联网公开数据 标签:播客,文本,新闻,时事,舆情分析,对话,VOX,Today Explained,转录 数据概述: 本数据集包含了Vox公司旗下播客节目“Today...