数据集

电影对话语料库第二部分

电影对话语料库第二部分数据来源：互联网公开数据标签：电影对话,语料库,自然语言处理,语音识别,时间标注,电影分析数据概述：电影对话语料库第二部分包含来自1,722部电影的149,689个对话片段。这些对话片段是通过使用基于深度神经网络的语音活动检测技术，并结合过滤规则自动分割得到的。语料库由两部分组成：电影文件和注释文件。注释文件包含了每个对话片段的开始时间、结束时间和是否为对话的标签（对话标注为“1”，非对话标注为“0”）。电影文件需要单独从托管网站下载。在项目网站上还提供了样本抓取脚本。数据用途概述：该数据集适用于自然语言处理、语音识别、电影分析等多种场景。研究人员可以利用此数据集进行对话分析、情感分析、语音识别技术的研究；电影制片公司可以利用对话数据进行电影内容分析和角色研究；教育机构可以将此数据集用于教学，帮助学生了解电影对话的结构和特征。

数据与资源

电影对话语料库第二部分.zipZIP
1.11 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	1.11 MiB
最后更新	2025年4月14日
创建于	2025年4月14日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

电影对话语料库第二部分

数据与资源

附加信息

注册成功！