电影剧情问答数据集Wikipedia-IMDb-thedevastator

电影剧情问答数据集Wikipedia-IMDb-thedevastator 数据来源:互联网公开数据 标签:问答,自然语言处理,电影,剧情,Wikipedia,IMDb,文本,机器阅读理解,语义理解 数据概述: 本数据集是一个英语问答数据集,问题和答案分别源自Wikipedia和IMDb电影剧情。数据集由众包工人创建,他们被允许从剧情中选择答案或自己编写答案。数据集包含两个子集:SelfRC和ParaphraseRC。SelfRC数据集完全基于Wikipedia电影剧情构建,ParaphraseRC则基于Wikipedia电影剧情生成问题,答案则来自对应的IMDb电影剧情。数据包含多个文件,分别对应训练集、测试集和验证集,每个文件包含电影剧情、电影标题、问题、答案(字符串列表)以及一个指示问题是否有答案的二元值。

数据用途概述: 该数据集可用于训练模型回答关于电影剧情的问题,进行机器阅读理解任务,也可以用于寻找电影剧情问题的释义。该数据集适用于自然语言处理、机器阅读理解、问答系统等研究领域,也可用于电影剧情分析、知识图谱构建等应用。

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 4, 2025, 08:45 (UTC)
创建于 五月 4, 2025, 08:41 (UTC)