学术_小说与歌曲语言数据集

关注者: 0

资源积分: 30

分类

公开数据

公开数据

授权

没有提供授权

数据集

学术_小说与歌曲语言数据集

数据集概述

该数据集为研究项目“学术、小说与歌曲中的语言”的数据管理计划（DMP）。核心内容围绕学术写作、小说文本与歌曲歌词中的动词使用差异展开，对比不同体裁及文本内的动词多样性，分析各体裁高频动词特征。

文件详解

文件名称：DMP_Language in academics fiction and song.pdf
文件格式：PDF (.pdf)
文件内容：包含研究项目的数据管理计划，记录数据来源、处理方法及查询文档（如queries.sql），需通过SQLite数据库浏览器（推荐DB Browser for SQLite）访问关联数据库。

数据来源

Sönning, Lukas, 2023, "Key verbs in academic writing: Dataset for 'Evaluation of keyness metrics: Performance and reliability'", https://doi.org/10.18710/EUXSMW, DataverseNO, V1
Bertin-Mahieux, Thierry et al. (2011). "The Million Song Dataset". In: Proceedings of the 12th International Conference on Music Information Retrieval (ISMIR 2011)
musiXmatch dataset（百万歌曲数据集官方歌词集）
Last.fm dataset（百万歌曲数据集官方标签与相似度集）

适用场景

语言学研究：分析学术、小说、歌曲三种文本体裁的动词使用差异与语言特征
自然语言处理（NLP）：探索不同文本类型的词汇多样性及高频词分布规律
跨体裁文本对比：研究正式与非正式文本在动词选择上的差异
数据管理案例：作为文本类研究项目数据管理计划（DMP）的参考范例

数据与资源

10379835.zipZIP
0.28 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	0.28 MiB
最后更新	2025年12月5日
创建于	2025年12月5日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

智能助手

您好！我是海数据平台的智能助手，有什么可以帮助您的吗？