学术_小说与歌曲语言数据集

数据集概述

该数据集为研究项目“学术、小说与歌曲中的语言”的数据管理计划(DMP)。核心内容围绕学术写作、小说文本与歌曲歌词中的动词使用差异展开,对比不同体裁及文本内的动词多样性,分析各体裁高频动词特征。

文件详解

  • 文件名称:DMP_Language in academics fiction and song.pdf
  • 文件格式:PDF (.pdf)
  • 文件内容:包含研究项目的数据管理计划,记录数据来源、处理方法及查询文档(如queries.sql),需通过SQLite数据库浏览器(推荐DB Browser for SQLite)访问关联数据库。

数据来源

  • Sönning, Lukas, 2023, "Key verbs in academic writing: Dataset for 'Evaluation of keyness metrics: Performance and reliability'", https://doi.org/10.18710/EUXSMW, DataverseNO, V1
  • Bertin-Mahieux, Thierry et al. (2011). "The Million Song Dataset". In: Proceedings of the 12th International Conference on Music Information Retrieval (ISMIR 2011)
  • musiXmatch dataset(百万歌曲数据集官方歌词集)
  • Last.fm dataset(百万歌曲数据集官方标签与相似度集)

适用场景

  • 语言学研究:分析学术、小说、歌曲三种文本体裁的动词使用差异与语言特征
  • 自然语言处理(NLP):探索不同文本类型的词汇多样性及高频词分布规律
  • 跨体裁文本对比:研究正式与非正式文本在动词选择上的差异
  • 数据管理案例:作为文本类研究项目数据管理计划(DMP)的参考范例
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.28 MiB
最后更新 2025年12月5日
创建于 2025年12月5日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。