找到2,278个数据集

标签: 数字人文

过滤结果
  • 推特科学分类学荷兰语气候变化讨论2023年

    2026年2月1日 30 128 28

    数据集概述 本数据集包含适用于荷兰语气候变化推特话语的科学术语分类体系,涵盖科学话语、科学发现、机构与人物、科学挑战四大类荷兰语关键词,用于筛选和分析推特中气候变化与科学知识、权威或怀疑相关的内容,支持数字人文、宗教社会学等领域研究。 文件详解 文件名称:Science_Taxonomy_Dutch_Climate_Twitter_2023.xlsx...
    packageimg
  • APIS丰富版奥地利传记词典JSON序列化数据

    2026年2月1日 0 46 20

    数据集概述 本数据集为奥地利传记词典的增强版JSON序列化数据,由奥地利人物志信息系统(APIS)项目生成。包含约一万九千名1815至1955年间在奥地利有影响且逝世的人物数据,采用内部JSON格式,提供最丰富的可用数据内容。 文件详解 LICENSE 文件格式:无扩展名 字段映射介绍:未提供具体字段信息,推测为数据使用许可说明文档...
    packageimg
  • PPA_Based_普林斯顿韵律学文献目录数据集

    2026年2月1日 30 203 189

    数据集概述 本数据集基于T. V. F. Brogan 1981年的《English Versification, 1570-1980》目录生成,包含普林斯顿韵律学档案(PPA)相关的文献信息。数据集提供完整目录及两个特定版本,助力学者研究历史语言与诗歌研究的交叉领域,共含3个Excel文件。 文件详解 文件名称:Full_Brogan-...
    packageimg
  • t1042_Owen_Tyddwr_人物档案数据

    2026年2月1日 30 19 18

    数据集概述 本数据集是关于Owen Tyddwr(musiXplora-ID: t1042)的结构化人物信息档案,包含其基本身份信息、职业领域、活动地点、相关文献记录等内容,首次提及时间为1800年,主要涉及弦乐器制作领域,数据集以单个JSON文件呈现。 文件详解 文件名称:t1042_DE.json 文件格式:JSON...
    packageimg
  • DWDS_Based_德语词源词典完整词条列表数据

    2026年1月31日 30 132 113

    数据集概述 本数据集为《德语词源词典》的词条列表,收录约24500个德语词汇,包含每个词汇在数字德语词典(DWDS)中的对应文章URL。该词典由沃尔夫冈·普法伊费尔领导的团队编写,涵盖词汇的年代、起源、亲属关系及词义演变等信息,是德语词源研究的重要参考资料。 文件详解 文件名称:etymwb-headwords.json 文件格式:JSON...
    packageimg
  • ToposText_Based_希腊古典文学地名数据

    2026年1月31日 30 204 0

    数据集概述 本数据集收录了源自古典文学的希腊地名,数据来源为Montanari编写的《布里尔古希腊语词典》(2015年版)及Kiesling等开发的ToposText网站(2019年3.0版本)。数据集仅包含一个文件,无目录结构,未划分训练测试集、数据标签或原始/处理数据,便于直接获取古典文学中的希腊地名信息。 文件详解...
    packageimg
  • ASNC_Based早期爱尔兰词汇表数据库XML档案

    2026年1月31日 30 100 12

    数据集概述 本数据集为早期爱尔兰词汇表数据库的XML档案,包含Sanas Cormaic、O’Mulconry’s Glossary、Dúil Dromma Cetta及短篇文本Loman和Irsan的各版本XML文件,共十八个文件,是研究中世纪爱尔兰文学与文化环境的重要资源。 文件详解 数据文件...
    packageimg
  • DHd_2015_2018年年会机构投稿量统计数据集

    2026年1月31日 30 90 85

    数据集概述 本数据集为2015-2018年DHd年会摘要集的机构投稿量统计结果,基于各年会议摘要集整理而成,包含2015-2018年各机构在不同会议形式(工作坊、报告/小组讨论、海报)的投稿数量,以及汇总统计数据,可用于分析数字人文领域机构参与会议的活跃度。 文件详解 数据文件...
    packageimg
  • AmadissigloXX_现代重写数据库_1955

    2026年1月31日 30 144 119

    数据集概述 本数据集是AmadissigloXX项目的一部分,聚焦现代对骑士文学及《堂吉诃德》的重写作品,包含 Álvaro Cunqueiro 1955年作品《Merlín e familia i outras historias》的相关数据。数据集通过JSON和XML两种格式,分别提供作品元数据与完整数据库内容,支持骑士文学现代重写研究。 文件详解...
    packageimg
  • Poesía_Twitter_诗歌传播新方式研究数据

    2026年1月31日 30 88 55

    数据集概述 本数据集围绕“诗歌与Twitter:尝试诗歌传播新方式”主题,收录了通过Twitter平台传播诗歌的相关内容,包括发布的推文文本及诗歌片段的关联图片,旨在探索社交媒体对诗歌推广的适配性与新路径。 文件详解 文件名称:Releyendo Comienzo + Bukowski.docx 文件格式:DOCX...
    packageimg
  • OHSH文学地理学_文学空间性的可视化与数据重现性研究

    2026年1月31日 30 165 106

    数据集概述 本数据集包含复现文章“Visualizing Literary Spatiality”中“Literary Geomorphology”章节可视化内容所需的数据与代码,包括10部小说的文本文件、地貌词素数据表及可视化代码笔记本,共15个文件,用于文学空间性的分析与可视化研究。 文件详解 文本文件(小说文本)...
    packageimg
  • 南亚1700_1900年音乐与舞蹈历史与分析的资料来源

    2026年1月31日 30 46 43

    数据集概述 本数据集为SHAMSA数据库1.0版的书目元数据,包含约1700至1900年间南亚(以恒河平原为主)北印度音乐与舞蹈相关的300余种核心文献记录,涵盖波斯语、梵语、乌尔都语等多语种文本,部分文献在伦敦国王学院存有数字副本,是研究殖民时期南亚音乐舞蹈文化史的重要资源。 文件详解 文件名称:SHAMSA_MUSTECIO_1.0.xlsx...
    packageimg
  • LSJ_Based_LAGT古希英词典_计算分析用数据

    2026年1月30日 30 147 103

    数据集概述 本数据集是基于LSJ词典构建的古希英数字词典,专为古希语文本计算分析设计,支持LAGT数据集相关研究。包含64,774个原始词元、46,693个标准化词元及对应英文释义,附Python查询脚本,适用于离线Python工作流,助力古希腊语料库语义与词汇探索。 文件详解 文件名称:lsj_dictionary_v1_0_0.json...
    packageimg
  • KOLLMEIER_Based汉印佛教词汇比较对照数据

    2026年1月30日 30 56 20

    数据集概述 本数据集为汉印佛教词汇比较对照表,聚焦汉语与印度语系佛教词汇的对比研究,包含一份核心文件,可用于语言学、宗教学领域的词汇语义分析与跨语言对比研究。 文件详解 文件名称:KOLLMEIER version 1.xlsx 文件格式:XLSX...
    packageimg
  • ANR_PICCH_殖民时期马赛媒体呈现语料库2022

    2026年1月30日 30 12 6

    数据集概述 本数据集是2022年在ANR PICCH项目框架下由Pauline Savéant构建的语料库,由Sophie Gebeil(法国项目负责人)负责。语料库收录了法国视听媒体及网络(含互联网档案馆)中与马赛殖民历史相关的资料,旨在为批判性研究殖民时期马赛的媒体呈现提供结构化数据,包含1个文件。 文件详解...
    packageimg
  • eBL_Based电子巴比伦文学项目楔形文字转写片段数据

    2026年1月30日 30 118 46

    数据集概述 本数据集为电子巴比伦文学项目(eBL)的楔形文字转写片段数据,源自同名论文。包含项目介绍文档、结构化转写数据及压缩包,共三个文件,可与GitHub代码库配合使用,用于亚述学楔形文字文献的数字化研究与分析。 文件详解 README.md 文件格式:MD...
    packageimg
  • DBNL_Based荷兰数字化图书OCR与校正文本数据集

    2026年1月30日 30 143 12

    数据集概述 本数据集包含荷兰DBNL平台数字化的220本图书的OCR相关数据,涵盖原始OCR输出文本、校正后的TEI格式文本及元数据,共3个文件,用于图书数字化文本的存储与处理。 文件详解 文件名称:Metadata_DBNL_OCR_v1.xlsx 文件格式:XLSX 字段映射介绍:包含数据集的元数据信息,具体字段未提供预览 文件名称:TXT.zip...
    packageimg
  • AED_TEI_Based_埃及长文本词汇排名位置值数据

    2026年1月30日 30 144 8

    数据集概述 本数据集包含埃及文本中词汇的排名位置值,仅覆盖超过100个词汇的文本。排名位置值通过词汇频率衡量其在文本内的相关性,为埃及学文本分析提供结构化词汇重要性参考。数据集含2个文件,以AED-TEI数据为基础。 文件详解 文件名称:readme.txt 文件格式:TXT...
    packageimg
  • COM_Based_中国口述记忆概念模型研究论文表格数据

    2026年1月30日 30 194 67

    数据集概述 本数据集包含论文"A Conceptual Model of Chinese Oral Memory Based on Digital Humanities"所用的3个表格文件,涉及中国口述记忆概念模型(COM)的项目信息、元数据提取及本体术语表与对应关系,为数字人文领域研究中国口述记忆提供结构化支撑。 文件详解...
    packageimg
  • 音乐探索者_延斯_佩德_斯密特_阿雷斯特鲁普人物档案数据

    2026年1月30日 30 203 169

    数据集概述 本数据集为Jens Peder Smidt Aarestrup(musiXplora-ID:a1382)的人物档案数据,包含其基本信息、职业背景、活动地点等内容,记录了这位19世纪挪威钢琴制造师与政治家的核心生平信息,数据以JSON格式存储。 文件详解 文件名称:a1382_DE.json 文件格式:JSON...
    packageimg