找到257个数据集

标签: 语言特征

过滤结果
  • 基于众包的新闻偏见分析与检测多维数据集

    2025年12月5日   

    数据集概述 本数据集包含九千篇涉及乌克兰危机的新闻文章中的两千零五十七句内容,由众包工作者对新闻偏见本身及隐藏假设、主观性、表征倾向三个维度进行标注,总计四万四千五百四十七个标签,为新闻偏见的分析与检测研究提供多维标注数据支持。 文件详解 文件名称: all-data-as-json.zip 文件格式: ZIP压缩包(.zip) 内容说明:...
    packageimg
  • 乌兹别克文学英译_Based_语言文化特征研究完整数据

    2025年12月5日   

    数据集概述 本数据集聚焦乌兹别克文学文本英译过程中的语言与文化特征,包含一篇相关研究的PDF文档,为翻译研究、文化传播等领域提供资料支持。 文件详解 文件名称: Usmonova Dona Satvoldiyevna .pdf 文件格式: PDF (.pdf) 内容说明: 该文档为研究乌兹别克文学文本英译语言与文化特征的相关资料,具体内容需查阅文档原文...
    packageimg
  • 比利时众议院议员数据集1995_2019

    2025年12月5日   

    数据集概述 该数据集包含1995至2019年间比利时众议院所有当选议员的政治背景特征数据,涵盖议员身份标识、所属政党、任期、语言、性别、议会任职年限等核心信息,为研究比利时议会政治结构与议员特征提供数据支持。 文件详解 文件名称: BelgianMPs_v1.csv 文件格式: CSV (.csv) 字段示例: mpidterm: 议员任期唯一标识...
    packageimg
  • 早期笈多王朝铭文_萨穆德拉笈多伽耶授予令_IN00004

    2025年12月5日   

    数据集概述 该数据集包含一份关于早期笈多王朝的铭文资料,具体为萨穆德拉笈多的伽耶授予令(IN00004)。资料源自《早期笈多国王铭文》一书,为研究古代印度政治、历史及铭文文献提供了原始资料支持。 文件详解 文件名称:IN00004 Gaya Grant of Samudragupta.pdf 文件格式:PDF (.pdf)...
    packageimg
  • childPoeDE_德国儿童诗歌计算与实验研究元数据

    2025年12月5日   

    数据集概述 该数据集是CHYLSA项目下的childPoeDE语料库元数据,包含一千零八十二首1991至2019年出版的德国儿童诗歌的元数据,涵盖诗歌层面(作者、长度、韵律等)、词元层面(词性、拟声词等)信息,以及词频表和处理脚本等。 文件详解 数据文件(CSV格式):...
    packageimg
  • 托嘎伊_穆罗德_家传箴言_作品中形容词的方言学分析数据集

    2025年12月5日   

    数据集概述 本数据集围绕托嘎伊·穆罗德作品《家传箴言》中形容词的方言学特征展开,通过分析作品中的形容词使用,探究其方言学属性与语言特点,为相关语言研究提供数据支持。 文件详解 文件名称: Turdiyeva Aziza Sobir qizi.pdf 文件格式: PDF (.pdf) 内容说明:...
    packageimg
  • IN02008_Tundaldevi_Based_铭文翻译资料完整数据

    2025年12月5日   

    数据集概述 本数据集包含IN02008编号的Tundaldevi铭文翻译资料,以PDF和DOCX两种格式的文档呈现,提供了该铭文的文本内容,为研究相关历史铭文提供基础资料。 文件详解 文件名称:IN02008 VII Tuṇḍāldevī one line Inscription.pdf 文件格式:PDF...
    packageimg
  • IN02085_Cyasaltole铭文2号翻译数据集

    2025年12月5日   

    数据集概述 该数据集包含IN02085 Cyasaltole铭文2号的翻译文件,提供了两种格式的文档,为研究该铭文内容提供基础资料。 文件详解 文件名称:IN02085 CXXXIX Cyasaltol (Patan).docx 文件格式:docx 内容说明:Cyasaltole铭文2号的翻译文档,格式便于编辑与内容提取 文件名称:IN02085...
    packageimg
  • 太平洋数字CLDF数据集2025

    2025年12月5日   

    数据集概述 该数据集是基于Barlow编辑的《太平洋数字:南岛语系和巴布亚语言数字术语集》的CLDF格式数据集,包含太平洋地区相关语言的数字术语收集内容。 文件详解 文件名称: numeralbank/barlowpacific-v1.7.zip 文件格式: ZIP压缩包 文件内容:...
    packageimg
  • 哥廷根印度语言电子文本注册中心湿婆文献数据集

    2025年12月4日   

    数据集概述 该数据集为哥廷根印度语言电子文本注册中心(GRETIL)收录的湿婆文献,包含八十二份HTML格式文件,覆盖湿婆教相关文本内容,为印度语言文学与宗教研究提供基础文本资源。 文件详解 文件类型:以.htm格式为主,共82个文件,占比百分之百...
    packageimg
  • 现代语言学中谚语_俗语与谜语研究的理论问题

    2025年12月4日   

    数据集概述 本数据集聚焦现代语言学领域中谚语、俗语与谜语的理论研究问题,包含一份相关主题的文档资料,为该领域的学术探讨提供参考。 文件详解 文件名称:Ismoilov Kakhramonjon Abdumuminovich.pdf 文件格式:PDF (.pdf)...
    packageimg
  • 基于选定语言工具的政治演讲分析数据集

    2025年12月4日   

    数据集概述 本数据集围绕政治演讲及致辞的语言特征分析展开,核心内容为使用特定语言工具对政治演讲文本进行的系统性研究成果。数据集以PDF文档形式呈现,为探索政治话语的语言结构、修辞策略及沟通效果提供了分析资料。 文件详解 数据集包含一个PDF格式的文档文件,具体如下: - 文件名称: Zhusupova Nurzada Sovetbekovna.pdf...
    packageimg
  • 早期英语书信扩展标注语料库抽样数据集

    2025年12月4日   

    数据集概述 本数据集是早期英语书信语料库(CEEC-400)18世纪部分的第三个公开版本,是未出版的《早期英语书信扩展标注语料库》(TCEECE)的抽样提取内容,包含书信元数据、编码说明文档及语料库文件,为早期英语语言研究提供标注语料资源。 文件详解 文件名称:CEECES1-metadata.txt 文件格式:TXT...
    packageimg
  • 波斯尼亚和黑塞哥维那议会辩论语料库1998_2018

    2025年12月4日   

    数据集概述 该数据集包含1998-2018年波斯尼亚和黑塞哥维那议会六个完整任期的议会辩论语料库,含超十二万七千篇演讲,同时提供议员及政党元数据,数据经清洗预处理,支持议会话语与政治研究。 文件详解 核心数据文件: BiH_2-7_term_final.RDS:R语言数据格式,存储六个任期的议会辩论语料库数据...
    packageimg
  • 全球顶级公司市值区域与语言分布数据集

    2025年4月15日   

    全球顶级公司市值区域与语言分布数据集 数据来源:互联网公开数据 标签:市值排行榜,全球企业,地区分布,语言特征,商业格局,经济趋势 数据概述...
    packageimg
  • 推特用户MBTI人格类型数据集

    2025年4月15日   

    推特用户MBTI人格类型数据集 数据来源:互联网公开数据 标签:推特用户,MBTI人格类型,文本分析,自然语言处理,机器学习,社交网络分析,行为特征,语言特征,网络特征 数据概述: 本数据集包含了8,328名推特用户的详细信息,这些用户在其个人资料中公开了他们的MBTI人格类型。数据集记录了每名用户的身份特征、行为特征、语言特征和网络特征。 -...
    packageimg
  • 世界语言结构数据库语言特征与分布数据集

    2025年4月14日   

    世界语言结构数据库语言特征与分布数据集 数据来源:互联网公开数据 标签:语言学,语言结构,语言特征,全球语言,WALS,语言分布,语言多样性,数据分析,地图可视化 数据概述: 本数据集基于《世界语言结构数据库》(WALS, World Atlas of Language...
    packageimg