找到14个数据集

格式: ZIP 标签: 语言类型

过滤结果
  • 加拿大数字学术中心初步目录2024

    2026年2月15日 30 135 71

    数据集概述 本数据集为加拿大高校图书馆内数字学术中心的初步列表,由阿尔伯塔大学图书馆与信息研究硕士项目研究课程收集,包含机构名称、所在省份与城市、语言、成立时间等信息,共2个文件,是研究加拿大数字学术服务布局的基础资料。 文件详解 数据文件 文件名称:DSCs_in_Canada.csv 文件格式:CSV...
    packageimg
  • Zero_marking_Source_零标记语言核心论元语序研究数据集

    2026年1月21日 30 149 76

    数据集概述 本数据集源自Sinnemäki 2010年发表的论文《Word order in zero-marking languages》的GitLab仓库,包含经修正和补充的内容。数据集聚焦零标记语言中核心论元的语序特征,为语言学研究提供结构化的实证数据支持。 文件详解 文件名称:sinnemaki2010.zip 文件格式:ZIP...
    packageimg
  • Areal_diachronic_Slavic_论元标记时空趋势研究修正数据集

    2026年1月20日 30 156 99

    数据集概述 本数据集是论文《Areal and diachronic trends in argument flagging across Slavic》的修正版数据库,由多所高校及研究机构合作构建,聚焦斯拉夫语系中论元标记的区域分布与历时演变趋势。数据集包含一个文件,为语言学研究提供结构化的分析基础。 文件详解...
    packageimg
  • Assimilation_Directionality_希腊语与德语词典条目数据

    2026年1月19日 30 83 20

    数据集概述 本数据集包含带有[x]或[c]标记的希腊语与德语词典条目数据,聚焦于同化方向性主题。数据集仅含一个文件,无分层目录结构,未划分训练测试集、数据标签集或原始处理集,主要文件类型为.xlsx。 文件详解 文件名称:directionality of assimilation.data.xlsx 文件格式:XLSX...
    packageimg
  • Global_Stocktake_Based全球气候行动进展多语言机器学习分析数据

    2026年1月15日 30 111 70

    数据集概述 本数据集为《Progress on Climate Action: a Multilingual Machine Learning Analysis of the Global Stocktake》一文的配套数据,包含全球盘点气候行动相关的文本嵌入、文档项、主题关键词及段落、降维嵌入和元数据概述,支持气候变化领域的多语言文本分析研究。...
    packageimg
  • Universal_attractors_Based语言演化普遍吸引子研究数据集

    2026年1月15日 30 53 9

    数据集概述 本数据集是论文“Universal attractors in language evolution provide evidence for the kinds of efficiency pressures...
    packageimg
  • Indonesia_E_voting_Sentiment_Based_X平台印尼电子投票系统评论情感分析数据

    2025年12月29日 30 75 58

    数据集概述 本数据集包含印尼网民在X平台上关于印尼电子投票系统的评论数据,涵盖原始评论、翻译后内容及情感标注信息,共4个文件,支持对电子投票相关舆情的情感分析研究。 文件详解 文件名称:Translated_sentiment.xlsx 文件格式:XLSX 字段映射介绍:包含翻译后的印尼电子投票相关评论内容及对应情感分析结果...
    packageimg
  • Modelos_de_Conciencia_Ambiental_Based_教育环境环境意识模型文献综述数据

    2025年12月29日 30 182 106

    数据集概述 本数据集是关于教育环境中环境意识模型的文献综述摘要表格,整理了相关研究论文的核心信息,包括作者与标题、发表年份、期刊或来源、被引次数、关键词与摘要、出版详情、质量等级、语言及文档类型等,为环境教育领域的学术研究提供结构化参考。 文件详解 文件名称:Modelos_de_Conciencia_Ambiental_en Entornos...
    packageimg
  • 英文政治与新闻媒体类Telegram公共频道列表

    2025年12月18日 30 134 74

    数据集概述 该数据集包含英文政治与新闻媒体类的公共Telegram频道列表,涵盖频道名称、URL、用户名、分类等信息,以CSV和PDF两种格式呈现,为研究社交媒体信息传播提供基础数据。 文件详解 文件名称:Telegram_channels_EN.csv 文件格式:CSV...
    packageimg
  • 形态句法区分的不确定性与变异性测量评估补充材料

    2025年12月15日 30 63 56

    数据集概述 本数据集是《语言类型学》期刊相关论文的补充材料,围绕形态句法区分的三个核心问题(边界强度、构成、架构),提供研究使用的原始数据及统计分析(相关矩阵、随机森林、聚类验证)的代码与结果文档,支撑方法论问题的探讨。 文件详解...
    packageimg
  • 印尼人权紧急状态推特标签推文数据集2020

    2025年12月14日 30 34 4

    数据集概述 本数据集是通过Twint工具采集的、包含2020年12月18日至19日期间,带#IndonesiaHumanRightsSOS标签的推特数据,共约十万六千九百零三条记录,涵盖用户ID、用户名、推文内容等基础信息,还附带词云、高频词等分析样例,为研究该标签相关讨论提供支持。 文件详解 原始数据文件:...
    packageimg
  • PAN19跨领域作者分析数据集2019

    2025年12月11日 30 11 0

    数据集概述 该数据集为PAN19评测任务的训练数据,聚焦跨领域作者归属问题,核心场景为粉丝小说(Fanfiction)的跨 fandom 作者识别。数据集包含已知作者的多 fandom 粉丝小说样本与未知作者的目标 fandom 样本,支持开放集归属任务(真实作者可能不在候选列表中)。 文件详解 数据集为单个压缩包文件,具体说明如下: - 文件名称:...
    packageimg
  • 英乌两种语言中多元分类法的话语本质研究论文

    2025年12月10日 30 55 27

    数据集概述 该数据集包含一篇关于英语和乌兹别克语中多元分类法话语本质的研究论文,以PDF格式呈现,聚焦两种语言中多元分类法的话语特征分析。 文件详解 文件名称: Nazarova Sevara Jakhongir qizi.pdf 文件格式: PDF (.pdf) 文件内容: 研究论文,主题为英乌两种语言中多元分类法的话语本质 适用场景 语言学研究:...
    packageimg
  • 客户服务中心关系策略数据集-旅行与电信领域-2016-veeralakrishna

    2025年4月21日 30 96 75

    客户服务中心关系策略数据集-旅行与电信领域-2016-veeralakrishna 数据来源:互联网公开数据 标签:客户服务中心,关系策略,IVAs,智能虚拟助手,旅行,电信,对话数据,注释,用户意图,语言类型 数据概述:...
    packageimg