找到8个数据集

标签: 语言模式

过滤结果
  • MHDL_Based_1922电影行业贸易出版物语料库数据

    2026年1月29日 30 52 21

    数据集概述 本数据集为1922年电影行业贸易出版物语料库,含23种出版物的DJVU文本文件及相似度分析代码压缩包。聚焦1922年7月电影行业贸易出版物竞争格局,覆盖知名刊物(如Variety)、被遗忘刊物、影迷杂志、技术期刊等,支持研究电影行业贸易出版文化及期刊间差异。 文件详解 文件名称:1922DataFiles.zip 文件格式:ZIP...
    packageimg
  • P_demotion_Extended_Sample_语言学实验扩展样本数据集

    2026年1月20日 30 122 44

    数据集概述 本数据集是Polonez Bis项目(编号2021/43/P/HS2/01395)的组成部分,由Adam Mickiewicz University的Katarzyna Janic团队创建并填充,数据收集自语法挖掘及语言专家咨询。数据集对应Polonez Bis 1项目的扩展样本,包含1个Excel文件,当前处于待调整状态。 文件详解...
    packageimg
  • Chronicling_America_Based_1810_1861美国报纸孤立主义语言AI分析数据集

    2025年12月31日 30 137 32

    数据集概述 本数据集包含基于Chronicling America数据集的AI驱动搜索与分析方法及结果,聚焦1810-1861年美国报纸中与外交事务相关的“isolation”“isolated”词汇使用情况,含2个文件,支持美国历史孤立主义语言模式研究。 文件详解 方法论文档 文件名称:Methodology for Chronicling...
    packageimg
  • 可核查事实主张基准数据集

    2025年12月21日 30 78 53

    数据集概述 该数据集为可核查事实主张的基准数据集,包含1960-2016年美国大选总统辩论中提取的陈述,以及人工标注的可核查性标签,将每条陈述分为非事实陈述、不重要事实陈述和可核查事实陈述三类。 文件详解 文件名称: ClaimBuster_Datasets.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 通用20种模式数据集_含参考文献

    2025年12月10日 30 202 140

    数据集概述 该数据集包含覆盖两千多种语言的通用20种模式相关数据及参考文献,持续更新中。同时提供包含一千六百八十七种语言的历史样本,可通过指定网站获取,为语言研究提供支持。 文件详解 U20LanguageAppendix(Terraling).pdf:PDF格式文件,可能包含通用20种模式相关的语言附录内容...
    packageimg
  • DebatePorts_Args_me_2019_Based_论点检索数据集完整数据

    2025年12月9日 30 175 38

    数据集概述 该数据集为args.me语料库1.0的已清理版本,包含2019年年中从Debatewise、IDebate.org、Debatepedia和Debate.org四个辩论门户网站爬取的382545条论点,为论点检索研究提供结构化数据支持。 文件详解 文件名称:argsme-1.0-cleaned.zip 文件格式:ZIP压缩包(.zip)...
    packageimg
  • 在线用户反馈质量特征分类研究附录与补充材料

    2025年12月5日 30 28 10

    数据集概述 本数据集是《在线用户反馈中质量特征的分类》研究的在线附录与补充材料,包含论文各部分的补充或完整内容PDF文档,以及整理了研究工件、数据和结果的压缩包,为研究低数据场景下质量特征分类方法提供支持。 文件详解 文件名称:...
    packageimg
  • 特立尼达犯罪相关新闻文章数据集2011-2023-chelcbee

    2025年4月24日 30 169 135

    特立尼达犯罪相关新闻文章数据集2011-2023-chelcbee 数据来源:互联网公开数据 标签:特立尼达,犯罪,新闻,数据分析,关键词分析,犯罪趋势,语言模式,文本清洗,机器学习 数据概述: 本数据集来自Loop News...
    packageimg