找到73个数据集

标签: TSV格式

过滤结果
  • MacArthur_Based莺类生态位分化重新评估数据_进化框架分析

    2026年1月22日 30 177 119

    数据集概述 本数据集包含重新评估MacArthur莺类生态位分化的相关数据与代码,涉及莺类形态测量、觅食行为及粪便宏条形码饮食分析,结合系统发育框架研究物种竞争与生态位分化机制,共32个文件,涵盖原始数据、处理脚本及分析结果。 文件详解 数据文件...
    packageimg
  • Mapping_plague_Based_自然语言处理鼠疫地理映射数据集

    2026年1月21日 30 13 1

    数据集概述 本数据集为“通过自然语言处理映射鼠疫”项目的配套数据与代码,包含基于Sticker(1908)和Biraben(1975)两部鼠疫论著生成的原始文件、中间数据产品及最终地理编码鼠疫数据集,用于研究NLP库与地理编码服务从叙事文本生成量化数据集的性能。 文件详解 核心数据文件...
    packageimg
  • Phenoscape_Based_基因扰动与表型进化关联研究数据_2015

    2026年1月21日 30 206 103

    数据集概述 本数据集来源于Phenoscape知识库应用研究,包含基因表型谱与分类单元进化表型谱数据,支持基因扰动与表型进化的关联分析。数据通过标准本体注释表型,可实现进化表型与模式生物遗传扰动表型的比较,包含语义相似性结果等文件,共6个文件。 文件详解 README文档...
    packageimg
  • CPLP_tuites_Based_葡萄牙语多中心推特语料库数据_2022

    2026年1月21日 30 122 62

    数据集概述 本数据集为CPLP:tuítes葡萄牙语多中心推特语料库,包含来自安哥拉、巴西、佛得角等七个葡语国家53个新闻机构账号的125,827条推特,共2,633,507个词元。涵盖原始推文、元数据及标注文件三类资源,是研究葡萄牙语多中心变体的结构化语料资源。 文件详解 原始推文文件 文件名称:tweets_untagged.zip...
    packageimg
  • MeSDiCon_Based_西班牙语医学疾病症状候选名称词汇集_未过滤初始版

    2026年1月19日 30 69 0

    数据集概述 本数据集为MeSDiCon(西班牙语医学疾病与症状名称词汇集)的未过滤初始版本,包含西班牙语临床文本中提及的疾病和症状候选名称列表。数据通过自动识别、翻译及临床语料匹配生成,每条记录关联目标术语命名空间(MeSH或OMIM)及对应标识符,提供术语在2000万份西班牙语临床笔记中的出现频率和文档频率。 文件详解...
    packageimg
  • ESNS_2023_音乐产业专业人士对音乐流媒体服务及推荐算法的观点调查问卷数据

    2026年1月19日 30 25 19

    数据集概述 本数据集包含2023年Eurosonic Noorderslag活动参与者的问卷响应数据,聚焦音乐行业专业人士对流媒体服务及推荐系统的看法。数据覆盖知情同意、流媒体服务角色、推荐系统透明度与可控性、多样性需求等维度,为研究音乐行业利益相关者视角提供支撑。 文件详解 说明文件(README.txt) 文件名称:README.txt...
    packageimg
  • BatLit_Reference_Metadata_蝙蝠科学文献项目元数据_v0_7

    2026年1月18日 30 165 147

    数据集概述 本数据集为Bat Literature Project(BatLit)v0.7版本的元数据与引用列表,包含蝙蝠相关科学文献的Zotero元数据、引用记录及与Zenodo平台的关联信息。数据通过Preston工具追踪生成,提供多种格式的文献索引文件,支持蝙蝠研究文献的发现与整合分析。 文件详解 元数据归档文件...
    packageimg
  • cichlid_adaptive_radiations_基因组分化平行性评估数据

    2026年1月15日 30 118 40

    数据集概述 本数据集基于三种同域慈鲷物种对的全基因组重测序数据,这些物种对具有相似功能和生态分化但演化年龄不同。数据记录了线粒体与核基因组分化随时间增加的特征,以及适应性辐射过程中基因组分化的平行性模式,支持对物种形成连续演化过程的研究。 文件详解 数据文件(.tsv格式)...
    packageimg
  • RMTable_Consolidated_Faraday旋转量天文射电源综合目录数据

    2026年1月14日 30 171 156

    数据集概述 本数据集是天文射电源法拉第旋转量(Faraday Rotation Measures)及相关属性的综合目录,整合了1980年至今天文学文献中的多个已发布目录。数据已转换为RMTable标准格式,提供FITS二进制表、制表符分隔ASCII和VOTable XML三种格式,可通过专用Python模块RMTable便捷访问与处理。 文件详解...
    packageimg
  • SeMRA_Anatomy_Mappings_Database_解剖学命名资源景观分析数据

    2026年1月13日 30 35 8

    数据集概述 本数据集为SeMRA解剖学映射数据库,支持解剖学命名资源景观分析,包含原始与处理后的映射数据、统计文件、可视化图表及配置脚本等27个文件,覆盖Uberon、MeSH等多类解剖学本体的映射关系与统计信息,可用于解剖学命名资源的整合与分析研究。 文件详解 文档类文件 文件名称:README.md 文件格式:MD...
    packageimg
  • phylodynamics_Based_人流感B病毒维多利亚与山形谱系系统动力学对比研究数据

    2026年1月12日 30 66 20

    数据集概述 本数据集来自人流感B病毒系统动力学对比研究,包含澳大利亚和新西兰26000余株流感B病毒流行病学样本中的900余条全基因组分析数据,揭示维多利亚和山形两个共循环谱系在传播、感染年龄及受体结合偏好等方面的差异,为流感B病毒进化与流行病学研究提供支撑,共9个文件。 文件详解 数据文件 文件名称:cases.tsv 文件格式:TSV...
    packageimg
  • Computed_Embeddings_Based_CoV知识图谱RotatE实体关系嵌入数据

    2026年1月12日 30 22 3

    数据集概述 本数据集包含基于RotatE模型训练的CoV知识图谱实体与关系嵌入结果,涵盖训练、验证和测试阶段的三元组数据、实体及关系映射、嵌入向量文件、训练日志和配置文件,共10个文件,用于CoV领域知识图谱的表示学习与分析。 文件详解 核心数据文件 文件名称:kg_train.tsv、kg_valid.tsv、kg_test.tsv 文件格式:TSV...
    packageimg
  • NER_Tutorial_Maschinelles_Lernen_数字文学机器学习NER教程训练数据

    2026年1月4日 30 134 55

    数据集概述 本数据集是NER教程“数字文学中的机器学习”所需的全部数据,包含模型训练用的信件分析相关文件,支持NER模型的训练与测试。数据集共5个文件,覆盖文本、表格、文档等多种格式,为数字文学领域的机器学习任务提供基础数据支持。 文件详解 数据文件 文件名称:ner_kernkorpus.txt 文件格式:TXT...
    packageimg
  • Local_Geohistory_Project_Based_康涅狄格州法律索引数据1789_1943

    2026年1月3日 30 84 11

    数据集概述 本数据集是Local Geohistory Project的一部分,旨在传播康涅狄格州的法律索引数据,涵盖1789年至1943年的私人和特殊法律。这类法律针对特定个人、实体或地区,是新英格兰地区调整市政边界和政府形式的主要方式。数据集包含一个TSV格式的法律索引文件,无法律全文或链接。 文件详解 文件名称:law-indexes-...
    packageimg
  • FrankensteinVariorum_기반_메리_셸리_프랑켄슈타인_텍스트_변이_교육용_데이터

    2026年1月3日 30 110 57

    数据集概述 本数据集是《数字人文学的引路人》第1章的教育用示例文件,包含玛丽·雪莱小说《弗兰肯斯坦》1818年初版与1831年修订版之间的文本变异,以多种数据格式结构化呈现。数据集分为“基础示例”和“深化示例”两类,共8个文件,旨在帮助学习者掌握人文学文本向计算机可分析数据的转换过程,理解数字版本基础并比较不同数据格式的特征。 文件详解...
    packageimg
  • TDWG_2023_Species_Occurrence_Test_Set_生物多样性信息任务评估数据

    2026年1月3日 30 135 40

    数据集概述 本数据集是论文《Using ChatGPT with Confidence for Biodiversity-Related Information Tasks》(TDWG 2023...
    packageimg
  • terranigra_dataset_Based_Fictibacillus_terranigra分析数据集

    2025年12月29日 30 120 14

    数据集概述 本数据集包含Fictibacillus terranigra的分析数据,共13个文件,涵盖基因注释、功能预测、代谢分析等内容,涉及blastKOALA、Prokka注释、microtrait筛选、dbcan3分析、DRAM及METABOLIC结果等多种类型文件,可用于研究该菌株的基因功能与代谢特征。 文件详解 基因功能注释文件...
    packageimg
  • 全球200万SARS_CoV_2基因组数据集_Viridian_Maple0_6_11处理

    2025年12月24日 30 159 113

    数据集概述 该数据集包含经MAPLE0.6.11处理的全球200万条SARS-CoV-2基因组数据,源自Viridian平台。涵盖基因组比对、变异信息、进化树及元数据等多类型文件,为新冠病毒基因组研究提供基础数据支持。 文件详解 元数据文件:...
    packageimg
  • 人类粪便中具群游能力单菌种分离数据集

    2025年12月23日 30 152 64

    数据集概述 该数据集包含从人类粪便中分离具群游能力单菌种的实验相关数据,涵盖测序元数据、MALDI质谱数据、实验图片及授权文件等,为研究肠道菌群中具群游能力细菌的特性提供数据支持。 文件详解 测序元数据文件: SEQUENCING metadata-13677325-processed-...
    packageimg
  • 德国常规疫苗接种覆盖率数据集_KV_Impfsurveillance

    2025年12月23日 30 4 1

    数据集概述 该数据集呈现德国常规疫苗接种覆盖率数据,由罗伯特·科赫研究所(RKI)基于法定医疗保险医生协会(KVen)的KV-Impfsurveillance系统数据整理,包含儿童、成人及HPV疫苗接种覆盖率等结构化数据文件,支持多维度疫苗接种情况分析。 文件详解 儿童疫苗接种覆盖率数据 KVIS_Impfquoten_Kinder.xlsx:...
    packageimg