-
季节性流感与SARS_CoV_2进化关系研究补充数据集
数据集概述 该数据集是关于季节性流感与SARS-CoV-2进化关系研究的补充数据,包含表格与文档类文件,为相关研究提供数据支持。 文件详解 数据表格文件(CSV格式): S2_Table.csv:包含季节性流感(如seasonal-flu-h3n2-ha-2016-2018)与SARS-...
-
重定向图与身份图URI分析数据集
数据集概述 该数据集聚焦LOD云(链接开放数据云)中统一资源标识符(URI)的重定向关系,基于2015年语义网爬取的sameAs.cc身份图实体,包含四组抽样实体的重定向关系数据,支持重定向语义、实体演化及重定向图属性的分析研究。 文件详解 数据文件(TSV格式):...
-
CETAF_DiSSCo_COVID19_TAF生物多样性相关知识中心工作组_索引生物相互作用与综述摘要数据集2020
数据集概述 本数据集是CETAF与DiSSCo联合发起的COVID19-TAF生物多样性知识中心工作组的成果,包含2020年4月至10月期间通过该工作组活动识别并由GloBI索引的生物相互作用数据,以及相关的综述摘要文件,为研究COVID-19相关生物多样性关联提供支持。 文件详解 该数据集包含多个文件,具体说明如下: - 综述摘要与统计文件: -...
-
印度艺术音乐主音数据集
数据集概述 该数据集包含印度艺术音乐的音频片段及人工标注的主音音高数据,每个片段配有编辑元数据。数据支持开发和评估印度艺术音乐自动主音识别的计算方法,包含卡纳提克、印度斯坦等不同传统类型,覆盖声乐、器乐及不同性别歌手的音频,是该领域较大规模的主音识别数据集。 文件详解 核心压缩文件: indian_art_music_tonic_1.0.zip:...
-
奥克语标注语料库
数据集概述 该数据集为奥克语标注语料库,包含经人工标注词性和词元的奥克语文本,共28篇文档、12425个词元,标注流程详见指定学术文章,为奥克语自然语言处理研究提供基础数据。 文件详解 文件名称: CorpusRestaureOccitan.zip 文件格式: ZIP压缩包 内容说明: 压缩包内包含采用TSV CoNLL-...
-
hexylena博士答辩期间心率与体温数据集
数据集概述 本数据集记录了数据主体hexylena在博士答辩期间通过FitBit Charge 5设备采集的心率与体温数据,涵盖睡眠、骑行、答辩相关环节(如Zweetkamer、Lekenpraatje、质询)等时间段,附原始数据文件及可视化图表。 文件详解 核心数据文件(.tsv格式):...
-
印地语文本宣传数据集2023_Prop_HiT
数据集概述 本数据集是针对印地语文本的宣传检测数据集,包含来自三十二家印地语新闻网站的七百九十篇文章,采用人工标注方式标记十八种宣传技术。数据按训练集(五百五十篇)和测试集(二百四十篇)划分,为印地语宣传内容识别研究提供结构化标注数据。 文件详解 该数据集包含以下文件: - 压缩包文件: - Prop-HiT Dataset.zip:...
-
人类代谢组学衰老时钟五组图表与补充数据
数据集概述 该数据集包含与人类代谢组学衰老时钟相关的研究图表和补充数据,涵盖论文中的核心图表文件及大型表格补充数据,为理解代谢组学衰老时钟的研究结果提供支持。 文件详解 图表文件(PDF格式):共5个,包括Fig1.pdf、Fig2.pdf、Fig3.pdf、Fig4.pdf、Fig5.pdf,为研究论文中的核心结果图表。...
-
Xff_Temecula1菌株基因组Bakta重注释数据集
数据集概述 本数据集是使用Bakta流程对Xff菌株Temecula1(NCBI登录号GCF_000007245.1)基因组进行的重注释结果,包含基因组序列、注释信息、统计摘要等多种格式文件,为研究该菌株的基因组结构与功能提供支持。 文件详解 该数据集包含十四种不同格式的文件,具体说明如下: - 基因组序列文件: -...
-
OpenITI千纪百万词作者数据集2023_1_8
数据集概述 该数据集基于OpenITI语料库2023.1.8版本及对应文本复用数据,聚焦公元1000 AH及之前语料库中字数超百万的“百万词作者”,包含其作品元数据、字数统计等信息,用于分析少数作者对语料库的贡献占比。 文件详解...
-
SNPector_Supplementary_Based_基因序列变异多格式数据完整集合
数据集概述 该数据集为SNPector相关的补充数据,包含输入与输出数据,涉及基因序列、遗传变异等信息。文件类型多样,涵盖TSV、CSV、TXT等格式,为相关基因分析提供多维度的数据支持。 文件详解 数据文件(共6个): Supplementary (3).tsv、Supplementary (4).tsv、Supplementary...
-
WorldFAIR试点数据集2023_访问数据溯源
数据集概述 本数据集记录了WorldFAIR试点项目中访问数据的溯源信息,基于2005至2006年的实地花卉访问观察数据,通过REBIPP模板转换为结构化数据,包含元数据和交互记录表格,并提供完整性验证方法与机器可读的RDF格式溯源信息。 文件详解 核心数据文件:...
-
临床与实验生物学转录组学研究补充数据集
数据集概述 本数据集是《Transcriptomics for clinical and experimental biology research: hang on a seq》论文的补充资料,包含生成论文图表的R脚本、源数据文件及额外图表,支持转录组学相关研究的复现与扩展分析。 文件详解 该数据集包含以下文件类型及内容: - 代码文件: -...
-
IODP_395C_GEODESC_Based_海洋岩心描述数据整合分析完整文档集
数据集概述 该数据集包含国际大洋发现计划(IODP)395C航次的GEODESC描述文件及目录,涵盖岩心材料的描述性数据、元数据文件和汇总信息列表,为岩心样本的描述信息分析提供支持。 文件详解 文件名称: GEODESC-README.txt 文件格式: TXT(.txt) 内容说明:...
-
复杂休闲搜索请求CRISPS编码方案辅助材料
数据集概述 本数据集是CRISPS编码方案的辅助材料,该方案用于分析书籍、游戏、电影和音乐领域的复杂休闲搜索请求。包含编码手册、编码方案图表、机器可读编码表、带编码的搜索请求数据及文章附录等材料。 文件详解 编码手册与示例文件: codebook.pdf: PDF格式,包含四个领域的CRISPS编码手册、各编码示例及领域间编码对比 编码方案文件:...
-
Galaxy中Circos可视化GTN教程数据集
数据集概述 本数据集为Galaxy平台中Circos可视化GTN教程所需的配套数据,包含核型定义、基因信息、密度统计、链接关系等多种类型的生物信息学数据文件,支持Circos可视化分析的实践操作。 文件详解 核心数据文件: 核型相关文件:如data-karyotype-README(TXT格式,核型文件说明)、data-karyotype-...
-
细菌UL23_01_03的DFAST分析数据集
数据集概述 本数据集为细菌UL23-01-03的DFAST分析结果,包含基因组序列、注释信息、质量检查报告及功能分析数据,覆盖RNA、蛋白质、基因特征等多维度生物学信息,为该细菌的分子生物学研究提供全面数据支持。 文件详解 序列与注释文件: rna.fna.txt:TXT格式,包含tRNA等RNA序列信息...
-
仓鼠基因间序列数据集
数据集概述 本数据集包含为Bgee 15.0版本构建的仓鼠(Mesocricetus auratus)基因间序列数据,基于十六个文库生成。涵盖基因间序列文件、分类统计数据及分布可视化文档,为基因表达分析提供基础数据支持。 文件详解 基因间序列文件: ref_intergenic.fa.gz: GZ压缩的FASTA文件,可能包含参考基因间序列数据...
-
扬_斯韦林克管风琴作品带注释乐谱语料库
数据集概述 本数据集为扬·斯韦林克管风琴作品的带注释乐谱语料库,源自DCML语料库计划,包含乐谱文件及结构化标注数据,支持音乐学实证研究,需通过指定文档页面获取使用说明。 文件详解 压缩包文件:...
-
发酵食品预测生物活性肽数据集
数据集概述 本数据集包含发酵食品来源生物活性肽的预测结果,涵盖5项发酵食品蛋白质组学研究、约200株BacDive数据库的发酵食品细菌分离株及约11500个发酵食品宏基因组组装基因组(MAGs)。通过bac-mining和peptide-bioactivity-...



