-
InstructIE_Based_双语指令信息抽取数据集
2026年1月30日 30 13 7
数据集概述 本数据集为InstructIE双语指令信息抽取数据集,包含中文和英文两种语言的指令调优数据,覆盖事件、自然科学、建筑结构等多个类别。数据集由9个文件组成,主要文件格式为JSON和MD,适用于信息抽取任务的模型训练与评估。 文件详解 说明文档 文件名称:README_ZH.md、README.md 文件格式:MD...
-
EveOut_Based_新闻事件与媒体关系可复现研究数据集
2026年1月29日 30 20 12
数据集概述 本数据集为EveOut,包含2019年1月至2020年5月期间收集的七万七千五百四十五条新闻事件数据。数据来源于全球排名前五的新闻媒体,通过Event Registry API获取,旨在支持事件与媒体选择关系的研究,可用于分析事件选择偏差、地理分布、时间特征等多维度内容。 文件详解 文档类文件 文件名称:README.txt...
-
真实室内声音事件分类数据集
2025年12月12日 30 135 38
数据集概述 该数据集包含一千八百个真实室内声音事件的二千四百七十九条录音,涵盖十八类事件,如门、家具移动、语音等。每条录音附带事件类别、动作、材质、强度等额外信息,采样频率为四万四千一百赫兹,采样位数为二十四位,总时长约三千六百二十四点五一秒,为声音事件分类算法测试提供数据支持。 文件详解 文件名称:...



