-
清真食品产品数据集
2025年12月16日 30 207 53
数据集概述 该数据集为清真食品相关的关联开放数据(Linked Open Data),以“turtle”格式存储,涉及清真食品产品的结构化数据信息,可支持数据关联与语义查询分析。 文件详解 文件名称: lodhalalturtle.zip 文件格式: ZIP压缩包 内容说明:...
-
金融新闻文本挖掘平行语料库数据集2007_2020
2025年12月15日 30 171 51
数据集概述 本数据集为金融领域的英汉平行新闻语料库,包含2007至2020年的60,473篇双语文档,涵盖新闻的标题、正文等核心内容,可用于金融领域的平行双语文本挖掘研究。 文件详解 文件名称:FT-en-zh.rar 文件格式:RAR压缩包...
-
论文_使用知识图谱嵌入和层次聚类的分类法提取_补充材料
2025年12月15日 30 186 108
数据集概述 该数据集为论文"使用知识图谱嵌入和层次聚类的分类法提取"的补充材料,包含非表达性分类法提取任务的输入数据、黄金标准,以及非表达性和表达性案例的提取分类法示例,可辅助理解论文研究方法与结果。 文件详解 readme.txt: 文本格式,说明文件内容,包括非表达性与表达性分类法提取的数据构成,如黄金标准文件、输入数据及提取结果文件的对应关系。...
-
多媒体信息检索数据集
2025年12月15日 30 121 117
数据集概述 该数据集围绕多媒体信息检索主题,包含一个PDF格式的文档文件,为相关领域的研究和学习提供基础资料支持。 文件详解 该数据集包含一个PDF格式的文档文件,具体说明如下: - 文件名称: MULTI MEDIA IR.pdf - 文件格式: PDF (.pdf) - 文件内容: 文档主题围绕多媒体信息检索展开,具体内容需通过文档内容获取...
-
开放科学的社会影响范围综述数据集
2025年12月14日 30 44 33
数据集概述 本数据集是“开放科学的社会影响范围综述”研究的成果,属于PathOS Horizon Europe项目的一部分,旨在探究开放科学的学术、经济和社会影响。研究分两阶段开展,包含学术数据库搜索、自动滚雪球搜索及灰色文献手动检索数据,通过PRISMA图展示研究流程。 文件详解 文档文件:...
-
Spotify_播放列表_Based_用户创建音乐内容分析完整数据
2025年12月13日 30 107 49
数据集概述 该数据集基于#nowplaying数据集中通过Spotify发布推文的用户子集,包含用户、其创建的播放列表及播放列表内的曲目信息,为音乐推荐相关研究提供结构化数据支持。 文件详解 文件名称: spotify_playlists.zip 文件格式: ZIP压缩包 包含内容: 压缩包内可能包含一个CSV格式的数据文件,字段包括:...
-
Agnus_Data_候选类型描述及真实URI数据集
2025年12月13日 30 201 186
数据集概述 该数据集包含多个压缩文件,涉及候选类型、描述及真实URI等内容,共六个文件,均为ZIP格式,无目录结构,未提供训练/测试、数据/标签或原始/处理数据的划分,无自述文件或内容预览。 文件详解 压缩文件集合:包含六个ZIP格式的压缩文件,具体如下: data_ACE.zip:ZIP格式压缩文件 data_KORE50.zip:ZIP格式压缩文件...
-
威胁情报决策本体开发补充材料
2025年12月12日 30 134 78
数据集概述 该数据集包含威胁情报决策本体(TIDO)开发过程中使用的补充材料,涵盖本体需求规范文档、知识图谱实例及SPARQL查询文件,为TIDO本体的构建与验证提供支持。 文件详解 TIDO_ORSD.xlsx: Excel格式文件,包含本体需求规范文档(ORSD)相关内容,具体包含: 用例表:已识别用例的描述及流程示例...
-
IODP第359航次样本报告数据集
2025年12月12日 30 182 33
数据集概述 本数据集为IODP第359航次的样本报告,包含样本测试的详细信息,涵盖位置/深度、类型/形态、测试内容、申请编号及数据库标识符等核心内容,以多种格式文件呈现样本相关数据及说明。 文件详解 SAMPLES-...
-
PAN19跨领域作者分析数据集2019
2025年12月11日 30 115 73
数据集概述 该数据集为PAN19评测任务的训练数据,聚焦跨领域作者归属问题,核心场景为粉丝小说(Fanfiction)的跨 fandom 作者识别。数据集包含已知作者的多 fandom 粉丝小说样本与未知作者的目标 fandom 样本,支持开放集归属任务(真实作者可能不在候选列表中)。 文件详解 数据集为单个压缩包文件,具体说明如下: - 文件名称:...
-
荷兰维基百科Palmetto位置存储Lucene索引数据集
2025年12月11日 30 53 42
数据集概述 本数据集是基于2015年11月2日荷兰维基百科数据生成的位置存储Lucene索引,用于配合Palmetto工具计算主题连贯性。包含索引文件、说明文档及案例研究报告,支持荷兰语资源的主题分析研究。 文件详解 文件名称: README.md 文件格式: Markdown (.md) 内容说明:...
-
MESINESP2西班牙语生物医学语义索引标注语料库
2025年12月11日 30 9 8
数据集概述 该数据集为MESINESP2任务生成的人工标注语料库,包含科学文献、临床试验、专利摘要三类西班牙语生物医学文档,由领域专家使用DeCS受控词汇标注,旨在推动非英语生物医学内容语义索引工具的开发。 文件详解 子任务语料压缩包:...
-
Search_Strategy_Based_搜索策略表2文献检索完整数据
2025年12月11日 30 137 69
数据集概述 本数据集包含一个PDF格式的文件,核心内容为“搜索策略表2”,可能用于系统性文献回顾或信息检索相关研究中的搜索策略说明。 文件详解 文件名称: Table 2 Search Strategy.pdf 文件格式: PDF (.pdf) 内容说明: 该文档为搜索策略相关的表格文件,具体字段或内容未提供详细描述。 适用场景 文献检索方法研究:...
-
人工智能在科学数据库文献检索中的应用比较数据集
2025年12月11日 30 122 84
数据集概述 该数据集包含在ChatGPT、Copilot和Gemini三种人工智能工具中执行文献检索命令的所有结果,内容围绕科学数据库文献检索中不同AI工具的搜索表达式比较展开,所有结果以PDF格式呈现,支持相关研究的验证与分析。 文件详解 该数据集包含十五个PDF格式文件,文件命名以不同AI工具和实验编号标识,具体如下:...
-
农业教育医学领域自动标引评估资源语料库与黄金标准索引数据集
2025年12月11日 30 148 98
数据集概述 该数据集包含农业、教育、医学三个领域的语料库及其对应的黄金标准索引,用于自动标引系统的评估。每个领域语料库含不同规模的文档集合,文档包含标题、摘要等元数据,黄金标准索引来自各领域专业数据库。 文件详解 文件名称:Corpora+Gold_Standard_Index.zip 文件格式:ZIP(.zip) 包含内容:...
-
成人肥胖管理国际临床指南检索策略数据集
2025年12月11日 30 208 128
数据集概述 该数据集包含针对成人肥胖管理国际临床指南检索的完整、可复现的检索策略,围绕“爱尔兰及国际上当前使用的成人肥胖管理相关临床指南”这一研究问题设计,为相关研究提供检索方法支持。 文件详解 文件名称: Obesity Search Strategies_zenodo.pdf 文件格式: PDF (.pdf) 文件内容:...
-
Bottrop_Boy_Johannes_Apotheke_Based_医疗药房场景完整数据集合
2025年12月11日 30 84 46
数据集概述 本数据集包含与Bottrop-Boy Johannes-Apotheke相关的两类文件,分别为TIFF格式的栅格文件和PDF格式的文档文件,各占总数的百分之五十,为相关场景的信息查询或分析提供基础数据支持。 文件详解 文件名称:08560.tiff 文件格式:TIFF(.tiff) 所属类别:栅格文件(raster_files)...
-
Cyberlaw_Forgery_Based_网络法与伪造领域文献综述分析数据
2025年12月10日 30 186 106
数据集概述 该数据集为网络法与伪造主题的文献综述资料,包含文献元数据文件、结构化数据文件及图片文件,覆盖文献的标题、发表信息、作者、摘要等核心内容,为相关领域的文献分析提供支持。 文件详解 文献元数据文件(.bib格式): 包含lens-export.bib、lens-export(1).bib、lens-...
-
PAN14文本对齐原创性测试语料库2014
2025年12月9日 30 87 59
数据集概述 本数据集为PAN14任务提供的测试语料库,包含文档对数据,其中部分文档可能存在经自动混淆处理的复用文本,用于研究文本原创性检测及对齐问题。 文件详解 文件名称: pan14-text-alignment-test-corpus3-2014-05-14.zip 文件格式: ZIP压缩包 内容说明:...
-
音乐数据挖掘增强开放数据集2019
2025年12月8日 30 46 38
数据集概述 该数据集是基于音乐流行度分类构建的音乐元素(艺术家、歌曲、专辑等)增强开放数据集,整合了流行度、元数据、声学及歌词特征三类来源数据,包含1962-2018年的流行度评分与分类,以SQL数据库和压缩CSV格式开放。 文件详解 文件名称: musicoset_metadata.zip,文件格式: ZIP,可能包含音乐、艺术家、专辑的元数据文件...



