找到494个数据集

标签: 信息抽取

过滤结果
  • 基于大语言模型的生命周期清单与环境影响数据检索框架数据集

    2025年11月29日   

    数据集概述 本数据集围绕Sustain-LLaMA框架构建,该框架通过分类、预训练、问答三阶段微调大语言模型,实现从科学文献中自动化检索生命周期清单(LCI)和环境影响数据,提升化工与塑料行业向净零排放转型的数据获取效率。 文件详解 该数据集按研究主题和任务阶段分类,包含以下核心文件类型: -...
    packageimg
  • 瑞德西韦作为SARS_CoV_2复制延迟易位抑制剂补充信息

    2025年11月29日   

    数据集概述 本数据集为研究论文《Remdesivir is a delayed translocation inhibitor of SARS CoV-2 replication》的补充信息文档,包含支持该研究结论的额外实验细节、数据或分析内容,为理解瑞德西韦抑制新冠病毒复制的机制提供补充资料。 文件详解 文件名称:...
    packageimg
  • 安徒生童话事件抽取数据集

    2025年11月29日   

    数据集概述 本数据集基于安徒生童话文本,通过事件抽取处理构建而成。数据源自三个公开平台的英文版本童话,经清洗与结构化处理,以JSON和CSV格式存储,包含童话原文、分句数据及事件抽取结果,适用于自然语言处理相关任务。 文件详解 文件名称:fairy_tales_andersen.fairy_tales.json 文件格式:JSON...
    packageimg
  • 新技术与持续意识形态_读者评论对少数宗教媒体视角支持的研究数据

    2025年11月29日   

    数据集概述 本数据集为研究论文《新技术,持续意识形态:读者评论对少数宗教媒体视角的支持》的配套数据,核心围绕读者评论与少数宗教媒体视角的关联展开,提供相关研究所需的文档资料。 文件详解 文件名称:research_data.docx 文件格式:DOCX(.docx)...
    packageimg
  • 科学与医学文本开放信息抽取评估数据集

    2025年11月28日   

    数据集概述 本数据集通过众包方式对Open IE 4和MinIE两款开放信息抽取工具的结果进行标注,评估其在科学与医学文本上的有效性。数据基于维基百科随机句子和OA-STM语料库随机句子构建,包含原始数据、处理代码、实验文件及分析代码等。 文件详解 该数据集包含2个目录和11个文件,具体说明如下: - 代码目录(code for applying...
    packageimg
  • 临床笔记知识增强混合抽取式摘要管道数据集

    2025年11月28日   

    数据集概述 该数据集包含四千九百九十九条医疗转录文本,围绕临床笔记知识增强混合抽取式摘要管道构建,涉及过敏/免疫学等医疗专科的转录内容,为临床文本摘要研究提供数据支持。 文件详解 文件名称:A Knowledge-Enhanced Hybrid Extractive Summarizati/mtsamples.csv 文件格式:CSV(.csv)...
    packageimg
  • Instagram账号黑客攻击防护指南

    2025年11月28日   

    数据集概述 本数据集为一份关于Instagram账号黑客攻击防护的指南文档,涵盖黑客常用攻击技术(如钓鱼、暴力破解等)、攻击造成的影响及具体防护措施,旨在提升用户对账号安全风险的认知与防护能力。 文件详解 文件名称: Hack Instagram Cara Melindungi Akun Anda dari Serangan Hacker.pdf...
    packageimg
  • 巴西BMF_Bovespa数据提取矩阵

    2025年11月28日   

    数据集概述 本数据集是一个辅助工具,用于正确提取巴西BMF&Bovespa交易所的历史数据。包含一个Excel格式的矩阵文件,为数据提取提供结构化支持。 文件详解 文件名称: Matriz de extracao BM&FBOVESPA.xlsx 文件格式: XLSX(Excel表格) 文件内容:...
    packageimg
  • 医学CT相关补充信息数据集

    2025年11月27日   

    数据集概述 本数据集为医学CT相关的补充信息集合,包含数据提取表格与文献补充材料两类文件,为医学CT相关研究提供辅助数据支持。 文件详解 文件名称: Supplementary Information/Data extraction table.xlsx 文件格式: XLSX 内容说明: 数据提取表格,可能包含医学CT相关研究的数据提取字段信息...
    packageimg
  • 宗教极端主义文本语料库

    2025年11月27日   

    数据集概述 该数据集是从社交网络收集的宗教极端主义文本语料库,主要来源于独立国家联合体(CIS)和中亚地区青年常用的社交平台,为相关文本分析提供基础数据支持。 文件详解 文件名称:Religious extremism and neutral text corpus.zip 文件格式:ZIP(压缩包)...
    packageimg
  • 塞尔维亚钣金制造业网络语义词汇库数据集

    2025年11月28日   

    数据集概述 本数据集是研究项目SM01的语言资源成果,包含基于塞尔维亚钣金制造业语料库构建的语义词汇库及相关辅助资源。词汇库涵盖概念实体、词形实体及关联关系统计数据,支持知识抽取相关爬虫工具应用,为制造业领域语义分析提供结构化数据基础。 文件详解 语义词汇库文件: lex_20170923_003408.rdf:RDF格式文件,存储语义词汇库数据...
    packageimg
  • 利什曼原虫HU3株脯氨酰_tRNA合成酶数据集

    2025年11月28日   

    数据集概述 本数据集包含利什曼原虫(HU3株)的脯氨酰-tRNA合成酶(ProRS)相关信息,通过文本文件记录该蛋白质的基础属性、物种来源及参考标识等核心内容。 文件详解 文件名称:LDHU3_18.1540.txt 文件格式:TXT(.txt) 字段映射: Wikidata:蛋白质对应的维基数据标识(如Q105278563) Protein...
    packageimg
  • 生物医学信息本体概念嵌入语义相关性测量数据集

    2025年11月28日   

    数据集概述 本数据集围绕生物医学信息本体的概念嵌入与语义相关性测量展开,通过扩展UMLS2015AB中CUI术语的维基百科定义信息,采用文档嵌入技术生成术语向量表示,为生物医学领域语义相似性模型研究提供数据支持。 文件详解 文件名称: MRDEF_WIKI_DOC_LABEL_PATH.csv 文件格式: CSV 字段示例:...
    packageimg
  • 二价金属核苷化数据集

    2025年11月28日   

    数据集概述 本数据集聚焦二价金属矿物促进的选择性核苷化研究,包含相关实验数据及高斯计算文件,为探究二价金属在核苷化过程中的作用提供数据支持。 文件详解 文件名称: Divalent Metal for Nucleosidation/Nucleosidation Experiments.rar 文件格式: RAR压缩包 内容说明:...
    packageimg
  • 社交媒体对心理健康影响的综合文献综述数据集

    2025年11月28日   

    数据集概述 本数据集是关于社交媒体对心理健康影响的综合文献综述研究资料,核心围绕过度社交媒体使用与抑郁、焦虑、睡眠障碍等负面心理健康结果的关联假设展开,综合了过去十年主流数据库的相关研究发现。 文件详解 该数据集包含一个文档文件,具体说明如下: - 文件名称: ACTION RESEARCH.docx - 文件格式: DOCX (.docx) -...
    packageimg
  • 艺术博物馆_医学院合作关系_博物馆教育者访谈记录

    2025年11月27日   

    数据集概述 本数据集为艺术博物馆与医学院合作关系相关的博物馆教育者访谈记录,聚焦合作建立与维护中的挑战、可持续发展关键及多方收益,为填补医学教育跨领域合作实证研究空白提供质性数据支持。 文件详解 文件名称:Art Museum-Medical School Partnerships - Interview Transcripts.pdf...
    packageimg
  • 纽约时报实体关系对齐数据集2005_2007

    2025年11月27日   

    数据集概述 该数据集基于2005-2006年纽约时报语料库的句子,通过Freebase实体进行对齐作为训练数据;2007年语料库句子作为测试数据。包含52种常见关系及无关系的NA类,提供训练与测试阶段的句子、实体对及关系事实数据,存储为压缩文件。 文件详解 文件名称:NYT/nyt.zip 文件格式:ZIP压缩包...
    packageimg
  • 专利问题_解决方案与优势语句黄金数据集

    2025年11月27日   

    数据集概述 该数据集包含两类专利相关数据:一是经人工标注(技术问题、解决方案、优势效果)的黄金集,二是用于模型评估的随机专利测试数据,为专利文本信息抽取研究提供标注基准与测试资源。 文件详解 文件名称: Test Data.csv 文件格式: CSV 核心字段:...
    packageimg
  • 绿色金融文献数据集

    2025年11月27日   

    数据集概述 该数据集为绿色金融领域的文献数据,包含一个文本文件,存储了与绿色金融主题相关的文献信息,为研究绿色金融领域的文献内容提供基础数据支持。 文件详解 文件名称: nckvyfbm8y-1/literature data.txt 文件格式: TXT(.txt) 内容说明: 包含绿色金融领域的文献数据,具体字段及内容需基于文件实际内容进一步解析。...
    packageimg
  • 印尼Tempo媒体人工智能新闻事实核查访谈转录数据集2025

    2025年11月27日   

    数据集概述 本数据集为印尼知名媒体Tempo编辑团队与记者的访谈转录内容,聚焦其作为人工智能新闻事实核查先行者的实践与观点,为研究媒体AI技术应用提供定性数据支持。 文件详解 文件名称: Interview Transcript with Tempo - ENG.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg