找到100个数据集

标签: 信息抽取

过滤结果
  • 问答数据集涵盖广泛主题的高质量问答内容

    2025年4月25日   

    标题:问答数据集涵盖广泛主题的高质量问答内容 数据内容:该数据集包含问答对的结构化信息,主要包括以下字段: - question:问题描述,包含3510种不同值 - answer:对应问题的答案,包含3512种不同值 - (未命名字段):3725种不同值,可能是问题类别或其他元数据 数据来源:互联网公开数据...
    packageimg
  • 全球新闻长上下文模型数据集

    2025年4月25日   

    全球新闻长上下文模型数据集 数据来源:互联网公开数据 标签:全球新闻,长上下文模型,新闻分析,主题分类,数据挖掘,自然语言处理,信息抽取 数据概述: 本数据集基于CC-News,包含来自全球的新闻文章,经过主题筛选,适合用于长上下文模型的演示。数据集通过关键词过滤方法,如“AI突破”、“绿色科技”等,筛选出与特定主题相关的文章。 数据用途概述:...
    packageimg
  • IBM辩论证据句子数据集IBMDebaterEvidenceSentencesDataset-kaggleqrdl

    2025年4月25日   

    IBM辩论证据句子数据集IBMDebaterEvidenceSentencesDataset-kaggleqrdl 数据来源:互联网公开数据 标签:自然语言处理,辩论,数据集,文本分析,语义理解,证据检索,信息抽取,人工智能 数据概述: 该数据集由IBM Debater项目提供,包含从大规模文本语料库中提取的辩论相关的证据句子。主要特征如下:...
    packageimg
  • 事件原始数据数据集EventsRawDataDataset-happy1996

    2025年4月24日   

    事件原始数据数据集EventsRawDataDataset-happy1996 数据来源:互联网公开数据 标签:事件,数据集,文本分析,自然语言处理,信息抽取,舆情分析,社会科学,新闻 数据概述: 该数据集包含来自不同来源的事件原始数据,记录了各种社会,政治,经济等领域的事件信息。主要特征如下:...
    packageimg
  • 带时间戳的文本标注数据集-vanniagm

    2025年4月24日   

    带时间戳的文本标注数据集-vanniagm 数据来源:互联网公开数据 标签:文本数据,时间戳,标注,自然语言处理,数据集,文本分析,信息抽取,机器学习 数据概述: 该数据集包含带时间戳的文本数据,记录了文本内容及其对应的时间信息。主要特征如下: 时间跨度:数据记录的时间范围取决于原始文本数据的时间跨度,可能从数小时到数年不等。...
    packageimg
  • 命名实体识别数据集NamedEntityRecognitionDataset-nileshmalode1

    2025年4月24日   

    命名实体识别数据集NamedEntityRecognitionDataset-nileshmalode1 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,文本分析,机器学习,信息抽取,深度学习,人工智能 数据概述: 该数据集包含标注好的文本数据,用于训练和评估命名实体识别(NER)模型。主要特征如下:...
    packageimg
  • 索赔分解-重构与验证数据集ClaimDecomposition-Restructuring-andValidationDataset-swethabalram2410

    2025年4月24日   

    索赔分解-重构与验证数据集ClaimDecomposition-Restructuring-andValidationDataset-swethabalram2410 数据来源:互联网公开数据 标签:索赔分析,自然语言处理,文本分析,数据集,信息抽取,机器学习,金融科技,风险管理 数据概述:...
    packageimg
  • 讯飞农业领域数据集-xuyatian

    2025年4月24日   

    讯飞农业领域数据集-xuyatian 数据来源:互联网公开数据 标签:农业,数据集,自然语言处理,人工智能,文本分析,农业科技,信息抽取,命名实体识别 数据概述:该数据集包含来自讯飞公开的农业领域相关数据,涵盖了农业领域的技术文档,新闻报道,专家访谈,学术论文等多种文本类型。主要特征如下:...
    packageimg
  • 德国新闻文本命名实体识别数据集-rodionshkokov

    2025年4月24日   

    德国新闻文本命名实体识别数据集-rodionshkokov 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,德语,NLP,文本分析,信息抽取,机器学习 数据概述: 该数据集包含来自德国新闻网站的文本数据,用于训练和评估命名实体识别(NER)模型。主要特征如下: 时间跨度: 数据记录的时间范围未明确给出,但数据内容主要来源于新闻报道。...
    packageimg
  • 餐厅概览摘要数据集RestaurantOverviewSummarizationDataset-kjeevan

    2025年4月23日   

    餐厅概览摘要数据集RestaurantOverviewSummarizationDataset-kjeevan 数据来源:互联网公开数据 标签:餐厅,摘要,自然语言处理,文本生成,数据集,餐饮业,信息抽取,人工智能 数据概述: 该数据集包含来自互联网的餐厅信息,主要用于生成餐厅概览摘要。主要特征如下:...
    packageimg
  • 命名实体识别数据集NERDataPS-NamedEntityRecognitionDataSet-hharshsharma2098

    2025年4月22日   

    命名实体识别数据集NERDataPS-NamedEntityRecognitionDataSet-hharshsharma2098 数据来源:互联网公开数据 标签:命名实体识别,数据集,自然语言处理,文本挖掘,机器学习,人工智能,语言学,信息抽取...
    packageimg
  • 命名实体识别数据集NER-animeshnareda

    2025年4月22日   

    命名实体识别数据集NER-animeshnareda 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,文本分析,机器学习,信息抽取,人工智能,NLP 数据概述:该数据集包含来自多个领域的文本数据,用于训练和评估命名实体识别模型。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖了不同时期的新闻,文章和报告等。...
    packageimg
  • 知识图谱与图注意力网络融合数据集KN-GATDataset-purnimahsv

    2025年4月22日   

    知识图谱与图注意力网络融合数据集KN-GATDataset-purnimahsv 数据来源:互联网公开数据 标签:知识图谱,图注意力网络,数据集,图神经网络,自然语言处理,机器学习,信息抽取,数据融合 数据概述: 该数据集包含知识图谱与图注意力网络(GAT)结合的数据,记录了知识图谱中的实体,关系以及图注意力网络的注意力权重。主要特征如下:...
    packageimg
  • 问题回答问答数据集

    2025年4月20日   

    问题回答问答数据集 数据来源:互联网公开数据 标签:问题回答,自然语言处理,问答系统,文本理解,信息抽取,文本定位,模型训练 数据概述: 本数据集包含多个问题回答任务相关的文本数据,旨在为自然语言处理和问答系统的研究提供支持。数据集中的每条记录包括以下字段: - Story:一段完整的文本内容,通常为叙述性或说明性段落。 -...
    packageimg
  • 法律文档检索数据集

    2025年4月20日   

    法律文档检索数据集 数据来源:互联网公开数据 标签:法律文档,文本检索,问答系统,自然语言处理,信息抽取,司法应用,机器学习 数据概述: 本数据集旨在支持法律文档检索和问答系统的开发,包含三个主要文件:corpus.csv、train.csv 和 public_test.csv。 1. corpus.csv:存储法律文本及其唯一标识符,字段包括: -...
    packageimg
  • 铁血远征数据集

    2025年4月19日   

    铁血远征数据集 数据来源:互联网公开数据 标签:社区讨论,论坛数据,文本分析,社交媒体,用户行为,话题分类,信息抽取 数据概述: 本数据集是Iron...
    packageimg
  • 土耳其新闻70000数据集

    2025年4月16日   

    土耳其新闻70000数据集 数据来源:互联网公开数据 标签:土耳其新闻,新闻分类,文本数据,机器学习,自然语言处理,媒体分析,信息抽取 数据概述:...
    packageimg
  • 命名实体识别文本信息标注数据集

    2025年4月14日   

    命名实体识别文本信息标注数据集 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,文本分析,机器学习,数据标注,信息抽取,文本挖掘 数据概述:...
    packageimg
  • 大型表格总结数据集

    2025年4月14日   

    大型表格总结数据集 数据来源:互联网公开数据 标签:表格数据,总结任务,自然语言处理,语言模型训练,复杂数据解析,数据压缩,信息抽取 数据概述:...
    packageimg
  • 问题分类数据集

    2025年4月14日   

    问题分类数据集 数据来源:互联网公开数据 标签:问题分类,问答系统,自然语言处理,文本分类,信息抽取,机器学习,数据标注 数据概述:...
    packageimg