找到150个数据集

标签: 信息提取

过滤结果
  • 俄罗斯高等经济学院新闻数据集HSENewsDataset-evavallistu

    2025年4月25日   

    俄罗斯高等经济学院新闻数据集HSENewsDataset-evavallistu 数据来源:互联网公开数据 标签:新闻数据,数据集,媒体分析,文本挖掘,自然语言处理,信息提取,学术研究,新闻传播 数据概述:该数据集包含来自俄罗斯高等经济学院(HSE)的新闻数据,记录了该学院发布的各类新闻和公告。主要特征如下:...
    packageimg
  • 人工智能文章抓取清理扩展数据集AIArticleScrapedCleanedExtraDataDataset-alikmondal

    2025年4月25日   

    人工智能文章抓取清理扩展数据集AIArticleScrapedCleanedExtraDataDataset-alikmondal 数据来源:互联网公开数据 标签:人工智能,文章抓取,数据清理,自然语言处理,机器学习,文本分析,信息提取,数据集 数据概述:...
    packageimg
  • 微软学习位置提及识别数据集MicrosoftLearnLocationMentionRecognitionDataset-hamdahmida

    2025年4月25日   

    微软学习位置提及识别数据集MicrosoftLearnLocationMentionRecognitionDataset-hamdahmida 数据来源:互联网公开数据 标签:自然语言处理,文本分析,位置识别,数据集,机器学习,信息提取,地理信息,人工智能 数据概述:...
    packageimg
  • 金融新闻数据集FinancialNewsDataDataset-mananjainb21ai021

    2025年4月25日   

    金融新闻数据集FinancialNewsDataDataset-mananjainb21ai021 数据来源:互联网公开数据 标签:金融,新闻,数据集,文本分析,自然语言处理,机器学习,市场研究,信息提取 数据概述: 该数据集包含来自互联网公开渠道的金融新闻数据,记录了金融领域的新闻报道和相关信息。主要特征如下:...
    packageimg
  • 命名实体识别16标签数据集NamedEntityRecognitionDatasetwith16Tags-sumitv29

    2025年4月25日   

    命名实体识别16标签数据集NamedEntityRecognitionDatasetwith16Tags-sumitv29 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,数据集,机器学习,文本分析,信息提取,语言技术,人工智能 数据概述: 该数据集包含用于命名实体识别任务的数据,记录了文本中的实体及其类别信息。主要特征如下:...
    packageimg
  • 官方标签数据集OfficialLabelDataset-nguyenvuthanhtung

    2025年4月25日   

    官方标签数据集OfficialLabelDataset-nguyenvuthanhtung 数据来源:互联网公开数据 标签:标签分类,数据集,数据标注,机器学习,自然语言处理,数据挖掘,人工智能,信息提取 数据概述: 该数据集包含来自官方渠道的标签数据,记录了各类数据项的官方标签信息。主要特征如下: 时间跨度:数据记录的时间范围从数据创建至今。...
    packageimg
  • 消息分类与识别数据集MessageClassifierDataset-kelvinfabichichi

    2025年4月25日   

    消息分类与识别数据集MessageClassifierDataset-kelvinfabichichi 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,信息提取,情感分析,语言模型,数据挖掘 数据概述: 该数据集包含来自互联网的各类消息文本数据,记录了不同类型消息的内容和分类标签。主要特征如下:...
    packageimg
  • 文本屏蔽基准数据集RedactionBenchmarkDataset-edithram23

    2025年4月25日   

    文本屏蔽基准数据集RedactionBenchmarkDataset-edithram23 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,机器学习,信息提取,文本分析,隐私保护,合规性 数据概述:该数据集包含来自多个来源的文本数据,记录了文本中敏感信息的屏蔽和分类任务。主要特征如下:...
    packageimg
  • 微软新闻数据集1999-2023MSFTNewsDataset1999-2023-abhindeves

    2025年4月25日   

    微软新闻数据集1999-2023MSFTNewsDataset1999-2023-abhindeves 数据来源:互联网公开数据 标签:新闻数据,数据集,文本分析,机器学习,自然语言处理,数据分析,信息提取,时间序列 数据概述: 该数据集包含来自微软公司官方新闻发布的数据,记录了微软公司自1999年至2023年间的新闻内容。主要特征如下:...
    packageimg
  • 数据集强调分析数据集DatasetEmphasesAnalysisDataset-juliocaquino

    2025年4月25日   

    数据集强调分析数据集DatasetEmphasesAnalysisDataset-juliocaquino 数据来源:互联网公开数据 标签:数据分析,数据集,统计分析,机器学习,数据挖掘,信息提取,研究工具,数据科学 数据概述: 该数据集包含来自公开数据源的分析数据,记录了数据集中各变量的重要性和关联性分析结果。主要特征如下:...
    packageimg
  • BBC新闻多语言数据集BBCNews8LanguagesDataset-irenemarban

    2025年4月25日   

    BBC新闻多语言数据集BBCNews8LanguagesDataset-irenemarban 数据来源:互联网公开数据 标签:新闻,多语言,数据集,文本分析,自然语言处理,机器学习,翻译,信息提取 数据概述: 该数据集包含来自BBC新闻网站的多语言新闻文本数据,记录了不同语言版本的新闻文章内容。主要特征如下:...
    packageimg
  • 乌尔都语新闻文本分类数据集UrduNewsTextClassificationDataset-muhammadgulraiz

    2025年4月25日   

    乌尔都语新闻文本分类数据集UrduNewsTextClassificationDataset-muhammadgulraiz 数据来源:互联网公开数据 标签:新闻文本,文本分类,乌尔都语,数据集,自然语言处理,机器学习,语言技术,信息提取 数据概述:...
    packageimg
  • 命名实体识别语料库NamedEntityRecognitionCorpus-endofnight17j03

    2025年4月25日   

    命名实体识别语料库NamedEntityRecognitionCorpus-endofnight17j03 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,数据集,文本分析,机器学习,信息提取,人工智能,语料库 数据概述:...
    packageimg
  • 问答数据集涵盖广泛主题的高质量问答内容

    2025年4月25日   

    标题:问答数据集涵盖广泛主题的高质量问答内容 数据内容:该数据集包含问答对的结构化信息,主要包括以下字段: - question:问题描述,包含3510种不同值 - answer:对应问题的答案,包含3512种不同值 - (未命名字段):3725种不同值,可能是问题类别或其他元数据 数据来源:互联网公开数据...
    packageimg
  • 新闻深度处理数据集NewsDeepProcessedDataset-mario123475

    2025年4月25日   

    新闻深度处理数据集NewsDeepProcessedDataset-mario123475 数据来源:互联网公开数据 标签:新闻处理,深度学习,自然语言处理,文本分析,机器学习,数据集,信息提取,学术资源 数据概述: 该数据集包含来自互联网公开资源的新闻文章,经过深度处理,适用于自然语言处理任务,如文本分类,情感分析等。主要特征如下:...
    packageimg
  • 图书评论与剧透检测数据集SpoilerBookReviewDataset-shreeyasapkotaa

    2025年4月25日   

    图书评论与剧透检测数据集SpoilerBookReviewDataset-shreeyasapkotaa 数据来源:互联网公开数据 标签:图书评论,剧透检测,数据集,自然语言处理,文本分类,机器学习,情感分析,信息提取 数据概述: 该数据集包含来自亚马逊等平台的图书评论数据,记录了用户对图书的评论内容及其是否包含剧透的标注信息。主要特征如下:...
    packageimg
  • 网页内容与词法特征提取数据集2022年-vanshhagrawal

    2025年4月25日   

    网页内容与词法特征提取数据集2022年-vanshhagrawal 数据来源:互联网公开数据 标签:网页内容,词法特征,数据集,自然语言处理,文本分析,机器学习,信息提取,文本挖掘 数据概述: 该数据集包含了从互联网上提取的网页内容及其词法特征,适用于自然语言处理,文本分析和机器学习等领域的研究。主要特征如下: 时间跨度:...
    packageimg
  • 图八标注文本数据集Figure-EightLabelledTextualDataset-manuelbenedicto

    2025年4月25日   

    图八标注文本数据集Figure-EightLabelledTextualDataset-manuelbenedicto 数据来源:互联网公开数据 标签:文本标注,数据集,自然语言处理,机器学习,数据挖掘,语义分析,人工智能,信息提取 数据概述: 该数据集由图八公司(Figure-...
    packageimg
  • AMD新闻文章数据集AMDNewsArticlesDataset-mingjjii

    2025年4月25日   

    AMD新闻文章数据集AMDNewsArticlesDataset-mingjjii 数据来源:互联网公开数据 标签:新闻文章,数据集,科技新闻,AMD,自然语言处理,文本分析,机器学习,信息提取 数据概述: 该数据集包含来自互联网公开渠道的与AMD公司相关的新闻文章数据,记录了关于AMD公司的新闻报道和相关信息。主要特征如下:...
    packageimg
  • 僧伽罗语新闻数据集SinhalaNewsDataset-virajtharinda

    2025年4月25日   

    僧伽罗语新闻数据集SinhalaNewsDataset-virajtharinda 数据来源:互联网公开数据 标签:新闻数据,数据集,文本分析,自然语言处理,机器学习,语言研究,新闻媒体,信息提取 数据概述: 该数据集包含来自僧伽罗语新闻媒体的数据,记录了僧伽罗语新闻文章的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg