找到144个数据集

标签: 信息提取

过滤结果
  • 网页挖掘与数据分析数据集DataProjectWebMining2024-1Dataset-shao2011

    2025年4月23日   

    网页挖掘与数据分析数据集DataProjectWebMining2024-1Dataset-shao2011 数据来源:互联网公开数据 标签:网页挖掘,数据采集,数据集,网络分析,机器学习,信息提取,数据科学,大数据 数据概述: 该数据集来自2024年网页挖掘项目,记录了从互联网上采集的各种网页数据。主要特征如下:...
    packageimg
  • 推特灾难文本分析数据集-bharathsj

    2025年4月23日   

    推特灾难文本分析数据集-bharathsj 数据来源:互联网公开数据 标签:推特数据,灾难事件,文本分析,自然语言处理,情感分析,信息提取,机器学习,社会科学 数据概述: 该数据集包含来自推特(Twitter)的文本数据,记录了与灾难事件相关的推文内容。主要特征如下: 时间跨度: 数据记录的时间范围根据数据集具体情况而定,通常涵盖特定灾难事件发生前后。...
    packageimg
  • 音频头信息数据集AudioHeaderInformationDataset-parsaaskari

    2025年4月23日   

    音频头信息数据集AudioHeaderInformationDataset-parsaaskari 数据来源:互联网公开数据 标签:音频处理,数据集,元数据,多媒体,信号处理,数据解析,音频分析,信息提取 数据概述: 该数据集包含来自公开音频文件的头部信息数据,记录了音频文件的元数据特征。主要特征如下: 时间跨度:...
    packageimg
  • 地理位置提及识别数据集ZindiLocationMentionRecognitionDataset-tanhtr

    2025年4月23日   

    地理位置提及识别数据集ZindiLocationMentionRecognitionDataset-tanhtr 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,位置识别,机器学习,信息提取,地理信息系统,命名实体识别 数据概述: 该数据集由Zindi平台提供,专注于识别文本中提及的地理位置信息。主要特征如下:...
    packageimg
  • 性别检测数据集GenderDetectionDataset-subhajournal

    2025年4月23日   

    性别检测数据集GenderDetectionDataset-subhajournal 数据来源:互联网公开数据 标签:性别检测,数据集,自然语言处理,机器学习,文本分析,文本分类,社会研究,信息提取 数据概述:该数据集包含来自互联网的公开数据,记录了不同用户在社交媒体上的用户名,昵称和相关文本信息,适用于性别检测和分类任务。主要特征如下:...
    packageimg
  • FAST-NU院校指南信息提取数据集-ahmedembedded

    2025年4月23日   

    FAST-NU院校指南信息提取数据集-ahmedembedded 数据来源:互联网公开数据 标签:FAST-NU,院校指南,OCR技术,学术项目,录取标准,课程详情,教育研究,数据科学,机器学习,信息提取 数据概述: 本数据集包含从FAST-NU(巴基斯坦国家科学技术大学基金会)院校指南中提取的文本数据,利用Tesseract...
    packageimg
  • BBC新闻自然语言处理与词云数据集BBCNewsNLPandWordcloudDataset-esrabicakci

    2025年4月23日   

    BBC新闻自然语言处理与词云数据集BBCNewsNLPandWordcloudDataset-esrabicakci 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,词云,文本分析,信息提取,新闻研究,学术资源...
    packageimg
  • 黄金摘要数据集GoldenSummaryDataset-nguyennguyentrung

    2025年4月23日   

    黄金摘要数据集GoldenSummaryDataset-nguyennguyentrung 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,文本分析,信息提取,人工智能,数据挖掘 数据概述: 该数据集包含来自多个来源的文本摘要数据,记录了原始文本及其对应的摘要信息。主要特征如下:...
    packageimg
  • 命名实体识别数据集NamedEntityRecognitionDataset-muhammadabubakar627

    2025年4月23日   

    命名实体识别数据集NamedEntityRecognitionDataset-muhammadabubakar627 数据来源:互联网公开数据 标签:命名实体识别,数据集,自然语言处理,文本分析,机器学习,信息提取,人工智能,语言学 数据概述: 该数据集包含来自互联网和公开文本资源的标注数据,记录了各种文本中的命名实体。主要特征如下: 时间跨度:...
    packageimg
  • 基特韦新闻语言模型数据集KitweNewsLLMDataset-kavinnan

    2025年4月22日   

    基特韦新闻语言模型数据集KitweNewsLLMDataset-kavinnan 数据来源:互联网公开数据 标签:新闻,语言模型,数据集,自然语言处理,机器学习,文本分析,信息提取,非洲研究 数据概述:该数据集包含来自赞比亚基特韦地区新闻媒体的文本数据,记录了该地区最新的新闻报道和事件。主要特征如下:...
    packageimg
  • 新闻标题预测数据集HeadlinePredictionDataset-bohraboxer

    2025年4月22日   

    新闻标题预测数据集HeadlinePredictionDataset-bohraboxer 数据来源:互联网公开数据 标签:新闻媒体,文本分析,数据集,机器学习,自然语言处理,预测模型,信息提取,深度学习 数据概述: 该数据集记录了来自新闻媒体平台的新闻标题及相关文本数据,主要包含新闻标题,正文片段,发布时间等特征。主要特征如下:...
    packageimg
  • 网页抓取新闻数据集WebScrapedNewsDataset-ewuraamaasorassiamah

    2025年4月22日   

    网页抓取新闻数据集WebScrapedNewsDataset-ewuraamaasorassiamah 数据来源:互联网公开数据 标签:新闻数据,网页抓取,数据集,自然语言处理,文本分析,机器学习,信息提取,文本挖掘 数据概述:该数据集包含通过网页抓取技术收集的新闻数据,记录了来自多个新闻网站的新闻文章。主要特征如下:...
    packageimg
  • 网页抓取数据集WebScrapingDataset-prabhuingole

    2025年4月22日   

    网页抓取数据集WebScrapingDataset-prabhuingole 数据来源:互联网公开数据 标签:数据采集,网页抓取,数据集,网络爬虫,数据挖掘,SEO,信息提取,大数据 数据概述: 该数据集通过网页抓取技术从互联网公开来源收集数据,记录了多个网站的内容信息。主要特征如下:...
    packageimg
  • 新闻分类数据集NewsCategoryDataset-tanmaypatil3151

    2025年4月22日   

    新闻分类数据集NewsCategoryDataset-tanmaypatil3151 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,机器学习,自然语言处理,信息提取,分类算法,数据挖掘 数据概述: 该数据集包含来自互联网的新闻文章数据,记录了新闻文章的标题,描述,类别等信息。主要特征如下:...
    packageimg
  • CNN新闻内容数据集CNNNewsContentDataset-interviewturabit

    2025年4月22日   

    CNN新闻内容数据集CNNNewsContentDataset-interviewturabit 数据来源:互联网公开数据 标签:新闻媒体,数据集,文本分析,机器学习,自然语言处理,信息提取,新闻分类,媒体研究 数据概述: 该数据集包含来自CNN的新闻文章数据,记录了大量新闻文本的详细信息。主要特征如下:...
    packageimg
  • 论文摘要生成数据集PaperSummarizationDataset-mohammedserag

    2025年4月22日   

    论文摘要生成数据集PaperSummarizationDataset-mohammedserag 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,信息提取,学术研究,深度学习,文本分析 数据概述: 该数据集包含来自学术文献和科技文章的论文摘要数据,记录了论文的原文与相应的摘要信息。主要特征如下:...
    packageimg
  • 新闻处理数据集NewsProcessedDataset-mario123475

    2025年4月22日   

    新闻处理数据集NewsProcessedDataset-mario123475 数据来源:互联网公开数据 标签:新闻,数据处理,文本分析,自然语言处理,机器学习,数据挖掘,信息提取,情感分析 数据概述:该数据集包含来自互联网的新闻数据,经过预处理和清洗,适用于文本分析和自然语言处理任务。主要特征如下:...
    packageimg
  • 网络语义解析数据集第一部分-2023-swaroopnath6

    2025年4月22日   

    网络语义解析数据集第一部分-2023-swaroopnath6 数据来源:互联网公开数据 标签:网络语义解析,数据集,网络爬虫,信息提取,文本处理,网站解析 数据概述: 本数据集旨在将网站上的相关信息解析为易于理解的文本格式,帮助用户从海量互联网信息中提取出重要数据。数据集包含了从多个信息网站中提取的各种HTML标签特征。...
    packageimg
  • 印度COVID-19研究文献信息提取三元组数据集

    2025年4月15日   

    印度COVID-19研究文献信息提取三元组数据集 数据来源:互联网公开数据 标签:COVID-19,印度,文献研究,信息提取,三元组,自然语言处理,知识图谱 数据概述: 本数据集是针对COVID-19 Open Research Dataset Challenge...
    packageimg
  • 生态问答数据集

    2025年4月15日   

    生态问答数据集 数据来源:互联网公开数据 标签:生态,问答,信息提取,自然语言处理,教育材料,环境科学,文本理解 数据概述:...
    packageimg