-
CSV文本提取数据集AllCSVTextExtractedDataset-shobhiii
CSV文本提取数据集AllCSVTextExtractedDataset-shobhiii 数据来源:互联网公开数据 标签:文本提取,数据集,数据处理,自然语言处理,数据分析,机器学习,数据挖掘,数据格式 数据概述: 该数据集包含从CSV文件中提取的文本数据,记录了多种CSV文件中的文本内容。主要特征如下: 时间跨度:数据记录的时间范围未明确说明。... -
灵长类动物样本文本提取数据集ExtractedTextfromSimianSampleDataset-rahardisalim
灵长类动物样本文本提取数据集ExtractedTextfromSimianSampleDataset-rahardisalim 数据来源:互联网公开数据 标签:生物信息学,文本提取,灵长类动物,数据集,自然语言处理,物种研究,机器学习,生物多样性 数据概述: 该数据集包含从灵长类动物样本中提取的文本数据,记录了与灵长类动物相关的生物信息。主要特征如下:... -
HackerEarthOCR-NLP社交媒体内容情感分析数据集-rohan0301
HackerEarthOCR-NLP社交媒体内容情感分析数据集-rohan0301 数据来源:互联网公开数据 标签:OCR,NLP,社交媒体,情感分析,图片分析,文本提取,分类 数据概述:... -
维基百科页面LLM科学考试训练数据集
维基百科页面LLM科学考试训练数据集 数据来源:互联网公开数据 标签:维基百科,LLM,科学考试,训练数据,物理概念,文本提取,教育研究 数据概述:... -
美国食品药品监督管理局FDA483表格关键信息提取与聚类数据集
美国食品药品监督管理局FDA483表格关键信息提取与聚类数据集 数据来源:互联网公开数据 标签:FDA,Form483,检查报告,文本提取,关键信息,聚类分析,AWS Textract,数据挖掘,医疗器械,药品 数据概述: 本数据集旨在为研究美国食品药品监督管理局(FDA)483表格的检查结果提供数据支持。数据来源于使用AWS Textract从FDA... -
匈牙利电子采购合同数据集
匈牙利电子采购合同数据集 数据来源:互联网公开数据 标签:匈牙利,电子采购,合同数据,OCR技术,文本提取,日期,价格,参与方 数据概述: 本数据集包含从匈牙利电子采购系统下载的135份合同文件,这些合同文件最初为PDF格式,后使用Tesseract... -
收据布局数据集SSD300V2-CSV
收据布局数据集SSD300V2-CSV 数据来源:互联网公开数据 标签:收据,布局分析,图像识别,文本提取,深度学习,计算机视觉,数据标注 数据概述:... -
Kaggle与Binder平台OCR引擎测试图像数据集
Kaggle与Binder平台OCR引擎测试图像数据集 数据来源:互联网公开数据 标签:OCR,图像识别,光学字符识别,文本提取,Jupyter Notebook,Kaggle,Binder,机器学习,计算机视觉 数据概述: 本数据集包含一组专为光学字符识别(OCR)测试设计的图像,主要用于在Kaggle和Binder平台上进行Jupyter... -
印度销售交易自然语言处理数据集1963-2021
印度销售交易自然语言处理数据集1963-2021 数据来源:互联网公开数据 标签:销售数据,自然语言处理,文本提取,会计自动化,机器学习,训练数据,客户信息,产品信息,支付方式 数据概述:... -
PDF数据分析数据集
PDF数据分析数据集 数据来源:互联网公开数据 标签:PDF分析,文本提取,数据处理,自然语言处理,机器学习,文档分析,信息提取 数据概述: 本数据集包含了一系列PDF文档,以及对这些文档进行分析后提取的数据。数据集涵盖了文档的基本信息、文本内容、关键词、结构化数据等关键要素,为研究PDF文档的内容和结构提供了基础。 数据用途概述:...