-
罗马尼亚过渡书写系统数据集
2025年6月1日 30 172 84
罗马尼亚过渡书写系统数据集 数据来源:互联网公开数据 标签:过渡书写系统,罗马尼亚,历史文档,OCR,字符统计,语言研究,文档分析 数据概述:... -
抖音轻量版Google商店评论分析数据集-350万条-2011至2023年-bwandowando
2025年6月1日 30 85 51
抖音轻量版Google商店评论分析数据集-350万条-2011至2023年-bwandowando 数据来源:互联网公开数据 标签:抖音, TikTok, App评论, Google商店, 用户反馈, 社交媒体, 感情分析, 版本比较, 文档分析 数据概述: 本数据集包含从抖音轻量版(TikTok... -
PDF文档内容提取与分析数据集PDFDataContentExtractionandAnalysisDataset-straathofrick
2025年5月30日 30 95 38
PDF文档内容提取与分析数据集PDFDataContentExtractionandAnalysisDataset-straathofrick 数据来源:互联网公开数据 标签:PDF文档,文本提取,数据挖掘,自然语言处理,信息检索,文档分析,机器学习,数据集 数据概述:... -
文档页面分类数据集DocumentPageClassificationDataset-lucigugler
2025年5月30日 30 66 4
文档页面分类数据集DocumentPageClassificationDataset-lucigugler 数据来源:互联网公开数据 标签:文本分类, 页面识别, 文档分析, 机器学习, 图像处理, 数据标注, 结构化数据, HDF5 数据概述: 该数据集包含用于文档页面分类的数据,记录了文档页面及其对应的分类标签。主要特征如下:... -
OCR文字识别数据集SourceOCRDataset-anhtdn
2025年5月28日 30 135 22
OCR文字识别数据集SourceOCRDataset-anhtdn 数据来源:互联网公开数据 标签:OCR, 文字识别, 数据集, 图像处理, 机器学习, 自然语言处理, 文档分析, 人工智能 数据概述:该数据集包含来自多个来源的图像和文字识别数据,记录了不同场景下的文字图像及其对应的正确文字内容。主要特征如下:... -
OCR测试图像数据集OCRTestingDataset-fayezsiddiqui
2025年5月20日 30 169 26
OCR测试图像数据集OCRTestingDataset-fayezsiddiqui 数据来源:互联网公开数据 标签:OCR, 图像识别, 数据集, 机器学习, 文字识别, 图像处理, 自动化, 文档分析 数据概述: 该数据集包含来自互联网的多种格式的测试图像,主要用于光学字符识别(OCR)系统的测试和评估。主要特征如下:... -
图像识别文档质量评估数据集ImageRecognitionDocumentQualityAssessmentDataset-anshbisarya
2025年5月11日 30 146 64
图像识别文档质量评估数据集ImageRecognitionDocumentQualityAssessmentDataset-anshbisarya 数据来源:互联网公开数据 标签:图像识别, 文档分析, 图像质量, 文本检测, 机器学习, 数据标注, 质量评估, BMP图像 数据概述:... -
客户服务文档支持分析数据集CustomerServiceDocumentSupportAnalysis-sarahwyer
2025年5月1日 30 8 4
客户服务文档支持分析数据集CustomerServiceDocumentSupportAnalysis-sarahwyer 数据来源:互联网公开数据 标签:客户服务, 文档分析, 自然语言处理, 文本分类, 支持文档, 情感分析, 数据挖掘, 服务质量 数据概述:... -
大规模数据挖掘文档相似度分析数据集MassiveDataMiningDocumentSimilarityAnalysisDataset-massivedatamining
2025年5月1日 30 123 23
大规模数据挖掘文档相似度分析数据集MassiveDataMiningDocumentSimilarityAnalysisDataset-massivedatamining 数据来源:互联网公开数据 标签:数据挖掘, 文档分析, 相似度计算, LSH, 文本处理, 机器学习, 向量化, 语料库 数据概述:... -
代码漏洞检测项目图像与文档数据集CodeVulnerabilityDetectionProjectImagesandDocuments-tungpro512
2025年4月29日 30 10 5
代码漏洞检测项目图像与文档数据集CodeVulnerabilityDetectionProjectImagesandDocuments-tungpro512 数据来源:互联网公开数据 标签:代码漏洞, 图像分析, 文档分析, 软件安全, 机器学习, 代码审计, 项目文档, 漏洞检测 数据概述:... -
旅游导览系统项目控制文档数据集TourismGuideSystemProjectControlDocuments-wjvaeeeee
2025年4月29日 30 11 5
旅游导览系统项目控制文档数据集TourismGuideSystemProjectControlDocuments-wjvaeeeee 数据来源:互联网公开数据 标签:项目管理, 旅游导览, 文档分析, Markdown, Python, 软件工程, 系统开发, 数据可视化 数据概述:... -
谷歌网络文档过滤边界框数据集GWD-FilteredBoundingBoxDataset-rifat963
2025年4月26日 30 188 38
谷歌网络文档过滤边界框数据集GWD-FilteredBoundingBoxDataset-rifat963 数据来源:互联网公开数据 标签:计算机视觉,目标检测,数据集,边界框,图像处理,深度学习,文本检测,文档分析 数据概述: 该数据集包含从谷歌网络文档中提取的过滤边界框数据,用于目标检测和文档分析任务。主要特征如下:... -
光学字符识别数据集OCR-DSCTextDataset-hhhoang
2025年4月26日 30 103 44
光学字符识别数据集OCR-DSCTextDataset-hhhoang 数据来源:互联网公开数据 标签:光学字符识别,文本数据,数据集,机器学习,图像处理,自然语言处理,计算机视觉,文档分析 数据概述: 该数据集专注于光学字符识别(OCR)任务,包含大量文本图像数据,用于训练和评估OCR系统的性能。主要特征如下:... -
主题模型分析数据集LDADataset-raditsoic
2025年4月25日 30 24 8
主题模型分析数据集LDADataset-raditsoic 数据来源:互联网公开数据 标签:主题模型,LDA,文本分析,自然语言处理,数据集,机器学习,文档分析,数据挖掘 数据概述: 该数据集包含用于主题模型分析的文本数据,旨在探索和发现文本集合中隐藏的主题结构。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于具体文本内容的时间属性。... -
微软OCR无缩放数据集MicrosoftOCRWithoutResizeDataset-mostafaatta222
2025年4月25日 30 199 153
微软OCR无缩放数据集MicrosoftOCRWithoutResizeDataset-mostafaatta222 数据来源:互联网公开数据 标签:OCR, 数据集, 文本识别, 机器学习, 图像处理, 自然语言处理, 文档分析, 软件工程 数据概述:... -
HuggingFace文档数据集HuggingFaceDocumentationDataset-sanjay74
2025年4月25日 30 69 47
HuggingFace文档数据集HuggingFaceDocumentationDataset-sanjay74 数据来源:互联网公开数据 标签:自然语言处理,数据集,文档分析,机器学习,文本处理,人工智能,语言模型,文本分类 数据概述:该数据集包含来自 Hugging Face... -
LaTeX文档分析数据集LaTeXDocumentAnalysisDataset-sai1881
2025年4月24日 30 39 18
LaTeX文档分析数据集LaTeXDocumentAnalysisDataset-sai1881 数据来源:互联网公开数据 标签:LaTeX, 文档分析, 数据集, 语法结构, 文学研究, 自然语言处理, 计算机科学, 学术资源 数据概述:... -
法律文档训练数据集TrainDataLegalDocDataset-lthnhtinostic
2025年4月24日 30 24 11
法律文档训练数据集TrainDataLegalDocDataset-lthnhtinostic 数据来源:互联网公开数据 标签:法律,文档分析,数据集,自然语言处理,文本分类,机器学习,合规性,智能合约 数据概述: 该数据集包含法律文档的相关数据,记录了各类法律文本的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
PDF文档摘要提取数据集DrivePDFDataset-atif10
2025年4月24日 30 133 49
PDF文档摘要提取数据集DrivePDFDataset-atif10 数据来源:互联网公开数据 标签:PDF文档,文本摘要,数据集,自然语言处理,机器学习,信息检索,文档分析,NLP 数据概述: 该数据集包含来自Google Drive的PDF文档及其对应的摘要文本。主要特征如下: 时间跨度: 数据记录的时间跨度不明确,取决于文档的创建和上传时间。... -
海事文件标签分类数据集
2025年4月15日 30 28 26
海事文件标签分类数据集 数据来源:互联网公开数据 标签:海事文件,标签分类,合同,条款,行业术语,数据清洗,预处理,机器学习,文档分析 数据概述:...