-
-
文本校对与语言纠错资源数据集TextProofreadingandLanguageCorrectionResources-fcbk95
文本校对与语言纠错资源数据集TextProofreadingandLanguageCorrectionResources-fcbk95 数据来源:互联网公开数据 标签:语言校对, 文本纠错, 自然语言处理, 多语言支持, 词汇校正, 语法检查, 数据集, 语言学 数据概述:...
-
商品信息哈希值数据集ProductInformationHashValuesDataset-eguhopor
商品信息哈希值数据集ProductInformationHashValuesDataset-eguhopor 数据来源:互联网公开数据 标签:商品信息, 哈希值, 数据比对, 数据清洗, 文本分析, 零售数据, 数据安全, 网页爬取 数据概述: 该数据集包含来自多个电商网站的商品信息,记录了商品的名称、URL链接以及对应的哈希值。主要特征如下:...
-
保险索赔预测数据集-2021年9月TabularPlaygroundSeries竞赛
保险索赔预测数据集-2021年9月TabularPlaygroundSeries竞赛 数据来源:互联网公开数据 标签:保险,索赔,预测,机器学习,竞赛,表格数据,匿名特征,CTGAN,二元分类 数据概述: 本数据集源于Kaggle平台2021年9月举办的Tabular Playground...
-
FLM训练样本数据集
FLM训练样本数据集 数据来源:互联网公开数据 标签:机器学习训练样本,随机采样,匹配数据,模型评估,监督学习,算法优化 数据概述: 本数据集是从训练数据中随机抽取的10万至60万实例样本,包含以下组成部分: 1. train-df:用于模型训练的采样数据,包含训练所需的特征和标签信息。 2. match-...
-
LlamaIndex教程资源数据集-hiarsl
LlamaIndex教程资源数据集-hiarsl 数据来源:互联网公开数据 标签:LlamaIndex,教程,资源,嵌入向量,模型调优,RAG,机器学习,教育,数据集 数据概述: 本数据集包含用于LlamaIndex教程的输入数据(例如,会议论文),可用于在调整嵌入向量以适应RAG(Retrieval-Augmented...
-
语言校对工具多语言支持数据集LanguageCorrectionToolMultilingualSupportDataset-ktgiahieu
语言校对工具多语言支持数据集LanguageCorrectionToolMultilingualSupportDataset-ktgiahieu 数据来源:互联网公开数据 标签:语言校对, 自然语言处理, 文本分析, 多语言, 语法检查, 拼写纠错, 文本处理, 开源项目 数据概述:...
-
问答对重复性判定数据集QuestionPairDuplicateDetection-seoltommy
问答对重复性判定数据集QuestionPairDuplicateDetection-seoltommy 数据来源:互联网公开数据 标签:自然语言处理, 文本相似度, 问答系统, 文本匹配, 二分类, 深度学习, 语义分析, 数据集 数据概述: 该数据集包含来自问答社区的配对问题数据,用于训练和评估判断问题对之间是否互为重复的二分类模型。主要特征如下:...
-
医疗文档社保号码提取数据集MedicalDocumentSocialSecurityNumberExtractionDataset-chaosmvptr
医疗文档社保号码提取数据集MedicalDocumentSocialSecurityNumberExtractionDataset-chaosmvptr 数据来源:互联网公开数据 标签:光学字符识别, OCR, 图像处理, 社保号码, 文本识别, 数据标注, 医疗影像, 信息提取 数据概述:...
-
谷歌数据分析案例研究数据集-202X
谷歌数据分析案例研究数据集-202X 数据来源:互联网公开数据 标签:谷歌,数据分析,案例研究,教育,数据清洗,数据处理,数据可视化,商业分析 数据概述:...
-
Python序列化与CSV数据处理数据集-shashankdubeypeace
Python序列化与CSV数据处理数据集-shashankdubeypeace 数据来源:互联网公开数据 标签:Python,数据处理,CSV,序列化,数据集,数据分析,编程实践,数据存储 数据概述:...
-
工业物联网数据预处理数据集X-IIoTPreprocessedDataset-kumisaki
工业物联网数据预处理数据集X-IIoTPreprocessedDataset-kumisaki 数据来源:互联网公开数据 标签:工业物联网,数据预处理,时序数据,机器学习,异常检测,预测分析,工业大数据,数据清洗 数据概述: 该数据集包含了来自工业物联网(IIoT)环境的预处理数据,主要用于机器学习模型的训练和性能评估。主要特征如下:...
-
CSV文件格式轻量化数据集CSVFilesLightweightDataset-kakarottoandroid
CSV文件格式轻量化数据集CSVFilesLightweightDataset-kakarottoandroid 数据来源:互联网公开数据 标签:CSV文件,数据格式,数据集,轻量化,数据存储,数据分析,机器学习,数据处理 数据概述:该数据集包含来自多个来源的CSV格式数据文件,记录了各类结构化数据的详细信息。主要特征如下:...
-
僧伽罗语文本纠错数据集SinhalaTextCorrectionDataset-uom200199t
僧伽罗语文本纠错数据集SinhalaTextCorrectionDataset-uom200199t 数据来源:互联网公开数据 标签:文本纠错, 僧伽罗语, 自然语言处理, 语言模型, 深度学习, 数据集, 文本校对, 机器学习 数据概述:...
-
重复图像检测与识别数据集DuplicatedImagesDataset-sieugadvn
重复图像检测与识别数据集DuplicatedImagesDataset-sieugadvn 数据来源:互联网公开数据 标签:图像处理,重复检测,数据集,计算机视觉,图像识别,模式识别,数据挖掘,机器学习 数据概述: 该数据集包含来自互联网的图像数据,记录了大量重复或相似的图像样本。主要特征如下:...
-
Jigsaw训练数据集JigsawTrainingDataset-shobhitupadhyaya
Jigsaw训练数据集JigsawTrainingDataset-shobhitupadhyaya 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,情感分析,机器学习,有害内容检测,文本分类,社交媒体 数据概述: 该数据集由 Jigsaw 团队提供,旨在支持有害内容检测和文本分析任务。主要特征如下:...
-
异常值去除数据集NoOutliersDataset-maverick2345
异常值去除数据集NoOutliersDataset-maverick2345 数据来源:互联网公开数据 标签:数据清理,异常值检测,数据集,数据分析,机器学习,统计学,数据科学,数据预处理 数据概述: 该数据集为经过异常值去除处理的数据集,适用于数据清理、异常值检测和数据分析等任务。主要特征如下: 时间跨度:...
-
少数类别数据集MinorityClassesDataset-roynjuguna
少数类别数据集MinorityClassesDataset-roynjuguna 数据来源:互联网公开数据 标签:少数类别,数据集,机器学习,不平衡数据,分类算法,数据增强,人工智能,计算机科学 数据概述: 该数据集包含来自多个领域的不平衡数据,记录了少数类别的样本信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,可能涵盖多个时间段。...
-
Python数据科学数据集-Venkat数据集-venkatreddykonasani
Python数据科学数据集-Venkat数据集-venkatreddykonasani 数据来源:互联网公开数据 标签:数据科学,Python,数据集,机器学习,数据分析,数据预处理,教学资源,案例研究 数据概述:该数据集包含Venkat提供的Python数据科学数据集,旨在帮助学习者和实践者掌握数据科学技能。主要特征如下:...
-
印度理工学院班加罗尔人工智能与机器学习课程2020实验1数据集IIITBAI511ML2020Assignment1Dataset-tejask98
印度理工学院班加罗尔人工智能与机器学习课程2020实验1数据集IIITBAI511ML2020Assignment1Dataset-tejask98 数据来源:互联网公开数据 标签:人工智能,机器学习,数据集,实验,分类,特征工程,数据科学,教育...



