-
文本错别字检测与纠正数据集Typo-IntroDataset-chasembowers
文本错别字检测与纠正数据集Typo-IntroDataset-chasembowers 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,错别字检测,机器学习,语言模型,文本纠错,人工智能 数据概述: 该数据集专注于文本中的错别字检测与纠正,记录了大量包含错别字的文本样本及其对应的正确文本。主要特征如下:...
-
机器学习特征工程预测数据集MachineLearningFeatureEngineeringPredictionDataset-ayaesano
机器学习特征工程预测数据集MachineLearningFeatureEngineeringPredictionDataset-ayaesano 数据来源:互联网公开数据 标签:特征工程, 机器学习, 预测模型, 数据分析, 建模, 训练集, 测试集, 数据集 数据概述: 该数据集包含用于机器学习模型训练和评估的结构化数值特征数据。主要特征如下:...
-
未采样数据集UnsampledDatasets-muskaanchopra
未采样数据集UnsampledDatasets-muskaanchopra 数据来源:互联网公开数据 标签:数据集,数据采样,统计学,机器学习,数据分析,抽样方法,数据质量,偏差 数据概述: 该数据集包含了未经过任何采样处理的原始数据,旨在用于研究和对比不同采样方法对数据分析结果的影响。主要特征如下: 时间跨度:...
-
印地语-英语平行语料翻译数据集Hindi-EnglishParallelTranslationCorpus-chinmaycp9
印地语-英语平行语料翻译数据集Hindi-EnglishParallelTranslationCorpus-chinmaycp9 数据来源:互联网公开数据 标签:机器翻译, 语料库, 文本翻译, 自然语言处理, 双语数据, 印地语, 英语, 语言模型 数据概述: 该数据集包含来自互联网的印地语-...
-
预处理输入数据分析数据集-mattiaangeli
预处理输入数据分析数据集-mattiaangeli 数据来源:互联网公开数据 标签:数据预处理,机器学习,数据集,特征工程,数据分析,模型训练,数据清洗,特征提取 数据概述: 该数据集包含预处理后的输入数据,用于机器学习模型的训练和评估。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于原始数据集的收集时间。...
-
文本数据常用词汇统计分析数据集TextDataCommonWordStatisticsAnalysis-shivamanhar
文本数据常用词汇统计分析数据集TextDataCommonWordStatisticsAnalysis-shivamanhar 数据来源:互联网公开数据 标签:文本分析, 词频统计, 自然语言处理, 语料库, 数据清洗, 文本预处理, 基础词汇, 数据集 数据概述:...
-
多语言恶意评论检测数据集MultilingualToxicCommentDetectionDataset-alphaecho
多语言恶意评论检测数据集MultilingualToxicCommentDetectionDataset-alphaecho 数据来源:互联网公开数据 标签:文本分类, 恶意评论, 多语言, 自然语言处理, 情感分析, 语言模型, 文本清洗, 机器学习 数据概述:...
-
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-khanhdaom
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-khanhdaom 数据来源:互联网公开数据 标签:越南语, 文本纠错, 自然语言处理, 错误检测, 文本校对, 机器学习, 深度学习, 语料库 数据概述:...
-
阿拉伯语文本去标点数据集ArabicTextDotlessDataset-ouassimbehlil
阿拉伯语文本去标点数据集ArabicTextDotlessDataset-ouassimbehlil 数据来源:互联网公开数据 标签:阿拉伯语, 文本处理, 文本清洗, 自然语言处理, 语言模型, 字符级分析, 数据预处理, 语料库 数据概述: 该数据集包含经过处理的阿拉伯语文本,记录了原始文本及其对应的去标点版本。主要特征如下:...
-
餐饮点餐指令解析数据集RestaurantOrderInstructionParsingDataset-hanzadafayez
餐饮点餐指令解析数据集RestaurantOrderInstructionParsingDataset-hanzadafayez 数据来源:互联网公开数据 标签:自然语言处理, 语义解析, 意图识别, 槽位填充, 餐饮, 订单管理, 文本标注, 机器学习 数据概述:...
-
视频字幕过滤数据集SubtitleFilteredDataset-hooong
视频字幕过滤数据集SubtitleFilteredDataset-hooong 数据来源:互联网公开数据 标签:字幕,视频,文本分析,自然语言处理,数据集,内容过滤,机器学习,数据清洗 数据概述: 该数据集包含经过筛选和过滤的视频字幕数据,旨在用于文本分析、内容过滤和自然语言处理任务。主要特征如下:...
-
标准化数据集NormalizedDataSet-mbmmurad
标准化数据集NormalizedDataSet-mbmmurad 数据来源:互联网公开数据 标签:数据标准化,数据集,数据处理,数据分析,机器学习,数据科学,数学统计,数据挖掘 数据概述: 该数据集为标准化数据集,主要包含经过标准化处理的数据,适用于各类数据分析和机器学习任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,具体取决于原始数据来源。...
-
无监督假新闻与真新闻识别数据集UnsupervisedFakeandRealNewsDataset-soheybfarohe
无监督假新闻与真新闻识别数据集UnsupervisedFakeandRealNewsDataset-soheybfarohe 数据来源:互联网公开数据 标签:假新闻,真新闻,数据集,文本分析,无监督学习,机器学习,新闻学,信息科学 数据概述:该数据集包含来自互联网的假新闻和真新闻文章,适用于无监督学习和新闻真实性检测任务。主要特征如下:...
-
地址数据增强数据集-tanguanyu
地址数据增强数据集-tanguanyu 数据来源:互联网公开数据 标签:地址数据,数据增强,自然语言处理,机器学习,文本处理,数据清洗,地理信息,人工智能 数据概述: 该数据集包含经过多种方法增强的地址数据,旨在提高地址数据的多样性和可用性。主要特征如下: 时间跨度:数据记录的时间范围涵盖了当前年份及之前的地址数据。...
-
数据2023机器学习项目数据集2023MachineLearningProjectDataset-momchilgeorgiev
2023机器学习项目数据集2023MachineLearningProjectDataset-momchilgeorgiev 数据来源:互联网公开数据 标签:机器学习,数据集,项目数据,数据分析,算法验证,深度学习,项目实践,模型训练 数据概述:...
-
我的训练集与SGKFold交叉验证数据集MyTrainwithSGKFoldDataset-zhiyue666
我的训练集与SGKFold交叉验证数据集MyTrainwithSGKFoldDataset-zhiyue666 数据来源:互联网公开数据 标签:机器学习,数据集,交叉验证,训练集,模型评估,数据科学,算法开发,预测分析 数据概述: 该数据集包含用于机器学习模型训练和评估的数据,特别集成了SGKFold(分层K折交叉验证)方法。主要特征如下:...
-
RUCODE公开测试数据集RUCODEPublicTestDataset-polinaminina
RUCODE公开测试数据集RUCODEPublicTestDataset-polinaminina 数据来源:互联网公开数据 标签:数据科学,竞赛,测试数据,机器学习,数据分析,教育,技术评估,算法验证 数据概述: 该数据集是RUCODE数据科学竞赛的公开测试数据集,用于参赛者在算法模型验证和性能评估时的参考。主要特征如下:...
-
主数据集MasterDataset-iamsamirmishra
主数据集MasterDataset-iamsamirmishra 数据来源:互联网公开数据 标签:主数据,数据集,综合数据,数据管理,数据分析,数据整合,企业资源规划,数据治理 数据概述: 该数据集包含来自多个来源的综合数据,记录了各类核心业务信息。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2023年。...
-
医疗诊断笔记特征识别数据集MedicalDiagnosisNotesFeatureRecognition-irenecampillopereda
医疗诊断笔记特征识别数据集MedicalDiagnosisNotesFeatureRecognition-irenecampillopereda 数据来源:互联网公开数据 标签:医疗诊断, 自然语言处理, 文本标注, 特征识别, 病例分析, 机器学习, 医疗健康, 临床笔记 数据概述:...
-
快速入门训练数据集QuickStartTrainingDataDataset-kolapoadedipe
快速入门训练数据集QuickStartTrainingDataDataset-kolapoadedipe 数据来源:互联网公开数据 标签:数据集,训练数据,机器学习,数据分析,基础教程,数据科学,算法开发,教育材料 数据概述: 该数据集包含用于快速入门的数据训练样本,记录了基础数据结构和变量关系。主要特征如下:...



