-
商业隐私识别项目代码数据集BusinessPrivacyIdentificationProjectCode-maxiaokai
商业隐私识别项目代码数据集BusinessPrivacyIdentificationProjectCode-maxiaokai 数据来源:互联网公开数据 标签:隐私保护,自然语言处理,代码分析,机器学习,信息安全,数据脱敏,风险评估,代码审计 数据概述: 该数据集包含一个商业隐私识别项目的相关代码,用于检测和处理与商业隐私相关的数据。主要特征如下:...
-
孟加拉语命名实体识别训练数据集BengaliNamedEntityRecognitionTrainingDataset-aman12398
孟加拉语命名实体识别训练数据集BengaliNamedEntityRecognitionTrainingDataset-aman12398 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 孟加拉语, 文本标注, 序列标注, 语言模型, 机器翻译, 文本分析 数据概述:...
-
垃圾短信识别文本数据集SpamMessageIdentificationTextDataset-bpsingh22
垃圾短信识别文本数据集SpamMessageIdentificationTextDataset-bpsingh22 数据来源:互联网公开数据 标签:垃圾短信, 文本分类, 自然语言处理, 机器学习, 短信过滤, 情感分析, 数据标注, 二分类 数据概述: 该数据集包含来自互联网的短信文本数据,用于垃圾短信的识别与分类任务。主要特征如下:...
-
印尼姓名数据标注集IndonesianNamesDataset-abcdjslferoakdk
印尼姓名数据标注集IndonesianNamesDataset-abcdjslferoakdk 数据来源:互联网公开数据 标签:印尼姓名, 命名实体识别, 文本标注, 人名识别, 文本分析, 机器学习, 数据清洗, 语料库 数据概述: 该数据集包含印尼人姓名数据,记录了经过标注的姓名信息,用于训练和评估姓名识别模型。主要特征如下:...
-
深度学习模型训练与评估代码数据集DeepLearningModelTrainingandEvaluationCode-asevlad
深度学习模型训练与评估代码数据集DeepLearningModelTrainingandEvaluationCode-asevlad 数据来源:互联网公开数据 标签:深度学习, 模型训练, 模型评估, Python, PyTorch, 配置文件, 训练框架, 代码示例 数据概述:...
-
知识蒸馏训练数据集KnowledgeDistillationTrainingDataset-anqmskz
知识蒸馏训练数据集KnowledgeDistillationTrainingDataset-anqmskz 数据来源:互联网公开数据 标签:知识蒸馏, 模型训练, 神经网络, 机器学习, 数据集, 深度学习, 模型压缩, 迁移学习 数据概述: 该数据集包含用于知识蒸馏模型训练的数据,记录了经过预处理的数值型特征。主要特征如下:...
-
推特文本数据预处理与情感分析数据集TwitterTextDataPreprocessingandSentimentAnalysis-jiryanfarokhi
推特文本数据预处理与情感分析数据集TwitterTextDataPreprocessingandSentimentAnalysis-jiryanfarokhi 数据来源:互联网公开数据 标签:推特数据, 文本预处理, 情感分析, 社交媒体, 文本清洗, 停用词移除, 词干提取, 数据标注 数据概述:...
-
房价预测过拟合测试数据集HousePricePredictionOverfittingTestData-huxin216
房价预测过拟合测试数据集HousePricePredictionOverfittingTestData-huxin216 数据来源:互联网公开数据 标签:房价预测, 过拟合, 模型评估, 机器学习, 价格预测, 数据分析, 预测测试, 回归分析 数据概述: 该数据集包含用于评估房价预测模型过拟合情况的测试数据。主要特征如下:...
-
用户评分数据缺失值补全数据集UserRatingDataImputation-stephaniepreyes
用户评分数据缺失值补全数据集UserRatingDataImputation-stephaniepreyes 数据来源:互联网公开数据 标签:用户行为, 评分预测, 数据补全, 缺失值处理, 推荐系统, 机器学习, 数据清洗, 统计分析 数据概述: 该数据集包含用户对项目的评分数据,旨在用于缺失值补全的实验和模型训练。主要特征如下:...
-
文本信息分类数据集TextInformationClassification-mustafasonbol
文本信息分类数据集TextInformationClassification-mustafasonbol 数据来源:互联网公开数据 标签:文本分类, 简历解析, 信息提取, 机器学习, 自然语言处理, 文本标注, 数据清洗, 结构化数据 数据概述:...
-
科技文本改写训练数据集TechnologyTextRewritingTrainingDataset-wenzhengcai
科技文本改写训练数据集TechnologyTextRewritingTrainingDataset-wenzhengcai 数据来源:互联网公开数据 标签:文本改写,自然语言处理,机器翻译,科技文本,数据增强,模型训练,Prompt工程,文本生成 数据概述: 该数据集包含来自科技领域的文本,记录了原文、改写提示(rewrite...
-
商品描述文本分析数据集ProductDescriptionTextAnalysis-vedantajaypawar
商品描述文本分析数据集ProductDescriptionTextAnalysis-vedantajaypawar 数据来源:互联网公开数据 标签:商品描述, 文本分析, 零售数据, 自然语言处理, 商品分类, 文本挖掘, 数据清洗, 市场调研 数据概述: 该数据集包含来自零售行业的商品描述文本,记录了不同商品的简要描述信息。主要特征如下:...
-
代码翻译与等价性验证数据集CodeTranslationandEquivalenceVerificationDataset-faridaamrfarouk
代码翻译与等价性验证数据集CodeTranslationandEquivalenceVerificationDataset-faridaamrfarouk 数据来源:互联网公开数据 标签:代码翻译, 软件工程, Java, Python, 代码等价性, 机器学习, 文本分析, 代码生成 数据概述:...
-
机器学习二分类数据集MachineLearningBinaryClassificationDataset-aphilip
机器学习二分类数据集MachineLearningBinaryClassificationDataset-aphilip 数据来源:互联网公开数据 标签:二分类, 机器学习, SMOTE, 数据重采样, 样本不平衡, 类别预测, 特征工程, 模型训练 数据概述: 该数据集包含经过SMOTE(Synthetic Minority Oversampling...
-
文本特征工程训练测试数据集TextFeatureEngineeringTrainingandTestingDataset-ootake
文本特征工程训练测试数据集TextFeatureEngineeringTrainingandTestingDataset-ootake 数据来源:互联网公开数据 标签:文本特征工程, 自然语言处理, 句子分析, 词汇统计, 机器学习, 数据集, 文本分析, 特征提取 数据概述:...
-
二分类点坐标数据训练测试集BinaryClassificationPointCoordinatesDataset-yashbansal1099
二分类点坐标数据训练测试集BinaryClassificationPointCoordinatesDataset-yashbansal1099 数据来源:互联网公开数据 标签:二分类, 机器学习, 逻辑回归, 数据集, 坐标数据, 训练集, 测试集, 数据建模 数据概述: 该数据集包含用于二分类任务的二维点坐标数据,由训练集和测试集构成。主要特征如下:...
-
数值型数据异常检测数据集NumericalDataAnomalyDetection-krishnendhumurali
数值型数据异常检测数据集NumericalDataAnomalyDetection-krishnendhumurali 数据来源:互联网公开数据 标签:异常检测, 数据清洗, 数值分析, 机器学习, 时间序列, 数据预处理, 异常值, 模式识别 数据概述: 该数据集包含来自模拟或生成的数据,记录了多个数值型变量。主要特征如下:...
-
预测缺失值填充数据集PredictionMissingValueFillingDataset-avitri73
预测缺失值填充数据集PredictionMissingValueFillingDataset-avitri73 数据来源:互联网公开数据 标签:缺失值, 数据预测, 数据填充, 数值分析, 数据预处理, 机器学习, 模型训练, 数据清洗 数据概述: 该数据集包含用于缺失值预测和填充的结构化数据,记录了包含缺失预测值的样本。主要特征如下:...
-
电子邮件垃圾邮件分类数据集EmailSpamClassificationDataset-nguynbtun
电子邮件垃圾邮件分类数据集EmailSpamClassificationDataset-nguynbtun 数据来源:互联网公开数据 标签:垃圾邮件, 电子邮件, 文本分类, 自然语言处理, 机器学习, 邮件过滤, 数据标注, 语料库 数据概述:...
-
电商地址信息数据集E-commerceAddressInformationDataset-jennagozali
电商地址信息数据集E-commerceAddressInformationDataset-jennagozali 数据来源:互联网公开数据 标签:电商数据, 地址信息, 地理位置, 数据清洗, 文本分析, 商家地址, 数据挖掘, 结构化数据 数据概述: 该数据集包含来自电商平台的用户地址信息,记录了商品销售相关的商家地址数据。主要特征如下:...



