-
数据平衡与分类场景下的Potrika数据集BalancedDatasetfromPotrika-habib3034
数据平衡与分类场景下的Potrika数据集BalancedDatasetfromPotrika-habib3034 数据来源:互联网公开数据 标签:数据平衡,分类任务,数据集,机器学习,统计分析,数据科学,模型训练,算法验证 数据概述: 该数据集来源于Potrika项目,经过特别处理以实现数据平衡,适用于分类任务的训练和验证。主要特征如下:...
-
邮件垃圾信息分类数据集EmailSpamClassificationDataset-jeisonjimnez
邮件垃圾信息分类数据集EmailSpamClassificationDataset-jeisonjimnez 数据来源:互联网公开数据 标签:垃圾邮件, 文本分类, 自然语言处理, 机器学习, 邮件过滤, 数据标注, 情感分析, 邮件内容 数据概述:...
-
数据质量评估基准数据集DataQualityEstimationBenchmarkDataset-bulivington
数据质量评估基准数据集DataQualityEstimationBenchmarkDataset-bulivington 数据来源:互联网公开数据 标签:数据质量,评估基准,数据清洗,数据科学,机器学习,数据管理,质量控制,数据分析 数据概述:该数据集包含来自多个数据集的数据质量评估指标,用于衡量和比较不同数据集的质量特征。主要特征如下:...
-
贝类生物年龄预测样本提交数据集ShellfishAgePredictionSampleSubmission-harshitrajpal2508
贝类生物年龄预测样本提交数据集ShellfishAgePredictionSampleSubmission-harshitrajpal2508 数据来源:互联网公开数据 标签:贝类, 生物学, 年龄预测, 机器学习, 数据分析, 样本提交, 预测模型, 竞赛数据 数据概述:...
-
网页HTML代码数据集WebpageHTMLCodeDataset-moemenebdelli
网页HTML代码数据集WebpageHTMLCodeDataset-moemenebdelli 数据来源:互联网公开数据 标签:HTML, 网页, 网络爬虫, 数据抓取, 文本分析, 网页结构, 数据清洗, 自然语言处理 数据概述: 该数据集包含从互联网抓取的HTML网页代码,记录了网页的结构化文本信息。主要特征如下:...
-
推特文本语料清洗数据集TwitterTextCorpusCleaning-jonathancy
推特文本语料清洗数据集TwitterTextCorpusCleaning-jonathancy 数据来源:互联网公开数据 标签:推特数据, 文本清洗, 自然语言处理, 语料库, 文本分析, 数据预处理, 社交媒体, 数据挖掘 数据概述: 该数据集包含来自推特平台的文本数据,记录了推文内容,主要用于文本清洗和预处理研究。主要特征如下:...
-
异常数据检测训练数据集AnomalyDetectionTrainingData-georgiosandronikou
异常数据检测训练数据集AnomalyDetectionTrainingData-georgiosandronikou 数据来源:互联网公开数据 标签:异常检测,机器学习,数据清洗,特征工程,模式识别,数据分析,时间序列,模型训练 数据概述: 该数据集包含用于异常数据检测任务的训练数据,记录了可能包含异常值的数据样本。主要特征如下:...
-
垃圾邮件-非垃圾邮件文本分类数据集Spam-HamTextClassificationDataset-muskanchughds
垃圾邮件-非垃圾邮件文本分类数据集Spam-HamTextClassificationDataset-muskanchughds 数据来源:互联网公开数据 标签:文本分类, 垃圾邮件, 邮件过滤, 自然语言处理, 机器学习, 文本分析, 邮件语料库, 数据标注 数据概述:...
-
问题文本真伪分类数据集QuestionTextSincerityClassification-httpwwwfszyc
问题文本真伪分类数据集QuestionTextSincerityClassification-httpwwwfszyc 数据来源:互联网公开数据 标签:文本分类, 自然语言处理, 情感分析, 问答系统, 垃圾信息检测, 机器学习, 语料库, 数据标注 数据概述:...
-
产品编码异常检测数据集ProductCodeAnomalyDetection-awadiabalokatanga
产品编码异常检测数据集ProductCodeAnomalyDetection-awadiabalokatanga 数据来源:互联网公开数据 标签:产品编码, 异常检测, 数据分类, 质量控制, 工业制造, 机器学习, 数据清洗, 算法模型 数据概述:...
-
心血管疾病诊断HTML文本数据集CardiovascularDiseaseDiagnosisHTMLTextDataset-mitrajitkamble
心血管疾病诊断HTML文本数据集CardiovascularDiseaseDiagnosisHTMLTextDataset-mitrajitkamble 数据来源:互联网公开数据 标签:心血管疾病, 文本数据, HTML, 医疗健康, 数据清洗, 文本分析, 机器学习, 数据集 数据概述:...
-
人工智能代码生成训练数据集-2021
人工智能代码生成训练数据集-2021 数据来源:互联网公开数据 标签:人工智能,代码生成,训练数据,数据科学,机器学习,编程,数据处理 数据概述: 本数据集包含用于人工智能代码生成模型训练的数据。数据集中包含了代码片段及其对应的自然语言描述,旨在帮助训练模型能够根据自然语言指令生成相应的代码。该数据集适用于机器学习和自然语言处理领域的研究与开发。...
-
文本内容恶意评论分类数据集TextContentMaliciousCommentClassificationDataset-teitlax
文本内容恶意评论分类数据集TextContentMaliciousCommentClassificationDataset-teitlax 数据来源:互联网公开数据 标签:文本分类, 恶意评论, 自然语言处理, 情感分析, 深度学习, 多标签分类, 语料库, 内容审核 数据概述:...
-
简历筛选数据集ResumeScreeningDataset-rizwanrizvi
简历筛选数据集ResumeScreeningDataset-rizwanrizvi 数据来源:互联网公开数据 标签:简历分析, 职业匹配, 人力资源, 文本挖掘, 数据清洗, 机器学习, 简历解析, 错误检测 数据概述: 该数据集包含从招聘平台或其他来源收集的简历信息,记录了应聘者的个人信息、工作经历、教育背景、技能以及薪资等。主要特征如下:...
-
欧洲在线船艇交易平台船艇列表数据集-2021年
欧洲在线船艇交易平台船艇列表数据集-2021年 数据来源:互联网公开数据 标签:在线市场,船艇,欧洲,数据工程,预测分析,图片数据,元数据,文本数据,市场价格 数据概述:...
-
呼叫中心通话记录数据集CallCenterCallRecords-nandan6969
呼叫中心通话记录数据集CallCenterCallRecords-nandan6969 数据来源:互联网公开数据 标签:呼叫中心, 通话记录, 数据分析, 客户服务, 行为分析, 数据清洗, 业务优化, 客户体验 数据概述: 该数据集包含来自呼叫中心的通话记录数据,记录了通话相关的关键信息。主要特征如下:...
-
越南语文本数据有效性分析数据集VietnameseTextDataValidityAnalysis-nguynththanhho
越南语文本数据有效性分析数据集VietnameseTextDataValidityAnalysis-nguynththanhho 数据来源:互联网公开数据 标签:越南语, 文本分析, 数据清洗, 文本分类, 自然语言处理, 数据质量, 语言模型, 语料库 数据概述: 该数据集包含来自越南语文本的数据,记录了文本的有效性评估结果。主要特征如下:...
-
生物物种名称数据集BiologicalSpeciesNameDataset-kunihikofurugori
生物物种名称数据集BiologicalSpeciesNameDataset-kunihikofurugori 数据来源:互联网公开数据 标签:生物学, 物种命名, 生物多样性, 分类学, 科学命名, 数据清洗, 文本数据, 生物信息学 数据概述: 该数据集包含生物物种的科学命名数据,用于物种识别和分类研究。主要特征如下:...
-
推特文本情感分析训练数据集TwitterTextSentimentAnalysisTrainingDataset-muhamadfaheem88
推特文本情感分析训练数据集TwitterTextSentimentAnalysisTrainingDataset-muhamadfaheem88 数据来源:互联网公开数据 标签:情感分析, 文本分类, 社交媒体, 自然语言处理, 机器学习, 情感标注, 文本语料, 深度学习 数据概述:...
-
葡萄酒质量数据HTML页面数据集WineQualityDataHTMLPage-manishkr1754
葡萄酒质量数据HTML页面数据集WineQualityDataHTMLPage-manishkr1754 数据来源:互联网公开数据 标签:葡萄酒, 质量评估, HTML, 数据抓取, 数据清洗, 网页分析, 数据集构建, 机器学习 数据概述: 该数据集包含从HTML页面抓取的数据,记录了关于葡萄酒质量评估的信息。主要特征如下:...



