-
推特文本清洗与展开缩写数据集CleanTweetswithExpandedContractionsDataset-mgmdif
推特文本清洗与展开缩写数据集CleanTweetswithExpandedContractionsDataset-mgmdif 数据来源:互联网公开数据 标签:推特,文本数据,数据清洗,自然语言处理,缩写展开,情感分析,机器学习,社交媒体 数据概述: 该数据集包含从推特(Twitter)平台收集的文本数据,并进行了清洗和缩写展开处理。主要特征如下:... -
商品标题文本预处理数据集ProductTitleTextPreprocessing-akshatgargbot
商品标题文本预处理数据集ProductTitleTextPreprocessing-akshatgargbot 数据来源:互联网公开数据 标签:商品标题, 文本预处理, 词干提取, 词形还原, 自然语言处理, 文本挖掘, 数据清洗, 机器学习 数据概述:... -
泰英双语翻译文本数据集Thai-EnglishBilingualTranslationText-jaroensakyodkantha
泰英双语翻译文本数据集Thai-EnglishBilingualTranslationText-jaroensakyodkantha 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 双语语料库, 泰语, 英语, 自然语言处理, 语言学, 数据清洗 数据概述:... -
预处理输入数据分析数据集-mattiaangeli
预处理输入数据分析数据集-mattiaangeli 数据来源:互联网公开数据 标签:数据预处理,机器学习,数据集,特征工程,数据分析,模型训练,数据清洗,特征提取 数据概述: 该数据集包含预处理后的输入数据,用于机器学习模型的训练和评估。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于原始数据集的收集时间。... -
文本数据常用词汇统计分析数据集TextDataCommonWordStatisticsAnalysis-shivamanhar
文本数据常用词汇统计分析数据集TextDataCommonWordStatisticsAnalysis-shivamanhar 数据来源:互联网公开数据 标签:文本分析, 词频统计, 自然语言处理, 语料库, 数据清洗, 文本预处理, 基础词汇, 数据集 数据概述:... -
数据2019年CIC-DDoS攻击检测数据集CICDDoS2019No-Corr-ColDataset-jafftaffy
2019年CIC-DDoS攻击检测数据集CICDDoS2019No-Corr-ColDataset-jafftaffy 数据来源:互联网公开数据 标签:网络攻击,数据集,DDoS检测,网络安全,机器学习,数据清洗,异常检测,网络监控 数据概述:该数据集来自CIC... -
视频字幕过滤数据集SubtitleFilteredDataset-hooong
视频字幕过滤数据集SubtitleFilteredDataset-hooong 数据来源:互联网公开数据 标签:字幕,视频,文本分析,自然语言处理,数据集,内容过滤,机器学习,数据清洗 数据概述: 该数据集包含经过筛选和过滤的视频字幕数据,旨在用于文本分析、内容过滤和自然语言处理任务。主要特征如下:... -
谷歌数据分析案例研究数据集GoogleDataAnalyticsCaseStudyDataset-theofanistsalparas
谷歌数据分析案例研究数据集GoogleDataAnalyticsCaseStudyDataset-theofanistsalparas 数据来源:互联网公开数据 标签:数据分析,案例研究,数据集,商业智能,数据清洗,市场分析,业务优化,科技公司 数据概述:... -
俄罗斯地址信息结构化数据集RussianAddressStructuredDataset-zokost
俄罗斯地址信息结构化数据集RussianAddressStructuredDataset-zokost 数据来源:互联网公开数据 标签:地址解析, 地理信息, 文本挖掘, 结构化数据, 俄罗斯, 数据清洗, 自然语言处理, 机器学习 数据概述: 该数据集包含来自俄罗斯地区的地址信息,旨在用于地址标准化、地理编码和相关数据分析任务。主要特征如下:... -
地址数据增强数据集-tanguanyu
地址数据增强数据集-tanguanyu 数据来源:互联网公开数据 标签:地址数据,数据增强,自然语言处理,机器学习,文本处理,数据清洗,地理信息,人工智能 数据概述: 该数据集包含经过多种方法增强的地址数据,旨在提高地址数据的多样性和可用性。主要特征如下: 时间跨度:数据记录的时间范围涵盖了当前年份及之前的地址数据。... -
地名匹配与预测数据集GeographicNameMatchingandPredictionDataset-takoihiraokazu
地名匹配与预测数据集GeographicNameMatchingandPredictionDataset-takoihiraokazu 数据来源:互联网公开数据 标签:地名匹配, 文本相似度, 地理信息系统, 数据挖掘, 预测模型, 实体链接, 机器学习, 数据清洗 数据概述: 该数据集包含多个CSV文件,记录了地名匹配与预测的相关数据。主要特征如下:... -
文本标注代码数据集TextAnnotationCodeDataset-jafarjon
文本标注代码数据集TextAnnotationCodeDataset-jafarjon 数据来源:互联网公开数据 标签:文本标注, 代码分析, 数据清洗, 自然语言处理, 机器学习, 数据集构建, 文本处理, 代码示例 数据概述: 该数据集包含来自网络公开的数据,记录了与文本标注相关的代码示例。主要特征如下:... -
导航数据清洗数据集NavDataCleanedDataset-dewashyadubey
导航数据清洗数据集NavDataCleanedDataset-dewashyadubey 数据来源:互联网公开数据 标签:导航数据,数据清洗,数据集,交通分析,机器学习,位置服务,地理信息,数据处理 数据概述: 该数据集包含经过清洗和标准化的导航数据,记录了车辆或移动设备的导航轨迹信息。主要特征如下:... -
药物名称数据集UCIDrugNameDataset-ahmedalghali
药物名称数据集UCIDrugNameDataset-ahmedalghali 数据来源:互联网公开数据 标签:药物名称,数据集,药理学,医学,数据清洗,信息检索,自然语言处理,健康科学 数据概述:该数据集来源于UCI机器学习库,记录了多种药物的相关信息,包括药物名称、品牌名称、药物类别、活性成分等。主要特征如下:... -
清洗后的电子邮件数据集-ashishgoraniya
清洗后的电子邮件数据集-ashishgoraniya 数据来源:互联网公开数据 标签:电子邮件,数据集,文本分析,自然语言处理,垃圾邮件检测,信息检索,情感分析,数据清洗 数据概述: 该数据集包含了经过清洗的电子邮件数据,主要用于文本分析和自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,取决于原始邮件的时间范围。... -
奶牛饲养场牛栏编号数据集CowStallNumberDataset-shareef0612
奶牛饲养场牛栏编号数据集CowStallNumberDataset-shareef0612 数据来源:互联网公开数据 标签:奶牛饲养,牛栏管理,数据集,农业科学,农场管理,物联网,数据清洗,智能养殖 数据概述:该数据集包含来自奶牛饲养场的牛栏编号数据,记录了每头奶牛在饲养场中的位置信息,适用于牛栏管理、饲养效率分析等任务。主要特征如下:... -
基础数据清洗数据集-jianbinchenuc
基础数据清洗数据集-jianbinchenuc 数据来源:互联网公开数据 标签:数据清洗,数据质量,数据集,数据预处理,数据分析,统计学,机器学习,数据科学 数据概述: 该数据集包含了用于基础数据清洗的各种数据,记录了不同类型数据中常见的脏数据和缺失数据。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时间段的数据。... -
历史申请数据清洗数据集CleanPreviousApplicationCSVDataset-duynguyen2
历史申请数据清洗数据集CleanPreviousApplicationCSVDataset-duynguyen2 数据来源:互联网公开数据 标签:金融业,申请数据,数据清洗,数据分析,机器学习,信用评估,数据集,风险管理 数据概述: 该数据集包含经过清洗的历史申请数据,记录了个人或企业的贷款申请信息。主要特征如下:... -
测试数据集ClearTestDataFinalDataset-its4iris
测试数据集ClearTestDataFinalDataset-its4iris 数据来源:互联网公开数据 标签:测试数据,数据集,数据验证,数据清洗,机器学习,数据分析,数据处理,质量控制 数据概述: 该数据集包含用于测试和验证目的的标准化数据,主要用于数据清洗、模型测试和数据验证等任务。主要特征如下:... -
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-haphan68
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-haphan68 数据来源:互联网公开数据 标签:越南语, 文本纠错, 自然语言处理, 语言模型, 文本校对, 数据清洗, 机器翻译, 拼写纠错 数据概述: 该数据集包含越南语文本的错误文本及其对应的正确文本,用于越南语文本的纠错任务。主要特征如下:...