-
大规模恶意评论检测数据集ToxicCommentClassificationChallenge-amankumar2002
大规模恶意评论检测数据集ToxicCommentClassificationChallenge-amankumar2002 数据来源:互联网公开数据 标签:文本分类,自然语言处理,深度学习,恶意评论,情感分析,数据集,机器学习,NLP 数据概述:...
-
基因组数据清洗数据集-washingtongold
基因组数据清洗数据集-washingtongold 数据来源:互联网公开数据 标签:基因组学,数据清洗,数据集,生物信息学,基因分析,数据处理,机器学习,序列分析 数据概述: 该数据集包含经过清洗的基因组数据,用于基因组学研究和生物信息学分析。主要特征如下: 时间跨度:数据记录的时间范围根据具体基因组数据而定。...
-
有毒内容分类数据集ToxicContentClassificationDataset-huangcunzeng
有毒内容分类数据集ToxicContentClassificationDataset-huangcunzeng 数据来源:互联网公开数据 标签:内容审核,文本分类,机器学习,自然语言处理,数据集,情感分析,网络安全,人工智能 数据概述:...
-
数据处理与修正数据集CorrectionofProcessingDataset-godgod3
数据处理与修正数据集CorrectionofProcessingDataset-godgod3 数据来源:互联网公开数据 标签:数据处理,数据修正,数据集,数据清洗,质量控制,数据管理,数据分析,机器学习 数据概述: 该数据集专注于数据处理与修正,记录了原始数据在处理过程中可能出现的错误及修正方法。主要特征如下:...
-
音视频转录文本数据集Audio-to-TextTranscriptionDataset-yumoan
音视频转录文本数据集Audio-to-TextTranscriptionDataset-yumoan 数据来源:互联网公开数据 标签:语音识别, 文本转录, 语音转文本, 音频分析, 深度学习, 自然语言处理, 数据标注, 机器翻译 数据概述: 该数据集包含来自公开音视频资源的转录文本数据,主要用于训练和评估语音转文本(STT)模型。主要特征如下:...
-
原始数据集OrigDataDataset-heitorbaldo
原始数据集OrigDataDataset-heitorbaldo 数据来源:互联网公开数据 标签:原始数据,数据集,数据采集,数据预处理,数据分析,机器学习,数据科学,基础研究 数据概述: 该数据集包含来自多个来源的原始数据,记录了未经处理或经过初步整理的基础信息。主要特征如下: 时间跨度:数据记录的时间范围不固定,可能涵盖过去几年或更长时间。...
-
CodeBERT代码生成数据集CodeBERTCodeGenerationDataset-ducanger
CodeBERT代码生成数据集CodeBERTCodeGenerationDataset-ducanger 数据来源:互联网公开数据 标签:代码生成,自然语言处理,深度学习,代码理解,软件工程,数据集,编程,文本生成 数据概述: 该数据集包含由CodeBERT模型生成的代码数据,用于代码生成任务。主要特征如下:...
-
数据链接加密字符串数据集DataLinkEncryptedStringDataset-pankaj13461
数据链接加密字符串数据集DataLinkEncryptedStringDataset-pankaj13461 数据来源:互联网公开数据 标签:数据安全, 字符串, 加密, 数据清洗, 文本分析, 隐私保护, 机器学习, 数据编码 数据概述: 该数据集包含来自互联网的数据链接加密字符串,记录了经过加密处理的字符串信息。主要特征如下:...
-
未知主题多文件数据集UnknownThemeMulti-FileDataset-bowzzz
未知主题多文件数据集UnknownThemeMulti-FileDataset-bowzzz 数据来源:互联网公开数据 标签:数据探索, 多文件, 数据分析, 缺失信息, 数据整合, 字段未知, 数据挖掘, 统计分析 数据概述: 该数据集包含来自未知来源的多个CSV文件,记录了未知主题下的数据信息。主要特征如下:...
-
中文新闻情感分析预处理数据集ChineseNewsSentimentAnalysisPreprocessedDataset-abidinawres
中文新闻情感分析预处理数据集ChineseNewsSentimentAnalysisPreprocessedDataset-abidinawres 数据来源:互联网公开数据 标签:情感分析, 文本处理, 自然语言处理, 中文文本, 情绪识别, 数据清洗, 机器学习, 舆情分析 数据概述:...
-
文本校对数据集DataFrameSpellcheckDataset-alvaromendizabal
文本校对数据集DataFrameSpellcheckDataset-alvaromendizabal 数据来源:互联网公开数据 标签:文本校对,拼写检查,自然语言处理,数据集,机器学习,语言模型,文本纠错,数据清洗 数据概述: 该数据集包含用于文本校对和拼写检查的文本数据,记录了包含拼写错误和对应正确拼写的文本对。主要特征如下:...
-
TabNet预训练数据集大规模GBM插补器-随机种子62数据集-mipypf
TabNet预训练数据集大规模GBM插补器-随机种子62数据集-mipypf 数据来源:互联网公开数据 标签:TabNet, 数据集, 机器学习, 模型预训练, 数据插补, GBM, 人工智能, 数据科学 数据概述:该数据集用于TabNet模型的预训练,包含经过大规模GBM插补器处理的数据。主要特征如下:...
-
完整探索性数据分析数据集CompleteEDADataset-mobin555
完整探索性数据分析数据集CompleteEDADataset-mobin555 数据来源:互联网公开数据 标签:数据分析,EDA,数据集,数据可视化,机器学习,统计分析,数据预处理,特征工程 数据概述: 该数据集包含了广泛的数据类型和变量,旨在用于进行全面的探索性数据分析(EDA)。主要特征如下:...
-
越南语问答匹配训练数据集VietnameseQuestionAnsweringMatchingTrainingData-ictunivers
越南语问答匹配训练数据集VietnameseQuestionAnsweringMatchingTrainingData-ictunivers 数据来源:互联网公开数据 标签:问答匹配, 自然语言处理, 文本分类, 越南语, 知识检索, 语义理解, 对话系统, 数据标注 数据概述:...
-
阿拉伯语问答数据集-真伪判断与文本分析ArabicQuestionAnsweringDataset-TrueorFalseJudgmentandTextA...
阿拉伯语问答数据集-真伪判断与文本分析ArabicQuestionAnsweringDataset-TrueorFalseJudgmentandTextAnalysis-ibrahim2002 数据来源:互联网公开数据 标签:阿拉伯语, 问答系统, 文本分析, 信息检索, 事实判断, 自然语言处理, 机器阅读理解, 数据集 数据概述:...
-
数据预处理Arthur数据集PreprocessingArthurDataset-valentinlaurent2
数据预处理Arthur数据集PreprocessingArthurDataset-valentinlaurent2 数据来源:互联网公开数据 标签:数据预处理,机器学习,数据清洗,特征工程,人工智能,数据科学,数据集,技术应用 数据概述: 该数据集包含来自 Arthur...
-
英国标点符号光学字符识别数据集PunctuationUKOCRDataset-thnhhunhtn
英国标点符号光学字符识别数据集PunctuationUKOCRDataset-thnhhunhtn 数据来源:互联网公开数据 标签:光学字符识别,文本处理,数据集,自然语言处理,机器学习,英语语言,标点符号,计算机视觉 数据概述: 该数据集专注于英国英语中的标点符号光学字符识别(OCR),记录了各种文档中的标点符号及其识别结果。主要特征如下:...
-
Colab测试数据集ColabTestDataset-shinoda18
Colab测试数据集ColabTestDataset-shinoda18 数据来源:互联网公开数据 标签:测试数据,数据集,机器学习,数据分析,教育,技术验证 数据概述: 该数据集为用于测试Colab等在线数据分析工具的示例数据,记录了基础的测试案例。主要特征如下: 时间跨度:数据记录的时间范围不明确。 地理范围:数据不涉及具体地理范围。...
-
多格式数据分析与转换数据集-zengpu
多格式数据分析与转换数据集-zengpu 数据来源:互联网公开数据 标签:数据分析,数据转换,数据集,格式处理,数据清洗,数据科学,机器学习,Python 数据概述: 该数据集包含多种不同格式的数据,旨在帮助用户学习和实践数据分析与转换技能。主要特征如下: 时间跨度:数据的时间范围不固定,取决于各个子数据集的特性。...
-
Bellabeat健康追踪数据集BellabeatCaseStudyOriginalDirtyDataDataset-sydneylynnyoung
Bellabeat健康追踪数据集BellabeatCaseStudyOriginalDirtyDataDataset-sydneylynnyoung 数据来源:互联网公开数据 标签:健康追踪,数据集,数据分析,用户行为,运动监测,睡眠研究,时间序列,健康管理 数据概述:...



