-
数值型数据示例数据集NumericalDataSampleDataset-sezginildes
数值型数据示例数据集NumericalDataSampleDataset-sezginildes 数据来源:互联网公开数据 标签:数值分析, 数据示例, 数据探索, 统计分析, 数据格式, CSV数据, 数据处理, 教学案例 数据概述: 该数据集包含来自不同来源的数值型数据示例,记录了三列(A, B, C)的数值信息。主要特征如下:...
-
视频特征过滤数据集VideoFeatureFilteringDataset-shankace
视频特征过滤数据集VideoFeatureFilteringDataset-shankace 数据来源:互联网公开数据 标签:视频分析, 特征工程, 数据过滤, 机器学习, 视频内容, 数据清洗, 异常检测, 行为识别 数据概述: 该数据集包含从视频数据中提取的特征信息,记录了经过初步处理和过滤后的视频特征数据。主要特征如下:...
-
英语-马拉雅拉姆语平行语料库数据集English-MalayalamParallelCorpus-alakaru
英语-马拉雅拉姆语平行语料库数据集English-MalayalamParallelCorpus-alakaru 数据来源:互联网公开数据 标签:机器翻译, 语料库, 双语对照, 自然语言处理, 语言学, 文本数据, 英语, 马拉雅拉姆语 数据概述: 该数据集包含英语和马拉雅拉姆语的平行文本,用于机器翻译和跨语言分析。主要特征如下:...
-
阿拉伯语文本转写与标注数据集ArabicTextTranscriptionandAnnotation-mariamfaroukgadalla
阿拉伯语文本转写与标注数据集ArabicTextTranscriptionandAnnotation-mariamfaroukgadalla 数据来源:互联网公开数据 标签:阿拉伯语,文本转录,语音识别,自然语言处理,文本标注,语言学,语料库,数据清洗 数据概述:...
-
书籍信息缺失数据分析数据集BookInformationIncompleteDataAnalysis-yassermessahli
书籍信息缺失数据分析数据集BookInformationIncompleteDataAnalysis-yassermessahli 数据来源:互联网公开数据 标签:书籍信息, 数据清洗, 文本分析, 机器学习, 图书出版, 数据质量, 自然语言处理, 书籍推荐 数据概述:...
-
文本改写平行语料库数据集TextParaphraseCorpus-zahraasn
文本改写平行语料库数据集TextParaphraseCorpus-zahraasn 数据来源:互联网公开数据 标签:文本生成, 语义相似度, 句子改写, 自然语言处理, 机器翻译, 数据集构建, 文本多样性, 对比学习 数据概述: 该数据集包含用于文本改写的平行语料库,记录了原始句子及其对应的改写版本。主要特征如下:...
-
自然语言处理作业代码数据集NaturalLanguageProcessingHomeworkCodeDataset-balasrinivishal
自然语言处理作业代码数据集NaturalLanguageProcessingHomeworkCodeDataset-balasrinivishal 数据来源:互联网公开数据 标签:自然语言处理, 机器学习, 深度学习, 代码, Python, 作业, 文本分析, 神经网络 数据概述:...
-
文本语义匹配数据集TextSemanticMatchingDataset-khuongtran1209
文本语义匹配数据集TextSemanticMatchingDataset-khuongtran1209 数据来源:互联网公开数据 标签:语义匹配, 文本相似度, 自然语言处理, 文本理解, 对比分析, 数据集, 机器学习, 语言模型 数据概述: 该数据集包含来自不同来源的文本对,记录了句子对之间的语义关系。主要特征如下:...
-
商品店铺俄语翻译数据集ProductShopRussianTranslationDataset-rickykonwar
商品店铺俄语翻译数据集ProductShopRussianTranslationDataset-rickykonwar 数据来源:互联网公开数据 标签:俄语翻译, 商品店铺, 文本翻译, 语言模型, 机器翻译, 零售业, 数据清洗, 自然语言处理 数据概述: 该数据集包含来自俄罗斯零售店铺的商品店铺名称的俄语原文及其对应的英文翻译。主要特征如下:...
-
SMOGN算法Python实现与应用数据集SMOGNAlgorithmPythonImplementationandApplication-koweihuang
SMOGN算法Python实现与应用数据集SMOGNAlgorithmPythonImplementationandApplication-koweihuang 数据来源:互联网公开数据 标签:SMOGN, 数据集生成, 过采样, 不平衡数据, 机器学习, Python, 算法实现, 数据分析 数据概述: 该数据集包含SMOGN(Synthetic...
-
恶意指令检测数据集MaliciousInstructionDetectionDataset-mapatb22205
恶意指令检测数据集MaliciousInstructionDetectionDataset-mapatb22205 数据来源:互联网公开数据 标签:指令注入, 文本分类, 自然语言处理, 恶意软件分析, 对抗样本, 机器学习, 安全研究, 数据标注 数据概述:...
-
电子邮件内容关键词分析数据集EmailContentKeywordAnalysis-salonimourya
电子邮件内容关键词分析数据集EmailContentKeywordAnalysis-salonimourya 数据来源:互联网公开数据 标签:电子邮件, 文本分析, 关键词提取, Enron数据集, 自然语言处理, 文本挖掘, 数据清洗, 信息检索 数据概述:...
-
印尼语文本辱骂词与停用词数据集IndonesianTextAbusiveWordsandStopwordsDataset-tarishamazaya
印尼语文本辱骂词与停用词数据集IndonesianTextAbusiveWordsandStopwordsDataset-tarishamazaya 数据来源:互联网公开数据 标签:文本分析, 情感分析, 自然语言处理, 停用词, 辱骂词, 印尼语, 文本预处理, 词汇表 数据概述:...
-
垃圾邮件内容识别数据集SpamEmailContentRecognition-emanali980
垃圾邮件内容识别数据集SpamEmailContentRecognition-emanali980 数据来源:互联网公开数据 标签:垃圾邮件, 文本分类, 自然语言处理, 邮件过滤, 文本挖掘, 机器学习, 邮件内容, 二分类 数据概述: 该数据集包含来自公开邮件语料库的邮件内容数据,记录了用于识别垃圾邮件的文本样本。主要特征如下:...
-
多语言数字转录数据集MultilingualNumberTranscriptionDataset-shubhamprakash108
多语言数字转录数据集MultilingualNumberTranscriptionDataset-shubhamprakash108 数据来源:互联网公开数据 标签:多语言, 数字转录, 语音识别, 文本翻译, 语言学, 数据集, 文本处理, 机器翻译 数据概述: 该数据集包含多种语言的数字转录数据,记录了数字与其在不同语言中的对应表达。主要特征如下:...
-
文本生成检测训练数据集TextGenerationDetectionTrainingEssays-ahmadakil
文本生成检测训练数据集TextGenerationDetectionTrainingEssays-ahmadakil 数据来源:互联网公开数据 标签:文本生成, 人工智能写作, 机器生成文本, 文本检测, 写作风格分析, 自然语言处理, 数据标注, 机器学习 数据概述:...
-
泰坦尼克号乘客生存预测数据集TitanicPassengerSurvivalPrediction-hamdysaeed
泰坦尼克号乘客生存预测数据集TitanicPassengerSurvivalPrediction-hamdysaeed 数据来源:互联网公开数据 标签:泰坦尼克号, 生存预测, 数据分析, 机器学习, 乘客信息, 灾难事件, 数据清洗, 预测模型 数据概述: 该数据集包含来自泰坦尼克号乘客的详细信息,记录了乘客的个人特征及是否幸存。主要特征如下:...
-
仇恨言论识别与修正语句数据集HateSpeechDetectionandCorrectionSentences-devayani14
仇恨言论识别与修正语句数据集HateSpeechDetectionandCorrectionSentences-devayani14 数据来源:互联网公开数据 标签:仇恨言论, 文本分析, 语句修正, 恶意文本, 自然语言处理, 数据标注, 语言模型, 文本纠错 数据概述:...
-
SMOGN算法测试数据集SMOGNAlgorithmTestingDataset-koweihuang
SMOGN算法测试数据集SMOGNAlgorithmTestingDataset-koweihuang 数据来源:互联网公开数据 标签:SMOGN, 机器学习, 算法测试, 数据集, 过采样, 不平衡数据, 数据分析, 软件测试 数据概述: 该数据集包含用于测试SMOGN(Synthetic Minority Over-sampling...
-
多语言阅读理解训练数据集MultilingualReadingComprehensionTrainingData-priyanshulodha
多语言阅读理解训练数据集MultilingualReadingComprehensionTrainingData-priyanshulodha 数据来源:互联网公开数据 标签:阅读理解, 问答系统, 机器阅读, 文本处理, 多语言, 自然语言处理, 文本标注, 语料库 数据概述:...



