-
问答主题文本转换数据集QuestionAnsweringTopicTextConversion-hobertj
问答主题文本转换数据集QuestionAnsweringTopicTextConversion-hobertj 数据来源:互联网公开数据 标签:文本转换, 问答系统, 文本摘要, 语义分析, 文本生成, 自然语言处理, 数据清洗, 机器翻译 数据概述:...
-
新闻标题翻译与来源识别数据集NewsTitleTranslationandSourceIdentificationDataset-zmddzf
新闻标题翻译与来源识别数据集NewsTitleTranslationandSourceIdentificationDataset-zmddzf 数据来源:互联网公开数据 标签:机器翻译, 文本摘要, 命名实体识别, 新闻分析, 语言模型, 数据清洗, 文本挖掘, 信息检索 数据概述:...
-
文本增强语料数据集TextAugmentationCorpus-fareedmohamed
文本增强语料数据集TextAugmentationCorpus-fareedmohamed 数据来源:互联网公开数据 标签:文本增强, 数据增强, 自然语言处理, 文本生成, 机器学习, 噪声注入, 文本处理, 语料库 数据概述: 该数据集包含经过文本增强处理的语料,记录了原始文本及其对应的增强版本,主要用于训练和评估文本增强模型。主要特征如下:...
-
命名实体识别标注数据集NamedEntityRecognitionAnnotationDataset-monoranjan24
命名实体识别标注数据集NamedEntityRecognitionAnnotationDataset-monoranjan24 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 文本标注, 序列标注, 词性标注, 语言模型, 语料库, 机器学习 数据概述:...
-
垃圾邮件短信识别数据集SpamSMSMessageIdentificationDataset-nickken253
垃圾邮件短信识别数据集SpamSMSMessageIdentificationDataset-nickken253 数据来源:互联网公开数据 标签:文本分类, 垃圾邮件, 短信, 自然语言处理, 机器学习, 数据预处理, 情感分析, 文本挖掘 数据概述:...
-
异常检测数据集OutlierDetectionDataset-wuhuegg
异常检测数据集OutlierDetectionDataset-wuhuegg 数据来源:互联网公开数据 标签:异常检测,数据集,机器学习,数据分析,统计学,模式识别,数据清洗,应用研究 数据概述: 该数据集包含了来自多个领域的异常检测数据,适用于异常模式识别和数据清洗等任务。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
-
命名实体识别数据集NamedEntityRecognitionDataset-c4pt41n2004
命名实体识别数据集NamedEntityRecognitionDataset-c4pt41n2004 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 文本标注, 机器学习, 语料库, 实体识别, 数据集, NER 数据概述:...
-
结构化数据回归预测数据集StructuredDataRegressionPredictionDataset-sunnysinha
结构化数据回归预测数据集StructuredDataRegressionPredictionDataset-sunnysinha 数据来源:互联网公开数据 标签:回归分析, 结构化数据, 机器学习, 预测模型, 数值预测, 特征工程, 交叉验证, 数据集 数据概述: 该数据集包含结构化数据,用于回归预测任务。主要特征如下:...
-
联系人信息地理分布数据集ContactInformationGeographicDistribution-talhaabdurrahman
联系人信息地理分布数据集ContactInformationGeographicDistribution-talhaabdurrahman 数据来源:互联网公开数据 标签:联系人信息, 地理位置, 电子邮件, 数据清洗, 数据分析, 文本数据, 商业应用, 客户管理 数据概述:...
-
数据20K负样本数据集20kNegativesDataset-ictworld
20K负样本数据集20kNegativesDataset-ictworld 数据来源:互联网公开数据 标签:负样本,数据集,机器学习,分类问题,数据增强,数据清洗,自然语言处理,人工智能 数据概述:该数据集包含20,000个负样本数据,适用于机器学习中的分类问题,特别适合数据增强和负样本学习。主要特征如下:...
-
图像文本信息提取预测数据集ImageTextInformationExtractionPredictionDataset-kartiknarayansahoo
图像文本信息提取预测数据集ImageTextInformationExtractionPredictionDataset-kartiknarayansahoo 数据来源:互联网公开数据 标签:图像识别, 文本提取, OCR, 机器学习, 命名实体识别, 数据标注, 模型训练, 预测分析 数据概述:...
-
社交媒体仇恨言论检测数据集SocialMediaHateSpeechDetectionDataset-rajkariya
社交媒体仇恨言论检测数据集SocialMediaHateSpeechDetectionDataset-rajkariya 数据来源:互联网公开数据 标签:仇恨言论, 社交媒体, 文本分类, 情感分析, 恶意内容, 文本清洗, 自然语言处理, 数据标注 数据概述:...
-
简历信息实体识别数据集ResumeInformationEntityRecognitionDataset-niteshsinghr
简历信息实体识别数据集ResumeInformationEntityRecognitionDataset-niteshsinghr 数据来源:互联网公开数据 标签:简历解析, 实体识别, 自然语言处理, 信息抽取, 文本标注, 数据集, 机器学习, 文本分析 数据概述: 该数据集包含从简历中提取的信息,用于训练和评估实体识别模型。主要特征如下:...
-
随机欠采样数据集RandomUnder-SamplingDataset-primadya021
随机欠采样数据集RandomUnder-SamplingDataset-primadya021 数据来源:互联网公开数据 标签:数据集,机器学习,数据平衡,欠采样,类别不平衡,数据处理,统计分析,算法优化 数据概述: 该数据集专注于通过随机欠采样技术解决数据类别不平衡问题,记录了从原始数据集中随机减少多数类样本的过程和结果。主要特征如下:...
-
垃圾邮件检测邮件正文数据集SpamDetectionEmailBodyDataset-deanleung
垃圾邮件检测邮件正文数据集SpamDetectionEmailBodyDataset-deanleung 数据来源:互联网公开数据 标签:垃圾邮件, 邮件分类, 文本分析, 自然语言处理, 机器学习, 文本挖掘, 二分类, 邮件安全 数据概述: 该数据集包含来自互联网的邮件正文数据,记录了用于垃圾邮件检测的邮件内容示例。主要特征如下:...
-
谷歌大脑研究项目五折数据集GoogleBrain5foldsDataset-tahsinulislam
谷歌大脑研究项目五折数据集GoogleBrain5foldsDataset-tahsinulislam 数据来源:互联网公开数据 标签:人工智能,数据集,机器学习,深度学习,研究项目,数据科学,谷歌技术,算法优化 数据概述: 该数据集来源于谷歌大脑研究项目,包含多个机器学习任务的数据,特别适用于模型训练和算法优化。主要特征如下:...
-
Bellabeat用户健康数据分析案例研究数据集-britaasmith
数据概述: 本数据集包含了Bellabeat公司旗下智能设备的用户健康数据,包括原始数据、清洗后的数据以及SQL查询结果表。数据以电子表格形式提供,旨在支持Tableau可视化分析和GitHub存储库中的案例研究。 数据用途概述:...
-
印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpusTranslationDataset-swapanroy
印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpusTranslationDataset-swapanroy 数据来源:互联网公开数据 标签:机器翻译, 语料库, 印地语, 英语, 文本数据, 语言学, 双语对照, 自然语言处理 数据概述: 该数据集包含印地语-英语平行语料,记录了印地语和英语的句子对。主要特征如下:...
-
机器学习分类预测数据集MachineLearningClassificationPrediction-kiesik98
机器学习分类预测数据集MachineLearningClassificationPrediction-kiesik98 数据来源:互联网公开数据 标签:分类预测, 机器学习, 类别特征, 数值特征, 模型训练, 数据分析, 预测建模, 评估指标 数据概述:...
-
问题相似度判断预处理数据集QuestionSimilarityPreprocessedDataset-longhainguyen
问题相似度判断预处理数据集QuestionSimilarityPreprocessedDataset-longhainguyen 数据来源:互联网公开数据 标签:问题相似度, 文本预处理, 自然语言处理, 问答系统, 文本分类, 语义分析, 数据清洗, 机器学习 数据概述:...



