-
CICPDF恶意软件检测数据集2022-satyaprakash138
CICPDF恶意软件检测数据集2022-satyaprakash138 数据来源:互联网公开数据 标签:CIC,PDF,恶意软件,网络安全,机器学习,数据集,特征提取,数据清洗,可视化,研究,开发,基准测试,社区参与 数据概述: CIC...
-
房地产列表数据集-未清洗2023-sabrinamacaluso
房地产列表数据集-未清洗2023-sabrinamacaluso 数据来源:互联网公开数据 标签:房地产,列表数据,未清洗,PropertyFinder,房产信息,面积,价格,房源 数据概述:...
-
网络URL良性与恶意分类数据集-2023-ahmad216658
网络URL良性与恶意分类数据集-2023-ahmad216658 数据来源:互联网公开数据 标签:URL分类,网络安全,恶意软件检测,数据集,平衡数据集,良性URL,恶意URL 数据概述: 本数据集包含632,508个唯一的URL,其中包括相同数量的良性URL和恶意URL。该数据集通过合并两个Kaggle上的数据集创建而成。...
-
AiroborosLLM数学对话数据集机器学习复杂数学运算实践数据集-thedevastator
AiroborosLLM数学对话数据集机器学习复杂数学运算实践数据集-thedevastator 数据来源:互联网公开数据 标签:机器学习,数学,对话,自然语言处理,运算,模型训练,Airoboros,ShareGPT,教育 数据概述:...
-
美国婴儿姓名数据集1910至2021年-donkea
美国婴儿姓名数据集1910至2021年-donkea 数据来源:互联网公开数据 标签:婴儿姓名,美国,人口统计,历史数据,社会学研究,数据清洗,教育 数据概述:...
-
自动WEKA算法选择工具SWAN-AutoWEKA数据集-swandoc
自动WEKA算法选择工具SWAN-AutoWEKA数据集-swandoc 数据来源:互联网公开数据 标签:自动机器学习,WEKA,算法选择,数据科学,参数优化,机器学习框架,开源代码 数据概述: 本数据集包含用于运行Auto-WEKA的SWAN-...
-
端到端自然语言生成餐厅领域挑战数据集-2017-mexwell
端到端自然语言生成餐厅领域挑战数据集-2017-mexwell 数据来源:互联网公开数据 标签:自然语言生成,NLG,端到端,数据驱动,餐厅领域,挑战数据集,文本生成 数据概述:...
-
格鲁吉亚汽车品牌与车型翻译数据集-alexey300479
格鲁吉亚汽车品牌与车型翻译数据集-alexey300479 数据来源:互联网公开数据 标签:汽车,品牌,车型,翻译,格鲁吉亚语,英语,数据预处理,机器学习 数据概述: 本数据集包含两个核心文件,用于汽车品牌和车型的翻译,主要服务于汽车价格预测等机器学习任务。 cars.csv:该文件包含了汽车制造商和车型的列表,其中车型信息以格鲁吉亚语呈现。...
-
文本分类问答数据集-2011年至2021年-thedevastator
文本分类问答数据集-2011年至2021年-thedevastator 数据来源:互联网公开数据 标签:文本分类,问答系统,自然语言处理,机器学习,数据集,教育,研究 数据概述:...
-
大型语言模型训练数据文法修正数据集-syoh0708
大型语言模型训练数据文法修正数据集-syoh0708 数据来源:互联网公开数据 标签:大型语言模型,文本数据,文法修正,自然语言处理,语言模型训练,文本处理 数据概述: 本数据集包含了两个经过文法修正的大型语言模型(LLM)训练数据集。 数据集一源自Kaggle上的“DAIGT Proper Train...
-
印度农民咨询电话问答数据集-daskoushik
印度农民咨询电话问答数据集-daskoushik 数据来源:互联网公开数据 标签:农业,农民,问答系统,自然语言处理,Kisan Call Centre,数据清洗,QA,印度 数据概述: 本数据集包含印度农民通过Kisan Call...
-
教育类聊天机器人意图识别数据集-leewanhung
教育类聊天机器人意图识别数据集-leewanhung 数据来源:互联网公开数据 标签:聊天机器人,意图识别,教育,自然语言处理,对话系统,机器学习,文本数据 数据概述: 本数据集旨在支持教育领域聊天机器人的构建,包含多种意图,以适应广泛的对话场景。 数据集包括核心意图和组合意图,旨在增强聊天机器人的交互能力。 核心意图:...
-
新闻真伪辨别文本分类数据集-neupane9sujal
新闻真伪辨别文本分类数据集-neupane9sujal 数据来源:互联网公开数据 标签:新闻,真伪,假新闻,文本分类,自然语言处理,机器学习,标题,文本,标签 数据概述: 本数据集包含新闻文章的标题、正文以及真伪标签,可用于进行假新闻检测任务。数据集旨在帮助初学者学习文本分类技术,了解如何利用机器学习模型识别新闻的真伪。 数据包含以下字段:...
-
Kymera数据逆向评分实验数据集-giladmanor
Kymera数据逆向评分实验数据集-giladmanor 数据来源:互联网公开数据 标签:数据隐私,合成数据,逆向评分,信用评分,数据安全,Kymera,数据脱敏,机器学习,数据处理 数据概述:...
-
Kaggle表格数据集成学习竞赛系列数据集-supriodutta2022
Kaggle表格数据集成学习竞赛系列数据集-supriodutta2022 数据来源:互联网公开数据 标签:Kaggle,竞赛,数据集,集成学习,表格数据,数据科学,教学,入门,奖励 数据概述:...
-
印度尼西亚与爪哇语自然语言推理跨语言数据集-202X-jalaluddinalmursyidy
印度尼西亚与爪哇语自然语言推理跨语言数据集-202X-jalaluddinalmursyidy 数据来源:互联网公开数据 标签:NLI,自然语言推理,跨语言,印度尼西亚,爪哇语,Ngoko,文本分析,数据集 数据概述:...
-
-
教育数据PII信息检测与移除数据集MiniDS版本1-训练集与验证集-neslihanozeryildiz
教育数据PII信息检测与移除数据集MiniDS版本1-训练集与验证集-neslihanozeryildiz 数据来源:互联网公开数据 标签:PII检测,教育数据,机器学习,自然语言处理,训练集,验证集,Kaggle,数据增强 数据概述: 本数据集是基于原始教育数据构建的,用于个人身份信息(PII,Personally Identifiable...
-
电子商务嘈杂评论文本规范化数据集-sakshijain23
电子商务嘈杂评论文本规范化数据集-sakshijain23 数据来源:互联网公开数据 标签:电商评论,文本规范化,自然语言处理,短语识别,数据清洗,文本分析 数据概述:...
-
印度尼西亚移动应用评论情感与情绪分析数据集-dhiakashabrinaassy
印度尼西亚移动应用评论情感与情绪分析数据集-dhiakashabrinaassy 数据来源:互联网公开数据 标签:移动应用,评论,情感分析,情绪分析,印尼语,数据预处理,文本挖掘,机器学习 数据概述: 本数据集来源于Zenodo网站,是Riccosan和Karen Etania...



