数据集 - 海数据

乳腺癌诊断增强数据集-乳腺癌诊断-数据集-增强版-neelakshigupta

2025年4月21日

乳腺癌诊断增强数据集-乳腺癌诊断-数据集-增强版-neelakshigupta 数据来源：互联网公开数据标签：乳腺癌,诊断,医学,肿瘤学,数据增强,机器学习,特征工程,生物医学数据概述：本数据集基于Winson...

ZIP

智能问答聊天机器人用户交互与知识检索数据集-sadmansakibmahi

2025年4月21日

智能问答聊天机器人用户交互与知识检索数据集-sadmansakibmahi 数据来源：互联网公开数据标签：聊天机器人,自然语言处理,问答系统,知识库,信息检索,文本处理,用户交互,Wikipedia,数据分析数据概述：...

ZIP

大型语言模型生成文本检测训练数据集中的重复文本-2023-agnedil

2025年4月21日

大型语言模型生成文本检测训练数据集中的重复文本-2023-agnedil 数据来源：互联网公开数据标签：LLM,大模型,文本检测,AI生成,重复文本,数据集,文本处理,训练数据,机器学习数据概述：本数据集包含用于“LLM - Detect AI Generated...

ZIP

文章数据集文本预处理-大小写转换过滤分词去停用词词干提取-muhammadalwi

2025年4月21日

文章数据集文本预处理-大小写转换过滤分词去停用词词干提取-muhammadalwi 数据来源：互联网公开数据标签：文本预处理,自然语言处理,NLP,大小写转换,过滤,分词,停用词,词干提取,文章数据集数据概述：...

ZIP

Gemini模型ReAct框架在Kaggle环境下的轨迹数据集-penpentled

2025年4月21日

Gemini模型ReAct框架在Kaggle环境下的轨迹数据集-penpentled 数据来源：互联网公开数据标签：大语言模型,LLM,ReAct,Gemini,Kaggle,轨迹数据,机器学习,Agent 数据概述：本数据集包含了使用Gemini模型在Kaggle环境中生成的ReAct（Reasoning and...

ZIP

垃圾邮件与正常邮件分类邮件数据集-venkateshch22384

2025年4月21日

垃圾邮件与正常邮件分类邮件数据集-venkateshch22384 数据来源：互联网公开数据标签：邮件,垃圾邮件,正常邮件,分类,数据预处理,文本分析,机器学习数据概述：...

ZIP

灾难推文清理与自然语言处理数据集-nishkoder

2025年4月21日

灾难推文清理与自然语言处理数据集-nishkoder 数据来源：互联网公开数据标签：NLP,推文清理,灾害检测,文本预处理,机器学习,数据清洗数据概述：...

ZIP

费舍尔随机化与置换方法统计教材数据集-mathurinache

2025年4月21日

费舍尔随机化与置换方法统计教材数据集-mathurinache 数据来源：互联网公开数据标签：统计学,随机化,置换方法,教育,教材,数据分析,统计推断,入门课程数据概述：...

ZIP

虚假新闻识别-ISOT虚假新闻数据集-islamic

2025年4月21日

虚假新闻识别-ISOT虚假新闻数据集-islamic 数据来源：互联网公开数据标签：虚假新闻, 真实新闻, 新闻文章, 文本分类, 自然语言处理, 政治新闻, 世界新闻, 数据集, 文本分析数据概述：...

ZIP

土耳其推特恶意评论分类数据集-glzadeevni

2025年4月21日

土耳其推特恶意评论分类数据集-glzadeevni 数据来源：互联网公开数据标签：推特,评论,恶意评论,分类,土耳其,文本分析,机器学习数据概述：...

ZIP

蘑菇过载数据集

2025年4月21日

蘑菇过载数据集数据来源：互联网公开数据标签：蘑菇,合成数据,机器学习,数据生成,特征工程数据概述：...

ZIP

预处理欺诈检测数据集

2025年4月21日

预处理欺诈检测数据集数据来源：互联网公开数据标签：欺诈检测,预处理,金融交易,机器学习,分类模型,数据分析,特征工程数据概述：本数据集是预处理后的IEEE-...

ZIP

数据清洗课程数据集

2025年4月21日

数据清洗课程数据集数据来源：互联网公开数据标签：数据清洗,数据预处理,数据质量,特征工程,数据科学,数据处理,数据清洗案例数据概述：...

ZIP

英法翻译数据集-英语至法语翻译项目-数据-通用

2025年4月21日

英法翻译数据集-英语至法语翻译项目-数据-通用数据来源：互联网公开数据标签：翻译,英语,法语,机器翻译,自然语言处理,Transformer,文本数据,语言学,数据集数据概述：本数据集用于基于Transformer架构的英法翻译项目。数据集包含大量的英语-...

ZIP

COVID-19数据集

2025年4月21日

COVID-19数据集数据来源：互联网公开数据标签：COVID-19, 疫情, 全球健康, 数据分析, 数据清洗, 传染病研究, 健康政策, 数据预处理数据概述：本数据集来自互联网公开数据，包含全球范围内与 COVID-19 相关的详细记录，总计 313,273 行数据，涉及 67...

ZIP

出租车小费数据集

2025年4月21日

出租车小费数据集数据来源：互联网公开数据标签：出租车,小费预测,特征工程,数据清洗,回归分析,数据建模,机器学习数据概述：...

ZIP

IMDB电影评论情感分析数据集-电影评论情感分类预测

2025年4月21日

IMDB电影评论情感分析数据集-电影评论情感分类预测数据来源：互联网公开数据标签：电影评论,情感分析,自然语言处理,文本分类,机器学习,IMDB,情感,评论,文本数据数据概述：...

ZIP

大规模语言模型生成文本检测数据集-LLM生成文本检测竞赛

2025年4月20日

大规模语言模型生成文本检测数据集-LLM生成文本检测竞赛数据来源：互联网公开数据标签：LLM,文本生成,机器生成文本,自然语言处理,文本检测,人工智能,竞赛数据数据概述：本数据集是为LLM（大型语言模型）生成文本检测竞赛收集的。数据来源于多个公开的文本资源，涵盖了不同来源和类型的文本，旨在用于训练和评估检测模型，以识别由LLM生成的文本。...

ZIP

公司数据集

2025年4月20日

公司数据集数据来源：互联网公开数据标签：公司,多源数据,数据整合,数据清洗,数据分析数据概述：...

ZIP

SuperGLUE自然语言理解任务基准数据集

2025年4月20日

SuperGLUE自然语言理解任务基准数据集数据来源：互联网公开数据标签：自然语言处理, NLP, 语言理解, 文本分类, 问答, 语义推理, 多任务学习数据概述： SuperGLUE 是一个由多个具有挑战性的自然语言理解（NLU）任务组成的数据集，旨在评估模型的泛化能力和对复杂语言现象的理解程度。该基准测试是 GLUE（General...

ZIP

找到2,381个数据集

注册成功！