-
乳腺癌诊断增强数据集-乳腺癌诊断-数据集-增强版-neelakshigupta
乳腺癌诊断增强数据集-乳腺癌诊断-数据集-增强版-neelakshigupta 数据来源:互联网公开数据 标签:乳腺癌,诊断,医学,肿瘤学,数据增强,机器学习,特征工程,生物医学 数据概述: 本数据集基于Winson...
-
智能问答聊天机器人用户交互与知识检索数据集-sadmansakibmahi
智能问答聊天机器人用户交互与知识检索数据集-sadmansakibmahi 数据来源:互联网公开数据 标签:聊天机器人,自然语言处理,问答系统,知识库,信息检索,文本处理,用户交互,Wikipedia,数据分析 数据概述:...
-
大型语言模型生成文本检测训练数据集中的重复文本-2023-agnedil
大型语言模型生成文本检测训练数据集中的重复文本-2023-agnedil 数据来源:互联网公开数据 标签:LLM,大模型,文本检测,AI生成,重复文本,数据集,文本处理,训练数据,机器学习 数据概述: 本数据集包含用于“LLM - Detect AI Generated...
-
文章数据集文本预处理-大小写转换过滤分词去停用词词干提取-muhammadalwi
文章数据集文本预处理-大小写转换过滤分词去停用词词干提取-muhammadalwi 数据来源:互联网公开数据 标签:文本预处理,自然语言处理,NLP,大小写转换,过滤,分词,停用词,词干提取,文章数据集 数据概述:...
-
Gemini模型ReAct框架在Kaggle环境下的轨迹数据集-penpentled
Gemini模型ReAct框架在Kaggle环境下的轨迹数据集-penpentled 数据来源:互联网公开数据 标签:大语言模型,LLM,ReAct,Gemini,Kaggle,轨迹数据,机器学习,Agent 数据概述: 本数据集包含了使用Gemini模型在Kaggle环境中生成的ReAct(Reasoning and...
-
垃圾邮件与正常邮件分类邮件数据集-venkateshch22384
垃圾邮件与正常邮件分类邮件数据集-venkateshch22384 数据来源:互联网公开数据 标签:邮件,垃圾邮件,正常邮件,分类,数据预处理,文本分析,机器学习 数据概述:...
-
灾难推文清理与自然语言处理数据集-nishkoder
灾难推文清理与自然语言处理数据集-nishkoder 数据来源:互联网公开数据 标签:NLP,推文清理,灾害检测,文本预处理,机器学习,数据清洗 数据概述:...
-
费舍尔随机化与置换方法统计教材数据集-mathurinache
费舍尔随机化与置换方法统计教材数据集-mathurinache 数据来源:互联网公开数据 标签:统计学,随机化,置换方法,教育,教材,数据分析,统计推断,入门课程 数据概述:...
-
虚假新闻识别-ISOT虚假新闻数据集-islamic
虚假新闻识别-ISOT虚假新闻数据集-islamic 数据来源:互联网公开数据 标签:虚假新闻, 真实新闻, 新闻文章, 文本分类, 自然语言处理, 政治新闻, 世界新闻, 数据集, 文本分析 数据概述:...
-
土耳其推特恶意评论分类数据集-glzadeevni
土耳其推特恶意评论分类数据集-glzadeevni 数据来源:互联网公开数据 标签:推特,评论,恶意评论,分类,土耳其,文本分析,机器学习 数据概述:...
-
-
预处理欺诈检测数据集
预处理欺诈检测数据集 数据来源:互联网公开数据 标签:欺诈检测,预处理,金融交易,机器学习,分类模型,数据分析,特征工程 数据概述: 本数据集是预处理后的IEEE-...
-
-
英法翻译数据集-英语至法语翻译项目-数据-通用
英法翻译数据集-英语至法语翻译项目-数据-通用 数据来源:互联网公开数据 标签:翻译,英语,法语,机器翻译,自然语言处理,Transformer,文本数据,语言学,数据集 数据概述: 本数据集用于基于Transformer架构的英法翻译项目。数据集包含大量的英语-...
-
COVID-19数据集
COVID-19数据集 数据来源:互联网公开数据 标签:COVID-19, 疫情, 全球健康, 数据分析, 数据清洗, 传染病研究, 健康政策, 数据预处理 数据概述: 本数据集来自互联网公开数据,包含全球范围内与 COVID-19 相关的详细记录,总计 313,273 行数据,涉及 67...
-
-
IMDB电影评论情感分析数据集-电影评论情感分类预测
IMDB电影评论情感分析数据集-电影评论情感分类预测 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,文本分类,机器学习,IMDB,情感,评论,文本数据 数据概述:...
-
大规模语言模型生成文本检测数据集-LLM生成文本检测竞赛
大规模语言模型生成文本检测数据集-LLM生成文本检测竞赛 数据来源:互联网公开数据 标签:LLM,文本生成,机器生成文本,自然语言处理,文本检测,人工智能,竞赛数据 数据概述: 本数据集是为LLM(大型语言模型)生成文本检测竞赛收集的。数据来源于多个公开的文本资源,涵盖了不同来源和类型的文本,旨在用于训练和评估检测模型,以识别由LLM生成的文本。...
-
-
SuperGLUE自然语言理解任务基准数据集
SuperGLUE自然语言理解任务基准数据集 数据来源:互联网公开数据 标签:自然语言处理, NLP, 语言理解, 文本分类, 问答, 语义推理, 多任务学习 数据概述: SuperGLUE 是一个由多个具有挑战性的自然语言理解(NLU)任务组成的数据集,旨在评估模型的泛化能力和对复杂语言现象的理解程度。该基准测试是 GLUE(General...



