找到426个数据集

标签: 数据增强

过滤结果
  • DatabricksDolly15k-基于指令的大型语言模型训练数据集

    2025年4月15日   

    DatabricksDolly15k-基于指令的大型语言模型训练数据集 数据来源:互联网公开数据 标签:大型语言模型,指令遵循,数据增强,自然语言处理,文本生成,分类,问答,摘要,信息提取,创意写作,开源数据集 数据概述: Databricks Dolly...
    packageimg
  • 卵巢病理图像分类数据集1963-2021

    2025年4月15日   

    卵巢病理图像分类数据集1963-2021 数据来源:互联网公开数据 标签:卵巢病理,图像分类,256x256,标签图像,数据增强,欠采样,过采样 数据概述: 本数据集包含了用于卵巢病理图像分类的所有256x256尺寸图像路径。数据集不仅包括标记图像的路径,还包含了经过欠采样和过采样处理的图像,旨在平衡数据集中的类别分布。 数据用途概述:...
    packageimg
  • 斯坦福新冠疫苗增强数据集

    2025年4月15日   

    斯坦福新冠疫苗增强数据集 数据来源:互联网公开数据 标签:新冠疫苗,数据增强,科学竞赛,在线游戏,众包,生物化学,MRNA稳定性 数据概述:...
    packageimg
  • 矛盾侦探瓦森翻译数据集

    2025年4月15日   

    矛盾侦探瓦森翻译数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,翻译,机器学习,文本分析,竞赛数据 数据概述: 本数据集为“Contradictory, My Dear...
    packageimg
  • 福尔摩斯的矛盾增强数据集1963-2021

    2025年4月15日   

    福尔摩斯的矛盾增强数据集1963-2021 数据来源:互联网公开数据 标签:自然语言处理,数据增强,矛盾检测,机器翻译,同义词替换,测试集增强,文本分析 数据概述:...
    packageimg
  • 自然语言处理数据增强用反向翻译数据集

    2025年4月15日   

    自然语言处理数据增强用反向翻译数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,反向翻译,文本分类,多语言,数据集,机器学习,文本生成 数据概述: 本数据集包含了来自Contradictory, My Dear...
    packageimg
  • VinBigData胸部X光片DICOM元数据年龄性别数据集

    2025年4月15日   

    VinBigData胸部X光片DICOM元数据年龄性别数据集 数据来源:互联网公开数据 标签:医学影像,胸部X光片,DICOM,元数据,年龄,性别,VinBigData,疾病诊断,数据增强 数据概述:...
    packageimg
  • 社交媒体灾害相关推文清洗数据集

    2025年4月15日   

    社交媒体灾害相关推文清洗数据集 数据来源:互联网公开数据 标签:社交媒体, 灾害, 自然语言处理, 文本清洗, 拼写纠正, 数据增强, 文本分析, 机器学习 数据概述: 本数据集基于“Natural Language Processing with Disaster...
    packageimg
  • LLM提示恢复与写作风格分析数据集

    2025年4月15日   

    LLM提示恢复与写作风格分析数据集 数据来源:互联网公开数据 标签:LLM,提示恢复,写作风格,自然语言处理,文本重写,竞赛数据,数据增强 数据概述:...
    packageimg
  • 自然背景声音数据集

    2025年4月15日   

    自然背景声音数据集 数据来源:互联网公开数据 标签:自然声音,背景噪音,环境音频,鸟类研究,数据增强,声音识别 数据概述...
    packageimg
  • 推特文本情感增强数据集-讽刺与反讽分类-增强版

    2025年4月15日   

    推特文本情感增强数据集-讽刺与反讽分类-增强版 数据来源:互联网公开数据 标签:推特,文本情感分析,讽刺,反讽,情感分类,自然语言处理,数据增强 数据概述: 本数据集是原始数据集的增强版本,原始数据集来自Kaggle上的公开数据源。该数据集通过同义词替换的方式进行了数据增强,旨在提高文本情感分析模型的性能。数据集包含了推特文本及其对应的类别标签。...
    packageimg
  • LLM科学假测试数据集

    2025年4月14日   

    LLM科学假测试数据集 数据来源:互联网公开数据 标签:LLM,科学测试,假数据,数据增强,性能评估,本地测试,运行时优化 数据概述:...
    packageimg
  • 基于GPT-3的改写文章数据集

    2025年4月14日   

    基于GPT-3的改写文章数据集 数据来源:互联网公开数据 标签:GPT-3,文本改写,自然语言处理,摘要,引言,数据增强,机器翻译 数据概述: 本数据集包含由GPT-3语言模型改写的文章标题、摘要和引言部分。原始文章选自Assoc. Prof. Mehmet Erkut Erdem的Google Scholar页面,并通过GPT-3...
    packageimg
  • WHOCOVID-19疫苗候选数据集

    2025年4月14日   

    WHOCOVID-19疫苗候选数据集 数据来源:互联网公开数据 标签:COVID-19,疫苗候选,临床试验,新闻活动,社交媒体,地理信息,数据增强 数据概述: 本数据集基于WHO发布的COVID-19疫苗候选蓝图PDF文件进行了扩充,增加了开发者的具体地理位置(通过Google...
    packageimg
  • 印度尼西亚论文错误检测数据集2023

    2025年4月14日   

    印度尼西亚论文错误检测数据集2023 数据来源:互联网公开数据 标签:论文错误检测,印度尼西亚,文本处理,自然语言处理,机器学习,数据增强,学术研究 数据概述: 本数据集来源于PERSUADE 2.0数据集,并经过Claude...
    packageimg
  • 国际象棋图像数据集

    2025年4月14日   

    国际象棋图像数据集 数据来源:互联网公开数据 标签:国际象棋,图像处理,数据增强,计算机视觉,项目开发 数据概述: 本数据集包含了从互联网上抓取的国际象棋图像,并进行了不同尺度和翻转的数据增强处理,适用于各类涉及图像数据的项目。数据集中的图像涵盖了国际象棋棋盘及其棋子的各种角度和形态,为图像处理和计算机视觉任务提供了丰富的素材。 数据用途概述:...
    packageimg
  • 哥伦比亚大学疾病症状知识数据库处理版

    2025年4月14日   

    哥伦比亚大学疾病症状知识数据库处理版 数据来源:互联网公开数据 标签:疾病,症状,知识图谱,数据增强,医学分析,健康研究,机器学习 数据概述:...
    packageimg
  • 土耳其语社交媒体攻击性语言识别数据集

    2025年4月14日   

    土耳其语社交媒体攻击性语言识别数据集 数据来源:互联网公开数据 标签:土耳其语,社交媒体,攻击性语言,数据增强,文本分类,自然语言处理,情感分析 数据概述:...
    packageimg
  • 超级碗冠军预测数据集

    2025年4月14日   

    超级碗冠军预测数据集 数据来源:互联网公开数据 标签:超级碗,美式足球,冠军预测,体育数据分析,机器学习竞赛,比赛数据,数据增强 数据概述:...
    packageimg
  • 沃森翻译增强训练测试数据集

    2025年4月14日   

    沃森翻译增强训练测试数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,翻译,机器翻译,文本对,假设检验,训练集,测试集,数据扩增,Augmentation 数据概述:...
    packageimg