-
DatabricksDolly15k-基于指令的大型语言模型训练数据集
DatabricksDolly15k-基于指令的大型语言模型训练数据集 数据来源:互联网公开数据 标签:大型语言模型,指令遵循,数据增强,自然语言处理,文本生成,分类,问答,摘要,信息提取,创意写作,开源数据集 数据概述: Databricks Dolly... -
卵巢病理图像分类数据集1963-2021
卵巢病理图像分类数据集1963-2021 数据来源:互联网公开数据 标签:卵巢病理,图像分类,256x256,标签图像,数据增强,欠采样,过采样 数据概述: 本数据集包含了用于卵巢病理图像分类的所有256x256尺寸图像路径。数据集不仅包括标记图像的路径,还包含了经过欠采样和过采样处理的图像,旨在平衡数据集中的类别分布。 数据用途概述:... -
-
矛盾侦探瓦森翻译数据集
矛盾侦探瓦森翻译数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,翻译,机器学习,文本分析,竞赛数据 数据概述: 本数据集为“Contradictory, My Dear... -
福尔摩斯的矛盾增强数据集1963-2021
福尔摩斯的矛盾增强数据集1963-2021 数据来源:互联网公开数据 标签:自然语言处理,数据增强,矛盾检测,机器翻译,同义词替换,测试集增强,文本分析 数据概述:... -
自然语言处理数据增强用反向翻译数据集
自然语言处理数据增强用反向翻译数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,反向翻译,文本分类,多语言,数据集,机器学习,文本生成 数据概述: 本数据集包含了来自Contradictory, My Dear... -
VinBigData胸部X光片DICOM元数据年龄性别数据集
VinBigData胸部X光片DICOM元数据年龄性别数据集 数据来源:互联网公开数据 标签:医学影像,胸部X光片,DICOM,元数据,年龄,性别,VinBigData,疾病诊断,数据增强 数据概述:... -
社交媒体灾害相关推文清洗数据集
社交媒体灾害相关推文清洗数据集 数据来源:互联网公开数据 标签:社交媒体, 灾害, 自然语言处理, 文本清洗, 拼写纠正, 数据增强, 文本分析, 机器学习 数据概述: 本数据集基于“Natural Language Processing with Disaster... -
LLM提示恢复与写作风格分析数据集
LLM提示恢复与写作风格分析数据集 数据来源:互联网公开数据 标签:LLM,提示恢复,写作风格,自然语言处理,文本重写,竞赛数据,数据增强 数据概述:... -
-
推特文本情感增强数据集-讽刺与反讽分类-增强版
推特文本情感增强数据集-讽刺与反讽分类-增强版 数据来源:互联网公开数据 标签:推特,文本情感分析,讽刺,反讽,情感分类,自然语言处理,数据增强 数据概述: 本数据集是原始数据集的增强版本,原始数据集来自Kaggle上的公开数据源。该数据集通过同义词替换的方式进行了数据增强,旨在提高文本情感分析模型的性能。数据集包含了推特文本及其对应的类别标签。... -
-
基于GPT-3的改写文章数据集
基于GPT-3的改写文章数据集 数据来源:互联网公开数据 标签:GPT-3,文本改写,自然语言处理,摘要,引言,数据增强,机器翻译 数据概述: 本数据集包含由GPT-3语言模型改写的文章标题、摘要和引言部分。原始文章选自Assoc. Prof. Mehmet Erkut Erdem的Google Scholar页面,并通过GPT-3... -
WHOCOVID-19疫苗候选数据集
WHOCOVID-19疫苗候选数据集 数据来源:互联网公开数据 标签:COVID-19,疫苗候选,临床试验,新闻活动,社交媒体,地理信息,数据增强 数据概述: 本数据集基于WHO发布的COVID-19疫苗候选蓝图PDF文件进行了扩充,增加了开发者的具体地理位置(通过Google... -
印度尼西亚论文错误检测数据集2023
印度尼西亚论文错误检测数据集2023 数据来源:互联网公开数据 标签:论文错误检测,印度尼西亚,文本处理,自然语言处理,机器学习,数据增强,学术研究 数据概述: 本数据集来源于PERSUADE 2.0数据集,并经过Claude... -
国际象棋图像数据集
国际象棋图像数据集 数据来源:互联网公开数据 标签:国际象棋,图像处理,数据增强,计算机视觉,项目开发 数据概述: 本数据集包含了从互联网上抓取的国际象棋图像,并进行了不同尺度和翻转的数据增强处理,适用于各类涉及图像数据的项目。数据集中的图像涵盖了国际象棋棋盘及其棋子的各种角度和形态,为图像处理和计算机视觉任务提供了丰富的素材。 数据用途概述:... -
哥伦比亚大学疾病症状知识数据库处理版
哥伦比亚大学疾病症状知识数据库处理版 数据来源:互联网公开数据 标签:疾病,症状,知识图谱,数据增强,医学分析,健康研究,机器学习 数据概述:... -
土耳其语社交媒体攻击性语言识别数据集
土耳其语社交媒体攻击性语言识别数据集 数据来源:互联网公开数据 标签:土耳其语,社交媒体,攻击性语言,数据增强,文本分类,自然语言处理,情感分析 数据概述:... -
-
沃森翻译增强训练测试数据集
沃森翻译增强训练测试数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,翻译,机器翻译,文本对,假设检验,训练集,测试集,数据扩增,Augmentation 数据概述:...