-
-
-
印度拼图毒评强度与严重性增强数据集1963-2021
印度拼图毒评强度与严重性增强数据集1963-2021 数据来源:互联网公开数据 标签:文本增强,毒评检测,数据增强,自然语言处理,情感分析,机器学习,数据分析 数据概述: 本数据集用于增强初始的印度拼图(Jigsaw)数据集,特别针对毒评强度与严重性的分析。数据集来源于Davidson等人在2017年发表的《Automated Hate Speech... -
补充文本重写数据集
补充文本重写数据集 数据来源:互联网公开数据 标签:文本重写,生成式AI,文本生成,数据增强,机器学习,自然语言处理 数据概述: 本数据集由Gemma_7b-it-... -
基于GPT-2生成的灾难推文数据集
基于GPT-2生成的灾难推文数据集 数据来源:互联网公开数据 标签:NLP,自然语言处理,灾难推文,数据增强,GPT-2,文本生成 数据概述:... -
葡萄酒品质评估大规模数据集-10万条样本
葡萄酒品质评估大规模数据集-10万条样本 数据来源:互联网公开数据 标签:葡萄酒,品质,分类,机器学习,数据增强,葡萄酒分析,酿酒,数据科学 数据概述:... -
乳腺癌增强数据集1963-2021
乳腺癌增强数据集1963-2021 数据来源:互联网公开数据 标签:乳腺癌,医学研究,数据增强,机器学习,疾病预测,健康数据分析 数据概述: 本数据集基于乳腺癌Winson... -
DatabricksDolly15k-基于指令的大型语言模型训练数据集
DatabricksDolly15k-基于指令的大型语言模型训练数据集 数据来源:互联网公开数据 标签:大型语言模型,指令遵循,数据增强,自然语言处理,文本生成,分类,问答,摘要,信息提取,创意写作,开源数据集 数据概述: Databricks Dolly... -
卵巢病理图像分类数据集1963-2021
卵巢病理图像分类数据集1963-2021 数据来源:互联网公开数据 标签:卵巢病理,图像分类,256x256,标签图像,数据增强,欠采样,过采样 数据概述: 本数据集包含了用于卵巢病理图像分类的所有256x256尺寸图像路径。数据集不仅包括标记图像的路径,还包含了经过欠采样和过采样处理的图像,旨在平衡数据集中的类别分布。 数据用途概述:... -
-
矛盾侦探瓦森翻译数据集
矛盾侦探瓦森翻译数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,翻译,机器学习,文本分析,竞赛数据 数据概述: 本数据集为“Contradictory, My Dear... -
福尔摩斯的矛盾增强数据集1963-2021
福尔摩斯的矛盾增强数据集1963-2021 数据来源:互联网公开数据 标签:自然语言处理,数据增强,矛盾检测,机器翻译,同义词替换,测试集增强,文本分析 数据概述:... -
自然语言处理数据增强用反向翻译数据集
自然语言处理数据增强用反向翻译数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,反向翻译,文本分类,多语言,数据集,机器学习,文本生成 数据概述: 本数据集包含了来自Contradictory, My Dear... -
VinBigData胸部X光片DICOM元数据年龄性别数据集
VinBigData胸部X光片DICOM元数据年龄性别数据集 数据来源:互联网公开数据 标签:医学影像,胸部X光片,DICOM,元数据,年龄,性别,VinBigData,疾病诊断,数据增强 数据概述:... -
社交媒体灾害相关推文清洗数据集
社交媒体灾害相关推文清洗数据集 数据来源:互联网公开数据 标签:社交媒体, 灾害, 自然语言处理, 文本清洗, 拼写纠正, 数据增强, 文本分析, 机器学习 数据概述: 本数据集基于“Natural Language Processing with Disaster... -
LLM提示恢复与写作风格分析数据集
LLM提示恢复与写作风格分析数据集 数据来源:互联网公开数据 标签:LLM,提示恢复,写作风格,自然语言处理,文本重写,竞赛数据,数据增强 数据概述:... -
-
推特文本情感增强数据集-讽刺与反讽分类-增强版
推特文本情感增强数据集-讽刺与反讽分类-增强版 数据来源:互联网公开数据 标签:推特,文本情感分析,讽刺,反讽,情感分类,自然语言处理,数据增强 数据概述: 本数据集是原始数据集的增强版本,原始数据集来自Kaggle上的公开数据源。该数据集通过同义词替换的方式进行了数据增强,旨在提高文本情感分析模型的性能。数据集包含了推特文本及其对应的类别标签。... -
-
基于GPT-3的改写文章数据集
基于GPT-3的改写文章数据集 数据来源:互联网公开数据 标签:GPT-3,文本改写,自然语言处理,摘要,引言,数据增强,机器翻译 数据概述: 本数据集包含由GPT-3语言模型改写的文章标题、摘要和引言部分。原始文章选自Assoc. Prof. Mehmet Erkut Erdem的Google Scholar页面,并通过GPT-3...