数据集 - 海数据

GPT角色扮演领域增强角色扮演数据集

2025年6月1日

GPT角色扮演领域增强角色扮演数据集数据来源：互联网公开数据标签：角色扮演,增强现实,语言模型,对话生成,虚拟人物,故事创作,互动游戏数据概述：...

ZIP

孟加拉语新闻语料库数据集

2025年5月31日

孟加拉语新闻语料库数据集数据来源：互联网公开数据标签：新闻,孟加拉语,文本分类,语言模型,文本生成,关系抽取,命名实体识别,词性标注数据概述：...

ZIP

孟加拉语机器翻译数据集

2025年5月31日

孟加拉语机器翻译数据集数据来源：互联网公开数据标签：机器翻译,孟加拉语,英文,自然语言处理,双语数据,文本分析,语言模型,翻译模型数据概述：...

ZIP

语法规则解析与文本片段生成数据集GrammarRuleParsingandTextFragmentGeneration-kiiroi

2025年5月31日

语法规则解析与文本片段生成数据集GrammarRuleParsingandTextFragmentGeneration-kiiroi 数据来源：互联网公开数据标签：自然语言处理, 语法分析, 文本生成, 规则提取, 语料库, 机器学习, 文本片段, 语言模型数据概述：...

ZIP

语言校对工具词汇与规则数据集LanguageCorrectionToolVocabularyandRulesDataset-kimijima

2025年5月31日

语言校对工具词汇与规则数据集LanguageCorrectionToolVocabularyandRulesDataset-kimijima 数据来源：互联网公开数据标签：语言学, 自然语言处理, 文本校对, 词汇, 语法规则, 语言模型, 文本分析, 数据集数据概述：...

ZIP

OpenHermesGPT-4生成数据分析与应用数据集-thedevastator

2025年5月31日

OpenHermesGPT-4生成数据分析与应用数据集-thedevastator 数据来源：互联网公开数据标签：GPT-4, 自然语言处理, AI, 数据集, 文本生成, 机器学习, OpenHermes, Huggingface, 语言模型数据概述：...

ZIP

小型OpenOrca数据集0-05比例-自然语言处理模型训练数据集

2025年5月11日

小型OpenOrca数据集0-05比例-自然语言处理模型训练数据集数据来源：互联网公开数据标签：自然语言处理, 文本生成, 模型训练, GPT-4, GPT-3.5, 语言模型, 文本增强, OpenOrca, 子集数据概述：本数据集是原始OpenOrca数据集的一个子集，OpenOrca数据集是一个由增强的FLAN...

ZIP

土耳其新闻摘要句子数据集-serdarcaglar

2025年5月31日

土耳其新闻摘要句子数据集-serdarcaglar 数据来源：互联网公开数据标签：土耳其,新闻摘要,自然语言处理,NLP,文本挖掘,语言模型,文本分类,文本聚类,词嵌入,文本提取数据概述：...

ZIP

大规模偏好数据集-语言模型对齐奖励与评论模型训练2021-thedevastator

2025年5月31日

大规模偏好数据集-语言模型对齐奖励与评论模型训练2021-thedevastator 数据来源：互联网公开数据标签：大规模数据集,偏好数据,语言模型,人工智能,奖励模型,评论模型,机器学习,训练数据,教育,研究数据概述：...

ZIP

文本生成与分类数据集TextGenerationandClassificationDataset-rishavdash

2025年5月31日

文本生成与分类数据集TextGenerationandClassificationDataset-rishavdash 数据来源：互联网公开数据标签：文本分类, 自然语言处理, 机器学习, 文本生成, 情感分析, 语言模型, 数据标注, 语料库数据概述：...

ZIP

文本润色提示词数据集TextRefinementPromptDataset-yuanzhezhou

2025年5月31日

文本润色提示词数据集TextRefinementPromptDataset-yuanzhezhou 数据来源：互联网公开数据标签：文本生成, 自然语言处理, 提示词工程, 文本转换, 风格迁移, 数据集, 语言模型, 文本编辑数据概述：...

ZIP

奥里亚语新闻与维基百科数据集-2021-arnavs19

2025年5月31日

奥里亚语新闻与维基百科数据集-2021-arnavs19 数据来源：互联网公开数据标签：奥里亚语,新闻,维基百科,语言模型,情感分析,主题建模,数据集数据概述：本数据集包含奥里亚语文本样本，来源包括新闻网站、维基百科和新闻语料库。数据集分为三个主要部分：奥里亚语新闻文章：收集了19000篇近期奥里亚语新闻文章，涵盖政治、体育、娱乐等多个主题。...

ZIP

英语写作质量评估数据集EnglishWritingQualityAssessmentDataset-goldenlock

2025年5月29日

英语写作质量评估数据集EnglishWritingQualityAssessmentDataset-goldenlock 数据来源：互联网公开数据标签：自然语言处理, 文本分析, 写作评估, 语言模型, 文本质量, 机器学习, 文本评分, 语言学数据概述：该数据集包含用于评估英语写作质量的相关数据，涵盖了文本评估的多个维度。主要特征如下：...

ZIP

文本质量评估多维度打分数据集TextQualityAssessmentMulti-dimensionalScoringDataset-goldenlock

2025年5月30日

文本质量评估多维度打分数据集TextQualityAssessmentMulti-dimensionalScoringDataset-goldenlock 数据来源：互联网公开数据标签：文本评估, 语言模型, 自动评分, 文本分析, 自然语言处理, 机器学习, 写作质量, 多维度评价数据概述：...

ZIP

英语写作质量评估特征数据集EnglishWritingQualityAssessmentFeatures-iitm21f1005087

2025年5月30日

英语写作质量评估特征数据集EnglishWritingQualityAssessmentFeatures-iitm21f1005087 数据来源：互联网公开数据标签：写作评估, 文本特征, 英语写作, 可读性, 语言模型, 文本分析, 机器学习, 写作评分数据概述：...

ZIP

越南语文本语料库构建与分析数据集VietnameseTextCorpusConstructionandAnalysis-dinhnhattruong

2025年5月30日

越南语文本语料库构建与分析数据集VietnameseTextCorpusConstructionandAnalysis-dinhnhattruong 数据来源：互联网公开数据标签：越南语, 文本语料库, 文本分析, 自然语言处理, 语料库构建, 文本摘要, 词嵌入, 语言模型数据概述：...

ZIP

预训练语言模型掩码任务训练数据集Pre-trainedLanguageModelMaskedLanguageModelingDataset-yuzhoudiyishuai

2025年5月30日

预训练语言模型掩码任务训练数据集Pre-trainedLanguageModelMaskedLanguageModelingDataset-yuzhoudiyishuai 数据来源：互联网公开数据标签：自然语言处理, 预训练, 语言模型, 掩码语言模型, 文本数据, 深度学习, 文本生成, 数据集构建数据概述：...

ZIP

僧伽罗语文本纠错数据集SinhalaTextCorrectionDataset-uom200199t

2025年5月30日

僧伽罗语文本纠错数据集SinhalaTextCorrectionDataset-uom200199t 数据来源：互联网公开数据标签：文本纠错, 僧伽罗语, 自然语言处理, 语言模型, 深度学习, 数据集, 文本校对, 机器学习数据概述：...

ZIP

Gemma模型重写数据集RewrittenGemma-7bDataset-patrickjchen

2025年5月30日

Gemma模型重写数据集RewrittenGemma-7bDataset-patrickjchen 数据来源：互联网公开数据标签：自然语言处理，机器学习，深度学习，文本生成，语言模型，模型重写，人工智能，大语言模型数据概述：该数据集包含对Gemma-7b语言模型的输出进行重写的数据，记录了原始文本和经过模型重写后的文本。主要特征如下：...

ZIP

问答平台相似问题配对数据集QuoraPairsDataset-develina

2025年5月30日

问答平台相似问题配对数据集QuoraPairsDataset-develina 数据来源：互联网公开数据标签：自然语言处理，问答系统，数据集，文本相似度，机器学习，数据挖掘，人工智能，语言模型数据概述：该数据集来源于问答平台Quora，包含了大量用户提交的问题对，用于判断问题是否相似或重复。主要特征如下：...

ZIP

找到740个数据集

注册成功！