-
YouTube视频字幕数据集-印地文与英文-2023
2025年6月4日 30 19 6
YouTube视频字幕数据集-印地文与英文-2023 数据来源:互联网公开数据 标签:YouTube,字幕,印地文,英文,视频数据,机器学习,语言模型,分类,摘要,翻译 数据概述:... -
中国医疗对话智能健康语言模型训练数据集-thedevastator
2025年6月4日 30 129 127
中国医疗对话智能健康语言模型训练数据集-thedevastator 数据来源:互联网公开数据 标签:医疗对话,智能医疗,深度学习,健康,数据集,语言模型,对话系统 数据概述:... -
语音识别技术在呼叫中心的应用评估数据集-ASRCalls2Val-saspav
2025年6月4日 30 16 9
语音识别技术在呼叫中心的应用评估数据集-ASRCalls2Val-saspav 数据来源:互联网公开数据 标签:语音识别,呼叫中心,语音数据,ASR,性能评估,自然语言处理,声学模型,语言模型 数据概述: 本数据集“ASR Calls 2 Val”包含了从呼叫中心收集的语音数据,主要用于评估语音识别(ASR, Automatic Speech... -
自然语言处理多领域对话数据集UltraChat-200K-thedevastator
2025年6月4日 30 141 56
自然语言处理多领域对话数据集UltraChat-200K-thedevastator 数据来源:互联网公开数据 标签:自然语言处理,对话,生成,训练,文本,语言模型,NLG,语料库 数据概述:... -
Tashkeela清理阿拉伯语带音符语料库
2025年6月1日 30 187 70
Tashkeela清理阿拉伯语带音符语料库 数据来源:互联网公开数据 标签:阿拉伯语,自然语言处理,文本清洗,语音标注,语言模型,机器学习,数据标注 数据概述:... -
GPT角色扮演领域增强角色扮演数据集
2025年6月1日 30 15 14
GPT角色扮演领域增强角色扮演数据集 数据来源:互联网公开数据 标签:角色扮演,增强现实,语言模型,对话生成,虚拟人物,故事创作,互动游戏 数据概述:... -
孟加拉语新闻语料库数据集
2025年5月31日 30 63 5
孟加拉语新闻语料库数据集 数据来源:互联网公开数据 标签:新闻,孟加拉语,文本分类,语言模型,文本生成,关系抽取,命名实体识别,词性标注 数据概述:... -
孟加拉语机器翻译数据集
2025年5月31日 30 84 48
孟加拉语机器翻译数据集 数据来源:互联网公开数据 标签:机器翻译,孟加拉语,英文,自然语言处理,双语数据,文本分析,语言模型,翻译模型 数据概述:... -
语法规则解析与文本片段生成数据集GrammarRuleParsingandTextFragmentGeneration-kiiroi
2025年5月31日 30 193 21
语法规则解析与文本片段生成数据集GrammarRuleParsingandTextFragmentGeneration-kiiroi 数据来源:互联网公开数据 标签:自然语言处理, 语法分析, 文本生成, 规则提取, 语料库, 机器学习, 文本片段, 语言模型 数据概述:... -
语言校对工具词汇与规则数据集LanguageCorrectionToolVocabularyandRulesDataset-kimijima
2025年5月31日 30 22 3
语言校对工具词汇与规则数据集LanguageCorrectionToolVocabularyandRulesDataset-kimijima 数据来源:互联网公开数据 标签:语言学, 自然语言处理, 文本校对, 词汇, 语法规则, 语言模型, 文本分析, 数据集 数据概述:... -
OpenHermesGPT-4生成数据分析与应用数据集-thedevastator
2025年5月31日 30 52 41
OpenHermesGPT-4生成数据分析与应用数据集-thedevastator 数据来源:互联网公开数据 标签:GPT-4, 自然语言处理, AI, 数据集, 文本生成, 机器学习, OpenHermes, Huggingface, 语言模型 数据概述:... -
小型OpenOrca数据集0-05比例-自然语言处理模型训练数据集
2025年5月11日 30 25 7
小型OpenOrca数据集0-05比例-自然语言处理模型训练数据集 数据来源:互联网公开数据 标签:自然语言处理, 文本生成, 模型训练, GPT-4, GPT-3.5, 语言模型, 文本增强, OpenOrca, 子集 数据概述: 本数据集是原始OpenOrca数据集的一个子集,OpenOrca数据集是一个由增强的FLAN... -
土耳其新闻摘要句子数据集-serdarcaglar
2025年5月31日 30 44 10
土耳其新闻摘要句子数据集-serdarcaglar 数据来源:互联网公开数据 标签:土耳其,新闻摘要,自然语言处理,NLP,文本挖掘,语言模型,文本分类,文本聚类,词嵌入,文本提取 数据概述:... -
大规模偏好数据集-语言模型对齐奖励与评论模型训练2021-thedevastator
2025年5月31日 30 144 27
大规模偏好数据集-语言模型对齐奖励与评论模型训练2021-thedevastator 数据来源:互联网公开数据 标签:大规模数据集,偏好数据,语言模型,人工智能,奖励模型,评论模型,机器学习,训练数据,教育,研究 数据概述:... -
文本生成与分类数据集TextGenerationandClassificationDataset-rishavdash
2025年5月31日 30 16 5
文本生成与分类数据集TextGenerationandClassificationDataset-rishavdash 数据来源:互联网公开数据 标签:文本分类, 自然语言处理, 机器学习, 文本生成, 情感分析, 语言模型, 数据标注, 语料库 数据概述:... -
文本润色提示词数据集TextRefinementPromptDataset-yuanzhezhou
2025年5月31日 30 145 109
文本润色提示词数据集TextRefinementPromptDataset-yuanzhezhou 数据来源:互联网公开数据 标签:文本生成, 自然语言处理, 提示词工程, 文本转换, 风格迁移, 数据集, 语言模型, 文本编辑 数据概述:... -
奥里亚语新闻与维基百科数据集-2021-arnavs19
2025年5月31日 30 45 6
奥里亚语新闻与维基百科数据集-2021-arnavs19 数据来源:互联网公开数据 标签:奥里亚语,新闻,维基百科,语言模型,情感分析,主题建模,数据集 数据概述: 本数据集包含奥里亚语文本样本,来源包括新闻网站、维基百科和新闻语料库。数据集分为三个主要部分: 奥里亚语新闻文章:收集了19000篇近期奥里亚语新闻文章,涵盖政治、体育、娱乐等多个主题。... -
英语写作质量评估数据集EnglishWritingQualityAssessmentDataset-goldenlock
2025年5月29日 60 47 18
英语写作质量评估数据集EnglishWritingQualityAssessmentDataset-goldenlock 数据来源:互联网公开数据 标签:自然语言处理, 文本分析, 写作评估, 语言模型, 文本质量, 机器学习, 文本评分, 语言学 数据概述: 该数据集包含用于评估英语写作质量的相关数据,涵盖了文本评估的多个维度。主要特征如下:... -
文本质量评估多维度打分数据集TextQualityAssessmentMulti-dimensionalScoringDataset-goldenlock
2025年5月30日 30 185 178
文本质量评估多维度打分数据集TextQualityAssessmentMulti-dimensionalScoringDataset-goldenlock 数据来源:互联网公开数据 标签:文本评估, 语言模型, 自动评分, 文本分析, 自然语言处理, 机器学习, 写作质量, 多维度评价 数据概述:... -
英语写作质量评估特征数据集EnglishWritingQualityAssessmentFeatures-iitm21f1005087
2025年5月30日 30 141 122
英语写作质量评估特征数据集EnglishWritingQualityAssessmentFeatures-iitm21f1005087 数据来源:互联网公开数据 标签:写作评估, 文本特征, 英语写作, 可读性, 语言模型, 文本分析, 机器学习, 写作评分 数据概述:...