找到730个数据集

标签: 语言模型

过滤结果
  • 神经机器翻译-玉刚数据集

    2025年4月14日   

    神经机器翻译-玉刚数据集 数据来源:互联网公开数据 标签:神经机器翻译,玉刚,语言模型,数据集,机器翻译,自然语言处理,翻译质量评估 数据概述: 本数据集包含约12,000个玉刚语言的 instructional...
    packageimg
  • 翻译数学问题数据集

    2025年4月14日   

    翻译数学问题数据集 数据来源:互联网公开数据 标签:数学问题,翻译, Bengali, English, 语言模型, 机器翻译, 取回增强生成, 少样本学习 数据概述:...
    packageimg
  • 蛋白质与RNA研究文本数据集2023

    2025年4月14日   

    蛋白质与RNA研究文本数据集2023 数据来源:互联网公开数据 标签:蛋白质, RNA, 医学研究, 数据挖掘, 机器学习, 语言模型, 生物信息学, 药物开发, 疫苗研究 数据概述: 本数据集包含从Wikipedia...
    packageimg
  • 文本编辑数据集

    2025年4月14日   

    文本编辑数据集 数据来源:互联网公开数据 标签:文本编辑,机器学习,自然语言处理,语法检查,语言模型,训练数据,数据标注 数据概述:...
    packageimg
  • 乌兹别克斯坦宪法NLP数据集

    2025年4月14日   

    乌兹别克斯坦宪法NLP数据集 数据来源:互联网公开数据 标签:乌兹别克斯坦宪法,自然语言处理,NLP,乌兹别克语,自动纠正,拼写检查,语言模型 数据概述: 本数据集来源于我的YouTube频道的直播内容,旨在为乌兹别克语(O'zbek语)创建一个自动纠正(拼写检查)的概率模型。数据集包含了乌兹别克斯坦宪法的文本,为训练语言模型提供了基础。...
    packageimg
  • 分钟悬疑侦探图数据集

    2025年4月14日   

    分钟悬疑侦探图数据集 数据来源:互联网公开数据 标签:文本谜题,推理,悬疑,文学,人工智能,语言模型,游戏开发 数据概述: 分钟悬疑侦探图(Minute...
    packageimg
  • 多语言复杂问答数据集-涵盖8种语言

    2025年4月14日   

    多语言复杂问答数据集-涵盖8种语言 数据来源:互联网公开数据 标签:多语言,问答,自然语言处理,NLP,机器翻译,语言模型,数据集,复杂问题,文本分析 数据概述: 本数据集由Hugging Face...
    packageimg
  • 带水印与不带水印文本生成数据集

    2025年4月14日   

    带水印与不带水印文本生成数据集 数据来源:互联网公开数据 标签:文本生成,水印嵌入,语言模型,OPT-350M,数据集,机器学习,自然语言处理 数据概述:...
    packageimg
  • 尼泊尔语与乌尔都语平行语料库

    2025年4月14日   

    尼泊尔语与乌尔都语平行语料库 数据来源:互联网公开数据 标签:尼泊尔语,乌尔都语,平行语料库,词性标注,宾夕法尼亚树库,机器翻译,语言模型,语料清洗,语言研究 数据概述:...
    packageimg