找到8个数据集

标签: 多语言数据集

过滤结果
  • 多语言用户反馈数据集UltraFeedbackMultilingualDatasetfromHuggingFace-arman1611

    2025年5月30日 30 201 98

    多语言用户反馈数据集UltraFeedbackMultilingualDatasetfromHuggingFace-arman1611 数据来源:互联网公开数据 标签:用户反馈,多语言数据集,自然语言处理,机器学习,情感分析,文本分类,数据增强,语言模型 数据概述: 该数据集来自Hugging...
    packageimg
  • 波斯语文本改写数据集PersianParaphraseDataset-armannikkhah

    2025年5月28日 30 158 128

    波斯语文本改写数据集PersianParaphraseDataset-armannikkhah 数据来源:互联网公开数据 标签:自然语言处理,文本改写,机器翻译,语言模型,多语言数据集,机器学习,语义分析,人工智能 数据概述: 该数据集包含来自波斯语领域的文本改写数据,记录了波斯语文本的改写和翻译对。主要特征如下:...
    packageimg
  • 亚马逊商品法国评论及其英文翻译数据集-dargolex

    2025年4月23日 30 61 44

    亚马逊商品法国评论及其英文翻译数据集-dargolex 数据来源:互联网公开数据 标签:亚马逊评论,法国评论,英语翻译,多语言数据集,自然语言处理,商品评价 数据概述: 本数据集包含来自亚马逊商品的法国评论及其对应的英文翻译。原始评论数据来源于Hugging Face,由Phillip Keung、Yichao Lu、György...
    packageimg
  • 英博平行语料库数据集-jigarpanjiyar

    2025年4月21日 30 151 109

    英博平行语料库数据集-jigarpanjiyar 数据来源:互联网公开数据 标签:英博语料库,语言学习,翻译,平行语料库,多语言数据集,教育 数据概述:...
    packageimg
  • 跨语言问答数据集XQuAD印地语部分2019-nbroad

    2025年4月21日 30 203 89

    跨语言问答数据集XQuAD印地语部分2019-nbroad 数据来源:互联网公开数据 标签:跨语言问答,自然语言处理,机器翻译,多语言数据集,印地语,文本理解 数据概述: 本数据集是XQuAD(跨语言问答数据集)中的印地语部分,用于评估跨语言问答性能。数据集包含SQuAD v1.1开发集的子集,共有240段落和1190个问题-...
    packageimg
  • 印度尼西亚至马来语桑巴斯翻译数据集

    2025年4月15日 30 44 7

    印度尼西亚至马来语桑巴斯翻译数据集 数据来源:互联网公开数据 标签:翻译,印度尼西亚语,马来语,桑巴斯语,语言学,自然语言处理,多语言数据集 数据概述: 本数据集包含印度尼西亚语句子及其在马来语(桑巴斯方言)中的翻译。数据集来源于公开的GitHub资源,涵盖了广泛的主题和内容,为语言学研究提供了丰富的语料库。 数据用途概述:...
    packageimg
  • 语言分类数据集

    2025年4月14日 30 86 33

    语言分类数据集 数据来源:互联网公开数据 标签:语言分类,多语言数据集,机器学习,深度学习,自然语言处理,句法分析 数据概述:...
    packageimg
  • 英德阿拉伯文本翻译数据集

    2025年4月14日 30 141 51

    英德阿拉伯文本翻译数据集 数据来源:互联网公开数据 标签:文本翻译,语言学,英语,德语,阿拉伯语,多语言数据集,语言对比 数据概述: 本数据集包含从英语翻译到德语和阿拉伯语的多语言文本内容。数据集涵盖了广泛的文本类型,适用于语言学研究、机器翻译模型训练以及跨语言信息处理等领域。其中,阿拉伯语翻译部分来源于特定的数据集。 数据用途概述:...
    packageimg