-
多语言用户反馈数据集UltraFeedbackMultilingualDatasetfromHuggingFace-arman1611
2025年5月30日 30 201 98
多语言用户反馈数据集UltraFeedbackMultilingualDatasetfromHuggingFace-arman1611 数据来源:互联网公开数据 标签:用户反馈,多语言数据集,自然语言处理,机器学习,情感分析,文本分类,数据增强,语言模型 数据概述: 该数据集来自Hugging... -
波斯语文本改写数据集PersianParaphraseDataset-armannikkhah
2025年5月28日 30 158 128
波斯语文本改写数据集PersianParaphraseDataset-armannikkhah 数据来源:互联网公开数据 标签:自然语言处理,文本改写,机器翻译,语言模型,多语言数据集,机器学习,语义分析,人工智能 数据概述: 该数据集包含来自波斯语领域的文本改写数据,记录了波斯语文本的改写和翻译对。主要特征如下:... -
亚马逊商品法国评论及其英文翻译数据集-dargolex
2025年4月23日 30 61 44
亚马逊商品法国评论及其英文翻译数据集-dargolex 数据来源:互联网公开数据 标签:亚马逊评论,法国评论,英语翻译,多语言数据集,自然语言处理,商品评价 数据概述: 本数据集包含来自亚马逊商品的法国评论及其对应的英文翻译。原始评论数据来源于Hugging Face,由Phillip Keung、Yichao Lu、György... -
英博平行语料库数据集-jigarpanjiyar
2025年4月21日 30 151 109
英博平行语料库数据集-jigarpanjiyar 数据来源:互联网公开数据 标签:英博语料库,语言学习,翻译,平行语料库,多语言数据集,教育 数据概述:... -
跨语言问答数据集XQuAD印地语部分2019-nbroad
2025年4月21日 30 203 89
跨语言问答数据集XQuAD印地语部分2019-nbroad 数据来源:互联网公开数据 标签:跨语言问答,自然语言处理,机器翻译,多语言数据集,印地语,文本理解 数据概述: 本数据集是XQuAD(跨语言问答数据集)中的印地语部分,用于评估跨语言问答性能。数据集包含SQuAD v1.1开发集的子集,共有240段落和1190个问题-... -
印度尼西亚至马来语桑巴斯翻译数据集
2025年4月15日 30 44 7
印度尼西亚至马来语桑巴斯翻译数据集 数据来源:互联网公开数据 标签:翻译,印度尼西亚语,马来语,桑巴斯语,语言学,自然语言处理,多语言数据集 数据概述: 本数据集包含印度尼西亚语句子及其在马来语(桑巴斯方言)中的翻译。数据集来源于公开的GitHub资源,涵盖了广泛的主题和内容,为语言学研究提供了丰富的语料库。 数据用途概述:... -
-
英德阿拉伯文本翻译数据集
2025年4月14日 30 141 51
英德阿拉伯文本翻译数据集 数据来源:互联网公开数据 标签:文本翻译,语言学,英语,德语,阿拉伯语,多语言数据集,语言对比 数据概述: 本数据集包含从英语翻译到德语和阿拉伯语的多语言文本内容。数据集涵盖了广泛的文本类型,适用于语言学研究、机器翻译模型训练以及跨语言信息处理等领域。其中,阿拉伯语翻译部分来源于特定的数据集。 数据用途概述:...