-
文本校对与语言纠错资源数据集TextProofreadingandLanguageCorrectionResources-fcbk95
2025年5月30日 30 137 87
文本校对与语言纠错资源数据集TextProofreadingandLanguageCorrectionResources-fcbk95 数据来源:互联网公开数据 标签:语言校对, 文本纠错, 自然语言处理, 多语言支持, 词汇校正, 语法检查, 数据集, 语言学 数据概述:... -
马拉雅拉姆字符集数据集MalayalamCharacterSetDataset-raven111
2025年5月29日 30 109 27
马拉雅拉姆字符集数据集MalayalamCharacterSetDataset-raven111 数据来源:互联网公开数据 标签:马拉雅拉姆字符,数据集,语言学,字符识别,机器学习,自然语言处理,学术资源,多语言支持 数据概述: 该数据集包含来自互联网公开资源的马拉雅拉姆字符集,记录了马拉雅拉姆语的各种字符及其相关信息。主要特征如下: 时间跨度:... -
大规模语言模型扩充训练数据集LargeLanguageModelSEExtraTrainDatasets-ranchantan
2025年5月28日 30 36 14
大规模语言模型扩充训练数据集LargeLanguageModelSEExtraTrainDatasets-ranchantan 数据来源:互联网公开数据 标签:自然语言处理,语言模型,数据集,机器学习,文本生成,深度学习,人工智能,多语言支持 数据概述: 该数据集包含来自多个来源的大规模文本数据,用于扩充和训练大规模语言模型。主要特征如下:... -
大规模语言检测数据集
2025年5月5日 30 46 33
大规模语言检测数据集 数据来源:互联网公开数据 标签:语言检测,ISO 639-3,自然语言处理,多语言支持,文本分析,语言识别,机器学习 数据概述: 本数据集包含一个约10^7行的.csv文件,每行记录包含一个句子及其对应的ISO 639-3语言代码。此外,数据集还包括一个.json文件,用于映射ISO... -
多语言翻译应用性能评估数据集
2025年4月26日 30 39 36
多语言翻译应用性能评估数据集 数据来源:互联网公开数据 标签:翻译应用,多语言支持,翻译质量,用户评价,性能评估,自然语言处理,机器学习 数据概述:... -
Flickr30K邦加拉语数据集Flicker30KBanglaDataset-arifmahmoodsarker
2025年4月26日 30 12 3
Flickr30K邦加拉语数据集Flicker30KBanglaDataset-arifmahmoodsarker 数据来源:互联网公开数据 标签:Flickr, 邦加拉语, 图像标注, 数据集, 机器学习, 自然语言处理, 图像识别, 多语言支持 数据概述: 该数据集包含来自 Flickr 30K 数据集的图像和其对应的邦加拉语描述。主要特征如下:... -
维基媒体语言类别名称数据集WikimediaNamesbyLanguageCategoriesDataset-jamesxiwoolley
2025年4月25日 30 73 66
维基媒体语言类别名称数据集WikimediaNamesbyLanguageCategoriesDataset-jamesxiwoolley 数据来源:互联网公开数据 标签:维基媒体,语言类别,名称数据,数据集,文本分析,自然语言处理,多语言支持,文化研究 数据概述: 该数据集包含来自维基媒体的数据,记录了不同语言类别下的名称信息。主要特征如下:... -
英西语翻译数据集English-SpanishTranslationDataset-nouranader
2025年4月24日 30 197 102
英西语翻译数据集English-SpanishTranslationDataset-nouranader 数据来源:互联网公开数据 标签:翻译,语言学,数据集,机器学习,自然语言处理,文本分析,多语言支持,语言学习 数据概述:该数据集包含来自互联网的英西语翻译数据,记录了英语和西班牙语之间的文本对应关系。主要特征如下:... -
评论测试检查翻译数据集1CommentsTestCheckTranslateDataset1-yamak1906
2025年4月23日 30 185 85
评论测试检查翻译数据集1CommentsTestCheckTranslateDataset1-yamak1906 数据来源:互联网公开数据 标签:评论数据,数据集,翻译测试,自然语言处理,文本分析,机器学习,多语言支持,质量检查... -
矛盾侦探沃森训练集上采样版ContradictoryMyDearWatsonTrainUpsampled数据集-hatemalamir
2025年4月23日 30 149 47
矛盾侦探沃森训练集上采样版ContradictoryMyDearWatsonTrainUpsampled数据集-hatemalamir 数据来源:互联网公开数据 标签:自然语言处理,矛盾检测,数据集,人工智能,机器学习,文本分析,情感分析,多语言支持 数据概述: 该数据集为Contradictory My Dear... -
布哈里与穆斯林圣训数据集
2025年4月19日 30 87 85
布哈里与穆斯林圣训数据集 数据来源:互联网公开数据 标签:圣训,布哈里,穆斯林,孟加拉语,英语,宗教研究,文本分析,多语言支持 数据概述:... -
环球影城游客评价数据集
2025年4月19日 30 92 68
环球影城游客评价数据集 数据来源:互联网公开数据 标签:环球影城,游客评价,情感分析,用户反馈,主题公园,满意度,评论分析,多语言支持 数据概述:... -
欧洲语言词库数据集
2025年4月19日 30 112 86
欧洲语言词库数据集 数据来源:互联网公开数据 标签:自然语言处理,多语言支持,词库,欧洲语言,文本分析,语言学习,编码支持 数据概述... -
全球流行音乐歌词与艺术家数据集1963-2021
2025年4月15日 30 27 26
全球流行音乐歌词与艺术家数据集1963-2021 数据来源:互联网公开数据 标签:音乐歌词,艺术家信息,音乐流派,摇滚,乡村,嘻哈,节奏布鲁斯,英语歌词,多语言支持 数据概述:... -
-
跨语言文本蕴含关系分类数据集
2025年4月14日 30 50 31
跨语言文本蕴含关系分类数据集 数据来源:互联网公开数据 标签:自然语言处理,跨语言分析,文本蕴含,机器学习,句子分类,逻辑推理,多语言支持 数据概述:... -
多语言对话数据集
2025年4月14日 0 78 1
多语言对话数据集 数据来源:互联网公开数据 标签:多语言对话, AI训练, 自然语言处理, 跨语言系统, 会话分析, 聊天机器人, 多语言支持 数据概述: 本数据集是一个用于多语言对话模型训练的资源,包含中文、英文、韩语和日语四种主要语言的对话记录。数据集涵盖了广泛的对话场景,提供了结构化和多样化的会话数据,为开发跨语言对话系统提供了坚实的基础。...