-
泰米尔语文本翻译数据集TamilLanguageTranslationDataset-rnaveenprakash
2025年5月1日 30 40 4
泰米尔语文本翻译数据集TamilLanguageTranslationDataset-rnaveenprakash 数据来源:互联网公开数据 标签:泰米尔语, 机器翻译, 文本翻译, 语言模型, 自然语言处理, 数据集构建, 语言学, 语料库 数据概述: 该数据集包含泰米尔语文本及其对应的翻译,旨在用于训练和评估机器翻译模型。主要特征如下:...
-
旁遮普语沙木基语料库词频统计数据集
2025年4月15日 30 201 192
旁遮普语沙木基语料库词频统计数据集 数据来源:互联网公开数据 标签:旁遮普语,沙木基语,语言学,词频统计,文本分析,自然语言处理,语料库 数据概述: 本数据集基于从互联网收集的旁遮普语沙木基语料库构建而成,包含单字词(unigram)和双字词(bigram)的频率统计信息。 数据文件包括: unigram-p.csv:包含50,000个单字词及其词频。...



