-
Jigsaw比赛前序精选原始数据集
2025年6月1日 30 50 1
Jigsaw比赛前序精选原始数据集 数据来源:互联网公开数据 标签:Jigsaw,比赛数据,文本分析,机器学习,评论数据,语言处理,数据集,社交平台评论,情感分析 数据概述:... -
JovemNerdNerdcast节目文字转录数据集-2024年3月18日-leonardocosta1206
2025年5月31日 30 120 82
JovemNerdNerdcast节目文字转录数据集-2024年3月18日-leonardocosta1206 数据来源:互联网公开数据 标签:Jovem Nerd, Nerdcast, 文字转录, 节目内容, 语言处理, 机器学习, 数据分析 数据概述: 本数据集收录了Jovem... -
阿拉伯语情感评论数据集ArabicSentimentReviewsDataset-ahmedelsany
2025年5月29日 30 114 104
阿拉伯语情感评论数据集ArabicSentimentReviewsDataset-ahmedelsany 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本挖掘,语言处理,机器翻译,阿拉伯语 数据概述: 该数据集包含来自阿拉伯语社交媒体平台和在线评论网站的情感评论数据,记录了用户对产品、服务或内容的情感表达。主要特征如下:... -
印度尼西亚新闻社交媒体文本数据集IndonesiaNewsSocialMediaText-iannarsa
2025年5月29日 30 98 48
印度尼西亚新闻社交媒体文本数据集IndonesiaNewsSocialMediaText-iannarsa 数据来源:互联网公开数据 标签:社交媒体, 文本分析, 新闻内容, 舆情分析, 情感分析, 印度尼西亚, 语言处理, 传播分析 数据概述:... -
罗马化泰卢固语数据集RomanizedTeluguDataset-teachingmachine
2025年5月28日 30 171 98
罗马化泰卢固语数据集RomanizedTeluguDataset-teachingmachine 数据来源:互联网公开数据 标签:语言处理,泰卢固语,罗马化,数据集,自然语言处理,文本分析,语言学,机器翻译 数据概述: 该数据集包含罗马化泰卢固语文本数据,记录了泰卢固语词汇、短语或句子的罗马化转写。主要特征如下:... -
考试语音识别数据集ExamSpeechRecognitionDataset-hassanoubrahim
2025年5月28日 30 133 107
考试语音识别数据集ExamSpeechRecognitionDataset-hassanoubrahim 数据来源:互联网公开数据 标签:语音识别,数据集,教育技术,机器学习,人工智能,语言处理,教育研究,技术评估 数据概述: 该数据集包含来自教育场景的语音识别数据,记录了学生在考试环境中的语音样本和对应的文本转录。主要特征如下:... -
通用英语语法纠错数据集GeneralEnglishCorrectionDataset-ajoydey00001
2025年5月28日 30 193 10
通用英语语法纠错数据集GeneralEnglishCorrectionDataset-ajoydey00001 数据来源:互联网公开数据 标签:自然语言处理,语法纠错,数据集,机器学习,文本分析,教育技术,语言处理,智能写作 数据概述: 该数据集专注于英语语法纠错任务,包含大量英语文本及其对应的语法错误标注和修正建议。主要特征如下:... -
孟加拉语手写字符数据集BanglalekhaIsolated5Classes数据集-ferdouszislam
2025年5月28日 30 93 76
孟加拉语手写字符数据集BanglalekhaIsolated5Classes数据集-ferdouszislam 数据来源:互联网公开数据 标签:手写识别,数据集,图像分析,机器学习,计算机视觉,孟加拉语,字符识别,语言处理 数据概述: 该数据集包含来自孟加拉语手写字符的图像,涵盖了5个不同类别的字符。主要特征如下:... -
孟加拉语情感分析数据集BanglaLoveDataset-fuadfab
2025年5月12日 30 208 66
孟加拉语情感分析数据集BanglaLoveDataset-fuadfab 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本分类,孟加拉语,语言处理,情感计算 数据概述: 该数据集包含来自互联网公开渠道的孟加拉语文本数据,记录了用户在不同平台上的情感表达。主要特征如下: 时间跨度:数据记录的时间范围从2019年到2022年。... -
语言工具-6数据集LanguageTool-6Dataset-tsobolev
2025年5月21日 30 94 10
语言工具-6数据集LanguageTool-6Dataset-tsobolev 数据来源:互联网公开数据 标签:语言处理,文本分析,数据集,自然语言处理,语法检查,机器学习,语义分析,文本纠错 数据概述: 该数据集由语言工具-6项目提供,主要包含用于语言处理的文本数据,适用于文本分析、语法检查等任务。主要特征如下:... -
英语到希伯来语翻译数据集OPUSEnglishtoHebrewCSVDataset-williamalabi
2025年5月19日 30 207 182
英语到希伯来语翻译数据集OPUSEnglishtoHebrewCSVDataset-williamalabi 数据来源:互联网公开数据 标签:机器翻译,语言处理,数据集,英语,希伯来语,自然语言处理,文本分析,翻译技术 数据概述: 该数据集包含来自OPUS项目的英语到希伯来语的平行文本数据,记录了大量的英文原文及其对应的希伯来文翻译。主要特征如下:... -
日英字幕语料库数据集-2020年-onslaught
2025年5月4日 30 25 20
日英字幕语料库数据集-2020年-onslaught 数据来源:互联网公开数据 标签:日英翻译,字幕,机器翻译,语言处理,语料库,自然语言处理,信息提取 数据概述:... -
商品品牌信息俄语数据集ProductBrandInformationRussianDataset-bulbazavril
2025年5月1日 30 48 46
商品品牌信息俄语数据集ProductBrandInformationRussianDataset-bulbazavril 数据来源:互联网公开数据 标签:商品信息, 品牌识别, 俄语, 文本数据, 数据清洗, 市场分析, 商品分类, 语言处理 数据概述: 该数据集包含来自未知来源的商品品牌信息,记录了商品名称与其对应的品牌。主要特征如下:... -
乌尔都语情感分析数据集UrduSentimentAnalysisDataset-mohabbatsial
2025年4月29日 30 38 20
乌尔都语情感分析数据集UrduSentimentAnalysisDataset-mohabbatsial 数据来源:互联网公开数据 标签:情感分析, 乌尔都语, 文本分类, 语言处理, 自然语言处理, 情感极性, 社交媒体, 文本挖掘 数据概述: 该数据集包含源自社交媒体平台的乌尔都语文本数据,记录了用户表达的情感倾向。主要特征如下:... -
MASC测试表格数据集MASCTestSheetDataset-amrkhaledsaleh
2025年4月26日 30 106 72
MASC测试表格数据集MASCTestSheetDataset-amrkhaledsaleh 数据来源:互联网公开数据 标签:语言处理,文本分析,数据集,自然语言处理,机器学习,情感分析,学术资源,计算机科学 数据概述: 该数据集包含来自MASC(Minimal Annotated Subcorpus of Canadian... -
阿姆哈拉语文本数据集AmharicDataDataset-azzaal
2025年4月26日 30 86 4
阿姆哈拉语文本数据集AmharicDataDataset-azzaal 数据来源:互联网公开数据 标签:阿姆哈拉语,文本数据,数据集,语言处理,自然语言处理,机器学习,多语言,非洲语言 数据概述: 该数据集包含来自公开来源的阿姆哈拉语文本数据,记录了阿姆哈拉语的文本内容。主要特征如下: 时间跨度:数据记录的时间范围不明确,可能涵盖多个时间段。... -
印地语BBC新闻数据集HindiBBCNewsDataset-renukaarch
2025年4月26日 30 83 60
印地语BBC新闻数据集HindiBBCNewsDataset-renukaarch 数据来源:互联网公开数据 标签:新闻,印地语,数据集,文本分析,自然语言处理,机器学习,新闻分类,语言处理 数据概述: 该数据集包含来自BBC印地语新闻频道的新闻文章数据,记录了BBC印地语新闻的文本内容。主要特征如下:... -
马拉地语处理数据集MarathiProcessedDataset-11Oct-parthplc
2025年4月26日 30 142 30
马拉地语处理数据集MarathiProcessedDataset-11Oct-parthplc 数据来源:互联网公开数据 标签:语言处理,马拉地语,自然语言处理,数据集,文本分析,机器学习,语言翻译,数据挖掘 数据概述: 该数据集包含经过处理的马拉地语文本数据,记录了马拉地语的自然语言文本信息。主要特征如下:... -
翻译数据数据集TranslationDataDataset-khoahongg
2025年4月26日 30 161 132
翻译数据数据集TranslationDataDataset-khoahongg 数据来源:互联网公开数据 标签:翻译,数据集,语言处理,机器学习,自然语言处理,跨文化交流,文本分析,人工智能 数据概述: 该数据集包含来自不同语言之间的翻译数据,记录了多种语言文本的翻译对应关系。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。... -
印地语语流中断数据集HindiDisfluencyDataset-daspinaki
2025年4月26日 30 181 16
印地语语流中断数据集HindiDisfluencyDataset-daspinaki 数据来源:互联网公开数据 标签:语言处理,语料库,数据分析,语音识别,自然语言处理,机器学习,语言学,印地语 数据概述: 该数据集包含来自印地语的语流中断语音和文本数据,记录了印地语语音中的中断,重复,修正等非流畅现象。主要特征如下:...