-
谷歌与Mozilla豪萨语音频数据集GoogleandMozillaHausaAudioDataset-horlawale
谷歌与Mozilla豪萨语音频数据集GoogleandMozillaHausaAudioDataset-horlawale 数据来源:互联网公开数据 标签:音频数据,豪萨语,自然语言处理,语音识别,机器学习,多语言,语音合成,人工智能 数据概述: 该数据集由谷歌和Mozilla联合提供,包含豪萨语的音频数据,记录了豪萨语的语音样本。主要特征如下:... -
葡萄酒品鉴评论文本数据集WineTastingReviewTextDataset-statiana
葡萄酒品鉴评论文本数据集WineTastingReviewTextDataset-statiana 数据来源:互联网公开数据 标签:葡萄酒, 品鉴, 评论, 文本分析, 自然语言处理, 多语言, 情感分析, 数据标注 数据概述: 该数据集包含来自多个来源的葡萄酒品鉴评论文本,记录了不同年份、不同葡萄酒的品鉴笔记。主要特征如下:... -
多语言恶意评论检测数据集MultilingualToxicCommentDetectionDataset-glkuzi
多语言恶意评论检测数据集MultilingualToxicCommentDetectionDataset-glkuzi 数据来源:互联网公开数据 标签:文本分类, 恶意评论, 多语言, 深度学习, 自然语言处理, 情感分析, 数据标注, BERT模型 数据概述:... -
波斯语新闻数据集PersianNewsDataset-fatemehmahdibabaee
波斯语新闻数据集PersianNewsDataset-fatemehmahdibabaee 数据来源:互联网公开数据 标签:新闻,波斯语,数据集,自然语言处理,文本分析,机器学习,多语言,数据挖掘 数据概述: 该数据集包含来自波斯语新闻媒体的文章数据,记录了波斯语新闻的文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
多语言有毒评论训练数据集MultilingualToxicCommentsTrainingDataset-leecming
多语言有毒评论训练数据集MultilingualToxicCommentsTrainingDataset-leecming 数据来源:互联网公开数据 标签:自然语言处理,有毒评论,数据集,文本分类,机器学习,多语言,数据挖掘,网络安全 数据概述: 该数据集包含来自多个语言环境的有毒评论数据,记录了不同语言背景下的网络评论内容及其毒性分类。主要特征如下:... -
多语言图像处理数据集MLIPDataset-dobosp
多语言图像处理数据集MLIPDataset-dobosp 数据来源:互联网公开数据 标签:图像处理,多语言,数据集,文本识别,计算机视觉,自然语言处理,跨模态,人工智能 数据概述: 该数据集包含多语言图像处理数据,旨在促进跨语言图像分析和理解。主要特征如下: 时间跨度:数据记录时间跨度不限,持续更新。... -
Jigsaw多语言恶意评论数据集JigsawMultilingualToxicCommentDataset-yeayates21
Jigsaw多语言恶意评论数据集JigsawMultilingualToxicCommentDataset-yeayates21 数据来源:互联网公开数据 标签:自然语言处理,文本分析,多语言,恶意评论,数据集,情感分析,机器学习,文本分类 数据概述: 该数据集由 Jigsaw... -
多语言文本识别数据集MultilingualTextRecognitionDataset-amitverma2030
多语言文本识别数据集MultilingualTextRecognitionDataset-amitverma2030 数据来源:互联网公开数据 标签:文本识别, 多语言, 语言检测, 文本分类, 自然语言处理, 机器学习, 语料库, 文本分析 数据概述: 该数据集包含来自多种语言的文本数据,旨在用于多语言文本识别和语言检测任务。主要特征如下:... -
多语言问答查询数据集MultilingualQuestionAnsweringQueryDataset-christinakopidaki
多语言问答查询数据集MultilingualQuestionAnsweringQueryDataset-christinakopidaki 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 机器阅读理解, 文本检索, 多语言, 问句分析, 语料库, 语言识别 数据概述:... -
阿拉伯新闻文本分类数据集ArabicNewsTextClassification-alaahaiderh
阿拉伯新闻文本分类数据集ArabicNewsTextClassification-alaahaiderh 数据来源:互联网公开数据 标签:新闻文本, 阿拉伯语, 文本分类, 自然语言处理, 机器翻译, 情感分析, 文本预处理, 多语言 数据概述: 该数据集包含来自阿拉伯新闻的文章文本,用于文本分类任务。主要特征如下:... -
网站状态监测文本数据集WebsiteStatusMonitoringTextDataset-abdyazouri
网站状态监测文本数据集WebsiteStatusMonitoringTextDataset-abdyazouri 数据来源:互联网公开数据 标签:网站状态, 文本分析, 状态监测, 自然语言处理, 多语言, 运维, 数据清洗, 机器学习 数据概述:... -
多语言海丝数据集Multi-LingualHSDataset-khankhattak
多语言海丝数据集Multi-LingualHSDataset-khankhattak 数据来源:互联网公开数据 标签:国际贸易,海关编码,多语言,数据集,机器学习,自然语言处理,数据分析,经济研究 数据概述: 该数据集包含来自多语言环境的海丝(HS)编码数据,记录了国际贸易中商品的海关编码及其多语言描述。主要特征如下:... -
多语言聊天机器人竞技比赛结果数据集MultilingualChatbotArenaCompetitionResults-mohammedhamdan
多语言聊天机器人竞技比赛结果数据集MultilingualChatbotArenaCompetitionResults-mohammedhamdan 数据来源:互联网公开数据 标签:聊天机器人, 自然语言处理, 机器学习, 竞赛数据, 模型评估, 多语言, 文本分析, 胜负预测 数据概述:... -
多语言翻译数据集Multiple-Languages-TranslatorDataset-rizwanash
多语言翻译数据集Multiple-Languages-TranslatorDataset-rizwanash 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,多语言,文本分析,人工智能,翻译技术 数据概述: 该数据集包含来自多个语言翻译平台的数据,记录了不同语言之间的文本翻译记录。主要特征如下:... -
语言纠错词汇校对数据集LanguageCorrectionLexicalCalibrationDataset-ilhamn
语言纠错词汇校对数据集LanguageCorrectionLexicalCalibrationDataset-ilhamn 数据来源:互联网公开数据 标签:语言纠错, 词汇校对, 自然语言处理, 文本校对, 语料库, 词典, 多语言, 机器学习 数据概述:... -
商品信息多语言价格分析数据集ProductInformationMultilingualPriceAnalysis-ziadmahmoud1
商品信息多语言价格分析数据集ProductInformationMultilingualPriceAnalysis-ziadmahmoud1 数据来源:互联网公开数据 标签:商品信息, 价格分析, 多语言, 零售数据, 阿拉伯语, 英语, 商品分类, 文本分析 数据概述:... -
多语种文本语言识别数据集MultilingualTextLanguageIdentificationDataset-pranavagrawal09
多语种文本语言识别数据集MultilingualTextLanguageIdentificationDataset-pranavagrawal09 数据来源:互联网公开数据 标签:文本分析, 语言识别, 自然语言处理, 多语言, 语种标注, 机器学习, 文本分类, 语料库 数据概述:... -
多语言情感分析文本数据集MultilingualEmotionAnalysisTextDataset-rookiejing
多语言情感分析文本数据集MultilingualEmotionAnalysisTextDataset-rookiejing 数据来源:互联网公开数据 标签:情感分析, 文本分类, 多语言, 情绪识别, 自然语言处理, 机器学习, 情感标注, 文本语料库 数据概述: 该数据集包含来自不同语言的文本数据,记录了文本对应的情感标签。主要特征如下:... -
多语言数据集Multy-LangDatasets-embarkiomar
多语言数据集Multy-LangDatasets-embarkiomar 数据来源:互联网公开数据 标签:多语言,数据集,自然语言处理,机器翻译,文本分类,语言模型,人工智能,计算机科学 数据概述: 该数据集包含来自多个语言的数据,记录了不同语言之间的文本对齐和文本分类信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。... -
多语言情感分析文本数据集MultilingualEmotionAnalysisTextDataset-phamhoanglenguyen
多语言情感分析文本数据集MultilingualEmotionAnalysisTextDataset-phamhoanglenguyen 数据来源:互联网公开数据 标签:情感分析, 文本分类, 多语言, 情绪识别, 机器学习, 自然语言处理, 文本情感, 语料库 数据概述:...