-
多语言恶意文本检测数据集
2025年9月14日 30 77 65
多语言恶意文本检测数据集_Multilingual_Toxic_Text_Detection_Dataset 数据来源:互联网公开数据 标签:文本分类, 恶意文本, 多语言, 自然语言处理, 机器翻译, 情感分析, 毒性检测, 语言模型 数据概述: 该数据集包含来自多个语种的文本数据,旨在用于恶意文本的检测与分析。主要特征如下:... -
多语言语音识别文本数据集
2025年9月13日 30 38 29
多语言语音识别文本数据集_Multilingual_Speech_Recognition_Text_Dataset 数据来源:互联网公开数据 标签:语音识别, 文本转录, 多语言, 语音数据, 机器学习, 声学模型, 自然语言处理, 数据集 数据概述: 该数据集包含来自多个来源的多语言语音数据,记录了语音片段及其对应的文本转录。主要特征如下:... -
口音识别音频数据集
2025年8月30日 30 29 8
口音识别音频数据集_Accent_Recognition_Audio_Dataset 数据来源:互联网公开数据 标签:语音识别, 口音识别, 音频数据, 机器学习, 语音分析, 多语言, 声学特征, 数据标注 数据概述: 该数据集包含来自多个来源的音频文件,记录了不同口音的语音样本,用于口音识别研究和模型训练。主要特征如下:... -
多语言维基百科文章翻译质量评估数据集
2025年8月11日 30 20 5
多语言维基百科文章翻译质量评估数据集_Multilingual_Wikipedia_Article_Translation_Quality_Assessment 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 语言模型, 文本质量评估, 多语言, 维基百科, 数据标注, 自然语言处理 数据概述:... -
多语言视觉问答图像数据集
2025年8月8日 30 161 116
多语言视觉问答图像数据集_Multilingual_Visual_Question_Answering_Image_Dataset 数据来源:互联网公开数据 标签:视觉问答, 多语言, 图像识别, 图像分类, 自然语言处理, 机器翻译, 数据标注, 计算机视觉 数据概述:... -
多语言蕴含关系推理数据集_Multilingual_Natural_Language_Inference_Dataset
2025年6月24日 60 137 21
多语言蕴含关系推理数据集_Multilingual_Natural_Language_Inference_Dataset 数据来源:互联网公开数据 标签:自然语言处理, 文本推理, 语义理解, 多语言, 情感分析, 机器学习, 语言模型, 语料库 数据概述:... -
多语言实体关系抽取数据集
2025年8月5日 30 191 44
多语言实体关系抽取数据集_Multilingual_Entity_Relation_Extraction_Dataset 数据来源:互联网公开数据 标签:关系抽取, 自然语言处理, 文本挖掘, 嵌入向量, 多语言, 知识图谱, 实体识别, 机器学习 数据概述:... -
情感分析多语言文本数据集MultilingualTextEmotionAnalysisDataset-rookiejing
2025年5月10日 60 125 59
情感分析多语言文本数据集MultilingualTextEmotionAnalysisDataset-rookiejing 数据来源:互联网公开数据 标签:情感分析, 文本分类, 多语言, 情感识别, 自然语言处理, 情绪识别, 机器学习, 语料库 数据概述: 该数据集包含来自多种语言的文本数据,旨在用于情感分析模型的训练和评估。主要特征如下:... -
印度多语言文本情感分类数据集
2025年7月26日 30 119 33
印度多语言文本情感分类数据集_Multi_Language_Text_Sentiment_Classification_Dataset 数据来源:互联网公开数据 标签:情感分析, 文本分类, 多语言, 印度语言, 机器学习, 自然语言处理, 文本情感, 数据集 数据概述:... -
多语言语音词汇识别数据集
2025年7月24日 30 138 62
多语言语音词汇识别数据集_Multilingual_Speech_Word_Recognition_Dataset 数据来源:互联网公开数据 标签:语音识别, 多语言, 词汇识别, 语音标注, 自然语言处理, 音频数据, 机器学习, 语音数据集 数据概述: 该数据集包含来自多个来源的语音数据,记录了不同语言的语音词汇及其对应的文本转录。主要特征如下:... -
文本嵌入向量数据集
2025年7月19日 30 140 63
文本嵌入向量数据集_Text_Embedding_Vectors 数据来源:互联网公开数据 标签:文本嵌入, 语义向量, 多语言, 相似度计算, 深度学习, 向量空间, 文本检索, 自然语言处理 数据概述: 该数据集包含基于多语言文本的嵌入向量,记录了文本经过特定模型转换后的数值化表示。主要特征如下:... -
多语言问答预测结果数据集
2025年7月12日 30 79 68
多语言问答预测结果数据集_Multilingual_Question_Answering_Prediction_Results 数据来源:互联网公开数据 标签:问答系统, 机器翻译, 自然语言处理, 文本分析, 预测结果, 相似度计算, 多语言, 机器学习 数据概述:... -
多语言语音数据集
2025年7月11日 30 132 126
多语言语音数据集_Multilingual_Speech_Dataset 数据来源:互联网公开数据 标签:语音识别, 语音合成, 多语言, 文本转语音, 声纹识别, 语音数据, 机器学习, 语言学 数据概述: 该数据集包含多语言语音数据,记录了不同说话者的语音片段及其对应的文本内容。主要特征如下: 时间跨度:数据未明确标注具体时间,可视为静态语音语料。... -
多语言指令微调问答数据集
2025年7月7日 30 99 13
多语言指令微调问答数据集_Multilingual_Instruction_Fine_tuning_Question_Answering_Dataset 数据来源:互联网公开数据 标签:自然语言处理, 问答系统, 多语言, 指令微调, 机器翻译, 文本生成, 模型训练, 大语言模型 数据概述:... -
多语言维基百科评论毒性分析数据集
2025年7月5日 30 136 9
多语言维基百科评论毒性分析数据集_Multilingual_Wikipedia_Comments_Toxicity_Analysis 数据来源:互联网公开数据 标签:毒性检测, 多语言, 文本分类, 自然语言处理, 机器学习, 评论分析, 情感分析, 机器翻译 数据概述:... -
多语言手写体图像数据集_Multilingual_Handwritten_Image_Dataset
2025年6月25日 30 153 137
多语言手写体图像数据集_Multilingual_Handwritten_Image_Dataset 数据来源:互联网公开数据 标签:手写体识别, 图像识别, 多语言, 卡纳达语, 英语, 文本检测, OCR, 数据集 数据概述: 该数据集包含多语言手写体图像数据,记录了卡纳达语和英语的手写字符、单词和句子图像。主要特征如下:... -
Spotify音乐与歌词数据集-1921至2020年-bwandowando
2025年6月4日 30 48 14
Spotify音乐与歌词数据集-1921至2020年-bwandowando 数据来源:互联网公开数据 标签:Spotify,音乐,歌词,数据集,多语言,嵌入模型,BAAI,bge-m3,歌单,音乐流派,国家排行榜,歌词API 数据概述:... -
多语言歌词音乐流派分类数据集-mateibejan
2025年6月1日 30 126 121
多语言歌词音乐流派分类数据集-mateibejan 数据来源:互联网公开数据 标签:多语言,歌词,音乐流派,文本挖掘,信息检索,语言检测,音乐分类 数据概述:... -
亚马逊多语言购物会话数据集
2025年6月1日 30 53 25
亚马逊多语言购物会话数据集 数据来源:互联网公开数据 标签:多语言,购物会话,亚马逊ASIN,电子商务,自然语言处理,多语言模型训练 数据概述:...