-
多语言问答预测结果数据集
多语言问答预测结果数据集_Multilingual_Question_Answering_Prediction_Results 数据来源:互联网公开数据 标签:问答系统, 机器翻译, 自然语言处理, 文本分析, 预测结果, 相似度计算, 多语言, 机器学习 数据概述:...
-
多语言语音数据集
多语言语音数据集_Multilingual_Speech_Dataset 数据来源:互联网公开数据 标签:语音识别, 语音合成, 多语言, 文本转语音, 声纹识别, 语音数据, 机器学习, 语言学 数据概述: 该数据集包含多语言语音数据,记录了不同说话者的语音片段及其对应的文本内容。主要特征如下: 时间跨度:数据未明确标注具体时间,可视为静态语音语料。...
-
多语言指令微调问答数据集
多语言指令微调问答数据集_Multilingual_Instruction_Fine_tuning_Question_Answering_Dataset 数据来源:互联网公开数据 标签:自然语言处理, 问答系统, 多语言, 指令微调, 机器翻译, 文本生成, 模型训练, 大语言模型 数据概述:...
-
多语言维基百科评论毒性分析数据集
多语言维基百科评论毒性分析数据集_Multilingual_Wikipedia_Comments_Toxicity_Analysis 数据来源:互联网公开数据 标签:毒性检测, 多语言, 文本分类, 自然语言处理, 机器学习, 评论分析, 情感分析, 机器翻译 数据概述:...
-
多语言手写体图像数据集_Multilingual_Handwritten_Image_Dataset
多语言手写体图像数据集_Multilingual_Handwritten_Image_Dataset 数据来源:互联网公开数据 标签:手写体识别, 图像识别, 多语言, 卡纳达语, 英语, 文本检测, OCR, 数据集 数据概述: 该数据集包含多语言手写体图像数据,记录了卡纳达语和英语的手写字符、单词和句子图像。主要特征如下:...
-
Spotify音乐与歌词数据集-1921至2020年-bwandowando
Spotify音乐与歌词数据集-1921至2020年-bwandowando 数据来源:互联网公开数据 标签:Spotify,音乐,歌词,数据集,多语言,嵌入模型,BAAI,bge-m3,歌单,音乐流派,国家排行榜,歌词API 数据概述:...
-
多语言歌词音乐流派分类数据集-mateibejan
多语言歌词音乐流派分类数据集-mateibejan 数据来源:互联网公开数据 标签:多语言,歌词,音乐流派,文本挖掘,信息检索,语言检测,音乐分类 数据概述:...
-
-
多语言句子嵌入模型DistilUSE-base-multilingual-cased-v2数据集
多语言句子嵌入模型DistilUSE-base-multilingual-cased-v2数据集 数据来源:互联网公开数据 标签:句子嵌入,多语言,自然语言处理,NLP,机器学习,文本相似度,语义分析,UKPLab 数据概述: 本数据集包含多语言句子嵌入模型DistilUSE-base-multilingual-...
-
Jigsaw多语言评论训练数据集-2021-miklgr500
Jigsaw多语言评论训练数据集-2021-miklgr500 数据来源:互联网公开数据 标签:Jigsaw,多语言,评论,分类,机器学习,Google API,翻译,训练数据 数据概述: 本数据集是“Jigsaw多语言毒评论分类”竞赛的翻译训练数据集,使用了Google...
-
圣经多语言平行语料库
圣经多语言平行语料库 数据来源:互联网公开数据 标签:多语言,平行语料库,圣经翻译,语言对比,机器翻译,语言学研究,跨文化交流 数据概述: 本数据集是一个多语言平行语料库,由Christos Christodoulopoulos和Mark...
-
-
多语言视觉问答数据集
多语言视觉问答数据集 数据来源:互联网公开数据 标签:多语言,视觉问答,英语,越南语,日语,图像分析,自然语言处理,跨语言学习 数据概述: 本数据集是首个包含英语、越南语和日语三种语言的多语言视觉问答数据集,包含33,000多个由人工创建的问题-...
-
维基百科2018-2019年网页流量数据集-sandeshbhat
维基百科2018-2019年网页流量数据集-sandeshbhat 数据来源:互联网公开数据 标签:维基百科,网页流量,时间序列,数据分析,预测,机器学习,多语言,数据科学,ARIMA,Prophet 数据概述:...
-
多语言语音转录数据集
多语言语音转录数据集 数据来源:互联网公开数据 标签:多语言,语音识别,说话人识别,语音转录,语言学研究,年龄分布,性别分布,口音分析,社会语言学 数据概述:...
-
商品搜索相关性数据集ProductSearchRelevanceDataset-ishitakumar2109
商品搜索相关性数据集ProductSearchRelevanceDataset-ishitakumar2109 数据来源:互联网公开数据 标签:搜索推荐, 文本匹配, 电商数据, 语义分析, 多语言, 机器学习, 商品搜索, 用户行为 数据概述: 该数据集包含来自电商平台的用户搜索查询与商品信息,记录了用户搜索行为与商品之间的关联性。主要特征如下:...
-
印度尼西亚面部特征描述数据集-2021-naimul314
印度尼西亚面部特征描述数据集-2021-naimul314 数据来源:互联网公开数据 标签:面部特征,描述,图像识别,多语言,数据集,机器学习,研究,教育 数据概述:...
-
社交媒体评论性别与情感分析数据集SocialMediaCommentsGenderandSentimentAnalysis-eemayas
社交媒体评论性别与情感分析数据集SocialMediaCommentsGenderandSentimentAnalysis-eemayas 数据来源:互联网公开数据 标签:性别识别, 情感分析, 社交媒体, 自然语言处理, 文本挖掘, 评论数据, 数据清洗, 多语言 数据概述:...
-
语音命令数据集
语音命令数据集 数据来源:互联网公开数据 标签:语音识别,虚拟助手,多语言,语音命令,语音处理,人机交互,数据增强 数据概述: 本数据集包含来自多个说话者的音频录音,旨在模拟虚拟助手的语音交互场景。录音内容为用户对虚拟助手发出的个体语音命令,涵盖不同语言、流利程度及其他属性的说话者。数据集经过简化处理,适合用于语音识别模型的训练与优化。 数据用途概述:...



