-
文本嵌入向量数据集
2025年7月19日 30 22 2
文本嵌入向量数据集_Text_Embedding_Vectors 数据来源:互联网公开数据 标签:文本嵌入, 语义向量, 多语言, 相似度计算, 深度学习, 向量空间, 文本检索, 自然语言处理 数据概述: 该数据集包含基于多语言文本的嵌入向量,记录了文本经过特定模型转换后的数值化表示。主要特征如下:... -
多语言问答预测结果数据集
2025年7月12日 30 23 4
多语言问答预测结果数据集_Multilingual_Question_Answering_Prediction_Results 数据来源:互联网公开数据 标签:问答系统, 机器翻译, 自然语言处理, 文本分析, 预测结果, 相似度计算, 多语言, 机器学习 数据概述:... -
多语言语音数据集
2025年7月11日 30 17 2
多语言语音数据集_Multilingual_Speech_Dataset 数据来源:互联网公开数据 标签:语音识别, 语音合成, 多语言, 文本转语音, 声纹识别, 语音数据, 机器学习, 语言学 数据概述: 该数据集包含多语言语音数据,记录了不同说话者的语音片段及其对应的文本内容。主要特征如下: 时间跨度:数据未明确标注具体时间,可视为静态语音语料。... -
多语言指令微调问答数据集
2025年7月7日 30 25 5
多语言指令微调问答数据集_Multilingual_Instruction_Fine_tuning_Question_Answering_Dataset 数据来源:互联网公开数据 标签:自然语言处理, 问答系统, 多语言, 指令微调, 机器翻译, 文本生成, 模型训练, 大语言模型 数据概述:... -
多语言维基百科评论毒性分析数据集
2025年7月5日 30 12 5
多语言维基百科评论毒性分析数据集_Multilingual_Wikipedia_Comments_Toxicity_Analysis 数据来源:互联网公开数据 标签:毒性检测, 多语言, 文本分类, 自然语言处理, 机器学习, 评论分析, 情感分析, 机器翻译 数据概述:... -
多语言手写体图像数据集_Multilingual_Handwritten_Image_Dataset
2025年6月25日 30 15 1
多语言手写体图像数据集_Multilingual_Handwritten_Image_Dataset 数据来源:互联网公开数据 标签:手写体识别, 图像识别, 多语言, 卡纳达语, 英语, 文本检测, OCR, 数据集 数据概述: 该数据集包含多语言手写体图像数据,记录了卡纳达语和英语的手写字符、单词和句子图像。主要特征如下:... -
多语言蕴含关系推理数据集_Multilingual_Natural_Language_Inference_Dataset
2025年6月24日 30 23 2
多语言蕴含关系推理数据集_Multilingual_Natural_Language_Inference_Dataset 数据来源:互联网公开数据 标签:自然语言处理, 文本推理, 语义理解, 多语言, 情感分析, 机器学习, 语言模型, 语料库 数据概述:... -
Spotify音乐与歌词数据集-1921至2020年-bwandowando
2025年6月4日 30 21 4
Spotify音乐与歌词数据集-1921至2020年-bwandowando 数据来源:互联网公开数据 标签:Spotify,音乐,歌词,数据集,多语言,嵌入模型,BAAI,bge-m3,歌单,音乐流派,国家排行榜,歌词API 数据概述:... -
多语言歌词音乐流派分类数据集-mateibejan
2025年6月1日 30 18 8
多语言歌词音乐流派分类数据集-mateibejan 数据来源:互联网公开数据 标签:多语言,歌词,音乐流派,文本挖掘,信息检索,语言检测,音乐分类 数据概述:... -
亚马逊多语言购物会话数据集
2025年6月1日 30 30 6
亚马逊多语言购物会话数据集 数据来源:互联网公开数据 标签:多语言,购物会话,亚马逊ASIN,电子商务,自然语言处理,多语言模型训练 数据概述:... -
多语言句子嵌入模型DistilUSE-base-multilingual-cased-v2数据集
2025年6月1日 30 29 6
多语言句子嵌入模型DistilUSE-base-multilingual-cased-v2数据集 数据来源:互联网公开数据 标签:句子嵌入,多语言,自然语言处理,NLP,机器学习,文本相似度,语义分析,UKPLab 数据概述: 本数据集包含多语言句子嵌入模型DistilUSE-base-multilingual-... -
Jigsaw多语言评论训练数据集-2021-miklgr500
2025年5月31日 30 20 3
Jigsaw多语言评论训练数据集-2021-miklgr500 数据来源:互联网公开数据 标签:Jigsaw,多语言,评论,分类,机器学习,Google API,翻译,训练数据 数据概述: 本数据集是“Jigsaw多语言毒评论分类”竞赛的翻译训练数据集,使用了Google... -
圣经多语言平行语料库
2025年5月31日 30 26 10
圣经多语言平行语料库 数据来源:互联网公开数据 标签:多语言,平行语料库,圣经翻译,语言对比,机器翻译,语言学研究,跨文化交流 数据概述: 本数据集是一个多语言平行语料库,由Christos Christodoulopoulos和Mark... -
毒性评论分类数据集
2025年5月31日 30 30 7
毒性评论分类数据集 数据来源:互联网公开数据 标签:毒性评论,分类模型,自然语言处理,多语言,情感分析,文本处理,数据预处理 数据概述:... -
多语言视觉问答数据集
2025年5月31日 30 17 4
多语言视觉问答数据集 数据来源:互联网公开数据 标签:多语言,视觉问答,英语,越南语,日语,图像分析,自然语言处理,跨语言学习 数据概述: 本数据集是首个包含英语、越南语和日语三种语言的多语言视觉问答数据集,包含33,000多个由人工创建的问题-... -
维基百科2018-2019年网页流量数据集-sandeshbhat
2025年5月31日 30 23 1
维基百科2018-2019年网页流量数据集-sandeshbhat 数据来源:互联网公开数据 标签:维基百科,网页流量,时间序列,数据分析,预测,机器学习,多语言,数据科学,ARIMA,Prophet 数据概述:... -
多语言语音转录数据集
2025年5月31日 30 13 4
多语言语音转录数据集 数据来源:互联网公开数据 标签:多语言,语音识别,说话人识别,语音转录,语言学研究,年龄分布,性别分布,口音分析,社会语言学 数据概述:... -
商品搜索相关性数据集ProductSearchRelevanceDataset-ishitakumar2109
2025年5月31日 30 30 9
商品搜索相关性数据集ProductSearchRelevanceDataset-ishitakumar2109 数据来源:互联网公开数据 标签:搜索推荐, 文本匹配, 电商数据, 语义分析, 多语言, 机器学习, 商品搜索, 用户行为 数据概述: 该数据集包含来自电商平台的用户搜索查询与商品信息,记录了用户搜索行为与商品之间的关联性。主要特征如下:... -
印度尼西亚面部特征描述数据集-2021-naimul314
2025年5月31日 30 13 7
印度尼西亚面部特征描述数据集-2021-naimul314 数据来源:互联网公开数据 标签:面部特征,描述,图像识别,多语言,数据集,机器学习,研究,教育 数据概述:...