找到385个数据集

格式: ZIP 标签: 多语言

过滤结果
  • 维基百科评论毒性分析数据集

    2025年10月30日 30 206 110

    维基百科评论毒性分析数据集_Wikipedia_Comments_Toxicity_Analysis_Dataset 数据来源:互联网公开数据 标签:文本分析, 情感分析, 毒性检测, 维基百科, 自然语言处理, 评论数据, 机器学习, 多语言 数据概述:...
    packageimg
  • 古吉拉特语与英语新闻标题分类数据集

    2025年10月30日 30 111 70

    古吉拉特语与英语新闻标题分类数据集_Gujarati_and_English_News_Headline_Classification_Dataset 数据来源:互联网公开数据 标签:文本分类,新闻标题,多语言,古吉拉特语,英语,情感分析,机器学习,自然语言处理 数据概述:...
    packageimg
  • 多语言语音数据元信息数据集

    2025年10月9日 30 89 36

    多语言语音数据元信息数据集_Multilingual_Speech_Metadata 数据来源:互联网公开数据 标签:语音识别, 多语言, 语音数据, 元数据, 声学分析, 语言学, 数据标注, 机器学习 数据概述: 该数据集包含语音数据的元信息,记录了多种语言的语音样本的相关属性。主要特征如下:...
    packageimg
  • 文本结构化分析多语言数据集

    2025年9月27日 30 123 58

    文本结构化分析多语言数据集_Text_Structural_Analysis_Multilingual_Dataset 数据来源:互联网公开数据 标签:文本分析, 语言学, 结构化数据, 句法分析, 自然语言处理, 多语言, 深度学习, 文本特征 数据概述:...
    packageimg
  • 多语言文本嵌入特征数据集

    2025年9月26日 30 64 22

    多语言文本嵌入特征数据集_Multilingual_Text_Embedding_Features 数据来源:互联网公开数据 标签:文本嵌入, 多语言, 自然语言处理, 语义分析, 向量表示, 机器翻译, 情感分析, 预训练模型 数据概述: 该数据集包含基于distiluse-base-multilingual-...
    packageimg
  • 泰米尔语_英语语音翻译数据集

    2025年9月26日 30 167 29

    泰米尔语_英语语音翻译数据集_Tamil_English_Speech_Translation_Dataset 数据来源:互联网公开数据 标签:语音识别, 语音翻译, 泰米尔语, 英语, 多语言, 语音, 文本, 机器学习 数据概述: 该数据集包含泰米尔语和英语的语音数据及对应的文本转录和翻译,旨在促进泰米尔语与英语之间的语音翻译研究。主要特征如下:...
    packageimg
  • 商品搜索相关性评估数据集

    2025年9月24日 30 62 50

    商品搜索相关性评估数据集_Product_Search_Relevance_Assessment 数据来源:互联网公开数据 标签:商品搜索, 相关性评估, 自然语言处理, 文本匹配, 多语言, 数据标注, 机器学习, 推荐系统 数据概述: 该数据集包含多个CSV文件,记录了用户查询与商品之间的相关性信息,用于评估和训练商品搜索相关性模型。主要特征如下:...
    packageimg
  • 多语言恶意文本检测数据集

    2025年9月14日 30 178 76

    多语言恶意文本检测数据集_Multilingual_Toxic_Text_Detection_Dataset 数据来源:互联网公开数据 标签:文本分类, 恶意文本, 多语言, 自然语言处理, 机器翻译, 情感分析, 毒性检测, 语言模型 数据概述: 该数据集包含来自多个语种的文本数据,旨在用于恶意文本的检测与分析。主要特征如下:...
    packageimg
  • 多语言语音识别文本数据集

    2025年9月13日 30 46 24

    多语言语音识别文本数据集_Multilingual_Speech_Recognition_Text_Dataset 数据来源:互联网公开数据 标签:语音识别, 文本转录, 多语言, 语音数据, 机器学习, 声学模型, 自然语言处理, 数据集 数据概述: 该数据集包含来自多个来源的多语言语音数据,记录了语音片段及其对应的文本转录。主要特征如下:...
    packageimg
  • 口音识别音频数据集

    2025年8月30日 30 103 91

    口音识别音频数据集_Accent_Recognition_Audio_Dataset 数据来源:互联网公开数据 标签:语音识别, 口音识别, 音频数据, 机器学习, 语音分析, 多语言, 声学特征, 数据标注 数据概述: 该数据集包含来自多个来源的音频文件,记录了不同口音的语音样本,用于口音识别研究和模型训练。主要特征如下:...
    packageimg
  • 多语言维基百科文章翻译质量评估数据集

    2025年8月11日 30 15 13

    多语言维基百科文章翻译质量评估数据集_Multilingual_Wikipedia_Article_Translation_Quality_Assessment 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 语言模型, 文本质量评估, 多语言, 维基百科, 数据标注, 自然语言处理 数据概述:...
    packageimg
  • 多语言视觉问答图像数据集

    2025年8月8日 30 40 30

    多语言视觉问答图像数据集_Multilingual_Visual_Question_Answering_Image_Dataset 数据来源:互联网公开数据 标签:视觉问答, 多语言, 图像识别, 图像分类, 自然语言处理, 机器翻译, 数据标注, 计算机视觉 数据概述:...
    packageimg
  • 多语言蕴含关系推理数据集_Multilingual_Natural_Language_Inference_Dataset

    2025年6月24日 60 187 20

    多语言蕴含关系推理数据集_Multilingual_Natural_Language_Inference_Dataset 数据来源:互联网公开数据 标签:自然语言处理, 文本推理, 语义理解, 多语言, 情感分析, 机器学习, 语言模型, 语料库 数据概述:...
    packageimg
  • 多语言实体关系抽取数据集

    2025年8月5日 30 168 32

    多语言实体关系抽取数据集_Multilingual_Entity_Relation_Extraction_Dataset 数据来源:互联网公开数据 标签:关系抽取, 自然语言处理, 文本挖掘, 嵌入向量, 多语言, 知识图谱, 实体识别, 机器学习 数据概述:...
    packageimg
  • 情感分析多语言文本数据集MultilingualTextEmotionAnalysisDataset-rookiejing

    2025年5月10日 60 165 119

    情感分析多语言文本数据集MultilingualTextEmotionAnalysisDataset-rookiejing 数据来源:互联网公开数据 标签:情感分析, 文本分类, 多语言, 情感识别, 自然语言处理, 情绪识别, 机器学习, 语料库 数据概述: 该数据集包含来自多种语言的文本数据,旨在用于情感分析模型的训练和评估。主要特征如下:...
    packageimg
  • 印度多语言文本情感分类数据集

    2025年7月26日 30 191 56

    印度多语言文本情感分类数据集_Multi_Language_Text_Sentiment_Classification_Dataset 数据来源:互联网公开数据 标签:情感分析, 文本分类, 多语言, 印度语言, 机器学习, 自然语言处理, 文本情感, 数据集 数据概述:...
    packageimg
  • 多语言语音词汇识别数据集

    2025年7月24日 30 100 79

    多语言语音词汇识别数据集_Multilingual_Speech_Word_Recognition_Dataset 数据来源:互联网公开数据 标签:语音识别, 多语言, 词汇识别, 语音标注, 自然语言处理, 音频数据, 机器学习, 语音数据集 数据概述: 该数据集包含来自多个来源的语音数据,记录了不同语言的语音词汇及其对应的文本转录。主要特征如下:...
    packageimg
  • 文本嵌入向量数据集

    2025年7月19日 30 54 38

    文本嵌入向量数据集_Text_Embedding_Vectors 数据来源:互联网公开数据 标签:文本嵌入, 语义向量, 多语言, 相似度计算, 深度学习, 向量空间, 文本检索, 自然语言处理 数据概述: 该数据集包含基于多语言文本的嵌入向量,记录了文本经过特定模型转换后的数值化表示。主要特征如下:...
    packageimg
  • 多语言问答预测结果数据集

    2025年7月12日 30 201 10

    多语言问答预测结果数据集_Multilingual_Question_Answering_Prediction_Results 数据来源:互联网公开数据 标签:问答系统, 机器翻译, 自然语言处理, 文本分析, 预测结果, 相似度计算, 多语言, 机器学习 数据概述:...
    packageimg
  • 多语言语音数据集

    2025年7月11日 30 151 30

    多语言语音数据集_Multilingual_Speech_Dataset 数据来源:互联网公开数据 标签:语音识别, 语音合成, 多语言, 文本转语音, 声纹识别, 语音数据, 机器学习, 语言学 数据概述: 该数据集包含多语言语音数据,记录了不同说话者的语音片段及其对应的文本内容。主要特征如下: 时间跨度:数据未明确标注具体时间,可视为静态语音语料。...
    packageimg