找到47个数据集

标签: 多语言处理

过滤结果
  • 卡纳达语评论数据集KannadaReviewDataset-kishorsinnur

    2025年4月22日   

    卡纳达语评论数据集KannadaReviewDataset-kishorsinnur 数据来源:互联网公开数据 标签:自然语言处理,卡纳达语,数据集,文本分析,情感分析,机器学习,多语言处理,语料库 数据概述:该数据集包含来自卡纳达语互联网平台的大量用户评论,记录了用户对各种产品,服务或内容的评价信息。主要特征如下:...
    packageimg
  • 英语到法语机器翻译数据集WMTSampled50000English-FrenchTranslationDataset-hoyso48

    2025年4月22日   

    英语到法语机器翻译数据集WMTSampled50000English-FrenchTranslationDataset-hoyso48 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,英语,法语,数据挖掘,人工智能,多语言处理 数据概述: 该数据集来自WMT(Workshop on Machine...
    packageimg
  • 印度泰米尔-英语文本情感分析数据集2021

    2025年4月15日   

    印度泰米尔-英语文本情感分析数据集2021 数据来源:互联网公开数据 标签:情感分析,泰米尔语,英语,多语言处理,社交媒体评论,文本分类,自然语言处理 数据概述: 本数据集包含从YouTube视频评论中收集的15,744条泰米尔-...
    packageimg
  • PHINC-平行印地英混合语社交媒体语料库用于机器翻译

    2025年4月14日   

    PHINC-平行印地英混合语社交媒体语料库用于机器翻译 数据来源:互联网公开数据 标签:印地英混合语,机器翻译,社交媒体,代码混合,自然语言处理,多语言处理,语料库 数据概述:...
    packageimg
  • 语言检测数据集

    2025年4月14日   

    语言检测数据集 数据来源:互联网公开数据 标签:语言检测,文本分类,社交媒体分析,推特数据,多语言处理 数据概述: 本数据集包含收集自2021年至2022年间推特上特定话题标签的推文数据,涵盖英语、法语和摩洛哥方言达里贾三种语言。数据集共包含约420行每种语言的数据,总计13153行,每行数据包括两个列:推文内容和对应的标签。 数据用途概述:...
    packageimg
  • 印度语言新闻摘要数据集

    2025年4月14日   

    印度语言新闻摘要数据集 数据来源:互联网公开数据 标签:印度语言,新闻摘要,多语言处理,自然语言处理,文本摘要,跨语言信息处理,新闻文章 数据概述:...
    packageimg
  • 达拉兹电商平台多语言产品评论数据集2023

    2025年4月14日   

    达拉兹电商平台多语言产品评论数据集2023 数据来源:互联网公开数据 标签:电商平台,产品评论,多语言处理,情感分析,代码混合,消费者反馈 数据概述:...
    packageimg