数据集 - 海数据

罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-huzzefakhan

2025年4月22日

罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-huzzefakhan 数据来源：互联网公开数据标签：自然语言处理，情感分析，数据集，文本分类，机器学习，乌尔都语，多语言处理，情感计算数据概述：该数据集包含来自罗马乌尔都语语料库的文本数据，记录了不同来源的文本内容及其情感标签。主要特征如下：...

ZIP

卡纳达语评论数据集KannadaReviewDataset-kishorsinnur

2025年4月22日

卡纳达语评论数据集KannadaReviewDataset-kishorsinnur 数据来源：互联网公开数据标签：自然语言处理，卡纳达语，数据集，文本分析，情感分析，机器学习，多语言处理，语料库数据概述：该数据集包含来自卡纳达语互联网平台的大量用户评论，记录了用户对各种产品，服务或内容的评价信息。主要特征如下：...

ZIP

英语到法语机器翻译数据集WMTSampled50000English-FrenchTranslationDataset-hoyso48

2025年4月22日

英语到法语机器翻译数据集WMTSampled50000English-FrenchTranslationDataset-hoyso48 数据来源：互联网公开数据标签：机器翻译，自然语言处理，数据集，英语，法语，数据挖掘，人工智能，多语言处理数据概述：该数据集来自WMT（Workshop on Machine...

ZIP

PHINC-平行印地英混合语社交媒体语料库用于机器翻译

2025年4月14日

PHINC-平行印地英混合语社交媒体语料库用于机器翻译数据来源：互联网公开数据标签：印地英混合语,机器翻译,社交媒体,代码混合,自然语言处理,多语言处理,语料库数据概述：...

ZIP

语言检测数据集

2025年4月14日

语言检测数据集数据来源：互联网公开数据标签：语言检测,文本分类,社交媒体分析,推特数据,多语言处理数据概述：本数据集包含收集自2021年至2022年间推特上特定话题标签的推文数据，涵盖英语、法语和摩洛哥方言达里贾三种语言。数据集共包含约420行每种语言的数据，总计13153行，每行数据包括两个列：推文内容和对应的标签。数据用途概述：...