-
肯尼亚社交媒体仇恨言论检测数据集-2017年肯尼亚大选期间
肯尼亚社交媒体仇恨言论检测数据集-2017年肯尼亚大选期间 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,肯尼亚,选举,多语言,代码切换,文本分类,自然语言处理,情感分析 数据概述:... -
多语言命名实体识别数据集英语
多语言命名实体识别数据集英语 数据来源:互联网公开数据 标签:多语言,命名实体识别,PER,LOC,ORG,MISC,自然语言处理 数据概述: 本数据集为多语言命名实体识别任务提供了一个经过处理的数据集版本,主要来源于GitHub项目(https://github.com/afshinrahimi/mmner),并在Amazon Cloud... -
印度尼泊尔酒店评论数据集多语言版
印度尼泊尔酒店评论数据集多语言版 数据来源:互联网公开数据 标签:酒店评论,印度,尼泊尔,多语言,客户反馈,旅游分析 数据概述: 本数据集包含了印度和尼泊尔酒店的客户评论,评论内容分别以泰米尔语、尼泊尔语和英语呈现。数据集涵盖了大量不同语言的评论,为研究多语言客户反馈提供了丰富素材。 数据用途概述:... -
多语言有毒言论检测数据集2023
多语言有毒言论检测数据集2023 数据来源:互联网公开数据 标签:有毒言论,社交媒体,自然语言处理,多语言,文本分类,情感分析,言论监测 数据概述: 本数据集收录了用法语、英语和阿拉伯语标注的推文,每条推文被标记为有毒或非有毒。数据集中,标签0表示非有毒推文,标签1表示有毒推文。该数据集为研究多语言环境下的有毒言论提供了丰富的资源。 数据用途概述:... -
-
Gaana平台歌曲信息数据集-多语言歌曲-4-5万首
Gaana平台歌曲信息数据集-多语言歌曲-4-5万首 数据来源:互联网公开数据 标签:音乐,歌曲,Gaana,音频,流媒体,印度,多语言,歌曲信息,元数据 数据概述: 本数据集收录了Gaana.com平台上约4.5万首来自不同语言的歌曲信息。数据涵盖了歌曲的多种关键属性,例如歌曲标题、艺术家、专辑、语言、流派等,为音乐研究和应用提供了丰富的数据资源。... -
多语言复杂问答数据集-涵盖8种语言
多语言复杂问答数据集-涵盖8种语言 数据来源:互联网公开数据 标签:多语言,问答,自然语言处理,NLP,机器翻译,语言模型,数据集,复杂问题,文本分析 数据概述: 本数据集由Hugging Face... -
IMDb高分动作电影票房及影评数据集-多语言电影
IMDb高分动作电影票房及影评数据集-多语言电影 数据来源:互联网公开数据 标签:动作电影,IMDb,电影票房,影评,多语言,英语,泰米尔语,中文,法语,电影数据 数据概述:...