-
伦巴第语命名实体识别与语言训练数据集
伦巴第语命名实体识别与语言训练数据集 数据来源:互联网公开数据 标签:伦巴第语,命名实体识别,NER,语言模型,文本处理,自然语言处理,维基百科,WikiANN,语言训练,文本标注 数据概述: 本数据集是基于WikiANN项目构建的伦巴第语(Lombard)文本数据集,用于命名实体识别(NER)和语言模型训练。... -
土耳其地震推文数据集
土耳其地震推文数据集 数据来源:互联网公开数据 标签:地震,推文,紧急呼吁,救援,文本标注,BERT模型,自然语言处理,社会应急响应 数据概述: 本数据集包含2020年伊兹密尔地震发生后,与地震相关的土耳其推文数据,主要分为三个部分: 1.... -
罗马-乌尔都语情感分析标注数据集
罗马-乌尔都语情感分析标注数据集 数据来源:互联网公开数据 标签:罗马乌尔都语,情感分析,文本标注,自然语言处理,机器学习 数据概述: 本数据集是Kaggle上已有的“Roman Urdu Sentiment Analysis”数据集的清理版本,由S.... -
命名实体识别数据集
命名实体识别数据集 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,预训练语言模型,文本标注,机器学习,数据科学,Kaggle数据集 数据概述: 本数据集主要用于运行基于预训练语言模型的命名实体识别(NER)任务的笔记本。数据集包含三个关键字段:1. 文本内容(Text),2. 实体标注(Labels),3.... -
基于16个表情符号的推特情感分析数据集
基于16个表情符号的推特情感分析数据集 数据来源:互联网公开数据 标签:推特,情感分析,表情符号,文本标注,情绪识别,社交媒体分析 数据概述:... -
-
-
数据2019印度板球联赛IPL比赛评论数据集
数据2019印度板球联赛IPL比赛评论数据集 数据来源:互联网公开数据 标签:板球比赛,印度板球联赛,IPL,实时评论,比赛分析,NLP,文本标注,体育数据 数据概述 本数据集包含2019年印度板球联赛(IPL)所有比赛的球级(ball-level)实时评论数据,以及比赛概要信息。数据来源于ESPN... -
IBM辩论者和规则标记演讲中被强调的词语数据集
IBM辩论者和规则标记演讲中被强调的词语数据集 数据来源:互联网公开数据 标签:IBM,辩论,演讲,文本标注,强调词语,自然语言处理,语音分析 数据概述:...