-
文本语言识别数据集TextLanguageDetectionDataset-tranlamtop
文本语言识别数据集TextLanguageDetectionDataset-tranlamtop 数据来源:互联网公开数据 标签:文本分析, 语言识别, 自然语言处理, 多语言, 文本分类, 机器学习, 语料库, 语言模型 数据概述: 该数据集包含来自不同来源的文本数据,记录了文本内容及其对应的语言标签,用于训练和评估语言识别模型。主要特征如下:... -
推特用户推文语言与情感分类数据集TwitterUserTweetLanguageandSentimentClassification-louialouza
推特用户推文语言与情感分类数据集TwitterUserTweetLanguageandSentimentClassification-louialouza 数据来源:互联网公开数据 标签:推特数据, 情感分析, 文本分类, 社交媒体, 用户行为, 自然语言处理, 语言识别, 数据标注 数据概述:... -
K-POP艺人社交媒体文本数据分析数据集K-POPArtistsSocialMediaTextDataAnalysis-aditisatsangi
K-POP艺人社交媒体文本数据分析数据集K-POPArtistsSocialMediaTextDataAnalysis-aditisatsangi 数据来源:互联网公开数据 标签:K-POP, 社交媒体, 文本分析, 语言识别, 情感分析, 粉丝互动, 艺人评价, 舆情分析 数据概述: 该数据集包含来自社交媒体平台的K-... -
阿拉伯语文本地域信息标注数据集ArabicTextGeolocationDataset-kamstats
阿拉伯语文本地域信息标注数据集ArabicTextGeolocationDataset-kamstats 数据来源:互联网公开数据 标签:文本分析, 地理位置, 阿拉伯语, 语言识别, 自然语言处理, 数据标注, 文本分类, 跨文化研究 数据概述: 该数据集包含来自互联网的阿拉伯语文本,并标注了相应的地理位置信息。主要特征如下:... -
社交媒体推文内容分析数据集SocialMediaTweetContentAnalysis-aakankshachouhan
社交媒体推文内容分析数据集SocialMediaTweetContentAnalysis-aakankshachouhan 数据来源:互联网公开数据 标签:社交媒体, 推文分析, 文本挖掘, 情感分析, 话题识别, 语言识别, 数据清洗, 舆情分析 数据概述:... -
文本语言识别数据集TextLanguageIdentificationDataset-abdullahkhan098
文本语言识别数据集TextLanguageIdentificationDataset-abdullahkhan098 数据来源:互联网公开数据 标签:文本分析, 语言识别, 自然语言处理, 多语言, 文本分类, 数据标注, 机器翻译, 语料库 数据概述:... -
多语言文档标识符数据集MultilingualDocumentIdentifierDataset-fredriknguyenepfl0
多语言文档标识符数据集MultilingualDocumentIdentifierDataset-fredriknguyenepfl0 数据来源:互联网公开数据 标签:文档标识, 多语言, 文本数据, 语料库, 语言识别, 数据清洗, 信息检索, 机器翻译 数据概述: 该数据集包含来自不同语言的文档标识符,记录了多种语言文档的唯一编号。主要特征如下:... -
文本语言识别数据集TextLanguageIdentificationDataset-kanhakhantaal
文本语言识别数据集TextLanguageIdentificationDataset-kanhakhantaal 数据来源:互联网公开数据 标签:语言识别, 文本分析, 自然语言处理, 文本分类, 多语言, 机器学习, 语料库, 文本预处理 数据概述: 该数据集包含来自互联网的文本数据,记录了不同文本内容及其对应的语言标签。主要特征如下:... -
多语言文本蕴含关系推理数据集MultilingualTextualEntailmentReasoningDataset-mariasolano
多语言文本蕴含关系推理数据集MultilingualTextualEntailmentReasoningDataset-mariasolano 数据来源:互联网公开数据 标签:文本蕴含, 自然语言推理, 多语言, 语言识别, 文本匹配, 机器阅读理解, 语义分析, 情感分析 数据概述:... -
新冠疫情社交媒体推文分析数据集COVID-19SocialMediaTweetsAnalysis-skyzz13
新冠疫情社交媒体推文分析数据集COVID-19SocialMediaTweetsAnalysis-skyzz13 数据来源:互联网公开数据 标签:新冠疫情, 社交媒体, 推文分析, 文本挖掘, 情绪分析, 自然语言处理, 疫情传播, 语言识别 数据概述: 该数据集包含来自Twitter的推文数据,记录了关于新冠疫情相关的社交媒体言论。主要特征如下:... -
维基多语言文本分类数据集-2018
维基多语言文本分类数据集-2018 数据来源:互联网公开数据 标签:文本分类,多语言,自然语言处理,机器学习,语言识别,维基百科,NLP,数据集 数据概述:... -
合并的Dataverse语言识别数据集MergedDataverseBhashaLanguageRecognitionDataset-samansarkerjoy
合并的Dataverse语言识别数据集MergedDataverseBhashaLanguageRecognitionDataset-samansarkerjoy 数据来源:互联网公开数据 标签:语言识别,数据集,自然语言处理,机器学习,语音识别,多语言,人工智能,数据分析 数据概述:... -
社交媒体文本中的冒犯性语言识别数据集OffensiveSpanishIdentificationinSocialMediaTexts-shashankpandey2411
社交媒体文本中的冒犯性语言识别数据集OffensiveSpanishIdentificationinSocialMediaTexts-shashankpandey2411 数据来源:互联网公开数据 标签:社交媒体,语言识别,数据集,文本分析,机器学习,自然语言处理,情感分析,西班牙语 数据概述:... -
语言识别数据集LanguageDetectorDataset-meet07824
语言识别数据集LanguageDetectorDataset-meet07824 数据来源:互联网公开数据 标签:语言识别,数据集,自然语言处理,机器学习,文本分类,多语言,人工智能,数据分析 数据概述: 该数据集包含来自公开来源的语言识别数据,记录了不同语言的文本样本及其对应的语言标签。主要特征如下:... -
语言识别数据集HalfdatasetLanguageIdentificationDataset-amitverma2030
语言识别数据集HalfdatasetLanguageIdentificationDataset-amitverma2030 数据来源:互联网公开数据 标签:语言识别,数据集,自然语言处理,机器学习,文本分类,多语言,数据挖掘,人工智能 数据概述: 该数据集包含来自多个语言样本的文本数据,记录了不同语言的文本片段及其对应的语言标签。主要特征如下:... -
数据10000条样本语言识别数据集-amitverma2030
10000条样本语言识别数据集-amitverma2030 数据来源:互联网公开数据 标签:语言识别,数据集,自然语言处理,文本分类,机器学习,文本分析,语言学,人工智能 数据概述: 该数据集包含10000条文本样本,用于语言识别任务。主要特征如下: 时间跨度:数据无明确的时间范围,为静态数据集。 地理范围:数据涵盖多种语言,文本来源多样。... -
北欧语言识别数据集
北欧语言识别数据集 数据来源:互联网公开数据 标签:语言识别,北欧语言,自然语言处理,机器学习,数据分类,丹麦语,瑞典语,挪威语,法罗语,冰岛语 数据概述:... -
奥罗莫语句子标注数据集
奥罗莫语句子标注数据集 数据来源:互联网公开数据 标签:奥罗莫语,句子标注,自然语言处理,文本分析,语言识别 数据概述: 本数据集包含78,000条经过清理的奥罗莫语句子,所有句子均无特殊字符和标点符号。数据集由两列组成,其中一列包含句子文本,另一列包含对应的语言标签。该数据集为研究和处理奥罗莫语提供了丰富的语言素材。 数据用途概述:... -
多语言文本检测与识别自然语言处理数据集
多语言文本检测与识别自然语言处理数据集 数据来源:互联网公开数据 标签:自然语言处理,多语言检测,语言识别,机器学习,文本分析,文化多样性,全球连接 数据概述:...