-
多语言歌词音乐流派分类数据集-mateibejan
2025年6月1日 30 176 154
多语言歌词音乐流派分类数据集-mateibejan 数据来源:互联网公开数据 标签:多语言,歌词,音乐流派,文本挖掘,信息检索,语言检测,音乐分类 数据概述:... -
多语言文本识别数据集MultilingualTextRecognitionDataset-amitverma2030
2025年5月26日 30 121 57
多语言文本识别数据集MultilingualTextRecognitionDataset-amitverma2030 数据来源:互联网公开数据 标签:文本识别, 多语言, 语言检测, 文本分类, 自然语言处理, 机器学习, 语料库, 文本分析 数据概述: 该数据集包含来自多种语言的文本数据,旨在用于多语言文本识别和语言检测任务。主要特征如下:... -
谷歌AI4Code竞赛Markdown语言检测训练数据集-astrung
2025年5月10日 30 146 136
谷歌AI4Code竞赛Markdown语言检测训练数据集-astrung 数据来源:互联网公开数据 标签:AI4Code,Markdown,语言检测,竞赛数据,机器学习,自然语言处理 数据概述:... -
大规模语言检测数据集
2025年5月5日 30 65 51
大规模语言检测数据集 数据来源:互联网公开数据 标签:语言检测,ISO 639-3,自然语言处理,多语言支持,文本分析,语言识别,机器学习 数据概述: 本数据集包含一个约10^7行的.csv文件,每行记录包含一个句子及其对应的ISO 639-3语言代码。此外,数据集还包括一个.json文件,用于映射ISO... -
恶意语言检测数据集-hiungtrung
2025年4月26日 30 97 93
恶意语言检测数据集-hiungtrung 数据来源:互联网公开数据 标签:自然语言处理,文本分析,情感分析,机器学习,恶意内容,语言检测,数据集,NLP 数据概述: 该数据集包含用于恶意语言检测的文本数据,旨在帮助开发和评估识别网络恶意内容(如辱骂,仇恨言论,威胁等)的模型。主要特征如下: 时间跨度:... -
自然语言处理语言检测数据集LanguageDetectionNLPDataset-tharun369
2025年4月24日 30 24 0
自然语言处理语言检测数据集LanguageDetectionNLPDataset-tharun369 数据来源:互联网公开数据 标签:自然语言处理,语言检测,数据集,文本分析,机器学习,文本分类,语言学,计算机科学 数据概述:该数据集包含来自多个来源的文本数据,用于自然语言处理中的语言检测任务。主要特征如下:... -
语言检测数据集LanguageDetectionDataset-trinhtung
2025年4月24日 30 166 25
语言检测数据集LanguageDetectionDataset-trinhtung 数据来源:互联网公开数据 标签:语言检测,自然语言处理,数据集,文本分析,机器学习,人工智能,数据科学,语言学 数据概述: 该数据集包含来自多个来源的文本数据,用于语言检测任务。主要特征如下: 时间跨度: 数据记录的时间范围从2010年到2022年。 地理范围:... -
语言检测数据集2010-2020年文本语言识别数据集-mogazeyalmogazey
2025年4月24日 30 117 24
语言检测数据集2010-2020年文本语言识别数据集-mogazeyalmogazey 数据来源:互联网公开数据 标签:语言检测,文本分析,数据集,自然语言处理,机器学习,多语言识别,文本分类,人工智能 数据概述: 该数据集包含来自不同来源的文本数据,记录了多种语言的文本样本,适用于语言检测和识别任务。主要特征如下:... -
多语言短信垃圾信息与情感分析检测数据集-2023-debapampal2002
2025年4月22日 30 63 37
多语言短信垃圾信息与情感分析检测数据集-2023-debapampal2002 数据来源:互联网公开数据 标签:垃圾短信,多语言,情感分析,文本分析,机器学习,语言检测,数据集 数据概述:... -
人工智能语言检测软件训练数据集
2025年4月15日 30 71 34
人工智能语言检测软件训练数据集 数据来源:互联网公开数据 标签:人工智能,语言检测,NLP,自然语言处理,开源软件,Naive Bayes算法,数据处理,机器学习 数据概述: 本数据集是用于训练人工智能语言检测软件的数据集合,由资深人工智能工程师Emirhan BULUT开发并公开分享。数据集涵盖了多种语言文本样本,用于训练和优化Naive... -
卢旺达语数据集
2025年4月14日 30 174 117
卢旺达语数据集 数据来源:互联网公开数据 标签:卢旺达语,法语,英语,斯瓦希里语,语言检测,机器学习,自然语言处理 数据概述: 本数据集旨在用于训练和测试能够识别四种语言文本的语言检测人工智能模型,包括卢旺达语、法语、英语和斯瓦希里语。数据集包含每种语言的多样化文本样本,适用于训练机器学习模型。每个文本样本都标注了相应的语言,以支持监督学习。... -
语言检测数据集
2025年4月14日 30 123 36
语言检测数据集 数据来源:互联网公开数据 标签:语言检测,文本分类,社交媒体分析,推特数据,多语言处理 数据概述: 本数据集包含收集自2021年至2022年间推特上特定话题标签的推文数据,涵盖英语、法语和摩洛哥方言达里贾三种语言。数据集共包含约420行每种语言的数据,总计13153行,每行数据包括两个列:推文内容和对应的标签。 数据用途概述:...