-
新闻文章文本数据分析数据集NewsArticlesTextDataAnalysis-phidole
2025年5月30日 30 19 2
新闻文章文本数据分析数据集NewsArticlesTextDataAnalysis-phidole 数据来源:互联网公开数据 标签:新闻文章, 文本分析, 自然语言处理, 停用词, 词干提取, 文本分类, 情感分析, 数据挖掘 数据概述: 该数据集包含来自新闻文章的数据,记录了新闻标题和文章正文内容。主要特征如下:... -
印尼语仇恨言论词汇与停用词数据集IndonesianHateSpeechLexiconandStopwordsDataset-tarishamazaya
2025年5月1日 30 10 6
印尼语仇恨言论词汇与停用词数据集IndonesianHateSpeechLexiconandStopwordsDataset-tarishamazaya 数据来源:互联网公开数据 标签:仇恨言论, 文本分析, 情感分析, 词汇表, 停用词, 自然语言处理, 语料库, 印尼语 数据概述:... -
自然语言处理停用词与词汇列表数据集NaturalLanguageProcessingStopwordsandWordlists-nathanh4903
2025年5月1日 30 135 76
自然语言处理停用词与词汇列表数据集NaturalLanguageProcessingStopwordsandWordlists-nathanh4903 数据来源:互联网公开数据 标签:停用词, 词汇列表, 自然语言处理, 文本分析, 语料库, 文本预处理, 词汇统计, 语言模型 数据概述:... -
印尼语文本辱骂词与停用词数据集IndonesianTextAbusiveWordsandStopwordsDataset-tarishamazaya
2025年4月29日 30 148 47
印尼语文本辱骂词与停用词数据集IndonesianTextAbusiveWordsandStopwordsDataset-tarishamazaya 数据来源:互联网公开数据 标签:文本分析, 情感分析, 自然语言处理, 停用词, 辱骂词, 印尼语, 文本预处理, 词汇表 数据概述:... -
印尼语文本数据预处理数据集IndonesianTextPreprocessingDataset-fransiskusbenyamin
2025年4月29日 30 103 35
印尼语文本数据预处理数据集IndonesianTextPreprocessingDataset-fransiskusbenyamin 数据来源:互联网公开数据 标签:印尼语, 文本预处理, 停用词, 词库, 脏话, 文本分析, 自然语言处理, 数据清洗 数据概述:... -
预处理数据集含停用词-文本处理与分析数据集PreprocessedDatawithStopwords-TextProcessingandAnalysisD...
2025年4月24日 30 133 115
预处理数据集含停用词-文本处理与分析数据集PreprocessedDatawithStopwords-TextProcessingandAnalysisDataset-solomonschwiger 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,停用词,机器学习,数据预处理,文本分析,信息检索 数据概述:... -
越南语停用词数据集VLSPStopwordsVietnameseDataset-phttrnnguyngia
2025年4月22日 30 53 29
越南语停用词数据集VLSPStopwordsVietnameseDataset-phttrnnguyngia 数据来源:互联网公开数据 标签:自然语言处理,文本分析,停用词,越南语,数据集,语言学,文本挖掘,信息检索 数据概述: 该数据集包含了越南语的停用词列表,旨在帮助文本处理和自然语言处理任务。主要特征如下:... -
维基百科电影剧情描述去名数据集-abbrivia
2025年4月22日 30 207 51
维基百科电影剧情描述去名数据集-abbrivia 数据来源:互联网公开数据 标签:电影,剧情,自然语言处理,主题建模,停用词,名字识别,维基百科 数据概述: 本数据集包含从维基百科抓取的35,000部电影的剧情描述,并移除了其中的所有名字。数据集通过内置的命名实体识别(NER)技术生成,并经过hunspell... -
孟加拉语自然语言处理基础词汇数据集-saifsunny
2025年4月21日 30 84 66
孟加拉语自然语言处理基础词汇数据集-saifsunny 数据来源:互联网公开数据 标签:孟加拉语,NLP,自然语言处理,词汇,语法,停用词,代词,动词,词干提取,文本处理 数据概述:... -
文章数据集文本预处理-大小写转换过滤分词去停用词词干提取-muhammadalwi
2025年4月21日 30 119 66
文章数据集文本预处理-大小写转换过滤分词去停用词词干提取-muhammadalwi 数据来源:互联网公开数据 标签:文本预处理,自然语言处理,NLP,大小写转换,过滤,分词,停用词,词干提取,文章数据集 数据概述:... -
南非语情感词典与停用词数据集
2025年4月15日 30 100 75
南非语情感词典与停用词数据集 数据来源:互联网公开数据 标签:南非语,情感分析,情感词典,停用词,圣经,平行语料库,文本分析 数据概述:... -
土耳其新闻文章数据集2017-2021
2025年4月15日 30 35 3
土耳其新闻文章数据集2017-2021 数据来源:互联网公开数据 标签:土耳其新闻,文章数据,自然语言处理,停用词,作者分析,时间序列,新闻研究 数据概述:... -
西班牙语评论文本向量化分析数据集
2025年4月14日 30 175 57
西班牙语评论文本向量化分析数据集 数据来源:互联网公开数据 标签:西班牙语,文本分析,自然语言处理,情感分析,机器学习,词袋模型,TF-IDF,停用词,分类 数据概述: 本数据集包含722条西班牙语评论文本,用于二元分类问题。数据集经过文本向量化处理,基于词袋模型(BoW)和TF-...