-
商品标题文本预处理数据集ProductTitleTextPreprocessing-akshatgargbot
2025年5月30日 30 48 5
商品标题文本预处理数据集ProductTitleTextPreprocessing-akshatgargbot 数据来源:互联网公开数据 标签:商品标题, 文本预处理, 词干提取, 词形还原, 自然语言处理, 文本挖掘, 数据清洗, 机器学习 数据概述:... -
孟加拉电子产品评论文本情感分析数据集BanglaElectronicsReviewTextSentimentAnalysis-nirajmahi
2025年5月6日 30 7 1
孟加拉电子产品评论文本情感分析数据集BanglaElectronicsReviewTextSentimentAnalysis-nirajmahi 数据来源:互联网公开数据 标签:情感分析, 文本挖掘, 孟加拉语, 电子产品, 评论数据, 自然语言处理, 情感分类, 词形还原 数据概述:... -
孟加拉语词形还原数据集BengaliLemmaDataset-jakir57
2025年4月29日 30 101 16
孟加拉语词形还原数据集BengaliLemmaDataset-jakir57 数据来源:互联网公开数据 标签:词形还原, 自然语言处理, 孟加拉语, 语言学, 文本分析, 词干提取, 词汇分析, 语料库 数据概述: 该数据集包含孟加拉语词汇的词形还原数据,记录了孟加拉语单词的词形与其对应的词元(lemma)之间的映射关系。主要特征如下:... -
孟加拉语词汇词形还原数据集BengaliWordLemmatizationDataset-jakir57
2025年4月29日 30 66 41
孟加拉语词汇词形还原数据集BengaliWordLemmatizationDataset-jakir57 数据来源:互联网公开数据 标签:词形还原, 自然语言处理, 孟加拉语, 文本分析, 语言学, 词汇, 语料库, 机器翻译 数据概述: 该数据集包含孟加拉语词汇的词形还原数据,用于训练和评估孟加拉语词形还原模型。主要特征如下:... -
孟加拉语文本词形还原数据集BanglaTextLemmatizationDataset-jakir57
2025年4月29日 30 28 7
孟加拉语文本词形还原数据集BanglaTextLemmatizationDataset-jakir57 数据来源:互联网公开数据 标签:词形还原, 孟加拉语, 自然语言处理, 文本分析, 语言学, 文本预处理, 机器翻译, 词干提取 数据概述: 该数据集包含孟加拉语文本的词形还原数据,旨在为孟加拉语文本处理任务提供支持。主要特征如下:... -
形态学分析数据集-faizankhan6356
2025年4月26日 30 208 186
形态学分析数据集-faizankhan6356 数据来源:互联网公开数据 标签:形态学,语言学,自然语言处理,数据集,词性标注,词干提取,词形还原,文本分析 数据概述: 该数据集包含了用于形态学分析的文本数据,记录了不同语言的词汇及其形态变化信息。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于具体数据集,可能涵盖多个历史时期和现代语言。... -
孟加拉语书籍词形还原数据集BanglaBookLemmatizedCSV-nirajmahi
2025年4月26日 30 21 0
孟加拉语书籍词形还原数据集BanglaBookLemmatizedCSV-nirajmahi 数据来源:互联网公开数据 标签:孟加拉语,词形还原,数据集,自然语言处理,文本分析,机器学习,语言学,学术资源 数据概述:该数据集包含来自孟加拉语书籍的词形还原数据,记录了孟加拉语文本中单词的词形还原结果。主要特征如下:... -
预处理与词形还原测试数据数据集-marouanesidali
2025年4月24日 30 179 142
预处理与词形还原测试数据数据集-marouanesidali 数据来源:互联网公开数据 标签:文本预处理,词形还原,自然语言处理,数据集,文本分析,机器学习,NLP,测试数据 数据概述: 该数据集包含了经过预处理和词形还原处理的文本数据,主要用于测试和评估文本处理算法的性能。主要特征如下:... -
文本预处理与词形还原训练数据集-marouanesidali
2025年4月23日 30 131 106
文本预处理与词形还原训练数据集-marouanesidali 数据来源:互联网公开数据 标签:文本预处理,词形还原,自然语言处理,机器学习,文本分析,数据集,NLP,训练数据 数据概述: 该数据集包含了经过预处理和词形还原的文本数据,主要用于训练和评估自然语言处理模型。主要特征如下: 时间跨度:数据记录的时间范围不限,取决于原始文本数据集的构成。... -
多主题分类新闻文章数据集1963-2021
2025年4月18日 30 88 29
多主题分类新闻文章数据集1963-2021 数据来源:互联网公开数据 标签:主题分类,新闻,文章,评论,情感分析,健康,金融,体育,科学,政治,NLP处理,文本清理,POS标注,词形还原 数据概述:... -
乌尔都语与旁遮普语合并数据集
2025年4月15日 30 40 26
乌尔都语与旁遮普语合并数据集 数据来源:互联网公开数据 标签:乌尔都语,旁遮普语,双语数据集,词性标注,词形还原,语言处理 数据概述:... -
高评分电影词干与词形还原分析数据集
2025年4月14日 30 159 13
高评分电影词干与词形还原分析数据集 数据来源:互联网公开数据 标签:电影,高评分,词干提取,词形还原,自然语言处理,文本分析,影视研究 数据概述: 本数据集收录了若干高评分电影的基本信息及其概述内容的词干和词形还原处理结果。数据集包含以下字段: - 电影标题:电影的名称 - 电影概述:对电影剧情的简要描述 - 类型列表:电影所属的类型或标签 -... -
孟加拉语词形还原数据集
2025年4月14日 30 194 1
孟加拉语词形还原数据集 数据来源:互联网公开数据 标签:孟加拉语,词形还原,自然语言处理,文本分析,语言学,数据集 数据概述: “孟加拉语词形还原数据集”收录了来自不同文本来源的词形还原词,特别 focus 在泰戈尔短篇小说和涵盖多个领域的新闻文章。该数据集为孟加拉语自然语言处理任务提供了宝贵的资源。 数据用途概述:...