-
塞尔维亚小说语料库2021年4月版
2025年12月4日 30 111 51
数据集概述 该数据集是2021年4月发布的塞尔维亚小说语料库(ELTeC-srp),包含90部以一级编码标注的小说文本,属于欧洲文学文本集合(ELTeC)的一部分,由COST Action项目推动构建。 文件详解 README.md(Markdown格式):包含语料库版本信息、发布说明、DOI引用链接及项目背景介绍,帮助用户理解数据集的来源与使用规范。...
-
亚马逊机器学习挑战赛2022-23数据集
2025年6月4日 30 146 13
亚马逊机器学习挑战赛2022-23数据集 数据来源:互联网公开数据 标签:自然语言处理,产品数据分析,长度预测,机器学习竞赛,亚马逊平台,文本特征提取,包装优化 数据概述:...
-
嵌入与TF-IDF文本特征提取数据集EmbeddedandTF-IDFTextFeatureExtractionDataset-malav312
2025年5月12日 30 169 78
嵌入与TF-IDF文本特征提取数据集EmbeddedandTF-IDFTextFeatureExtractionDataset-malav312 数据来源:互联网公开数据 标签:自然语言处理,文本特征提取,机器学习,数据集,TF-IDF,词嵌入,文本分析,信息检索 数据概述:该数据集包含用于文本特征提取的嵌入和TF-...
-
邮件主题垃圾邮件分类数据集EmailSubjectSpamClassification-diazdeentr
2025年5月10日 30 5 4
邮件主题垃圾邮件分类数据集EmailSubjectSpamClassification-diazdeentr 数据来源:互联网公开数据 标签:垃圾邮件, 邮件分类, 文本挖掘, 自然语言处理, 机器学习, 文本特征提取, 邮件内容分析, 二分类 数据概述:...
-
词汇语义关联分析数据集LexicalSemanticAssociationAnalysis-murtadhayaseen
2025年4月29日 30 115 91
词汇语义关联分析数据集LexicalSemanticAssociationAnalysis-murtadhayaseen 数据来源:互联网公开数据 标签:词汇关联, 语义分析, 文本挖掘, 自然语言处理, 语料库, 词向量, 文本特征提取, 数据清洗 数据概述: 该数据集包含从多个来源收集的词汇数据,记录了词汇之间的语义关联信息。主要特征如下:...
-
文本特征提取TF-IDF提交数据集TF-IDFSubmissionDataset-panser
2025年4月24日 30 1 0
文本特征提取TF-IDF提交数据集TF-IDFSubmissionDataset-panser 数据来源:互联网公开数据 标签:文本分析,TF-IDF,数据集,自然语言处理,机器学习,信息检索,文本挖掘,文本特征 数据概述: 该数据集包含来自公开提交的文本特征提取数据,记录了通过TF-IDF方法提取的文本特征。主要特征如下:...
-
电子邮件分类检测垃圾邮件与非垃圾邮件数据集-brahimettanany
2025年4月21日 30 155 34
电子邮件分类检测垃圾邮件与非垃圾邮件数据集-brahimettanany 数据来源:互联网公开数据 标签:电子邮件分类,垃圾邮件,非垃圾邮件,文本分析,机器学习,数据标注,文本特征提取 数据概述:...
-
产品情感分析数据集2022
2025年4月14日 30 210 177
产品情感分析数据集2022 数据来源:互联网公开数据 标签:产品情感分析,自然语言处理,机器学习,预训练模型,情感分类,文本特征提取 数据概述:...



