-
中文文本分词训练数据集
2025年10月24日 30 7 2
中文文本分词训练数据集_Chinese_Text_Tokenization_Training_Dataset 数据来源:互联网公开数据 标签:中文分词, 文本处理, 自然语言处理, 机器学习, 词汇表构建, BPE分词, 语料库, 深度学习 数据概述: 该数据集包含用于中文文本分词任务的训练数据和相关配置信息。主要特征如下:...
-
学生姓名识别标注预测数据集
2025年10月23日 30 183 70
学生姓名识别标注预测数据集_Student_Name_Recognition_and_Prediction_Dataset 数据来源:互联网公开数据 标签:命名实体识别, 文本标注, 自然语言处理, 机器学习, 学生信息, 预测分析, 深度学习, 数据集 数据概述: 该数据集包含用于学生姓名识别与预测的标注数据和模型相关文件。主要特征如下:...
-
图像识别训练集构建交叉验证数据集
2025年10月19日 30 102 86
图像识别训练集构建交叉验证数据集_Image_Recognition_Training_Cross_Validation_Dataset 数据来源:互联网公开数据 标签:图像识别, 深度学习, 计算机视觉, 数据增强, 交叉验证, 数据集构建, 图像分类, 模型训练 数据概述:...
-
机器翻译模型训练数据集
2025年10月17日 30 187 114
机器翻译模型训练数据集_Machine_Translation_Model_Training_Dataset 数据来源:互联网公开数据 标签:机器翻译, 自然语言处理, 文本数据, 深度学习, 神经机器翻译, 文本编码, 数据预处理, 模型训练 数据概述: 该数据集包含用于训练和评估机器翻译模型的数据,主要用于构建和优化翻译系统。主要特征如下:...
-
无监督学习网络文本内容数据集
2025年10月14日 30 49 6
无监督学习网络文本内容数据集_Unsupervised_Learning_Web_Content_Dataset 数据来源:互联网公开数据 标签:文本挖掘, 无监督学习, 自然语言处理, 网页内容, 文本预处理, 语料库, 数据清洗, 机器学习 数据概述: 该数据集包含来自网络抓取的文本内容,记录了用于无监督学习模型的网页文本信息。主要特征如下:...
-
通用特征数值预测训练数据集
2025年10月14日 30 189 42
通用特征数值预测训练数据集_General_Feature_Numerical_Prediction_Training_Data 数据来源:互联网公开数据 标签:特征工程, 数值预测, 机器学习, 数据集, 训练数据, 回归分析, 数据建模, 多元分析 数据概述:...
-
医学文本信息抽取验证数据集
2025年10月10日 30 62 38
医学文本信息抽取验证数据集_Medical_Text_Information_Extraction_Validation_Dataset 数据来源:互联网公开数据 标签:医学文本, 信息抽取, 命名实体识别, 关系抽取, 文本标注, 机器学习, 自然语言处理, 医疗健康 数据概述:...
-
文本纠错与生成训练数据集
2025年10月9日 30 205 79
文本纠错与生成训练数据集_Text_Correction_and_Generation_Training_Dataset 数据来源:互联网公开数据 标签:文本纠错, 文本生成, 自然语言处理, 机器学习, 序列到序列, 数据集, 语法纠错, 深度学习 数据概述:...
-
电影推荐系统数据集-2023年-rishabjain237
2025年4月22日 60 172 93
电影推荐系统数据集-2023年-rishabjain237 数据来源:互联网公开数据 标签:电影,推荐系统,数据清洗,评分,用户行为,电影特征 数据概述: 本数据集包含用于电影推荐系统的电影评分和用户行为数据,包含超过100,000条记录。数据集涵盖了用户的评分信息、电影的元数据以及用户的基本信息。数据集的字段包括但不限于:...
-
商品描述文本清洗数据集
2025年9月30日 30 196 92
商品描述文本清洗数据集_Product_Description_Text_Cleaning_Dataset 数据来源:互联网公开数据 标签:文本清洗, 商品描述, 自然语言处理, 文本预处理, 数据集, 机器学习, 文本分析, 数据标注 数据概述: 该数据集包含来自电商平台或其他来源的商品描述文本,记录了经过清洗后的商品标题和要点信息。主要特征如下:...
-
信用风险预测学生建模数据集
2025年9月30日 30 57 49
信用风险预测学生建模数据集_Credit_Risk_Prediction_Student_Modeling_Dataset 数据来源:互联网公开数据 标签:信用风险, 机器学习, 风险评估, 违约预测, 数据建模, 金融风控, 银行, 预测模型 数据概述: 该数据集包含用于信用风险预测建模的数据,记录了与个人信用相关的各种特征。主要特征如下:...
-
越南语文本纠错数据集
2025年7月14日 60 117 105
越南语文本纠错数据集_Vietnamese_Text_Error_Correction_Dataset 数据来源:互联网公开数据 标签:文本纠错, 自然语言处理, 越南语, 错误检测, 语言模型, 深度学习, 数据标注, 文本校对 数据概述:...
-
邮件文本内容分析数据集
2025年9月26日 30 135 53
邮件文本内容分析数据集_Email_Text_Content_Analysis 数据来源:互联网公开数据 标签:邮件内容, 文本分析, 自然语言处理, 文本挖掘, 数据清洗, 信息提取, 邮件安全, 语料库 数据概述: 该数据集包含来自邮件文本的数据,记录了邮件的原始内容。主要特征如下: 时间跨度:数据未明确标注时间,可视为静态文本语料库。...
-
客户身份识别数据集
2025年9月18日 30 183 71
客户身份识别数据集_Customer_ID_Identification_Dataset 数据来源:互联网公开数据 标签:客户数据, 身份识别, 数据隐私, 用户画像, 数据清洗, 客户关系管理, 机器学习, 数据集 数据概述: 该数据集包含客户身份识别相关的数据,记录了客户的唯一标识符 (customer_ID)。主要特征如下:...
-
文本信息实体识别标注数据集
2025年9月17日 30 22 0
文本信息实体识别标注数据集_Text_Information_Entity_Recognition_Annotation_Dataset 数据来源:互联网公开数据 标签:实体识别, 命名实体识别, 信息抽取, 文本标注, 机器学习, 自然语言处理, 数据集, 序列标注 数据概述:...
-
多模态有毒评论文本分类数据集
2025年9月10日 30 159 92
多模态有毒评论文本分类数据集_Multimodal_Toxic_Comment_Text_Classification 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 情感分析, 机器学习, 数据集, 自然语言处理, 交叉验证, 文本对抗 数据概述:...
-
深度学习模型参数与归一化数据集
2025年8月25日 30 93 92
深度学习模型参数与归一化数据集_Deep_Learning_Model_Parameters_and_Normalization_Data 数据来源:互联网公开数据 标签:深度学习, 模型参数, 数据归一化, 机器学习, 模型权重, 数据分析, 神经网络, 预测模型 数据概述:...
-
缺失值处理数据集(2015-2022)
2025年8月20日 60 97 59
包含缺失数据的各类数据集,涵盖多个领域,如医疗、金融、零售等 适用于数据预处理课程,学生可以进行缺失值处理、数据填充、插补等技术应用,提升数据质量,为后续分析打下基础。
-
聊天记录数据集(2015-2022)
2025年8月19日 60 160 71
社交媒体或在线平台的聊天记录,包含文本消息、对话内容、情感标签等 适用于人工智能与自然语言处理课程,学生可以使用该数据集进行情感分析、对话生成、对话系统优化等任务。
-
社交媒体评论文本预处理数据集
2025年8月21日 30 65 23
社交媒体评论文本预处理数据集_Social_Media_Comment_Text_Preprocessed_Dataset 数据来源:互联网公开数据 标签:文本预处理, 社交媒体, 评论分析, 自然语言处理, 文本挖掘, 数据清洗, 情感分析, 语料库 数据概述:...



