找到1,272个数据集

标签: 数据清洗

过滤结果
  • 越南新闻犯罪事件文本数据集

    2025年10月28日 30 163 79

    越南新闻犯罪事件文本数据集_Vietnam_News_Crime_Incident_Text_Data 数据来源:互联网公开数据 标签:犯罪事件, 新闻文本, 越南, 文本分析, 自然语言处理, 情感分析, 数据清洗, 语料库 数据概述: 该数据集包含来自越南新闻网站的犯罪事件相关文本,记录了不同来源的新闻报道内容。主要特征如下:...
    packageimg
  • 越南新闻犯罪事件文本数据集

    2025年10月25日 30 92 18

    越南新闻犯罪事件文本数据集_Vietnam_News_Crime_Incident_Text_Data 数据来源:互联网公开数据 标签:犯罪事件, 新闻文本, 越南, 文本分析, 自然语言处理, 情感分析, 数据清洗, 语料库 数据概述: 该数据集包含来自越南新闻网站的犯罪事件相关文本,记录了不同来源的新闻报道内容。主要特征如下:...
    packageimg
  • 预处理文件-用户行为分析数据集-upamamahato

    2025年5月28日 90 128 106

    预处理文件-用户行为分析数据集-upamamahato 数据来源:互联网公开数据 标签:用户行为,数据预处理,数据集,行为分析,数据清洗,用户画像,机器学习,数据挖掘 数据概述: 该数据集包含经过预处理的用户行为数据,记录了用户在特定平台或应用中的交互行为。主要特征如下: 时间跨度:数据记录的时间范围为一段时间,具体时间范围取决于原始数据集。...
    packageimg
  • 无监督学习网络文本内容数据集

    2025年10月14日 30 167 63

    无监督学习网络文本内容数据集_Unsupervised_Learning_Web_Content_Dataset 数据来源:互联网公开数据 标签:文本挖掘, 无监督学习, 自然语言处理, 网页内容, 文本预处理, 语料库, 数据清洗, 机器学习 数据概述: 该数据集包含来自网络抓取的文本内容,记录了用于无监督学习模型的网页文本信息。主要特征如下:...
    packageimg
  • 软件缺陷报告分析数据集

    2025年10月6日 30 158 75

    软件缺陷报告分析数据集_Software_Defect_Report_Analysis 数据来源:互联网公开数据 标签:软件工程, 缺陷分析, 文本挖掘, 缺陷预测, 代码质量, 数据清洗, 自然语言处理, 机器学习 数据概述: 该数据集包含来自软件开发项目的缺陷报告数据,记录了软件缺陷的描述信息、状态、优先级等关键属性。主要特征如下:...
    packageimg
  • 电影推荐系统数据集-2023年-rishabjain237

    2025年4月22日 60 66 33

    电影推荐系统数据集-2023年-rishabjain237 数据来源:互联网公开数据 标签:电影,推荐系统,数据清洗,评分,用户行为,电影特征 数据概述: 本数据集包含用于电影推荐系统的电影评分和用户行为数据,包含超过100,000条记录。数据集涵盖了用户的评分信息、电影的元数据以及用户的基本信息。数据集的字段包括但不限于:...
    packageimg
  • 教育研究论文文本分析数据集

    2025年9月27日 30 31 23

    教育研究论文文本分析数据集_Education_Research_Paper_Text_Analysis 数据来源:互联网公开数据 标签:教育研究, 文本分析, 论文摘要, 自然语言处理, 文本分类, 标签提取, 学术研究, 数据清洗 数据概述: 该数据集包含来自教育研究领域的学术论文文本数据,主要用于文本分析和自然语言处理任务。主要特征如下:...
    packageimg
  • 商品海关编码与描述信息数据集

    2025年9月27日 30 33 5

    商品海关编码与描述信息数据集_Commodity_Customs_Code_and_Description_Dataset 数据来源:互联网公开数据 标签:海关数据,商品编码,商品描述,贸易数据,文本分析,数据清洗,数据挖掘,关税分析 数据概述: 该数据集包含来自海关申报的商品数据,记录了商品的海关编码、描述信息以及相关日期。主要特征如下:...
    packageimg
  • 邮件文本内容分析数据集

    2025年9月26日 30 180 13

    邮件文本内容分析数据集_Email_Text_Content_Analysis 数据来源:互联网公开数据 标签:邮件内容, 文本分析, 自然语言处理, 文本挖掘, 数据清洗, 信息提取, 邮件安全, 语料库 数据概述: 该数据集包含来自邮件文本的数据,记录了邮件的原始内容。主要特征如下: 时间跨度:数据未明确标注时间,可视为静态文本语料库。...
    packageimg
  • 多模态图像_文本关联数据集

    2025年9月22日 30 15 7

    多模态图像_文本关联数据集_Multimodal_Image_Text_Association_Dataset 数据来源:互联网公开数据 标签:图像识别, 文本描述, 多模态, 图像检索, 计算机视觉, 自然语言处理, 数据清洗, 图像标注 数据概述: 该数据集包含来自互联网的图像及其对应的文本描述,用于研究图像与文本之间的关联。主要特征如下:...
    packageimg
  • 金融市场情绪分析数据集

    2025年9月19日 30 123 70

    金融市场情绪分析数据集_Financial_Market_Sentiment_Analysis 数据来源:互联网公开数据 标签:金融市场, 情绪分析, 文本分析, 情感分类, 自然语言处理, 市场预测, 数据清洗, 舆情分析 数据概述: 该数据集包含来自金融市场相关数据,记录了用于分析市场情绪的文本信息。主要特征如下:...
    packageimg
  • 客户身份识别数据集

    2025年9月18日 30 169 17

    客户身份识别数据集_Customer_ID_Identification_Dataset 数据来源:互联网公开数据 标签:客户数据, 身份识别, 数据隐私, 用户画像, 数据清洗, 客户关系管理, 机器学习, 数据集 数据概述: 该数据集包含客户身份识别相关的数据,记录了客户的唯一标识符 (customer_ID)。主要特征如下:...
    packageimg
  • 芝加哥犯罪地点描述与替代方案数据集

    2025年9月14日 30 109 63

    芝加哥犯罪地点描述与替代方案数据集_Chicago_Crime_Location_Description_and_Alternatives 数据来源:互联网公开数据 标签:犯罪分析, 地理位置, 犯罪地点, 描述分析, 数据清洗, 文本挖掘, 替代方案, 芝加哥 数据概述:...
    packageimg
  • 客户信用风险评估与预测数据集

    2025年9月1日 30 1 0

    客户信用风险评估与预测数据集_Customer_Credit_Risk_Assessment_and_Prediction_Dataset 数据来源:互联网公开数据 标签:信用风险, 客户行为, 欺诈检测, 机器学习, 数据清洗, 特征工程, 时间序列, 风险管理 数据概述:...
    packageimg
  • 旧金山餐饮行业Yelp评论与健康检查数据分析数据集

    2025年8月26日 30 49 0

    旧金山餐饮行业Yelp评论与健康检查数据分析数据集_San_Francisco_Restaurant_Yelp_Reviews_and_Health_Inspection_Data 数据来源:互联网公开数据 标签:Yelp评论, 健康检查, 餐饮行业, 数据融合, 文本分析, 风险评估, 地理信息, 数据清洗 数据概述:...
    packageimg
  • 图像描述与视觉内容关联数据集

    2025年8月25日 30 69 61

    图像描述与视觉内容关联数据集_Image_Description_and_Visual_Content_Association_Dataset 数据来源:互联网公开数据 标签:图像识别, 图像描述, 视觉语言, 多模态, 图像检索, 文本生成, 机器学习, 数据清洗 数据概述:...
    packageimg
  • 社交媒体评论文本预处理数据集

    2025年8月21日 30 60 2

    社交媒体评论文本预处理数据集_Social_Media_Comment_Text_Preprocessed_Dataset 数据来源:互联网公开数据 标签:文本预处理, 社交媒体, 评论分析, 自然语言处理, 文本挖掘, 数据清洗, 情感分析, 语料库 数据概述:...
    packageimg
  • 个人身份信息数据集

    2025年8月19日 30 164 59

    个人身份信息数据集_Personal_Identity_Information_Dataset 数据来源:互联网公开数据 标签:个人信息, 身份识别, 数据隐私, 人口统计, 数据清洗, 机器学习, 用户画像, 文本分析 数据概述: 该数据集包含个人身份信息,记录了多位个人的详细资料。主要特征如下:...
    packageimg
  • 新冠疫情期间美国社交媒体推文数据集

    2025年8月17日 30 24 15

    新冠疫情期间美国社交媒体推文数据集_COVID_19_USA_Social_Media_Tweets 数据来源:互联网公开数据 标签:新冠疫情, 社交媒体, 推文分析, 情感分析, 文本挖掘, 美国, 时间序列, 数据清洗 数据概述: 该数据集包含来自美国社交媒体平台推文数据,记录了新冠疫情期间用户发布的相关推文内容。主要特征如下:...
    packageimg
  • 社交媒体推文内容分析数据集

    2025年8月16日 30 93 35

    社交媒体推文内容分析数据集_Social_Media_Tweet_Content_Analysis_Dataset 数据来源:互联网公开数据 标签:社交媒体, 推文分析, 文本挖掘, 自然语言处理, 时间序列, 情感分析, 用户行为, 数据清洗 数据概述:...
    packageimg