找到5,725个数据集

标签: 文本分析

过滤结果
  • IEEEXplore机器学习论文关键词数据集

    2025年4月20日   

    IEEEXplore机器学习论文关键词数据集 数据来源:互联网公开数据 标签:机器学习,论文,关键词,IEEE Xplore,自然语言处理,学术研究,数据挖掘,文本分析 数据概述: 本数据集包含了从IEEE...
    packageimg
  • 新冠疫情社交媒体信息传播分析推特数据集-2020年3-4月

    2025年4月20日   

    新冠疫情社交媒体信息传播分析推特数据集-2020年3-4月 数据来源:互联网公开数据 标签:新冠疫情,推特,社交媒体,文本分析,自然语言处理,疫情传播,舆情分析,时间序列 数据概述:...
    packageimg
  • Steam平台游戏国际评论数据集

    2025年4月20日   

    Steam平台游戏国际评论数据集 数据来源:互联网公开数据 标签:Steam,游戏评论,用户评价,国际化,文本分析,情感分析,游戏推荐 数据概述: 本数据集包含40万条来自Steam平台的国际用户评论数据,数据通过Steamworks...
    packageimg
  • 用户图书评分数据集-书籍推荐系统-用户偏好-时间跨度未知

    2025年4月20日   

    用户图书评分数据集-书籍推荐系统-用户偏好-时间跨度未知 数据来源:互联网公开数据 标签:图书评分,用户行为,推荐系统,书籍,偏好分析,数据挖掘,文本分析 数据概述:...
    packageimg
  • Steam平台最古老游戏评论数据-俄语版

    2025年4月20日   

    Steam平台最古老游戏评论数据-俄语版 数据来源:互联网公开数据 标签:Steam,游戏,评论,评价,俄语,用户评价,游戏数据,文本分析 数据概述: 本数据集包含了Steam平台上最古老游戏的用户评论数据,数据来源于Steam API。主要关注用户对这些游戏的评价和反馈,为研究游戏历史、用户体验和市场趋势提供了数据基础。 数据用途概述:...
    packageimg
  • BERT嵌入垃圾邮件数据集

    2025年4月20日   

    BERT嵌入垃圾邮件数据集 数据来源:互联网公开数据 标签:垃圾邮件,短信分类,BERT嵌入,机器学习,文本分析,自然语言处理,ROC-AUC指标 数据概述...
    packageimg
  • 天气推文数据集

    2025年4月20日   

    天气推文数据集 数据来源:互联网公开数据 标签:天气,推特,社交媒体,文本分析,情感分析,数据挖掘 数据概述:...
    packageimg
  • ISIS相关推文数据集

    2025年4月20日   

    ISIS相关推文数据集 数据来源:互联网公开数据 标签:ISIS,恐怖主义,社交媒体,推文,反恐分析,数据挖掘,文本分析 数据概述 本数据集包含了2016年7月4日和7月11日两天内,从Twitter收集的122,000条推文。这些推文包含关键词“ISIS”、“ISIL”、“Daesh”、“Islamic...
    packageimg
  • 维基百科电影剧情摘要数据集

    2025年4月20日   

    维基百科电影剧情摘要数据集 数据来源:互联网公开数据 标签:电影,剧情,摘要,自然语言处理,文本分析,电影推荐,文化研究 数据概述: 本数据集基于JustinR在Kaggle发布的维基百科电影剧情数据集,包含了数以千计的电影及其完整剧情。在此基础上,我们使用DistilBART-...
    packageimg
  • 毒评分类挑战训练与测试数据集带标签

    2025年4月20日   

    毒评分类挑战训练与测试数据集带标签 数据来源:互联网公开数据 标签:毒评分类,机器学习,文本分析,自然语言处理 数据概述: 本数据集来源于毒评分类挑战,包含了合并的训练数据和带标签的测试数据。数据集中的每条评论都被标记为包含或不包含毒评,未标记的测试数据已从数据集中移除。该数据集旨在用于机器学习模型的训练和评估,特别是针对文本分类任务中的毒评检测。...
    packageimg
  • 恩尼翁2006年电子邮件垃圾邮件与正常邮件分类数据集

    2025年4月20日   

    恩尼翁2006年电子邮件垃圾邮件与正常邮件分类数据集 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件分类,正常邮件,文本处理,数据预处理,机器学习,文本分析 数据概述:...
    packageimg
  • 孟加拉语手写文本图像数据集

    2025年4月19日   

    孟加拉语手写文本图像数据集 数据来源:互联网公开数据 标签:手写识别,孟加拉语,OCR,图像处理,文本分析,机器学习,计算机视觉 数据概述:...
    packageimg
  • 银行短信消息分类数据集1963-2021

    2025年4月19日   

    银行短信消息分类数据集1963-2021 数据来源:互联网公开数据 标签:银行短信,交易分类,机器学习,金融行业,数据标注,文本分析 数据概述: 本数据集包含了由银行发送给用户的短信消息,涵盖交易描述、交易失败通知及其他各种警报信息。数据集旨在将短信消息分类为交易相关(Transactional)与非交易相关(Not...
    packageimg
  • Kaggle平台推特用户活跃度与讨论内容数据集-2010-2021

    2025年4月19日   

    Kaggle平台推特用户活跃度与讨论内容数据集-2010-2021 数据来源:互联网公开数据 标签:Kaggle,推特,社交媒体,数据科学,机器学习,社区,用户行为,文本分析 数据概述:...
    packageimg
  • 布哈里与穆斯林圣训数据集

    2025年4月19日   

    布哈里与穆斯林圣训数据集 数据来源:互联网公开数据 标签:圣训,布哈里,穆斯林,孟加拉语,英语,宗教研究,文本分析,多语言支持 数据概述:...
    packageimg
  • 古兰经与塔夫西尔数据集

    2025年4月19日   

    古兰经与塔夫西尔数据集 数据来源:互联网公开数据 标签:古兰经,塔夫西尔,宗教文本,阿拉伯语,自然语言处理,文本分析,机器学习 数据概述:...
    packageimg
  • 泰国美容产品评论数据集

    2025年4月19日   

    泰国美容产品评论数据集 数据来源:互联网公开数据 标签:泰国美容产品评论,情感分析,自然语言处理,消费者评价,星评体系,文本分析 数据概述: 本数据集来自泰国最大的美容产品评论网站,旨在为情感分析项目提供数据支持。数据集包含用户对美容产品的评分及评论,其中评分采用5星制,评论内容为用户对产品的多样化评价。 数据用途概述:...
    packageimg
  • 微博失业话题讨论数据集

    2025年4月19日   

    微博失业话题讨论数据集 数据来源:互联网公开数据 标签:失业,社交媒体,文本分析,社会热点,舆论趋势,自然语言处理,就业市场 数据概述:...
    packageimg
  • 印尼Twitter社交媒体互动与用户行为数据集-2020年2月

    2025年4月19日   

    印尼Twitter社交媒体互动与用户行为数据集-2020年2月 数据来源:互联网公开数据 标签:Twitter,社交媒体,印尼,推文,用户,互动,数据分析,文本分析,哈希处理 数据概述: 本数据集包含2020年2月期间,源自Twitter平台的印尼地区社交媒体数据,主要来源于DFRLab与Data Fest...
    packageimg
  • 推特社交媒体海量推文情感分析数据集-两年期

    2025年4月19日   

    推特社交媒体海量推文情感分析数据集-两年期 数据来源:互联网公开数据 标签:推特,社交媒体,情感分析,自然语言处理,文本分析,用户生成内容,机器学习,文本分类,时间序列分析,用户行为 数据概述:...
    packageimg