找到5,695个数据集

标签: 文本分析

过滤结果
  • 在线评论欺骗检测数据集2023

    2025年4月15日   

    在线评论欺骗检测数据集2023 数据来源:互联网公开数据 标签:在线评论,欺骗检测,文本分析,自然语言处理,机器学习,数据挖掘 数据概述: 本数据集来源于Kaggle,包含了用于欺骗性意见垃圾邮件检测的评论文本记录。数据集包括真实的和欺骗性的在线评论,每个评论都经过标注,可以帮助研究人员和开发者训练和评估文本分析及自然语言处理模型。 数据用途概述:...
    packageimg
  • 自杀行为与尝试数据集

    2025年4月15日   

    自杀行为与尝试数据集 数据来源:互联网公开数据 标签:自杀行为,风险因素,心理健康,社会学研究,文本分析,Reddit数据 数据概述:...
    packageimg
  • 社交媒体数据样本

    2025年4月15日   

    社交媒体数据样本 数据来源:互联网公开数据 标签:社交媒体,Instagram,Facebook,TikTok,YouTube,数据清理,文本分析,用户行为,内容分析 数据概述:...
    packageimg
  • WhatsApp谣言传播分析数据集-boatos-org网站谣言文本-时间跨度未知

    2025年4月15日   

    WhatsApp谣言传播分析数据集-boatos-org网站谣言文本-时间跨度未知 数据来源:互联网公开数据 标签:谣言,WhatsApp,社交媒体,文本分析,自然语言处理,假新闻,舆情分析,巴西,boatos.org,传播规律 数据概述:...
    packageimg
  • 钦定本圣经旧约与新约章节数据集

    2025年4月15日   

    钦定本圣经旧约与新约章节数据集 数据来源:互联网公开数据 标签:钦定本圣经,旧约,新约,章节,经文,宗教研究,文本分析,历史文献 数据概述: 本数据集收录了钦定本圣经(King James...
    packageimg
  • 有声书平台用户评价数据清洗与分析数据集

    2025年4月15日   

    有声书平台用户评价数据清洗与分析数据集 数据来源:互联网公开数据 标签:有声书,用户评价,数据清洗,SQL,MySQL,用户行为,文本分析,情感分析 数据概述:...
    packageimg
  • 莫迪总理推文数据集

    2025年4月15日   

    莫迪总理推文数据集 数据来源:互联网公开数据 标签:推文,社交媒体,莫迪,文本分析,情感分析,影响力评估,时间序列,公众人物 数据概述:...
    packageimg
  • 毒性数据集

    2025年4月15日   

    毒性数据集 数据来源:互联网公开数据 标签:毒性,文本分析,自然语言处理,机器学习,内容审核,社交媒体,网络言论 数据概述: 本数据集收录了多种来源的文本数据,涵盖社交媒体评论、论坛帖子、新闻评论等,主要用于识别和分析其中的毒性内容。数据集标注了不同类型的毒性评论,如侮辱、威胁、歧视等,为研究文本中的不良内容提供了丰富的样本。 数据用途概述:...
    packageimg
  • 巴西葡萄牙语讽刺与讽刺数据集

    2025年4月15日   

    巴西葡萄牙语讽刺与讽刺数据集 数据来源:互联网公开数据 标签:讽刺,讽刺检测,巴西葡萄牙语,自然语言处理,文本分析,情感分析,社交媒体分析 数据概述: 本数据集是从2021年3月20日Fabio Ricardo Araujo da Silva和Andreia Gentil Bonfante在https://github.com/fabio-...
    packageimg
  • 说唱歌词NLP数据集

    2025年4月15日   

    说唱歌词NLP数据集 数据来源:互联网公开数据 标签:说唱,歌词,NLP,文本分析,文本预处理,文本分类,音乐分析 数据概述: 本数据集收录了来自11位不同艺术家的说唱歌词,包括Drake、J. Cole、Kendrick Lamar、Eminem、Nas、Skepta、Rapsody、Nicki...
    packageimg
  • 土耳其恶意内容推文数据集2023

    2025年4月15日   

    土耳其恶意内容推文数据集2023 数据来源:互联网公开数据 标签:土耳其,推文,社交媒体,恶意内容,文本分析,语言处理,社会研究 数据概述: 本数据集收录了来自Twitter的土耳其推文,涵盖2023年的推文内容。数据集中约40%的推文包含冒犯性或粗俗的语境,为研究社交媒体上的恶意内容提供了宝贵的材料。每个推文记录了原文、发布时间、推文语言等关键信息。...
    packageimg
  • 电影类型预测竞赛数据集1963-2021

    2025年4月15日   

    电影类型预测竞赛数据集1963-2021 数据来源:互联网公开数据 标签:电影类型,预测模型,人工智能竞赛,数据可视化,机器学习,文本分析 数据概述:...
    packageimg
  • 心理健康与自杀风险评估演示数据集

    2025年4月15日   

    心理健康与自杀风险评估演示数据集 数据来源:互联网公开数据 标签:心理健康,自杀风险,演示数据,机器学习,情感分析,文本分析,数据挖掘 数据概述:...
    packageimg
  • 最后生还者全英文更新数据集

    2025年4月15日   

    最后生还者全英文更新数据集 数据来源:互联网公开数据 标签:最后生还者,英文推文,社交媒体数据,文本分析,情感分析,游戏社区,用户行为,文本挖掘 数据概述:...
    packageimg
  • 万圣节热门服装亚马逊评论数据集

    2025年4月15日   

    万圣节热门服装亚马逊评论数据集 数据来源:互联网公开数据 标签:万圣节服装,亚马逊,用户评论,自然语言处理,NLP,文本分析,评分预测,时间序列,产品评价 数据概述:...
    packageimg
  • 山区命名实体识别数据集

    2025年4月15日   

    山区命名实体识别数据集 数据来源:互联网公开数据 标签:命名实体识别,山区,自然地理,文本分析,机器学习,自然语言处理 数据概述: 本数据集用于命名实体识别(NER)任务,旨在识别文本中的山区名称。数据集中的每条记录对应一个由OpenAI的ChatGPT生成的推文或句子。数据集包含多种类型的推文/文本,其中包括专注于山区体验的内容,也可能涉及其他主题。...
    packageimg
  • 印度尼西亚反论语料库数据集2023

    2025年4月15日   

    印度尼西亚反论语料库数据集2023 数据来源:互联网公开数据 标签:反论,批判性思维,自然语言处理,众包数据,逻辑谬误,学术研究,文本分析 数据概述: 本数据集来源于《Riposte! 大型反论语料库》论文,由Paul Reisert、Benjamin Heinzerling、Naoya Inoue、Shun Kiyono和Kentaro...
    packageimg
  • 亚马逊评论情感属性分析数据集

    2025年4月15日   

    亚马逊评论情感属性分析数据集 数据来源:互联网公开数据 标签:亚马逊评论,情感分析,情感属性,NRC词典,文本分析,产品评价,分类标签 数据概述: 本数据集包含了亚马逊平台上客户对产品的评论文本及其对应的情感属性分析结果,覆盖了从评论内容到情感分类的多个维度。数据集包含评论文本(ReviewBody)、七种情感属性(Joy, Surprise,...
    packageimg
  • Rawat图书出版物主题分类数据集

    2025年4月15日   

    Rawat图书出版物主题分类数据集 数据来源:互联网公开数据 标签:图书,出版,学术,人文社科,ISBN,作者,主题分类,文本分析,自然语言处理,Rawat图书 数据概述: 本数据集包含了Rawat图书网站上公开列出的图书信息,涵盖了广泛的学术和人文社科领域。...
    packageimg
  • Reddit社区点击诱饵文章摘要数据集-r-SavedYouAClick-TOP1000-ish

    2025年4月15日   

    Reddit社区点击诱饵文章摘要数据集-r-SavedYouAClick-TOP1000-ish 数据来源:互联网公开数据 标签:Reddit,点击诱饵,文章摘要,社交媒体,文本分析,自然语言处理,TLDR,网络社区 数据概述:...
    packageimg