找到5,725个数据集

标签: 文本分析

过滤结果
  • 学术引用意图分类数据集

    2025年4月14日   

    学术引用意图分类数据集 数据来源:互联网公开数据 标签:学术引用,意图分类,科学文章,计算机科学,生物医学,生态学,数据挖掘,机器学习,文本分析,自然语言处理 数据概述: 本数据集来源于Huggingface...
    packageimg
  • 印度尼西亚垃圾邮件检测短信数据集1963-2021

    2025年4月14日   

    印度尼西亚垃圾邮件检测短信数据集1963-2021 数据来源:互联网公开数据 标签:垃圾邮件检测,短信数据,文本分析,分类模型,电子邮件,合法邮件,印度尼西亚 数据概述:...
    packageimg
  • 垃圾邮件分类邮件数据集

    2025年4月14日   

    垃圾邮件分类邮件数据集 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,文本分析,机器学习,数据挖掘,自然语言处理, Spam Detection 数据概述:...
    packageimg
  • 阿拉伯语推特情感分析数据集

    2025年4月14日   

    阿拉伯语推特情感分析数据集 数据来源:互联网公开数据 标签:阿拉伯语,推特,情感分析,社交媒体,文本分析,自然语言处理,情感趋势 数据概述: 本数据集来源于推特,包含用阿拉伯语书写的推文,并根据内容被标注为正面或负面。数据集涵盖了广泛的主题和情感表达,适用于分析阿拉伯语社交媒体上的公众情绪和观点。 数据用途概述:...
    packageimg
  • 马来西亚新闻推特账户数据集

    2025年4月14日   

    马来西亚新闻推特账户数据集 数据来源:互联网公开数据 标签:马来西亚,新闻,推特,社交媒体分析,文本分析,时间序列,新闻媒体 数据概述: 本数据集包含2021年7月22日至2021年8月12日期间马来西亚4个主要新闻推特账户的推文信息,包括推文内容、推文来源、地理位置以及每个账户的粉丝数量。这四个账户分别是Berita Harian、Harian...
    packageimg
  • 俄罗斯矿业行业文本数据集2009-2023

    2025年4月14日   

    俄罗斯矿业行业文本数据集2009-2023 数据来源:互联网公开数据 标签:矿业,俄罗斯,新闻,行业报告,文本分析,自然语言处理,数据挖掘 数据概述: 本数据集收录了2009年至2023年间约9万条新闻文章、新闻稿和矿业公司公共报告的俄语文本数据。数据通过自动抓取网站内容生成,经过句法切分处理,每行包含一个句子,适用于矿业行业文本分析。 数据用途概述:...
    packageimg
  • 波斯推特情感分析数据集

    2025年4月14日   

    波斯推特情感分析数据集 数据来源:互联网公开数据 标签:推特,波斯语,情感分析,社交媒体,文本分析,情绪识别 数据概述:...
    packageimg
  • Discord游戏改进建议与投票数据集-Discord服务器-时间不限

    2025年4月14日   

    Discord游戏改进建议与投票数据集-Discord服务器-时间不限 数据来源:互联网公开数据 标签:游戏改进,Discord,社区反馈,NLP,文本分析,投票,建议,开发者,用户生成内容 数据概述:...
    packageimg
  • COVID-19研究文章数据集

    2025年4月14日   

    COVID-19研究文章数据集 数据来源:互联网公开数据 标签:COVID-19, 研究文章, 文本分析, 时间序列, 推荐系统, 情感分析, 机器学习 数据概述...
    packageimg
  • 调整文本数据集

    2025年4月14日   

    调整文本数据集 数据来源:互联网公开数据 标签:文本调整,数据优化,文本处理,文本分析,数据可视化,数据集共享 数据概述: 本数据集包含与调整文本相关的数据集,适用于文本布局优化、数据可视化调整等场景。数据集内容涵盖文本调整的具体参数、调整前后对比数据以及相关算法实现的示例数据,为研究人员和开发者提供标准化的文本调整数据支持。 数据用途概述:...
    packageimg
  • 谷歌新闻原始数据集

    2025年4月14日   

    谷歌新闻原始数据集 数据来源:互联网公开数据 标签:谷歌新闻,原始数据,自然语言处理,文本分析,数据科学,新闻内容 数据概述: 本数据集包含从谷歌新闻收集的新闻文章集合,数据通过网络抓取获得,涵盖多个新闻来源的原始、未加工文本。该数据集提供了广泛的新聞内容,适用于自然语言处理项目、文本分析和其他需要原始文本数据的数据科学应用。 数据用途概述:...
    packageimg
  • Goodreads书籍样本数据清洗与整理数据集

    2025年4月14日   

    Goodreads书籍样本数据清洗与整理数据集 数据来源:互联网公开数据 标签:书籍,Goodreads,数据清洗,文本分析,图书推荐,Python,数据整理 数据概述:...
    packageimg
  • AskReddit热门评论数据集-NLP文本分析

    2025年4月14日   

    AskReddit热门评论数据集-NLP文本分析 数据来源:互联网公开数据 标签:AskReddit,评论,Reddit,文本分析,NLP,自然语言处理,情感分析,热门评论,数据分析,EDA 数据概述: 本数据集包含了过去一个月内AskReddit版块中,最热门的评论数据。...
    packageimg
  • 英文引言与标签分类数据集

    2025年4月14日   

    英文引言与标签分类数据集 数据来源:互联网公开数据 标签:引言,作者,标签分类,数据清理,文本分析,数据挖掘 数据概述:...
    packageimg
  • 数据科学领域访谈博客文章互动表现数据集

    2025年4月14日   

    数据科学领域访谈博客文章互动表现数据集 数据来源:互联网公开数据 标签:数据科学,访谈,博客,机器学习,人物访谈,文本分析,社交媒体,互动分析 数据概述: 本数据集包含了Sanyam...
    packageimg
  • 印度巴拉特生物科技公司Covaxin新冠疫苗推文数据集

    2025年4月14日   

    印度巴拉特生物科技公司Covaxin新冠疫苗推文数据集 数据来源:互联网公开数据 标签:Covaxin,新冠疫苗,疫苗,推文,社交媒体,巴拉特生物科技,疫情,公共卫生,文本分析 数据概述: 本数据集包含了巴拉特生物科技公司(Bharat Biotech)在Twitter平台上发布的超过200条关于Covaxin新冠疫苗的推文。...
    packageimg
  • 古兰经数字奇迹分析数据集1990-2023

    2025年4月14日   

    古兰经数字奇迹分析数据集1990-2023 数据来源:互联网公开数据 标签:古兰经,数字奇迹,伊斯兰教,文化研究,历史文献,文本分析,数据科学 数据概述:...
    packageimg
  • 孟加拉每日英语新闻文章数据集

    2025年4月14日   

    孟加拉每日英语新闻文章数据集 数据来源:互联网公开数据 标签:孟加拉,新闻,自然语言处理,文本分析,时间序列,媒体研究,信息提取 数据概述: 本数据集收录了孟加拉每日英语新闻文章,数据来源包括五个主要的孟加拉英语新闻门户:The Daily Star、The Financial Express、New Age bd、Dhaka Tribune 和...
    packageimg
  • 互联网公开数据集深度洞察与应用分析

    2025年4月8日   

    标题:互联网公开数据集深度洞察与应用分析 数据内容: 该数据集包含以下字段: 1. id:标识数据记录的唯一标识符,共有53043种不同的值。 2. statement:描述具体事件或信息的文本字段,共有51074种不同的值。 3. status:表示事件或信息的状态,共有7种不同的值。 数据来源: 互联网公开数据 数据用途:...
    packageimg
  • 互联网公开数据集垃圾邮件分类与文本分析

    2025年4月8日   

    标题:互联网公开数据集垃圾邮件分类与文本分析 数据内容:该数据集包含文本内容(text)和垃圾邮件分类(spam)两个字段。文本内容字段包含5695种不同的文本值,垃圾邮件分类字段包含两种不同的分类值(0和1)。 数据来源:互联网公开数据...
    packageimg