找到5,684个数据集

标签: 文本分析

过滤结果
  • 安然公司电子邮件数据集-垃圾邮件检测与分析-2000-2002

    2025年4月14日   

    安然公司电子邮件数据集-垃圾邮件检测与分析-2000-2002 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,安然公司,文本分析,自然语言处理,信息检索,邮件安全,金融,商业丑闻 数据概述:...
    packageimg
  • 马拉提语新闻标题数据集1963-2021

    2025年4月14日   

    马拉提语新闻标题数据集1963-2021 数据来源:互联网公开数据 标签:马拉提语,新闻标题,文本分析,自然语言处理,分类模型,机器学习,数据清洗 数据概述: 本数据集包含从马拉提语新闻网站收集的约12000条新闻文章标题。数据集已经经过清洗处理,并分为训练集和测试集,适用于基准测试各类马拉提语文本分类模型。 数据用途概述:...
    packageimg
  • 联合国一般性辩论文本集

    2025年4月14日   

    联合国一般性辩论文本集 数据来源:互联网公开数据 标签:联合国,一般性辩论,政治话语,文本分析,国际关系,NLP,全球治理,多边外交,历史记录,政治文本,政策分析 数据概述:...
    packageimg
  • ChatGPT医疗应用研究文献数据集

    2025年4月14日   

    ChatGPT医疗应用研究文献数据集 数据来源:互联网公开数据 标签:PubMed, 医疗, ChatGPT, 研究论文, 文本分析, 长上下文建模, 大语言模型, Gemini 数据概述: 本数据集由 Google - Gemini Long Context 竞赛产生,包含通过 PubMed 搜索获取的关于 ChatGPT...
    packageimg
  • 微软位置提及识别实践数据集

    2025年4月14日   

    微软位置提及识别实践数据集 数据来源:互联网公开数据 标签:位置提及识别,微博客,紧急情况,灾害响应,救援活动,推特,文本分析 数据概述:...
    packageimg
  • 命名实体识别文本信息标注数据集

    2025年4月14日   

    命名实体识别文本信息标注数据集 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,文本分析,机器学习,数据标注,信息抽取,文本挖掘 数据概述:...
    packageimg
  • 特朗普推文及情感分析数据集

    2025年4月14日   

    特朗普推文及情感分析数据集 数据来源:互联网公开数据 标签:推文,特朗普,社交媒体,情感分析,时间序列,文本分析,政治,公众反应 数据概述:...
    packageimg
  • 事实核查科学声明文章数据集

    2025年4月14日   

    事实核查科学声明文章数据集 数据来源:互联网公开数据 标签:事实核查,科学声明,文本分析,情感分析,机器学习,新闻元数据,数据清洗 数据概述:...
    packageimg
  • 西班牙语评论文本向量化分析数据集

    2025年4月14日   

    西班牙语评论文本向量化分析数据集 数据来源:互联网公开数据 标签:西班牙语,文本分析,自然语言处理,情感分析,机器学习,词袋模型,TF-IDF,停用词,分类 数据概述: 本数据集包含722条西班牙语评论文本,用于二元分类问题。数据集经过文本向量化处理,基于词袋模型(BoW)和TF-...
    packageimg
  • 仇恨言论和冒犯性推文数据集

    2025年4月14日   

    仇恨言论和冒犯性推文数据集 数据来源:互联网公开数据 标签:仇恨言论,冒犯性语言,社交媒体,推特,文本分析,自然语言处理,社会伦理 数据概述:...
    packageimg
  • 印度尼西亚短信垃圾信息数据集

    2025年4月14日   

    印度尼西亚短信垃圾信息数据集 数据来源:互联网公开数据 标签:短信,垃圾信息,分类,文本分析,机器学习,印尼语 数据概述: 本数据集来源于https://yudiwbs.wordpress.com/2018/08/05/dataset-klasifikasi-bahasa-indonesia-sms-spam-klasifikasi-teks-...
    packageimg
  • 华尔街赌场Reddit帖子数据集

    2025年4月14日   

    华尔街赌场Reddit帖子数据集 数据来源:互联网公开数据 标签:华尔街赌场,Reddit,社交媒体,股票,投资,金融,社区,帖子,文本分析,情绪分析 数据概述:...
    packageimg
  • 福尔德家族故事集情感分析数据集

    2025年4月14日   

    福尔德家族故事集情感分析数据集 数据来源:互联网公开数据 标签:情感分析,文本分析,自然语言处理,福尔德家族,故事集,词频分析,情感词典,主题建模,实体识别 数据概述:...
    packageimg
  • 多模态情感数据集

    2025年4月14日   

    多模态情感数据集 数据来源:互联网公开数据 标签:多模态,情感分析,图像识别,自然语言处理,计算机视觉,图像分类,文本分析 数据概述: 本数据集包含100个不同类别动物和物体的图像及其对应的文本描述和情感标签,适用于多模态情感分析研究。图像类别包括鲨鱼、鸟类、蜥蜴、蜘蛛等。该数据集为计算机视觉和自然语言处理任务提供了丰富的数据资源。 数据用途概述:...
    packageimg
  • 在线新闻聚类分析数据集2021

    2025年4月14日   

    在线新闻聚类分析数据集2021 数据来源:互联网公开数据 标签:在线新闻,聚类分析,K均值聚类,层次聚类,新闻分类,数据挖掘,文本分析 数据概述: 本数据集包含2021年在线新闻的文章数据,涵盖新闻的主题、内容摘要、发布日期、作者、类别等多种信息。数据集旨在为新闻分类和聚类分析提供丰富的源数据,支持不同类型的文本处理研究。 数据用途概述:...
    packageimg
  • 印度尼西亚垃圾短信文本分析数据集1963-2021

    2025年4月14日   

    印度尼西亚垃圾短信文本分析数据集1963-2021 数据来源:互联网公开数据 标签:垃圾短信,文本分析,商业用途,欺诈检测,客户支持,趋势分析,教育,网络安全,短信分类,机器学习,自然语言处理 数据概述:...
    packageimg
  • 微博头像数据集

    2025年4月14日   

    微博头像数据集 数据来源:互联网公开数据 标签:微博,社交媒体,头像,文本分析,TF-IDF,Bert,话题识别 数据概述: 本数据集包含从微博爬取的CSV文件和使用TF-...
    packageimg
  • 新冠疫情相似句对判定数据集

    2025年4月14日   

    新冠疫情相似句对判定数据集 数据来源:互联网公开数据 标签:新冠疫情,相似句对,文本分析,自然语言处理,疫情信息,语义分析 数据概述:...
    packageimg
  • 推特情绪强度分析数据集1963-2021

    2025年4月14日   

    推特情绪强度分析数据集1963-2021 数据来源:互联网公开数据 标签:情绪分析,推特,情感强度,情绪分类,自然语言处理,文本分析,社交媒体分析 数据概述:...
    packageimg
  • 印度法律与法案数据集1074-至今

    2025年4月14日   

    印度法律与法案数据集1074-至今 数据来源:互联网公开数据 标签:印度法律,法案,历史,法律研究,文本分析,语言模型,政策分析 数据概述:...
    packageimg