找到5,692个数据集

标签: 文本分析

过滤结果
  • 特拉维夫短租Facebook帖子数据集-2015年

    2025年4月14日   

    特拉维夫短租Facebook帖子数据集-2015年 数据来源:互联网公开数据 标签:短租,特拉维夫,Facebook,社交媒体,房地产,希伯来语,NLP,文本分析,价格分析 数据概述: 本数据集收录了2015年从Facebook群组“特拉维夫短租” (希伯来语:סאבלטים בתל אביב לתקופות קצרות)...
    packageimg
  • 韩国大学人文论文数据集

    2025年4月14日   

    韩国大学人文论文数据集 数据来源:互联网公开数据 标签:韩国大学,人文论文,教育,学术研究,自然语言处理,文本分析,教育趋势 数据概述:...
    packageimg
  • 康德著作数据集

    2025年4月14日   

    康德著作数据集 数据来源:互联网公开数据 标签:康德,哲学,伦理学,道德学,形而上学,自然语言处理,文本分析 数据概述: 本数据集收录了伊曼努尔·康德的主要著作,涵盖了伦理学、道德学和形而上学等领域。数据集包含一个自增列和四个重要的信息列,包括著作标题、出版日期以及原始文本和清理后的文本。这些文本数据为研究康德哲学思想提供了丰富的资源。 数据用途概述:...
    packageimg
  • 网络攻击性言论数据集

    2025年4月14日   

    网络攻击性言论数据集 数据来源:互联网公开数据 标签:仇恨言论,攻击性言论,社交媒体,内容审核,自然语言处理,文本分析,社会问题 数据概述:...
    packageimg
  • Steam游戏评论关键要素标注数据集-英语评论-2024

    2025年4月14日   

    Steam游戏评论关键要素标注数据集-英语评论-2024 数据来源:互联网公开数据 标签:游戏评论,Steam,用户评价,文本分析,情感分析,自然语言处理,机器学习,数据标注 数据概述:...
    packageimg
  • 多语言复杂问答数据集-涵盖8种语言

    2025年4月14日   

    多语言复杂问答数据集-涵盖8种语言 数据来源:互联网公开数据 标签:多语言,问答,自然语言处理,NLP,机器翻译,语言模型,数据集,复杂问题,文本分析 数据概述: 本数据集由Hugging Face...
    packageimg
  • 抑郁症检测数据集

    2025年4月14日   

    抑郁症检测数据集 数据来源:互联网公开数据 标签:抑郁症,社交媒体,情感分析,心理健康,文本分析 数据概述: 本数据集包含两个字段:推文文本和标签。推文文本字段记录了用户的社交媒体内容,标签字段则标注了该推文是否涉及抑郁症。数据集提供了广泛的社会媒体文本数据,为抑郁症检测模型的开发与训练提供了必要的基础。 数据用途概述:...
    packageimg
  • 学术引用意图分类数据集

    2025年4月14日   

    学术引用意图分类数据集 数据来源:互联网公开数据 标签:学术引用,意图分类,科学文章,计算机科学,生物医学,生态学,数据挖掘,机器学习,文本分析,自然语言处理 数据概述: 本数据集来源于Huggingface...
    packageimg
  • 印度尼西亚垃圾邮件检测短信数据集1963-2021

    2025年4月14日   

    印度尼西亚垃圾邮件检测短信数据集1963-2021 数据来源:互联网公开数据 标签:垃圾邮件检测,短信数据,文本分析,分类模型,电子邮件,合法邮件,印度尼西亚 数据概述:...
    packageimg
  • 垃圾邮件分类邮件数据集

    2025年4月14日   

    垃圾邮件分类邮件数据集 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,文本分析,机器学习,数据挖掘,自然语言处理, Spam Detection 数据概述:...
    packageimg
  • 阿拉伯语推特情感分析数据集

    2025年4月14日   

    阿拉伯语推特情感分析数据集 数据来源:互联网公开数据 标签:阿拉伯语,推特,情感分析,社交媒体,文本分析,自然语言处理,情感趋势 数据概述: 本数据集来源于推特,包含用阿拉伯语书写的推文,并根据内容被标注为正面或负面。数据集涵盖了广泛的主题和情感表达,适用于分析阿拉伯语社交媒体上的公众情绪和观点。 数据用途概述:...
    packageimg
  • 马来西亚新闻推特账户数据集

    2025年4月14日   

    马来西亚新闻推特账户数据集 数据来源:互联网公开数据 标签:马来西亚,新闻,推特,社交媒体分析,文本分析,时间序列,新闻媒体 数据概述: 本数据集包含2021年7月22日至2021年8月12日期间马来西亚4个主要新闻推特账户的推文信息,包括推文内容、推文来源、地理位置以及每个账户的粉丝数量。这四个账户分别是Berita Harian、Harian...
    packageimg
  • 俄罗斯矿业行业文本数据集2009-2023

    2025年4月14日   

    俄罗斯矿业行业文本数据集2009-2023 数据来源:互联网公开数据 标签:矿业,俄罗斯,新闻,行业报告,文本分析,自然语言处理,数据挖掘 数据概述: 本数据集收录了2009年至2023年间约9万条新闻文章、新闻稿和矿业公司公共报告的俄语文本数据。数据通过自动抓取网站内容生成,经过句法切分处理,每行包含一个句子,适用于矿业行业文本分析。 数据用途概述:...
    packageimg
  • 波斯推特情感分析数据集

    2025年4月14日   

    波斯推特情感分析数据集 数据来源:互联网公开数据 标签:推特,波斯语,情感分析,社交媒体,文本分析,情绪识别 数据概述:...
    packageimg
  • Discord游戏改进建议与投票数据集-Discord服务器-时间不限

    2025年4月14日   

    Discord游戏改进建议与投票数据集-Discord服务器-时间不限 数据来源:互联网公开数据 标签:游戏改进,Discord,社区反馈,NLP,文本分析,投票,建议,开发者,用户生成内容 数据概述:...
    packageimg
  • COVID-19研究文章数据集

    2025年4月14日   

    COVID-19研究文章数据集 数据来源:互联网公开数据 标签:COVID-19, 研究文章, 文本分析, 时间序列, 推荐系统, 情感分析, 机器学习 数据概述...
    packageimg
  • 调整文本数据集

    2025年4月14日   

    调整文本数据集 数据来源:互联网公开数据 标签:文本调整,数据优化,文本处理,文本分析,数据可视化,数据集共享 数据概述: 本数据集包含与调整文本相关的数据集,适用于文本布局优化、数据可视化调整等场景。数据集内容涵盖文本调整的具体参数、调整前后对比数据以及相关算法实现的示例数据,为研究人员和开发者提供标准化的文本调整数据支持。 数据用途概述:...
    packageimg
  • 谷歌新闻原始数据集

    2025年4月14日   

    谷歌新闻原始数据集 数据来源:互联网公开数据 标签:谷歌新闻,原始数据,自然语言处理,文本分析,数据科学,新闻内容 数据概述: 本数据集包含从谷歌新闻收集的新闻文章集合,数据通过网络抓取获得,涵盖多个新闻来源的原始、未加工文本。该数据集提供了广泛的新聞内容,适用于自然语言处理项目、文本分析和其他需要原始文本数据的数据科学应用。 数据用途概述:...
    packageimg
  • Goodreads书籍样本数据清洗与整理数据集

    2025年4月14日   

    Goodreads书籍样本数据清洗与整理数据集 数据来源:互联网公开数据 标签:书籍,Goodreads,数据清洗,文本分析,图书推荐,Python,数据整理 数据概述:...
    packageimg
  • AskReddit热门评论数据集-NLP文本分析

    2025年4月14日   

    AskReddit热门评论数据集-NLP文本分析 数据来源:互联网公开数据 标签:AskReddit,评论,Reddit,文本分析,NLP,自然语言处理,情感分析,热门评论,数据分析,EDA 数据概述: 本数据集包含了过去一个月内AskReddit版块中,最热门的评论数据。...
    packageimg