找到5,684个数据集

标签: 文本分析

过滤结果
  • 文档评论意图分类数据集

    2025年4月14日   

    文档评论意图分类数据集 数据来源:互联网公开数据 标签:文档评论,意图分类,CommonCrawl,文本分析,自然语言处理,商务文档,交互分析 数据概述:...
    packageimg
  • 土耳其学术期刊机器学习与人工智能论文摘要数据集-DergiPark网站-v2

    2025年4月14日   

    土耳其学术期刊机器学习与人工智能论文摘要数据集-DergiPark网站-v2 数据来源:互联网公开数据 标签:机器学习,深度学习,迁移学习,人工智能,论文摘要,土耳其,学术期刊,自然语言处理,文本分析 数据概述:...
    packageimg
  • 奥斯卡颁奖典礼获奖感言文本数据集-1940至今

    2025年4月14日   

    奥斯卡颁奖典礼获奖感言文本数据集-1940至今 数据来源:互联网公开数据 标签:奥斯卡,颁奖典礼,获奖感言,电影,文本分析,情感分析,自然语言处理,文化研究 数据概述:...
    packageimg
  • 阿瓦米阿瓦兹-信德语文章分类数据集

    2025年4月14日   

    阿瓦米阿瓦兹-信德语文章分类数据集 数据来源:互联网公开数据 标签:信德语,文章分类,NLP,文本分析,数据科学,机器学习,词云,探索性分析 数据概述:...
    packageimg
  • 常用表情符号编码与描述数据集

    2025年4月14日   

    常用表情符号编码与描述数据集 数据来源:互联网公开数据 标签:表情符号,emoji,Unicode,编码,描述,文本分析,社交媒体 数据概述: 本数据集包含一个CSV文件,共计4236行(包括标题行)。文件提供了广泛使用的表情符号(emoji)的详细信息,涵盖了表情符号的名称、Unicode编码点、图形表示、简要描述以及Unicode版本等关键属性。...
    packageimg
  • 社交媒体仇恨言论识别数据集-文本内容-2017

    2025年4月14日   

    社交媒体仇恨言论识别数据集-文本内容-2017 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,情感分析,自然语言处理,语言学,数据标注,分类,攻击性语言 数据概述: 本数据集包含近1.5万条短文本,每条文本均由多位贡献者进行标注,以识别其是否包含仇恨言论。标注结果分为三类:a) 包含仇恨言论;b) 具有攻击性,但不属于仇恨言论;c)...
    packageimg
  • 伊斯兰国宗教文本数据集2014-2017

    2025年4月14日   

    伊斯兰国宗教文本数据集2014-2017 数据来源:互联网公开数据 标签:伊斯兰国,宗教文本,宣传材料,招募,意识形态,反恐研究,文本分析 数据概述:...
    packageimg
  • 奥罗莫语句子标注数据集

    2025年4月14日   

    奥罗莫语句子标注数据集 数据来源:互联网公开数据 标签:奥罗莫语,句子标注,自然语言处理,文本分析,语言识别 数据概述: 本数据集包含78,000条经过清理的奥罗莫语句子,所有句子均无特殊字符和标点符号。数据集由两列组成,其中一列包含句子文本,另一列包含对应的语言标签。该数据集为研究和处理奥罗莫语提供了丰富的语言素材。 数据用途概述:...
    packageimg
  • 贝叶斯方法与机器学习书籍主题建模数据集

    2025年4月14日   

    贝叶斯方法与机器学习书籍主题建模数据集 数据来源:互联网公开数据 标签:机器学习,贝叶斯方法,主题建模,文本分析,自然语言处理,书籍,数据挖掘,Bishop 数据概述: 本数据集包含了《模式识别与机器学习》(Pattern Recognition and Machine Learning)一书(作者:Christopher...
    packageimg
  • 不明飞行物目击事件词序模式数据集

    2025年4月14日   

    不明飞行物目击事件词序模式数据集 数据来源:互联网公开数据 标签:不明飞行物,词序模式,NLP,文本分析,UFO,目击报告,模式识别 数据概述: 本数据集来源于NUFORC的不明飞行物目击事件数据库,包含了通过https://github.com/jacksonkarel/nlp-...
    packageimg
  • 推特用户情感分析数据集-社交媒体内容情感分类-多实体-训练验证

    2025年4月14日   

    推特用户情感分析数据集-社交媒体内容情感分类-多实体-训练验证 数据来源:互联网公开数据 标签:推特,情感分析,自然语言处理,社交媒体,情感分类,机器学习,文本分析,训练集,验证集 数据概述: 本数据集用于推特(Twitter)用户情感分析,旨在对推特消息中针对特定实体的情感倾向进行分类。...
    packageimg
  • 表情符号描述与释义数据集

    2025年4月14日   

    表情符号描述与释义数据集 数据来源:互联网公开数据 标签:表情符号,Emoji,释义,情感分析,文本分析,社交媒体,符号学,数据挖掘 数据概述:...
    packageimg
  • 在线新闻文章分享量预测数据集-Mashable平台-2015年

    2025年4月14日   

    在线新闻文章分享量预测数据集-Mashable平台-2015年 数据来源:互联网公开数据 标签:新闻,社交媒体,文章,分享量,预测,机器学习,文本分析,Mashable,内容分析 数据概述:...
    packageimg
  • 斯坦福问答数据集SQuAD泰米尔语翻译数据集-问答对-泰米尔语-

    2025年4月14日   

    斯坦福问答数据集SQuAD泰米尔语翻译数据集-问答对-泰米尔语- 数据来源:互联网公开数据 标签:问答,SQuAD,泰米尔语,自然语言处理,机器翻译,文本分析,数据集,翻译 数据概述: 本数据集是针对“chaii -...
    packageimg
  • 英超梦幻联赛Reddit社区讨论内容数据集

    2025年4月14日   

    英超梦幻联赛Reddit社区讨论内容数据集 数据来源:互联网公开数据 标签:足球,英超,梦幻联赛,Reddit,社交媒体,文本分析,情感分析,社区讨论,数据挖掘 数据概述: 本数据集收录了来自Reddit社区r/FantasyPL的帖子和评论,该社区主要讨论英超梦幻联赛(Fantasy Premier League)。数据通过Python Reddit...
    packageimg
  • 神经信息处理系统大会论文提交数据集NeurIPS2016-2019

    2025年4月14日   

    神经信息处理系统大会论文提交数据集NeurIPS2016-2019 数据来源:互联网公开数据 标签:NeurIPS,机器学习,计算神经科学,论文,学术会议,文本分析,自然语言处理,主题建模,聚类,分类 数据概述:...
    packageimg
  • 孟加拉语维基百科语料库数据集

    2025年4月14日   

    孟加拉语维基百科语料库数据集 数据来源:互联网公开数据 标签:孟加拉语,维基百科,自然语言处理,NLP,文本分析,机器学习,语料库 数据概述:...
    packageimg
  • 多标签分类新闻类别数据集

    2025年4月14日   

    多标签分类新闻类别数据集 数据来源:互联网公开数据 标签:多标签分类,新闻类别,文本分析,机器学习,自然语言处理,信息提取,数据标注 数据概述:...
    packageimg
  • 洛杉矶推特新闻数据集

    2025年4月14日   

    洛杉矶推特新闻数据集 数据来源:互联网公开数据 标签:洛杉矶,推特,新闻,分类,自然语言处理,NLP,文本分析 数据概述:...
    packageimg
  • 印度尼西亚垃圾邮件检测电子邮件数据集1963-2021

    2025年4月14日   

    印度尼西亚垃圾邮件检测电子邮件数据集1963-2021 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,分类,文本分析,网络安全,数据清洗,特征提取 数据概述:...
    packageimg