-
斯洛伐克虚假新闻检测数据集-2023年-matejkore
斯洛伐克虚假新闻检测数据集-2023年-matejkore 数据来源:互联网公开数据 标签:虚假新闻,斯洛伐克,文本分类,数据集,教育,研究,机器学习,自然语言处理 数据概述:... -
社交媒体虚假新闻内容识别数据集-abhayku2002
社交媒体虚假新闻内容识别数据集-abhayku2002 数据来源:互联网公开数据 标签:虚假新闻,社交媒体,谣言,信息甄别,文本分析,自然语言处理,机器学习,舆情分析 数据概述:... -
维基百科电影剧情描述去名数据集-abbrivia
维基百科电影剧情描述去名数据集-abbrivia 数据来源:互联网公开数据 标签:电影,剧情,自然语言处理,主题建模,停用词,名字识别,维基百科 数据概述: 本数据集包含从维基百科抓取的35,000部电影的剧情描述,并移除了其中的所有名字。数据集通过内置的命名实体识别(NER)技术生成,并经过hunspell... -
索马里语文本语料库-清洗后句子数据集-hassen7
索马里语文本语料库-清洗后句子数据集-hassen7 数据来源:互联网公开数据 标签:索马里语,语言学,文本数据,自然语言处理,句子,清洗,语料库 数据概述:... -
教育类聊天机器人意图识别数据集-leewanhung
教育类聊天机器人意图识别数据集-leewanhung 数据来源:互联网公开数据 标签:聊天机器人,意图识别,教育,自然语言处理,对话系统,机器学习,文本数据 数据概述: 本数据集旨在支持教育领域聊天机器人的构建,包含多种意图,以适应广泛的对话场景。 数据集包括核心意图和组合意图,旨在增强聊天机器人的交互能力。 核心意图:... -
数据2020至2023年英超转会新闻文章数据集-crxxom
2020至2023年英超转会新闻文章数据集-crxxom 数据来源:互联网公开数据 标签:足球,转会市场,新闻,英超,自然语言处理,NLP,90min.com,体育新闻 数据概述:... -
新闻真伪辨别文本分类数据集-neupane9sujal
新闻真伪辨别文本分类数据集-neupane9sujal 数据来源:互联网公开数据 标签:新闻,真伪,假新闻,文本分类,自然语言处理,机器学习,标题,文本,标签 数据概述: 本数据集包含新闻文章的标题、正文以及真伪标签,可用于进行假新闻检测任务。数据集旨在帮助初学者学习文本分类技术,了解如何利用机器学习模型识别新闻的真伪。 数据包含以下字段:... -
斯瓦希里语句子标注数据集-2023-hassen7
斯瓦希里语句子标注数据集-2023-hassen7 数据来源:互联网公开数据 标签:斯瓦希里语,句子标注,自然语言处理,文本分析,语言学,数据集,语料库 数据概述:... -
-
亚马逊EchoDotGen3产品评论情感分析数据集-pradeeshprabhakar
亚马逊EchoDotGen3产品评论情感分析数据集-pradeeshprabhakar 数据来源:互联网公开数据 标签:亚马逊,Echo Dot,产品评论,情感分析,文本挖掘,自然语言处理,nltk,情感标签,消费者反馈 数据概述: 本数据集包含了从亚马逊印度站(amazon.in)上抓取的Echo Dot... -
教育数据PII信息检测与移除数据集MiniDS版本1-训练集与验证集-neslihanozeryildiz
教育数据PII信息检测与移除数据集MiniDS版本1-训练集与验证集-neslihanozeryildiz 数据来源:互联网公开数据 标签:PII检测,教育数据,机器学习,自然语言处理,训练集,验证集,Kaggle,数据增强 数据概述: 本数据集是基于原始教育数据构建的,用于个人身份信息(PII,Personally Identifiable... -
电子商务嘈杂评论文本规范化数据集-sakshijain23
电子商务嘈杂评论文本规范化数据集-sakshijain23 数据来源:互联网公开数据 标签:电商评论,文本规范化,自然语言处理,短语识别,数据清洗,文本分析 数据概述:... -
ChatGPT应用用户评价数据集-全球用户反馈-PlayStore-多国-2024-humairmunir
ChatGPT应用用户评价数据集-全球用户反馈-PlayStore-多国-2024-humairmunir 数据来源:互联网公开数据 标签:ChatGPT, 评论, 用户反馈, 情感分析, 自然语言处理, 应用评估, Play Store, 移动应用, 多语言, 市场调研 数据概述: 本数据集包含100,000条来自Google Play... -
特朗普政府简报与声明数据集
特朗普政府简报与声明数据集 数据来源:互联网公开数据 标签:特朗普, 政府简报, 声明, 言论分析, 政策文本, 数据挖掘, 自然语言处理 数据概述 本数据集包含特朗普政府任期内所有公开的简报与声明内容,数据来源于白宫官方网站的“简报与声明”部分。数据集通过网络爬取方式获取,涵盖了特朗普政府期间发布的各类声明和简报,记录了其具体内容及相关元数据。... -
短信垃圾信息检测数据集-2023-faisalhossainruet
短信垃圾信息检测数据集-2023-faisalhossainruet 数据来源:互联网公开数据 标签:短信,垃圾信息,文本处理,NLP,预处理,自然语言处理,机器学习,数据集 数据概述:... -
科学家与公众人物推文数据集
科学家与公众人物推文数据集 数据来源:互联网公开数据 标签:推文,社交媒体,科学家,公众人物,时间序列,文本分析,自然语言处理 数据概述 本数据集包含来自多位活跃科学家和公众人物的推文记录,涵盖了从唐纳德·特朗普(Donald Trump)和希拉里·克林顿(Hillary Clinton)到尼尔·德格拉斯·泰森(Neil deGrasse... -
推特网络热门话题峰值检测数据集-milankalkenings
推特网络热门话题峰值检测数据集-milankalkenings 数据来源:互联网公开数据 标签:推特,社交媒体,话题分析,峰值检测,时间序列,文本挖掘,数据挖掘,自然语言处理,内容摘要,话题演化 数据概述:... -
多场景对话数据集-2023-itsashyadav
多场景对话数据集-2023-itsashyadav 数据来源:互联网公开数据 标签:对话数据,自然语言处理,社交互动,视频转录,人工智能,场景模拟,销售,事件讨论 数据概述:... -
人工智能论文摘要风格转换数据集-prathapkashyap
人工智能论文摘要风格转换数据集-prathapkashyap 数据来源:互联网公开数据 标签:人工智能,论文摘要,风格转换,自然语言处理,平行语料库,GPT-4,文本生成,风格迁移 数据概述:... -
乌克兰语情感分析调查问卷回复数据集-annzhukova340
乌克兰语情感分析调查问卷回复数据集-annzhukova340 数据来源:互联网公开数据 标签:乌克兰语,情感分析,文本分类,自然语言处理,调查数据,情感标签,机器学习,语言学 数据概述: 本数据集包含了18,000份以乌克兰语书写的调查问卷回复。 数据集经过平衡处理,包含: 9,000份正面回复 9,000份负面回复 每条记录由两部分组成:...