-
电商平台商品评论数据集无标签-多品类商品评论-200k--mujdatcabuk
电商平台商品评论数据集无标签-多品类商品评论-200k--mujdatcabuk 数据来源:互联网公开数据 标签:电商,商品评论,用户评价,文本数据,自然语言处理,情感分析,无标签数据,评论数据 数据概述:... -
圣经英乌双语对照情感分析数据集-muhammadanasmahmood
圣经英乌双语对照情感分析数据集-muhammadanasmahmood 数据来源:互联网公开数据 标签:圣经,英语,乌尔都语,翻译,情感分析,宗教,文本数据,双语对照 数据概述:... -
大规模文本数据集分析报告
标题:大规模文本数据集分析报告 数据内容: 该数据集包含两个主要字段: 1. text:包含487,235种不同的文本值,覆盖了广泛的文本内容,可能是从互联网公开数据中提取的。 2. generated:包含2种不同的值,可能是二元分类字段(例如,"是"或"否"),用于标识文本是否为生成内容。 数据来源:互联网公开数据 数据用途: 1.... -
南非新冠疫苗接种相关推文数据集-2021年1月至2021年8月-ogbuokiriblessing
南非新冠疫苗接种相关推文数据集-2021年1月至2021年8月-ogbuokiriblessing 数据来源:互联网公开数据 标签:新冠疫情,疫苗,推文,社交媒体,南非,Twitter,文本数据,地理位置,疫苗接种,疫情传播 数据概述:... -
英国经济Twitter评论情感分析数据集-2021年3月20日-sanana
英国经济Twitter评论情感分析数据集-2021年3月20日-sanana 数据来源:互联网公开数据 标签:英国经济,Twitter,社交媒体,情感分析,自然语言处理,文本数据,时间序列,舆情分析 数据概述: 本数据集通过Twitter... -
俄罗斯Medsi医疗文章标题与正文数据集-kwyrob
俄罗斯Medsi医疗文章标题与正文数据集-kwyrob 数据来源:互联网公开数据 标签:医疗,文章,俄语,Medsi,健康,医学,文本数据,内容分析 数据概述:... -
Reddit平台r-Jokes版块笑话内容情感分析数据集
Reddit平台r-Jokes版块笑话内容情感分析数据集 数据来源:互联网公开数据 标签:Reddit,笑话,幽默,情感分析,自然语言处理,文本数据,社交媒体,用户互动,情感,语言 数据概述:... -
美国总统国情咨文文本数据集1790-2024年-nicholasheyerdahl
美国总统国情咨文文本数据集1790-2024年-nicholasheyerdahl 数据来源:互联网公开数据 标签:国情咨文,美国总统,演讲文本,历史,政治,政府,言论,文本数据,美国,18世纪,19世纪,20世纪,21世纪 数据概述:... -
阿萨姆语新闻文章数据集-新闻标题与正文-新闻18-东北现在--krishnabhdas
阿萨姆语新闻文章数据集-新闻标题与正文-新闻18-东北现在--krishnabhdas 数据来源:互联网公开数据 标签:阿萨姆语,新闻,文章,标题,正文,新闻18,东北现在,文本数据,自然语言处理,NLP 数据概述:... -
多样化文本数据集丰富的内容资源
标题:多样化文本数据集丰富的内容资源 数据内容: 该数据集包含多样化的文本信息,具体字段包括: 1. FileName:表示文件的名称,包含20000种不同的文件名,展示了数据集的广泛覆盖范围。 2. Font:表示文本使用的字体类型,共有20种不同的字体,反映了不同字体的使用情况。 3.... -
大型语言模型训练数据文法修正数据集-syoh0708
大型语言模型训练数据文法修正数据集-syoh0708 数据来源:互联网公开数据 标签:大型语言模型,文本数据,文法修正,自然语言处理,语言模型训练,文本处理 数据概述: 本数据集包含了两个经过文法修正的大型语言模型(LLM)训练数据集。 数据集一源自Kaggle上的“DAIGT Proper Train... -
高质量推特文本数据集-2023-mskorski
高质量推特文本数据集-2023-mskorski 数据来源:互联网公开数据 标签:推特,社交媒体,文本数据,机器学习,主题提取,数据集,自然语言处理 数据概述: 本数据集包含6000条高质量的原始推特文本,这些推特最初由Khuyen... -
索马里语文本语料库-清洗后句子数据集-hassen7
索马里语文本语料库-清洗后句子数据集-hassen7 数据来源:互联网公开数据 标签:索马里语,语言学,文本数据,自然语言处理,句子,清洗,语料库 数据概述:... -
教育类聊天机器人意图识别数据集-leewanhung
教育类聊天机器人意图识别数据集-leewanhung 数据来源:互联网公开数据 标签:聊天机器人,意图识别,教育,自然语言处理,对话系统,机器学习,文本数据 数据概述: 本数据集旨在支持教育领域聊天机器人的构建,包含多种意图,以适应广泛的对话场景。 数据集包括核心意图和组合意图,旨在增强聊天机器人的交互能力。 核心意图:... -
法国2022年总统选举候选人推文数据集-mathurinache
法国2022年总统选举候选人推文数据集-mathurinache 数据来源:互联网公开数据 标签:推文,社交媒体,法国大选,政治,舆情分析,文本数据,情感分析,候选人,Twitter 数据概述: 本数据集包含了通过Twitter... -
诗歌机器学习分析数据集-爱情-自然与神话与民间传说-文艺复兴与现代时期-ishnoor
诗歌机器学习分析数据集-爱情-自然与神话与民间传说-文艺复兴与现代时期-ishnoor 数据来源:互联网公开数据 标签:诗歌,机器学习,分类,文学分析,文艺复兴,现代,自然,爱情,神话,民间传说,文本数据 数据概述:... -
米德尔敦书屋笑话生成训练数据集-thedevastator
米德尔敦书屋笑话生成训练数据集-thedevastator 数据来源:互联网公开数据 标签:笑话生成,自然语言处理,幽默分析,机器学习,文本数据,训练集,教育 数据概述:... -
Reddit阴谋论社区加密货币讨论数据-r-ConspiracyTheory-时间跨度不限-gpreda
Reddit阴谋论社区加密货币讨论数据-r-ConspiracyTheory-时间跨度不限-gpreda 数据来源:互联网公开数据 标签:Reddit,阴谋论,加密货币,社交媒体,文本数据,社区讨论,情感分析,话题分析,数字货币,区块链 数据概述:... -
亚马逊耳机-耳塞-耳麦产品用户评论情感分析数据集-mohdhasankhan
亚马逊耳机-耳塞-耳麦产品用户评论情感分析数据集-mohdhasankhan 数据来源:互联网公开数据 标签:亚马逊,耳机,耳塞,耳麦,用户评论,情感分析,产品评价,客户反馈,文本数据,评分数据 数据概述:... -
俄罗斯娱乐明星访谈情感分析数据集-linata66
俄罗斯娱乐明星访谈情感分析数据集-linata66 数据来源:互联网公开数据 标签:访谈,情感分析,俄罗斯,名人,娱乐,文本数据,自然语言处理 数据概述: 本数据集基于多个杂志、文章和视频,收集了俄罗斯演艺界代表人物的访谈内容。数据涵盖了广泛的话题,包括科技、心理学、个人生活、职业发展等。数据集包含两列数据:序号和句子。 数据用途概述:...