-
动物与萨马巴杜尔电影推特情感分析数据集
动物与萨马巴杜尔电影推特情感分析数据集 数据来源:互联网公开数据 标签:电影推特,情感分析,自然语言处理,文本挖掘,动物,萨马巴杜尔,公众意见 数据概述: 本数据集包含与电影“动物”和“萨马巴杜尔”相关的推特集合,从Twitter公共API提取。每个数据条目代表一条单独的推特,未附带情感标签。 数据格式: 文件格式:CSV 列:单列包含原始推特文本... -
俄罗斯语言设备评论情感分析数据集
俄罗斯语言设备评论情感分析数据集 数据来源:互联网公开数据 标签:评论分析,情感分析,俄罗斯语言,设备评价,文本挖掘,自然语言处理 数据概述:... -
包含-机器学习-关键词的推文数据集
包含-机器学习-关键词的推文数据集 数据来源:互联网公开数据 标签:推文,机器学习,社交媒体分析,自然语言处理,文本挖掘 数据概述: 本数据集收录了在推特平台上包含日语关键词“機械学習”(机器学习)的相关推文记录。数据包括推文的发布时间、作者信息、推文内容等关键字段,为研究机器学习领域的社交媒体讨论提供了丰富的数据资源。 数据用途概述:... -
-
星巴克评论数据集
星巴克评论数据集 数据来源:互联网公开数据 标签:星巴克,评论,情感分析,自然语言处理,文本分类,数据清洗,商业分析 数据概述: 本数据集包含700条星巴克评论数据,涵盖5个字段:用户名称、位置、日期、评分和评论内容。评论内容为原始文本,未经过预处理。数据集旨在为自然语言处理任务提供基础数据支持,适用于情感分析、文本分类等场景。 数据用途概述:... -
俄罗斯敏感话题不适当言论数据集
俄罗斯敏感话题不适当言论数据集 数据来源:互联网公开数据 标签:敏感话题,不适当言论,网络言论,俄罗斯,自然语言处理,文本分析,社会学研究 数据概述: 本数据集专注于收集和分析涉及敏感话题的不适当言论,这些言论可能引起读者的不适或损害发言者的声誉。不适当性概念接近于毒性,但明确的毒性和明显的... -
写作质量分析文本变化补充数据集
写作质量分析文本变化补充数据集 数据来源:互联网公开数据 标签:写作质量,文本变化,竞赛数据,学术研究,自然语言处理,数据补充,文本分析 数据概述:... -
土耳其新闻文章数据集2017-2021
土耳其新闻文章数据集2017-2021 数据来源:互联网公开数据 标签:土耳其新闻,文章数据,自然语言处理,停用词,作者分析,时间序列,新闻研究 数据概述:... -
基因组生物医学事件数据集
基因组生物医学事件数据集 数据来源:互联网公开数据 标签:生物医学文本,事件标注,自然语言处理,NLP,药物效果分析,医学条件识别,数据集简化版 数据概述: 本数据集是GENIA事件标注数据集的简化版本,来源于TEES平台,基于BioNLP共享任务2011(BioNLP Shared Task... -
-
LinkedIn职位招聘信息数据集-2024年
LinkedIn职位招聘信息数据集-2024年 数据来源:互联网公开数据 标签:LinkedIn,招聘,职位,就业,数据分析,自然语言处理,文本挖掘,职位描述 数据概述: 本数据集来源于LinkedIn网站的职位招聘信息抓取结果,包含了多个关键字段,用于深入分析职位招聘趋势和就业市场动态。数据主要包含以下字段:... -
Quora平台重复问题识别数据集
Quora平台重复问题识别数据集 数据来源:互联网公开数据 标签:Quora,问答平台,重复问题,自然语言处理,文本相似度,数据挖掘,用户体验 数据概述:... -
立场检测多领域用户观点数据集2021
立场检测多领域用户观点数据集2021 数据来源:互联网公开数据 标签:立场检测,自然语言处理,社交媒体分析,情感分析,讽刺检测,COVID-19疫苗,数字转型,女性赋权 数据概述:... -
新闻文章摘要数据集
新闻文章摘要数据集 数据来源:互联网公开数据 标签:新闻,文章,摘要,标题,超链接,内容,文本分析,自然语言处理 数据概述: 本数据集包含了新闻文章的标题、超链接和正文内容。数据集覆盖了广泛的新闻来源,提供了丰富的文本信息,适用于新闻分析、文本摘要生成和自然语言处理等多种应用场景。 数据用途概述:... -
基于文本的分类数据集
基于文本的分类数据集 数据来源:互联网公开数据 标签:文本分类,区块链,机器学习,自然语言处理,数据标注,监督学习,领域特定文本 数据概述 本数据集旨在基于文本内容对样本进行分类,数据来源于区块链领域相关的文本资料。数据集包含两部分内容: -... -
电影壮志凌云2-独行侠影评情感分析数据集-2022年
电影壮志凌云2-独行侠影评情感分析数据集-2022年 数据来源:互联网公开数据 标签:电影,影评,情感分析,自然语言处理,NLP,好莱坞,票房,评论,观众反馈 数据概述: 本数据集包含电影《壮志凌云2:独行侠》(Top Gun:... -
恐怖小说作者识别数据集
恐怖小说作者识别数据集 数据来源:互联网公开数据 标签:恐怖小说,作者识别,文本分析,机器学习,自然语言处理 数据概述: 本数据集包含多篇由不同恐怖小说作者撰写的文本样本,旨在用于作者识别任务。数据集涵盖了多位著名恐怖小说作者的作品,每篇文本均标注了相应的作者身份,为研究和开发作者识别模型提供了丰富的训练和测试材料。 数据用途概述:... -
阿拉伯语指令与响应文化相关性研究数据集
阿拉伯语指令与响应文化相关性研究数据集 数据来源:互联网公开数据 标签:阿拉伯语指令,文化相关性,语言模型训练,自然语言处理,跨文化研究,人工智能,机器学习 数据概述:... -
Eedi数学竞赛学生解题思维链增强数据集-2023
Eedi数学竞赛学生解题思维链增强数据集-2023 数据来源:互联网公开数据 标签:Eedi,数学,思维链,ChatGPT,增强,竞赛,教育,机器学习,自然语言处理 数据概述: 本数据集是Eedi数学竞赛数据的思维链(Chain-of-Thought,... -
全球社交平台Pinterest热门内容数据集
全球社交平台Pinterest热门内容数据集 数据来源:互联网公开数据 标签:内容分析, 图像分析, 自然语言处理, 社交媒体, 趋势分析, 图网络分析 数据集简介: 本数据集汇总了Pinterest平台上高人气内容(Pins)的结构化信息,包含图像内容、文本描述、标题信息与受欢迎程度(Repin次数)等关键指标。该数据集由Oneli...