-
-
职位技能集数据集
职位技能集数据集 数据来源:互联网公开数据 标签:职位技能,招聘,技能提取,自然语言处理,职位匹配,推荐系统,行业分析 数据概述: 职位技能集数据集旨在用于与职位匹配、技能提取和自然语言处理相关的机器学习项目。数据集包含了职位角色、描述及其相关技能集的详细信息,使开发者和研究者能够构建和评估职业生涯推荐系统、简历解析和技能推断的模型。...
-
每日韩语对话数据集2017-2020
每日韩语对话数据集2017-2020 数据来源:互联网公开数据 标签:韩语学习,对话数据,双语对照,教育工具,语言研究,文本挖掘,自然语言处理 数据概述: 本数据集包含了2017年12月4日至2020年8月19日期间,从Naver Dictionary每日对话栏目中提取的韩语-...
-
降世神通-最后的气宗全集剧本数据集
降世神通-最后的气宗全集剧本数据集 数据来源:互联网公开数据 标签:降世神通,角色台词,文本分析,剧情研究,娱乐产业,文化研究 数据概述 本数据集包含了热门动画剧集《降世神通:最后的气宗》(Avatar: The Last Airbender)的完整剧本内容,数据来源为 fandom wiki...
-
知识符号关联与大语言模型数据集
知识符号关联与大语言模型数据集 数据来源:互联网公开数据 标签:知识符号关联,大语言模型,LLM,机器学习,自然语言处理,提示生成,知识表示 数据概述:...
-
性别预测通过名字数据集
性别预测通过名字数据集 数据来源:互联网公开数据 标签:性别预测,名字分析,机器学习, TensorFlow, Keras, 数据预处理, 模型评估 数据概述: 本数据集包含一组名字及其对应性别(男性或女性)的训练数据,旨在用于训练机器学习模型,以预测未见过的名字的性别。数据集包含了多种名字以及它们的性别标签,用于构建和评估性别预测模型。...
-
-
-
推特情感分析竞赛伪标签推文数据集-2020年
推特情感分析竞赛伪标签推文数据集-2020年 数据来源:互联网公开数据 标签:推特,情感分析,自然语言处理,伪标签,文本分类,竞赛,机器学习,社交媒体 数据概述:...
-
Subros员工评价数据集-2023年
Subros员工评价数据集-2023年 数据来源:互联网公开数据 标签:员工评价,Subros,汽车空调,印度,工作环境,职业发展,公司文化,HR分析,NLP,文化分析 数据概述: 本数据集包含从Ambition Box平台收集的Subros员工评价数据,Ambition...
-
Reddit印度板块帖子标签预测数据集-2024
Reddit印度板块帖子标签预测数据集-2024 数据来源:互联网公开数据 标签:Reddit,印度,社交媒体,文本分析,机器学习,自然语言处理,标签预测,内容分类,PRAW API 数据概述: 本数据集来源于Reddit社交平台上的r/india子版块,通过PRAW...
-
印度板球超级联赛自动评论数据集
印度板球超级联赛自动评论数据集 数据来源:互联网公开数据 标签:印度板球超级联赛,自动评论,板球,比赛亮点,数据探索,体育分析,机器学习 数据概述:...
-
俄罗斯传记文本语料库1963-2021
俄罗斯传记文本语料库1963-2021 数据来源:互联网公开数据 标签:传记文本,俄罗斯,自然语言处理,文本挖掘,生物信息提取,主题分类 数据概述:...
-
科学文献关键词分析数据集1963-2021
科学文献关键词分析数据集1963-2021 数据来源:互联网公开数据 标签:科学文献,关键词,作者关键词,自动关键词,Web of Science,文本分析,自然语言处理 数据概述: 本数据集包含了从Web of Science...
-
动物与萨马巴杜尔电影推特情感分析数据集
动物与萨马巴杜尔电影推特情感分析数据集 数据来源:互联网公开数据 标签:电影推特,情感分析,自然语言处理,文本挖掘,动物,萨马巴杜尔,公众意见 数据概述: 本数据集包含与电影“动物”和“萨马巴杜尔”相关的推特集合,从Twitter公共API提取。每个数据条目代表一条单独的推特,未附带情感标签。 数据格式: 文件格式:CSV 列:单列包含原始推特文本...
-
俄罗斯语言设备评论情感分析数据集
俄罗斯语言设备评论情感分析数据集 数据来源:互联网公开数据 标签:评论分析,情感分析,俄罗斯语言,设备评价,文本挖掘,自然语言处理 数据概述:...
-
包含-机器学习-关键词的推文数据集
包含-机器学习-关键词的推文数据集 数据来源:互联网公开数据 标签:推文,机器学习,社交媒体分析,自然语言处理,文本挖掘 数据概述: 本数据集收录了在推特平台上包含日语关键词“機械学習”(机器学习)的相关推文记录。数据包括推文的发布时间、作者信息、推文内容等关键字段,为研究机器学习领域的社交媒体讨论提供了丰富的数据资源。 数据用途概述:...
-
-
星巴克评论数据集
星巴克评论数据集 数据来源:互联网公开数据 标签:星巴克,评论,情感分析,自然语言处理,文本分类,数据清洗,商业分析 数据概述: 本数据集包含700条星巴克评论数据,涵盖5个字段:用户名称、位置、日期、评分和评论内容。评论内容为原始文本,未经过预处理。数据集旨在为自然语言处理任务提供基础数据支持,适用于情感分析、文本分类等场景。 数据用途概述:...
-
俄罗斯敏感话题不适当言论数据集
俄罗斯敏感话题不适当言论数据集 数据来源:互联网公开数据 标签:敏感话题,不适当言论,网络言论,俄罗斯,自然语言处理,文本分析,社会学研究 数据概述: 本数据集专注于收集和分析涉及敏感话题的不适当言论,这些言论可能引起读者的不适或损害发言者的声誉。不适当性概念接近于毒性,但明确的毒性和明显的...



