数据集 - 海数据

英语俳句与短诗数据集

2025年4月15日

英语俳句与短诗数据集数据来源：互联网公开数据标签：俳句,短诗,英语诗歌,语言文学,诗歌分析,数据集,文本分析数据概述：...

ZIP

职位技能集数据集

2025年4月15日

职位技能集数据集数据来源：互联网公开数据标签：职位技能,招聘,技能提取,自然语言处理,职位匹配,推荐系统,行业分析数据概述：职位技能集数据集旨在用于与职位匹配、技能提取和自然语言处理相关的机器学习项目。数据集包含了职位角色、描述及其相关技能集的详细信息，使开发者和研究者能够构建和评估职业生涯推荐系统、简历解析和技能推断的模型。...

ZIP

每日韩语对话数据集2017-2020

2025年4月15日

每日韩语对话数据集2017-2020 数据来源：互联网公开数据标签：韩语学习,对话数据,双语对照,教育工具,语言研究,文本挖掘,自然语言处理数据概述：本数据集包含了2017年12月4日至2020年8月19日期间，从Naver Dictionary每日对话栏目中提取的韩语-...

ZIP

降世神通-最后的气宗全集剧本数据集

2025年4月15日

降世神通-最后的气宗全集剧本数据集数据来源：互联网公开数据标签：降世神通,角色台词,文本分析,剧情研究,娱乐产业,文化研究数据概述本数据集包含了热门动画剧集《降世神通：最后的气宗》（Avatar: The Last Airbender）的完整剧本内容，数据来源为 fandom wiki...

ZIP

知识符号关联与大语言模型数据集

2025年4月15日

知识符号关联与大语言模型数据集数据来源：互联网公开数据标签：知识符号关联,大语言模型,LLM,机器学习,自然语言处理,提示生成,知识表示数据概述：...

ZIP

性别预测通过名字数据集

2025年4月15日

性别预测通过名字数据集数据来源：互联网公开数据标签：性别预测,名字分析,机器学习, TensorFlow, Keras, 数据预处理, 模型评估数据概述：本数据集包含一组名字及其对应性别（男性或女性）的训练数据，旨在用于训练机器学习模型，以预测未见过的名字的性别。数据集包含了多种名字以及它们的性别标签，用于构建和评估性别预测模型。...

ZIP

推特情感分析数据集2021

2025年4月15日

推特情感分析数据集2021 数据来源：互联网公开数据标签：推特,情感分析,社交媒体,文本分析,自然语言处理,机器学习数据概述：...

ZIP

种族歧视检测数据集

2025年4月15日

种族歧视检测数据集数据来源：互联网公开数据标签：种族歧视,评论分析,自然语言处理,情感分析,偏见检测,机器学习,数据清洗数据概述：...

ZIP

推特情感分析竞赛伪标签推文数据集-2020年

2025年4月15日

推特情感分析竞赛伪标签推文数据集-2020年数据来源：互联网公开数据标签：推特,情感分析,自然语言处理,伪标签,文本分类,竞赛,机器学习,社交媒体数据概述：...

ZIP

Subros员工评价数据集-2023年

2025年4月15日

Subros员工评价数据集-2023年数据来源：互联网公开数据标签：员工评价,Subros,汽车空调,印度,工作环境,职业发展,公司文化,HR分析,NLP,文化分析数据概述：本数据集包含从Ambition Box平台收集的Subros员工评价数据，Ambition...

ZIP

Reddit印度板块帖子标签预测数据集-2024

2025年4月15日

Reddit印度板块帖子标签预测数据集-2024 数据来源：互联网公开数据标签：Reddit,印度,社交媒体,文本分析,机器学习,自然语言处理,标签预测,内容分类,PRAW API 数据概述：本数据集来源于Reddit社交平台上的r/india子版块，通过PRAW...

ZIP

印度板球超级联赛自动评论数据集

2025年4月15日

印度板球超级联赛自动评论数据集数据来源：互联网公开数据标签：印度板球超级联赛,自动评论,板球,比赛亮点,数据探索,体育分析,机器学习数据概述：...

ZIP

俄罗斯传记文本语料库1963-2021

2025年4月15日

俄罗斯传记文本语料库1963-2021 数据来源：互联网公开数据标签：传记文本,俄罗斯,自然语言处理,文本挖掘,生物信息提取,主题分类数据概述：...

ZIP

科学文献关键词分析数据集1963-2021

2025年4月15日

科学文献关键词分析数据集1963-2021 数据来源：互联网公开数据标签：科学文献,关键词,作者关键词,自动关键词,Web of Science,文本分析,自然语言处理数据概述：本数据集包含了从Web of Science...

ZIP

动物与萨马巴杜尔电影推特情感分析数据集

2025年4月15日

动物与萨马巴杜尔电影推特情感分析数据集数据来源：互联网公开数据标签：电影推特,情感分析,自然语言处理,文本挖掘,动物,萨马巴杜尔,公众意见数据概述：本数据集包含与电影“动物”和“萨马巴杜尔”相关的推特集合，从Twitter公共API提取。每个数据条目代表一条单独的推特，未附带情感标签。数据格式：文件格式：CSV 列：单列包含原始推特文本...

ZIP

俄罗斯语言设备评论情感分析数据集

2025年4月15日

俄罗斯语言设备评论情感分析数据集数据来源：互联网公开数据标签：评论分析,情感分析,俄罗斯语言,设备评价,文本挖掘,自然语言处理数据概述：...

ZIP

包含-机器学习-关键词的推文数据集

2025年4月15日

包含-机器学习-关键词的推文数据集数据来源：互联网公开数据标签：推文,机器学习,社交媒体分析,自然语言处理,文本挖掘数据概述：本数据集收录了在推特平台上包含日语关键词“機械学習”（机器学习）的相关推文记录。数据包括推文的发布时间、作者信息、推文内容等关键字段，为研究机器学习领域的社交媒体讨论提供了丰富的数据资源。数据用途概述：...

ZIP

土耳其社交媒体文本数据集

2025年4月15日

土耳其社交媒体文本数据集数据来源：互联网公开数据标签：社交媒体,文本分析,网络欺凌,情感分析,自然语言处理,土耳其语,机器学习数据概述：...

ZIP

星巴克评论数据集

2025年4月15日

星巴克评论数据集数据来源：互联网公开数据标签：星巴克,评论,情感分析,自然语言处理,文本分类,数据清洗,商业分析数据概述：本数据集包含700条星巴克评论数据，涵盖5个字段：用户名称、位置、日期、评分和评论内容。评论内容为原始文本，未经过预处理。数据集旨在为自然语言处理任务提供基础数据支持，适用于情感分析、文本分类等场景。数据用途概述：...