数据集 - 海数据

OmdenaFAQ聊天机器人训练数据集

2025年4月14日

OmdenaFAQ聊天机器人训练数据集数据来源：互联网公开数据标签：聊天机器人,FAQ,自然语言处理,训练数据,互动网站,项目数据,Omdena 数据概述：...

ZIP

美国2024年夏季数据科学家职位招聘数据集

2025年4月14日

美国2024年夏季数据科学家职位招聘数据集数据来源：互联网公开数据标签：数据科学,招聘,职位,美国,远程,数据分析,数据可视化,文本分析,自然语言处理,机器学习数据概述：本数据集抓取自Indeed招聘网站，时间为2024年夏季，关键词为“数据科学家”。数据覆盖了美国所有州的职位招聘信息，包括远程职位，全面反映了该时期的数据科学就业市场状况。...

ZIP

综合新闻文章数据集

2025年4月14日

综合新闻文章数据集数据来源：互联网公开数据标签：新闻文章,自然语言处理,情感分析,主题建模,机器学习,文本分类,命名实体识别数据概述：本数据集汇集了来自多个来源的新闻文章，涵盖了包括科技、体育、金融、政治、教育、健康和娱乐在内的多个类别。数据集旨在为自然语言处理（NLP）任务、情感分析、主题建模等机器学习应用提供多样且广泛的数据支持。...

ZIP

意大利汽车金融公司客户评论数据集

2025年4月14日

意大利汽车金融公司客户评论数据集数据来源：互联网公开数据标签：汽车金融,意大利,客户评论,自然语言处理,Toyota,VolksWagen,Opel,PSA 数据概述：本数据集收录了2021年从谷歌评论中获取的四家意大利汽车金融公司的客户评论，包括Toyota Financial Services Italia、Volkswagen...

ZIP

产品情感分析数据集2022

2025年4月14日

产品情感分析数据集2022 数据来源：互联网公开数据标签：产品情感分析,自然语言处理,机器学习,预训练模型,情感分类,文本特征提取数据概述：...

ZIP

IMDB电影评论情感分析数据集-1万条评论-二元分类

2025年4月14日

IMDB电影评论情感分析数据集-1万条评论-二元分类数据来源：互联网公开数据标签：IMDB,电影评论,情感分析,文本分类,二元分类,自然语言处理,机器学习,情感极性数据概述：...

ZIP

刺客信条-奥德赛Steam平台用户评论情感分析数据集

2025年4月14日

刺客信条-奥德赛Steam平台用户评论情感分析数据集数据来源：互联网公开数据标签：刺客信条，奥德赛，Steam，游戏评论，情感分析，自然语言处理，用户反馈，游戏测评数据概述：...

ZIP

马恒达汽车员工评价数据集1963-2021

2025年4月14日

马恒达汽车员工评价数据集1963-2021 数据来源：互联网公开数据标签：马恒达汽车,员工评价,工作环境,公司文化,职业发展,工作生活平衡,情感分析,自然语言处理数据概述：本数据集收集了来自印度跨国汽车制造公司马恒达汽车员工在Ambition...

ZIP

数据16K长度文本指令数据集

2025年4月14日

数据16K长度文本指令数据集数据来源：互联网公开数据标签：文本指令,自然语言处理,机器学习模型,数据分析,文本分析,情感分析,指令比较数据概述：...

ZIP

耐克产品描述数据集

2025年4月14日

耐克产品描述数据集数据来源：互联网公开数据标签：耐克,产品描述,自然语言处理,语言模型,训练数据,电子商务,文本分析数据概述：本数据集包含从耐克官方网站抓取的400个耐克产品的详细描述信息，包括产品标题、副标题和产品描述三个字段。数据采用CSV格式存储，每一行代表一个产品的相关信息。数据用途概述：...

ZIP

孟加拉语文本噪声标注数据集-情感分析应用-2024

2025年4月14日

孟加拉语文本噪声标注数据集-情感分析应用-2024 数据来源：互联网公开数据标签：孟加拉语,文本,噪声,标注,情感分析,自然语言处理,W-NUT,机器学习,语言学数据概述：本数据集为多标签数据集，旨在用于孟加拉语文本中的噪声识别。该数据集由四位母语为孟加拉语的专家标注，标注可信度达到90%。Fleiss'...

ZIP

数据2017至2020年黎巴嫩社交网络阿拉伯化语言情感分析数据集

2025年4月14日

数据2017至2020年黎巴嫩社交网络阿拉伯化语言情感分析数据集数据来源：互联网公开数据标签：情感分析,阿拉伯化语言,社交媒体,黎巴嫩,数据集,自然语言处理,机器学习数据概述：...

ZIP

IMDB电影评论情感分析数据集-电影评论文本-电影评论文本-电影评论文本

2025年4月14日

IMDB电影评论情感分析数据集-电影评论文本-电影评论文本-电影评论文本数据来源：互联网公开数据标签：电影评论,情感分析,自然语言处理,文本分析,机器学习,深度学习,分类,IMDB,电影,评论数据概述：...

ZIP

词语难度评估数据集

2025年4月14日

词语难度评估数据集数据来源：互联网公开数据标签：词语难度,语言学,文本简化,深度学习,特征工程,自然语言处理,词频分析,二分类问题数据概述本数据集包含40,481条数据记录，主要用于评估词语的难度。数据集的每个实例包含多个特征，包括词语本身、词长、词频、词频的对数变换、平均反应时间（Mean...

ZIP

亚马逊购物查询数据集2022年

2025年4月14日

亚马逊购物查询数据集2022年数据来源：互联网公开数据标签：亚马逊,购物查询,产品搜索,电子商务,用户行为,自然语言处理,推荐系统数据概述：本数据集收录了亚马逊平台上的大规模购物查询记录，涵盖2022年期间的用户搜索数据。数据包括用户的查询文本、查询时间戳、查询结果的相关产品信息等，为提升产品搜索性能提供了丰富的基准数据。数据用途概述：...

ZIP

土耳其土耳其语推特字符数据集

2025年4月14日

土耳其土耳其语推特字符数据集数据来源：互联网公开数据标签：土耳其,推特,社交媒体,文本分析,自然语言处理,情感分析,字符数据数据概述：本数据集包含从Twitter API及其他多种来源收集的土耳其语推文，并经过伦理标注处理。数据集中的400个类别已被简化为30个类别，旨在为文本分析和自然语言处理任务提供丰富的数据基础。数据用途概述：...

ZIP

BBC印地语新闻文章数据集

2025年4月14日

BBC印地语新闻文章数据集数据来源：互联网公开数据标签：印地语新闻,新闻文本,自然语言处理,NLP,情感分析,语言模型,新闻分类数据概述：本数据集包含通过Python网络爬虫技术从BBC印地语新闻网站采集的大量新闻文章，涵盖了多个新闻类别。每个新闻条目包含以下三个核心字段：标题（Headline）：新闻文章的标题，用于概括新闻的主要内容。...

ZIP

人工智能推文情感分析数据集

2025年4月14日

人工智能推文情感分析数据集数据来源：互联网公开数据标签：人工智能,情感分析,推文,自然语言处理,社交媒体,数据挖掘,数据可视化,机器学习数据概述：...

ZIP

汽车规格数据集

2025年4月14日

汽车规格数据集数据来源：互联网公开数据标签：汽车规格,车辆信息,汽车品牌,发动机,变速箱,油耗,尺寸,数据清洗,自然语言处理,分类数据概述：...

ZIP

心理健康诊断数据集

2025年4月14日

心理健康诊断数据集数据来源：互联网公开数据标签：心理健康,诊断,自然语言处理,智能医疗,健康数据分析,情感分析,机器学习数据概述：本数据集用于自然语言处理和智能医疗领域，包含了大量的心理健康相关文本数据，如患者咨询记录、诊断报告等。数据集涵盖了不同心理健康状况的描述，为研究心理健康诊断提供了丰富的文本资源。数据用途概述：...

ZIP

找到11,965个数据集

注册成功！