-
灾害推文分类训练数据集
灾害推文分类训练数据集 数据来源:互联网公开数据 标签:灾害推文,自然灾害,文本分类,机器学习,训练数据 数据概述: 本数据集是用于自然语言处理(NLP)的灾害推文分类任务的更新版训练集,包含了一些简短的推文,并且已经进行了填充处理。数据集中的每条推文都标注了是否与灾害相关,适用于训练灾害推文分类模型。 数据用途概述:...
-
维基百科多语言文本识别数据集-2018
维基百科多语言文本识别数据集-2018 数据来源:互联网公开数据 标签:文本识别,多语言,维基百科,自然语言处理,机器学习,语言学,文本分类,数据集 数据概述: WiLI-2018数据集是一个用于评估多语言文本识别任务的基准数据集,包含了来自维基百科的235种语言的235,000个文本段落。该数据集经过精心平衡,并提供了训练集和测试集划分。...
-
机器设备预测性维护故障诊断数据集
机器设备预测性维护故障诊断数据集 数据来源:互联网公开数据 标签:机器设备,预测性维护,故障诊断,工业,时间序列,机器学习,故障类型 数据概述: 本数据集为合成数据集,模拟了工业环境中机器设备预测性维护的场景。数据集包含10,000个数据点,每个数据点对应一个机器设备状态的快照,共有14个特征。 特征包括: UID:唯一标识符,范围从1到10000。...
-
DeepSeek与ChatGPT人工智能平台表现对比数据集-2023年7月至2025年2月
DeepSeek与ChatGPT人工智能平台表现对比数据集-2023年7月至2025年2月 数据来源:互联网公开数据 标签:人工智能,AI,ChatGPT,DeepSeek,性能对比,用户行为,时间序列,数据分析,机器学习,自然语言处理 数据概述: 本数据集模拟生成了2023年7月至2025年2月期间,ChatGPT (GPT-4-turbo) 和...
-
-
-
AI文本生成图像推特数据集
AI文本生成图像推特数据集 数据来源:互联网公开数据 标签:AI文本生成图像,推特数据,社交媒体分析,文本挖掘,图像生成,服务流行度,用户反馈 数据概述: 本数据集收录了关于互联网上最流行的文本生成图像AI服务的推特记录,涵盖dalle2、glide、imagen、stablediffusion及其相关关键词。数据通过Twitter...
-
北美Yelp商家地理位置划分数据集
北美Yelp商家地理位置划分数据集 数据来源:互联网公开数据 标签:Yelp,商家,地理位置,区域划分,北美,商业,数据分析 数据概述: 本数据集基于Kaggle上公开的Yelp数据集,旨在为北美地区Yelp商家进行地理位置划分。数据集中包含两个字段:business_id 和 metro_area。 business_id...
-
IMDb电影信息与用户评价数据集-1990至2023
IMDb电影信息与用户评价数据集-1990至2023 数据来源:互联网公开数据 标签:电影,IMDb,评价,票房,演员,导演,电影类型,用户评论,数据分析 数据概述:...
-
可疑微博数据集
可疑微博数据集 数据来源:互联网公开数据 标签:社交媒体,文本分类,异常检测,网络安全,内容监管,自然语言处理,情感分析 数据概述 本数据集包含一批经过分类的社交媒体文本数据,主要用于识别和分析可疑内容。数据中的每条记录代表一条微博文本,并根据其是否具有可疑特征被标注为“可疑”或“非可疑”。具体标注规则如下: - 可疑 = 1 - 非可疑 = 0...
-
-
精酿啤酒配方与风格特征分析数据集
精酿啤酒配方与风格特征分析数据集 数据来源:互联网公开数据 标签:精酿啤酒,啤酒配方,啤酒风格,酒精度,苦味值,颜色值,酿造工艺 数据概述: 本数据集收录了来自Brewer's...
-
SSD和HDD性能基准数据集
SSD和HDD性能基准数据集 数据来源:互联网公开数据 标签:SSD, HDD, 存储驱动器, 性能基准, 数据比较, PC购买, 数据中心 数据概述: 本数据集包含了截至2022年5月4日的SSD(固态硬盘)和HDD(机械硬盘)的性能基准测试数据。基准测试通过一系列标准化测试来评估存储驱动器的性能,包括顺序读写、随机寻道读写(IOPS...
-
数据1902至2022年电影评分数据集
数据1902至2022年电影评分数据集 数据来源:互联网公开数据 标签:电影评分,电影信息,电影历史,时间序列,娱乐分析,观众偏好,电影产业 数据概述:...
-
-
freeCodeCamp-orgYouTube频道视频数据分析数据集-2024年6月
freeCodeCamp-orgYouTube频道视频数据分析数据集-2024年6月 数据来源:互联网公开数据 标签:YouTube,视频,编程,教育,技术,数据分析,freeCodeCamp.org,计算机科学 数据概述: 本数据集收录了freeCodeCamp.org...
-
维基百科页面LLM科学考试训练数据集
维基百科页面LLM科学考试训练数据集 数据来源:互联网公开数据 标签:维基百科,LLM,科学考试,训练数据,物理概念,文本提取,教育研究 数据概述:...
-
洋葱新闻讽刺文章数据集
洋葱新闻讽刺文章数据集 数据来源:互联网公开数据 标签:讽刺新闻,洋葱,媒体分析,文本数据,图像数据,新闻趋势,幽默文化 数据概述: 本数据集收录了来自《洋葱》(The...
-
SFU评论语料库-否定标注数据集
SFU评论语料库-否定标注数据集 数据来源:互联网公开数据 标签:自然语言处理,情感分析,否定标注,文本语料,电影书评,消费者评价,机器学习 数据概述:...
-
印度政治舆情分析数据集2020-2023
印度政治舆情分析数据集2020-2023 数据来源:互联网公开数据 标签:印度政治,舆情分析,社会媒体,公众意见,情感分析,趋势分析,政治研究,NLP 数据概述:...



