-
社区电视节目台词数据集1963-2021
社区电视节目台词数据集1963-2021 数据来源:互联网公开数据 标签:社区电视节目,台词,语言模型,文本分析,电视剧研究,文化研究,历史背景 数据概述: 本数据集收录了某社区电视节目的全部台词记录,涵盖了从1963年至2021年间的多个季度和剧集。数据集通过网络爬虫技术收集,为研究该节目提供了全面的台词文本资料,适合进行语言模型训练和文本分析。...
-
Kaggle-ConnectX决赛智能体对局数据集2023
Kaggle-ConnectX决赛智能体对局数据集2023 数据来源:互联网公开数据 本数据集来自 Kaggle 平台举办的 ConnectX 强化学习竞赛,收集了公开排行榜(Public Leaderboard)前 50 名智能体在比赛中进行的对局信息。原始对局以 JSON 格式保存,同时提取了所有对局中的动作与状态,共包含: 6367...
-
NBA球队统计数据集2000-2023
NBA球队统计数据集2000-2023 数据来源:互联网公开数据 标签:NBA,球队统计,赛季数据,比赛结果,球员表现,数据分析,体育研究 数据概述: 本数据集收录了2000年至2023年NBA常规赛期间各球队的统计数据,数据来源于篮球参考网(basketball-...
-
AI2逻辑艺术数据集
AI2逻辑艺术数据集 数据来源:互联网公开数据 标签:AI2,逻辑推理,自然语言处理,常识推理,机器学习,数据集,训练数据,语义算法,创业生态 数据概述: 该数据集由AI2(Allen Institute for AI)提供,是Huggingface...
-
IMDB电影描述与类型数据集
IMDB电影描述与类型数据集 数据来源:互联网公开数据 标签:电影,IMDB,电影类型,电影描述,电影数据,影视,娱乐,影评,数据挖掘 数据概述: 本数据集包含超过18000部电影的类型和描述信息,数据来源于IMDB(互联网电影数据库)官方网站。 数据集包含了电影名称、电影类型以及对电影内容的简要描述。 数据用途概述:...
-
Spotify平台精选音乐人-ThisIs-歌单歌曲数据集
Spotify平台精选音乐人-ThisIs-歌单歌曲数据集 数据来源:互联网公开数据 标签:Spotify,音乐,歌单,歌曲,艺术家,音乐数据,流媒体,流行音乐 数据概述: 本数据集通过spotipy库抓取了Spotify平台上32位知名音乐人的“This...
-
Reddit评论情感倾向与冒犯性评分数据集
Reddit评论情感倾向与冒犯性评分数据集 数据来源:互联网公开数据 标签:Reddit,评论,情感分析,冒犯性,自然语言处理,文本数据,社交媒体,评分数据 数据概述:...
-
洗碗机加速度计数据集
洗碗机加速度计数据集 数据来源:互联网公开数据 标签:洗碗机,加速度计,传感器数据,机器状态识别,智能家居,数据采集,时间序列分析 数据概述: 本数据集包含了从三星Galaxy...
-
美国大学体育协会2023年男子篮球赛预测比赛数据集
美国大学体育协会2023年男子篮球赛预测比赛数据集 数据来源:互联网公开数据 标签:NCAA,篮球赛,预测分析,评估指标,Brier评分,比赛数据,2023 数据概述: 本数据集包含2023年美国大学体育协会(NCAA)男子篮球赛的相关数据,用于 Kaggle...
-
高等教育数学学习评估平台学生答题数据集-2019年2月至2023年12月
高等教育数学学习评估平台学生答题数据集-2019年2月至2023年12月 数据来源:互联网公开数据 标签:数学教育,高等教育,学习评估,答题数据,数学平台,学习分析,学生表现 数据概述: 本数据集基于MathE数学平台,收录了9546条高等教育阶段数学题目的答题记录。MathE平台是MathE项目(mathe.pixel-...
-
特斯拉-NASDAQ股价预测数据集
特斯拉-NASDAQ股价预测数据集 数据来源:互联网公开数据 标签:特斯拉, NASDAQ, 股价预测, 人工智能, RNN神经网络, 时间序列预测, 金融分析, 预测模型 数据概述:...
-
Spotify音乐音频特征与排行榜数据分析数据集1970-2005
Spotify音乐音频特征与排行榜数据分析数据集1970-2005 数据来源:互联网公开数据 标签:Spotify,音乐,音频特征,排行榜,时间序列,音乐分析,流行音乐,数据挖掘,文化研究 数据概述:...
-
KEGG代谢关系网络数据集定向
KEGG代谢关系网络数据集定向 数据来源:互联网公开数据 标签:KEGG,代谢关系,生物分子相互作用网络,生物信息学,定向图,基因组学,代谢路径 数据概述: 本数据集来源于KEGG数据库,收录了生物分子间的代谢关系网络,具体包括代谢路径中的定向相互作用关系。数据集涵盖多种生物体的代谢途径,为研究生物分子间的相互作用提供了基础数据。 数据用途概述:...
-
BME688气味数据集
BME688气味数据集 数据来源:互联网公开数据 标签:气味识别,BME688传感器,ESP32,气体传感器,加热曲线,机器学习,数据分析 数据概述:...
-
Reddit食谱分享与互动分析数据集
Reddit食谱分享与互动分析数据集 数据来源:互联网公开数据 标签:食谱,Reddit,社交媒体,文本分析,NLP,烹饪,菜谱,用户互动,数据挖掘 数据概述:...
-
全球电影票房与评分数据集-TMDB电影数据-时间不限
全球电影票房与评分数据集-TMDB电影数据-时间不限 数据来源:互联网公开数据 标签:电影,票房,评分,TMDB,好莱坞,宝莱坞,电影数据,数据分析,机器学习 数据概述: 本数据集基于TMDB (The Movie Database)...
-
灾害推文分类训练数据集
灾害推文分类训练数据集 数据来源:互联网公开数据 标签:灾害推文,自然灾害,文本分类,机器学习,训练数据 数据概述: 本数据集是用于自然语言处理(NLP)的灾害推文分类任务的更新版训练集,包含了一些简短的推文,并且已经进行了填充处理。数据集中的每条推文都标注了是否与灾害相关,适用于训练灾害推文分类模型。 数据用途概述:...
-
维基百科多语言文本识别数据集-2018
维基百科多语言文本识别数据集-2018 数据来源:互联网公开数据 标签:文本识别,多语言,维基百科,自然语言处理,机器学习,语言学,文本分类,数据集 数据概述: WiLI-2018数据集是一个用于评估多语言文本识别任务的基准数据集,包含了来自维基百科的235种语言的235,000个文本段落。该数据集经过精心平衡,并提供了训练集和测试集划分。...
-
机器设备预测性维护故障诊断数据集
机器设备预测性维护故障诊断数据集 数据来源:互联网公开数据 标签:机器设备,预测性维护,故障诊断,工业,时间序列,机器学习,故障类型 数据概述: 本数据集为合成数据集,模拟了工业环境中机器设备预测性维护的场景。数据集包含10,000个数据点,每个数据点对应一个机器设备状态的快照,共有14个特征。 特征包括: UID:唯一标识符,范围从1到10000。...
-
DeepSeek与ChatGPT人工智能平台表现对比数据集-2023年7月至2025年2月
DeepSeek与ChatGPT人工智能平台表现对比数据集-2023年7月至2025年2月 数据来源:互联网公开数据 标签:人工智能,AI,ChatGPT,DeepSeek,性能对比,用户行为,时间序列,数据分析,机器学习,自然语言处理 数据概述: 本数据集模拟生成了2023年7月至2025年2月期间,ChatGPT (GPT-4-turbo) 和...



