-
IMDB演员与工作人员平均评分数据集-harannallasivanduke
IMDB演员与工作人员平均评分数据集-harannallasivanduke 数据来源:互联网公开数据 标签:IMDB, 电影, 评分, 演员, 导演, 制片人, 编剧, 摄影师, 数据分析, 电影产业 数据概述:... -
欧洲议会议事录说话者性别与年龄注释数据集
欧洲议会议事录说话者性别与年龄注释数据集 数据来源:互联网公开数据 标签:欧洲议会,说话者属性,性别,年龄,机器翻译,个性化翻译,平行语料库,自然语言处理 数据概述: 本数据集是对欧洲议会议事录的注释版本,标注了说话者的性别和年龄信息,注释粒度为句子级别。数据集包含英语-法语和英语-德语两个平行语料库,为研究个性化机器翻译提供了高质量的数据基础。... -
法国选举结果分析数据集
法国选举结果分析数据集 数据来源:互联网公开数据 标签:法国,选举,社会人口统计,地理分析,政策研究,数据可视化,选举趋势,社会经济因素 数据概述: 本数据集旨在比较法国选举结果与选民的... -
-
俄语社交媒体短文本情感分析与毒性检测数据集-RuTweetCorp-2012-maximsuvorov
俄语社交媒体短文本情感分析与毒性检测数据集-RuTweetCorp-2012-maximsuvorov 数据来源:互联网公开数据 标签:俄语,社交媒体,短文本,情感分析,毒性检测,文本分类,自然语言处理,机器学习,RuTweetCorp 数据概述: 本数据集源自论文《Рубцова Ю. Автоматическое построение и... -
CINIC-10图像数据集
CINIC-10图像数据集 数据来源:互联网公开数据 标签:图像分类,深度学习,数据增强,计算机视觉,机器学习,图像识别,基准测试,数据集扩展 数据概述: CINIC-10是一个基于CIFAR-10的扩展数据集,包含CIFAR-10的60,000张32x32... -
Spotify音乐与歌词数据集-1921至2020年-bwandowando
Spotify音乐与歌词数据集-1921至2020年-bwandowando 数据来源:互联网公开数据 标签:Spotify,音乐,歌词,数据集,多语言,嵌入模型,BAAI,bge-m3,歌单,音乐流派,国家排行榜,歌词API 数据概述:... -
Reddit社群-真实生活-幽默内容互动数据集-2022年4月1日
Reddit社群-真实生活-幽默内容互动数据集-2022年4月1日 数据来源:互联网公开数据 标签:Reddit,社交媒体,幽默,文化,情感,网络社区,文本分析,内容分析,meirl,me_irl 数据概述:... -
-
浮动光伏站点数据集-2011至2023年-mycolabfactory
浮动光伏站点数据集-2011至2023年-mycolabfactory 数据来源:互联网公开数据 标签:浮动光伏,光伏站点,太阳能,可再生能源,DOE项目,FSEC数据库,历史数据,实时数据 数据概述:... -
巴西葡萄牙语情感分析数据集-2016至2018年-fredericods
巴西葡萄牙语情感分析数据集-2016至2018年-fredericods 数据来源:互联网公开数据 标签:巴西葡萄牙语,情感分析,机器学习,自然语言处理,数据集,电商评论,电影评论,应用评论,预处理,教育,研究 数据概述:... -
青空文庫日文文学语料库数据集
青空文庫日文文学语料库数据集 数据来源:互联网公开数据 标签:日文文学,语料库,文本分析,自然语言处理,教育,文化研究 数据概述: 本数据集是将青空文庫(Aozora Bunko)中收录的日本文学文本编译成更易于使用的CSV格式。包含的经典文学作品涵盖了多个历史时期,为研究日文文本提供了丰富的资源。数据集旨在为研究日文写作和语言学项目提供基础数据支持。... -
Cyclistic共享单车用户骑行数据分析数据集-2016至2021年
Cyclistic共享单车用户骑行数据分析数据集-2016至2021年 数据来源:互联网公开数据 标签:共享单车,骑行数据,用户行为,时间序列分析,地理位置,会员制度,骑行时长,用户画像,数据分析 数据概述: 本数据集源自Google数据分析专业课程的结业项目,由Motivate International... -
胸部X光片医学影像数据集
胸部X光片医学影像数据集 数据来源:互联网公开数据 标签:肺结节检测,医学影像,胸部X光片,深度学习,医学分析,影像识别,医疗AI 数据概述: 本数据集包含数万张胸部X光片影像数据,分辨率适中,适用于医学影像分析任务。数据集中的图像经过标注,涵盖了肺结节、肺炎、肿瘤等病变区域,为医学影像研究提供了高质量的样本数据。 数据用途概述:... -
Reddit比特币相关评论数据集-2009至2019
Reddit比特币相关评论数据集-2009至2019 数据来源:互联网公开数据 标签:Reddit,比特币,评论,社交网络,数据收集,时间序列,市场趋势,投资行为,技术讨论 数据概述: 本数据集包含了2009年至2019年间Reddit上所有提及“比特币”关键词的评论,总计超过400万条评论。数据来源于Google... -
基于阅读理解的对话关系抽取数据集-QaZre-thedevastator
基于阅读理解的对话关系抽取数据集-QaZre-thedevastator 数据来源:互联网公开数据 标签:自然语言处理,关系抽取,阅读理解,知识图谱,对话,机器学习,文本分析 数据概述:...