-
维基百科多语言文本识别数据集-2018
维基百科多语言文本识别数据集-2018 数据来源:互联网公开数据 标签:文本识别,多语言,维基百科,自然语言处理,机器学习,语言学,文本分类,数据集 数据概述: WiLI-2018数据集是一个用于评估多语言文本识别任务的基准数据集,包含了来自维基百科的235种语言的235,000个文本段落。该数据集经过精心平衡,并提供了训练集和测试集划分。... -
-
过滤后的TMDB电影数据集
过滤后的TMDB电影数据集 数据来源:互联网公开数据 标签:电影,推荐系统,数据集,影评分析,演员组合,导演风格,电影概述,数据预处理 数据概述:... -
KagglePlaygroundSeason4Episode9公开提交作品融合数据集-2024年9月
KagglePlaygroundSeason4Episode9公开提交作品融合数据集-2024年9月 数据来源:互联网公开数据 标签:Kaggle, Playground, 竞赛, 机器学习, 数据集, 汽车, 预测, 融合 数据概述: 本数据集是为Kaggle Playground Season 4 Episode... -
Ookla全球互联网速度测试数据集-2020年
Ookla全球互联网速度测试数据集-2020年 数据来源:互联网公开数据 标签:互联网速度,宽带测试,移动网络,数据可视化,全球网络性能,Speedtest,数据集,网络智能,速度测试,地理信息 数据概述:... -
宝可梦GO乌诺字母图像数据集
宝可梦GO乌诺字母图像数据集 数据来源:互联网公开数据 标签:宝可梦,POKEMON,乌诺,字母,图像数据,机器学习,数据集,教育,娱乐 数据概述:... -
指数积分数据集20000样本1963-2021
指数积分数据集20000样本1963-2021 数据来源:互联网公开数据 标签:指数积分,随机生成,数据集,数学分析,函数分析,教育工具 数据概述:... -
LSBR载荷与校准数据集
LSBR载荷与校准数据集 数据来源:互联网公开数据 标签:LSBR, 空间域, 隐写术, 校准, 数据集, 图像处理, CSM算法 数据概述: 本数据集用于支持论文《CSM问题求解技术在图像空间域LSBR隐写术中的应用》(SUMMA 2024)。数据集包含了LSBR(Least Significant Bit... -
基于DeLP程序的参数与查询时间评估数据集
基于DeLP程序的参数与查询时间评估数据集 数据来源:互联网公开数据 标签:DeLP,程序生成,参数,查询时间,人工智能,逻辑编程,数据集,评估 数据概述: 本数据集包含了用于合成生成DeLP程序的参数值。这些程序由DeLP程序生成器(DPG)生成。 数据集记录了生成程序时使用的参数值,以及一个标签,该标签指示查询每个程序中文字所需的时间是否超过1秒。... -
人工智能生成的填字游戏线索数据集
人工智能生成的填字游戏线索数据集 数据来源:互联网公开数据 标签:人工智能,填字游戏,线索生成,自然语言处理,数据集,机器学习 数据概述:... -
ISLR第二版数据集
ISLR第二版数据集 数据来源:互联网公开数据 标签:ISLR,统计学习,机器学习,数据集,第二版,学习资源,数据分析,统计建模 数据概述: 本数据集包含了《统计学习基础》第二版(ISLR, Second Edition)一书中所有示例数据集。这些数据集涵盖了统计学习和机器学习领域的各种主题,为学习者和研究者提供了丰富的实践材料。 数据用途概述:... -
印度尼西亚英语歌曲音频特征数据集1960-2023
印度尼西亚英语歌曲音频特征数据集1960-2023 数据来源:互联网公开数据 标签:英语歌曲,音频特征,音乐分析,多样性,Spotify,数据集 数据概述: 本数据集包含超过65,000首来自不同流派、年代和艺术表达的英文歌曲,涵盖了从1960年至2023年的丰富音乐资源。数据集不仅收录了每首歌曲的名称、艺术家、Spotify... -
Tox21药物毒性预测化学化合物数据集-2021
Tox21药物毒性预测化学化合物数据集-2021 数据来源:互联网公开数据 标签:Tox21,药物毒性,化学化合物,机器学习,预测,毒理学实验,数据集,科研,教育 数据概述:... -
图像数据集分类研究灰度图像数据集1963-2021
图像数据集分类研究灰度图像数据集1963-2021 数据来源:互联网公开数据 标签:图像分类,灰度图像,机器学习,深度学习,计算机视觉,数据集 数据概述: 本数据集包含60张灰度图像,分为6个不同的类别(标记为1-6)。每张图像的像素值范围在0到255之间,图像尺寸为256 x 384像素。所有图像已展平为一个一维数组,大小为98,304。... -
德语到英语机器翻译数据集
德语到英语机器翻译数据集 数据来源:互联网公开数据 标签:机器翻译,德语,英语,数据集,PyTorch,自然语言处理,翻译模型 数据概述: 本数据集包含用于机器翻译的德语到英语句子对,旨在为翻译模型的训练和评估提供数据支持。数据集由28975条训练数据和1000条测试数据组成,涵盖了多样化的语言表达和上下文。 数据用途概述:... -
Kaggle平台公开数据集汇总与分析数据集
Kaggle平台公开数据集汇总与分析数据集 数据来源:互联网公开数据 标签:Kaggle,数据集,数据科学,机器学习,数据分析,开放数据,竞赛,研究,统计 数据概述:... -
WikiQA开放域问答数据集-问题与句子对-开放域问答研究
WikiQA开放域问答数据集-问题与句子对-开放域问答研究 数据来源:互联网公开数据 标签:问答系统,自然语言处理,文本匹配,信息检索,知识库,开放域问答,WikiQA,机器学习,数据集 数据概述:... -
星际编码器自指令数据集-自然语言处理指令生成-2024
星际编码器自指令数据集-自然语言处理指令生成-2024 数据来源:互联网公开数据 标签:自然语言处理,指令生成,语言模型,机器学习,数据集,星际编码器,Stanford Alpaca,CC0 数据概述:... -
-
乳腺癌影像与临床特征数据集
乳腺癌影像与临床特征数据集 数据来源:互联网公开数据 标签:乳腺癌,影像,临床,诊断,医学,肿瘤,影像组学,TCIA,数据集 数据概述: 本数据集收录了来自 https://www.cancerimagingarchive.net/collections/...