-
GitHub热门仓库PR与Issue关联分析数据集GitHubPullRequest-IssueAssociationDataset-petrescustefan
GitHub热门仓库PR与Issue关联分析数据集GitHubPullRequest-IssueAssociationDataset-petrescustefan 数据来源:互联网公开数据 标签:GitHub, 开源, 数据集, 软件工程, 文本分析, 自然语言处理, 社交网络, 机器学习 数据概述:... -
国际象棋棋局数据集Lichess-moaazreda
国际象棋棋局数据集Lichess-moaazreda 数据来源:互联网公开数据 标签:国际象棋,棋局,数据集,博弈论,机器学习,游戏分析,策略,开源 数据概述: 该数据集包含来自 Lichess 平台的国际象棋棋局数据,记录了大量棋局的详细信息。主要特征如下: 时间跨度:数据记录的时间范围涵盖多个时间段,具体取决于数据集版本。... -
HuggingFace模型-数据集与空间资源总览数据集-2023年12月
HuggingFace模型-数据集与空间资源总览数据集-2023年12月 数据来源:互联网公开数据 标签:Hugging Face Hub,模型,数据集,空间,机器学习,人工智能,资源,开源,许可,每周更新 数据概述: 本数据集全面收录了Hugging Face Hub上所有模型、数据集和Spaces的详细信息。Hugging Face... -
GitHub开发者开源活动季度经济指标数据集-2020至今-sujaykapadnis
GitHub开发者开源活动季度经济指标数据集-2020至今-sujaykapadnis 数据来源:互联网公开数据 标签:GitHub, 开发者, 开源, 活动, 季度, 经济, 指标, 数据集 数据概述: 本数据集包含了GitHub平台上公开活动的结构化数据文件,数据按季度聚合,从2020年开始至今。数据来源于GitHub Innovation... -
大规模语言模型开源项目LMSYS的快速版LLaMA数据集LMSYSOpen-sourceFastLLaMADataset-rushali98
大规模语言模型开源项目LMSYS的快速版LLaMA数据集LMSYSOpen-sourceFastLLaMADataset-rushali98 数据来源:互联网公开数据 标签:自然语言处理,大型语言模型,数据集,LLaMA,开源,文本生成,机器学习,预训练 数据概述:... -
GitHub热门主题爬取数据集-tarunmohapatra
GitHub热门主题爬取数据集-tarunmohapatra 数据来源:互联网公开数据 标签:GitHub,主题,爬虫,数据抓取,Web数据,开源,主题分析,数据科学 数据概述: 该数据集包含从 GitHub 网站上爬取的主题相关数据,记录了GitHub上各种热门主题的详细信息。主要特征如下:... -
Exercism-orgPython编程练习数据集-rcurioso
Exercism-orgPython编程练习数据集-rcurioso 数据来源:互联网公开数据 标签:编程练习,Python,代码审查,开源,教育,编程语言,学习,代码优化,编程社区 数据概述:... -
Linux操作系统代码提交数据集-2011至2023年-chasewillden
Linux操作系统代码提交数据集-2011至2023年-chasewillden 数据来源:互联网公开数据 标签:Linux,代码提交,开源,GitHub,操作系统,开发,编程,版本控制 数据概述:... -
PySpark应用数据集PySparkApplicationDataset-rashid60
PySpark应用数据集PySparkApplicationDataset-rashid60 数据来源:互联网公开数据 标签:PySpark, 数据集, 大数据, 机器学习, 数据分析, 数据处理, 编程, 开源 数据概述: 该数据集包含多个用于PySpark应用的数据集,适用于大数据分析,机器学习等任务。主要特征如下:... -
法国企业财务报表数据集利润表-2020年12月数据提取-briaclg
法国企业财务报表数据集利润表-2020年12月数据提取-briaclg 数据来源:互联网公开数据 标签:法国,企业,财务,利润表,RNCS,INPI,行业分析,财务分析,经济数据,开源,低代码 数据概述:... -
Linux内核代码提交历史文件变更数据集-2011-2023-philschmidt
Linux内核代码提交历史文件变更数据集-2011-2023-philschmidt 数据来源:互联网公开数据 标签:Linux内核,Git,代码提交,版本控制,软件开发,代码分析,文件变更,开源,时间序列,开发者 数据概述:... -
GitHub主题与仓库数据集2022-joonasyoon
GitHub主题与仓库数据集2022-joonasyoon 数据来源:互联网公开数据 标签:GitHub,主题,仓库,数据集,编程,开源,技术,开发,社区,标签,语言,许可证,统计 数据概述:... -
GitHub顶级Java仓库洞察数据集-2023-walimuhammadahmad
GitHub顶级Java仓库洞察数据集-2023-walimuhammadahmad 数据来源:互联网公开数据 标签:GitHub,Java,仓库,排名,编程,开源,代码,数据分析,开发者社区 数据概述:... -
绕口令数据集-英文绕口令集合-2023-djathidiro
绕口令数据集-英文绕口令集合-2023-djathidiro 数据来源:互联网公开数据 标签:绕口令,语言学,机器学习,自然语言处理,数据集,开源,贡献,教育,娱乐,语言技能 数据概述:... -
GitHub最受欢迎项目数据集-2023-donbarbos
GitHub最受欢迎项目数据集-2023-donbarbos 数据来源:互联网公开数据 标签:GitHub,项目,代码仓库,流行度,编程,开源,技术,编程语言,许可证,社区参与,数据科学,项目管理,开发工具 数据概述:... -
开源逻辑推理数据集
开源逻辑推理数据集 数据来源:互联网公开数据 标签:开源,逻辑推理,GPT-4,机器学习,自然语言处理,意识流,知识图谱,创造性思维 数据概述: 本数据集为Know-Saraswati-COT,是一个开源的逻辑推理与意识流思维支持数据集。该数据集由Huggingface... -
自由发音数字音频数据集
自由发音数字音频数据集 数据来源:互联网公开数据 标签:语音识别,音频,数字,语音,机器学习,数据集,FSDD,开源 数据概述: 自由发音数字数据集(FSDD)是一个简单、开放的音频数据集,包含以8kHz采样率录制的英语数字语音wav文件。数据集中的录音经过剪辑,以最大限度地减少开头和结尾的静音。 数据集当前版本包括: 6位说话者... -
GitHub上最受欢迎的Python项目排名数据集-2018-2023
GitHub上最受欢迎的Python项目排名数据集-2018-2023 数据来源:互联网公开数据 标签:Python, GitHub, 项目, 排名, 星星, 活跃度, 开源, 数据分析, 编程, 流行趋势 数据概述:... -
GitHub平台活跃用户画像数据集
GitHub平台活跃用户画像数据集 数据来源:互联网公开数据 标签:GitHub, 用户, 社交网络, 开源, 开发者, 社区, 数据分析, 开发者画像 数据概述:... -
埃及开发者GitHub数据集
埃及开发者GitHub数据集 数据来源:互联网公开数据 标签:GitHub, 开发者, 埃及, 社区分析, 编程语言, 开源, 用户行为, 项目管理, 开发趋势 数据概述: 本数据集旨在提供埃及GitHub用户的详细信息及其关联的仓库数据。数据集分为两个部分: 1....