找到75,960个数据集

标签: 开发者

过滤结果
  • 伦巴第语命名实体识别与语言训练数据集

    2025年4月17日   

    伦巴第语命名实体识别与语言训练数据集 数据来源:互联网公开数据 标签:伦巴第语,命名实体识别,NER,语言模型,文本处理,自然语言处理,维基百科,WikiANN,语言训练,文本标注 数据概述: 本数据集是基于WikiANN项目构建的伦巴第语(Lombard)文本数据集,用于命名实体识别(NER)和语言模型训练。...
    packageimg
  • AI4Privacy个人身份信息PII掩蔽数据集-200K样本

    2025年4月17日   

    AI4Privacy个人身份信息PII掩蔽数据集-200K样本 数据来源:互联网公开数据 标签:AI4Privacy, PII, 个人身份信息, 数据掩蔽, 隐私保护, 自然语言处理, 人工智能, 合成数据, 多语言, Hugging Face 数据概述: 本数据集由 AI4Privacy 开发,是隐私保护与人工智能领域的一项开创性工作。该数据集托管于...
    packageimg
  • 谷歌主题与全球百万热门网站关联数据集

    2025年4月17日   

    谷歌主题与全球百万热门网站关联数据集 数据来源:互联网公开数据 标签:谷歌主题,网站分类,域名,热门网站,数据分析,互联网,主题建模 数据概述: 本数据集整合了全球最受欢迎的100万个域名,并与谷歌主题进行了关联。域名数据来源于http://s3-us-west-1.amazonaws.com/umbrella-...
    packageimg
  • Steam平台玩家地理位置与游戏行为数据集

    2025年4月17日   

    Steam平台玩家地理位置与游戏行为数据集 数据来源:互联网公开数据 标签:Steam, 玩家, 游戏, 地理位置, 游戏服务器, 数据分析, 玩家行为 数据概述: 本数据集整合了Steam平台玩家的公开信息,重点关注玩家的地理位置信息和游戏行为数据。 数据来源包括Steam平台公开的玩家信息,经过筛选和清洗,保留了与玩家地理位置相关的关键字段。...
    packageimg
  • 医疗健康患者综合信息模拟数据集

    2025年4月17日   

    医疗健康患者综合信息模拟数据集 数据来源:互联网公开数据 标签:医疗健康,患者,数据分析,机器学习,合成数据,医疗记录,健康数据,数据科学,Python,Faker 数据概述:...
    packageimg
  • 芝加哥自行车共享公司骑行数据分析数据集-2020年7月至2021年6月

    2025年4月17日   

    芝加哥自行车共享公司骑行数据分析数据集-2020年7月至2021年6月 数据来源:互联网公开数据 标签:自行车共享,骑行数据,用户行为,骑行时长,会员,休闲用户,数据分析,芝加哥 数据概述:...
    packageimg
  • StackOverflow开发者年度调查报告开发者洞察数据集-2022年

    2025年4月17日   

    StackOverflow开发者年度调查报告开发者洞察数据集-2022年 数据来源:互联网公开数据 标签:开发者调查,软件开发,技术趋势,职业发展,编程,Stack Overflow,开发者体验,技术栈,编程语言,工作环境 数据概述: 本数据集基于Stack Overflow...
    packageimg
  • KaggleLLM科学考试-GPT辅助作答数据集

    2025年4月17日   

    KaggleLLM科学考试-GPT辅助作答数据集 数据来源:互联网公开数据 标签:大型语言模型,LLM,科学考试,自然语言处理,NLP,数据集,Kaggle,考试,竞赛,GPT,人工智能 数据概述: 本数据集专为Kaggle...
    packageimg
  • 比特币对USDT交易数据集

    2025年4月17日   

    比特币对USDT交易数据集 数据来源:互联网公开数据 标签:比特币,USDT,时间序列,交易数据,技术指标,预测分析,金融建模 数据概述: 本数据集包含2017年9月至2021年11月期间比特币对USDT交易对的每五分钟 tick...
    packageimg
  • 新冠疫苗mRNA降解预测竞赛参赛者提交结果数据集

    2025年4月17日   

    新冠疫苗mRNA降解预测竞赛参赛者提交结果数据集 数据来源:互联网公开数据 标签:新冠疫苗,mRNA,降解预测,机器学习,竞赛,Kaggle,GNN,提交结果 数据概述: 本数据集包含了在OpenVaccine: COVID-19 mRNA Vaccine Degradation...
    packageimg
  • ICLR论文与评审数据集

    2025年4月17日   

    ICLR论文与评审数据集 数据来源:互联网公开数据 标签:ICLR,机器学习,深度学习,论文评审,学术研究,开放科学 数据概述: 本数据集收录了2018年至2023年间国际学习表征会议(ICLR)的论文链接、论文元数据及同行评审信息。数据集包含以下三类文件: 1....
    packageimg
  • IMDb电影与电视节目用户评论数据集

    2025年4月17日   

    IMDb电影与电视节目用户评论数据集 数据来源:互联网公开数据 标签:电影,电视节目,评论,用户评价,情感分析,自然语言处理,推荐系统,IMDb,影视数据 数据概述:...
    packageimg
  • 华盛顿州住房抵押贷款数据集

    2025年4月17日   

    华盛顿州住房抵押贷款数据集 数据来源:互联网公开数据 标签:住房抵押贷款,华盛顿州,贷款分析,歧视性贷款,政策制定,社区服务,金融公平 数据概述:...
    packageimg
  • 开源软件文件大小数据集

    2025年4月17日   

    开源软件文件大小数据集 数据来源:互联网公开数据 标签:开源软件,文件大小,代码仓库,统计分析,版本控制,开发模式 数据概述:...
    packageimg
  • 伊朗法律数据集

    2025年4月17日   

    伊朗法律数据集 数据来源:互联网公开数据 标签:伊朗法律,议会,立法活动,文本分析,自然语言处理,NLP,政策研究,数据分析 数据概述...
    packageimg
  • 保加利亚19500本书籍注释数据集1960-2021

    2025年4月17日   

    保加利亚19500本书籍注释数据集1960-2021 数据来源:互联网公开数据 标签:书籍分类,保加利亚,书籍信息,数据清理,文本分析,出版信息,图书管理 数据概述:...
    packageimg
  • IMDB情感分析数据集1995-2017

    2025年4月17日   

    IMDB情感分析数据集1995-2017 数据来源:互联网公开数据 标签:IMDB,情感分析,电影评论,词嵌入,情感分类,正向,负向 数据概述: 本数据集包含50,000条电影评论,来源于IMDB,用于情感分类任务。数据集中的每条评论被标记为正向或负向情感。评论涵盖了从1995年至2017年的电影评价,为研究情感分析提供了丰富的样本数据。...
    packageimg
  • 雷达信号处理数据集

    2025年4月17日   

    雷达信号处理数据集 数据来源:互联网公开数据 标签:雷达信号,深度学习,向量嵌入,信号处理,6G通信,多模态数据,嵌入学习 数据概述: 本数据集是DeepSense6G多模态感知与通信数据集的修改版本,主要对原始雷达信号输入进行了处理,生成可用于深度学习模型快速训练的向量嵌入。数据集包含雷达信号的特征提取结果,适用于多种深度学习任务的训练与研究。...
    packageimg
  • 小行星轨道数据集

    2025年4月17日   

    小行星轨道数据集 数据来源:互联网公开数据 标签:小行星,轨道分类,天文学,机器学习,轨道参数,天体力学,天文数据分析 数据概述: 本数据集收录了来自Minor Planet...
    packageimg
  • 数据加速框架CPU与GPU性能对比数据集

    2025年4月17日   

    数据加速框架CPU与GPU性能对比数据集 数据来源:互联网公开数据 标签:数据科学,GPU加速,CPU,性能对比,数据预处理,机器学习,表格数据 数据概述: 本数据集包含五个表格数据集(data0.csv, data1.csv, data2.csv, data3.csv,...
    packageimg