找到152个数据集

标签: 维基百科

过滤结果
  • 英国议会议员维基百科页面浏览数据与统计分析数据集2019-2024

    2025年4月16日   

    英国议会议员维基百科页面浏览数据与统计分析数据集2019-2024 数据来源:互联网公开数据 标签:英国议会, 议员, 维基百科, 页面浏览量, 政治, 数据分析, 选举, 下议院, 上议院 数据概述:...
    packageimg
  • 维基百科关于谷歌的页面浏览量统计数据集-2023

    2025年4月15日   

    维基百科关于谷歌的页面浏览量统计数据集-2023 数据来源:互联网公开数据 标签:维基百科,谷歌,页面浏览量,搜索,互联网,信息检索,数据分析,多语言 数据概述:...
    packageimg
  • 维基百科多语言文本识别数据集-2018

    2025年4月15日   

    维基百科多语言文本识别数据集-2018 数据来源:互联网公开数据 标签:文本识别,多语言,维基百科,自然语言处理,机器学习,语言学,文本分类,数据集 数据概述: WiLI-2018数据集是一个用于评估多语言文本识别任务的基准数据集,包含了来自维基百科的235种语言的235,000个文本段落。该数据集经过精心平衡,并提供了训练集和测试集划分。...
    packageimg
  • 维基百科页面LLM科学考试训练数据集

    2025年4月15日   

    维基百科页面LLM科学考试训练数据集 数据来源:互联网公开数据 标签:维基百科,LLM,科学考试,训练数据,物理概念,文本提取,教育研究 数据概述:...
    packageimg
  • 格莱美第一季数据集

    2025年4月15日   

    格莱美第一季数据集 数据来源:互联网公开数据 标签:格莱美,电视剧,收视率,导演,流行度,数据可视化, IMDb,维基百科 数据概述: 本数据集收录了《格莱美》第一季至第六季的剧集信息,包括剧集编号、剧集标题、导演、播出日期以及剧集评分。剧集评分基于1至10的评分标准,由IMDb用户给出。 数据用途概述:...
    packageimg
  • 维基百科数据集

    2025年4月15日   

    维基百科数据集 数据来源:互联网公开数据 标签:维基百科,开放数据,知识库,多语言,历史数据,内容分析,用户贡献 数据概述:...
    packageimg
  • 印度尼西亚维基百科表格数据集1963-2021

    2025年4月15日   

    印度尼西亚维基百科表格数据集1963-2021 数据来源:互联网公开数据 标签:维基百科,印度尼西亚,表格数据,地理,人口统计,经济,文化,政治,数据提取,CSV文件 数据概述:...
    packageimg
  • 维基百科音乐艺术家关联关系数据集

    2025年4月15日   

    维基百科音乐艺术家关联关系数据集 数据来源:互联网公开数据 标签:音乐,艺术家,维基百科,链接,关系,影响,风格,推荐系统,网络分析,数据可视化 数据概述:...
    packageimg
  • 连环杀手维基数据集

    2025年4月15日   

    连环杀手维基数据集 数据来源:互联网公开数据 标签:连环杀手,维基百科,犯罪学,历史,数据清洗,数据分析,教育 数据概述:...
    packageimg
  • 维基百科图像分类数据集

    2025年4月15日   

    维基百科图像分类数据集 数据来源:互联网公开数据 标签:维基百科,图像分类,人物识别,性别分类,图像标注 数据概述:...
    packageimg
  • YALICKJ维基百科带上下文数据集

    2025年4月15日   

    YALICKJ维基百科带上下文数据集 数据来源:互联网公开数据 标签:维基百科,上下文,数据集,自然语言处理,机器学习,文本分析 数据概述: 本数据集基于YALICKJ在Kaggle上提供的维基百科数据集,并增加了由Chris Notebook生成的上下文列。数据集包含了维基百科页面的文本内容及其对应的上下文信息,适用于自然语言处理和机器学习任务。...
    packageimg
  • 数据3000文本恢复挑战提示数据集

    2025年4月15日   

    数据3000文本恢复挑战提示数据集 数据来源:互联网公开数据 标签:文本恢复,提示生成,创造力,文本处理,专业设置,维基百科,相似度评分 数据概述:...
    packageimg
  • 中日游戏艺术家与插图师标签分类数据集2023

    2025年4月15日   

    中日游戏艺术家与插图师标签分类数据集2023 数据来源:互联网公开数据 标签:中日游戏艺术家,插图师,标签分类,维基百科,生成式AI,话题分类 数据概述:...
    packageimg
  • 维基百科产品名称提及数据集

    2025年4月15日   

    维基百科产品名称提及数据集 数据来源:互联网公开数据 标签:维基百科,产品名称,提及频率,时间序列,市场分析,产品趋势,自然语言处理 数据概述: 本数据集收录了维基百科页面中提及的产品名称及其出现频率,涵盖多个时间点的数据。数据集通过对维基百科文章的分析,提取出不同产品名称的提及情况,为了解市场趋势和产品影响力提供了宝贵的数据支持。 数据用途概述:...
    packageimg
  • 维基百科文章网络数据集2018

    2025年4月14日   

    维基百科文章网络数据集2018 数据来源:互联网公开数据 标签:维基百科,文章网络,网络分析,机器学习,回归分析,链接预测,社区检测,网络可视化 数据概述:...
    packageimg
  • 全球连环杀手犯罪记录数据集

    2025年4月14日   

    全球连环杀手犯罪记录数据集 数据来源:互联网公开数据 标签:连环杀手,犯罪,杀人,谋杀,犯罪学,社会学,维基百科,罪犯 数据概述: 本数据集汇集了来自全球超过50个国家/地区的620名连环杀手的数据。数据来源于维基百科页面。连环杀手的定义通常为:在超过一个月的时间内,以异常心理满足为目的,谋杀三人或三人以上的人,并且谋杀之间有显著的时间间隔。...
    packageimg
  • 标普500成分公司文本数据集

    2025年4月14日   

    标普500成分公司文本数据集 数据来源:互联网公开数据 标签:标普500,维基百科,公司文本,企业分析,行业研究,文本挖掘,投资分析 数据概述:...
    packageimg
  • 孟加拉语维基百科语料库数据集

    2025年4月14日   

    孟加拉语维基百科语料库数据集 数据来源:互联网公开数据 标签:孟加拉语,维基百科,自然语言处理,NLP,文本分析,机器学习,语料库 数据概述:...
    packageimg
  • 多语言维基百科命名实体识别数据集

    2025年4月14日   

    多语言维基百科命名实体识别数据集 数据来源:互联网公开数据 标签:多语言,维基百科,命名实体识别,PER,LOC,ORG,MISC,自然语言处理,机器学习 数据概述:...
    packageimg
  • 维基百科热门页面浏览量数据集2016至今

    2025年4月14日   

    维基百科热门页面浏览量数据集2016至今 数据来源:互联网公开数据 标签:维基百科,页面浏览量,热门文章,趋势分析,时间序列,数据可视化,互联网分析 数据概述:...
    packageimg