-
引力波观测结果整理数据集
2025年12月18日 30 59 49
数据集概述 该数据集是对维基百科中截至当前日期所有引力波观测结果的整理集合,通过Chat GPT辅助编译为易于访问的HTML文件,为引力波观测相关研究提供便捷的参考数据。 文件详解 文件名称: gravitational_wave_observations.html 文件格式: HTML (.html) 内容说明:...
-
Kaggle维基百科每日网络流量数据集_含缺失值
2025年12月16日 30 142 3
数据集概述 本数据集是Kaggle维基百科网络流量预测竞赛所用数据,包含十四万五千零六十三条每日时间序列,记录2015年7月1日至2017年9月10日期间一组维基百科页面的点击量或网络流量数据,存在缺失值。 文件详解 文件名称: kaggle_web_traffic_dataset_with_missing_values.zip 文件格式:...
-
扩展版维基百科日度网络流量数据集_无缺失值
2025年12月15日 30 8 7
数据集概述 该数据集包含十四万五千零六十三条时间序列数据,记录了2015年7月1日至2022年6月30日期间一组维基百科页面的日访问量。此数据集为Kaggle维基百科流量预测竞赛所用数据集的扩展版本,保留了竞赛中的维基百科页面,且将文章名称中的冒号替换为短横线,以适配特定数据加载器。原始数据中的缺失值已被简单替换为零。 文件详解 文件名称:...
-
维基百科集体审议中的性别不对称数据集
2025年12月13日 30 23 13
数据集概述 该数据集聚焦维基百科“待删除条目”(AfD)讨论中的性别不对称问题,分析女性传记条目在删除提名速度、共识达成时间及合并/重定向情况等方面的差异,为开放知识平台治理提供数据支持。 文件详解 文件名称: data.zip 文件格式: ZIP压缩包 内容说明: 包含研究维基百科集体审议中性别不对称的相关数据,具体字段及结构需解压后查看 适用场景...
-
Kaggle维基百科日度网络流量数据集_无缺失值
2025年12月12日 30 148 10
数据集概述 该数据集为Kaggle维基百科网络流量预测竞赛所用数据,包含十四万五千零六十三条日度时间序列,记录了2015年7月1日至2017年9月10日期间一组维基百科页面的访问量或网络流量数据,原始数据的缺失值已被替换为零。 文件详解 文件名称:...
-
Kaggle维基百科周度网络流量数据集
2025年12月11日 30 180 73
数据集概述 该数据集是Kaggle维基百科网络流量预测竞赛日度数据集的周度聚合版本,包含十四万五千零六十三条时间序列,记录了2015年7月1日至2017年9月5日期间一组维基百科页面的周度访问量,原始缺失值已被替换为零后聚合。 文件详解 文件名称: kaggle_web_traffic_weekly_dataset.zip 文件格式: ZIP压缩包...
-
特诺奇蒂特兰大神庙科约尔齐瓦基石数据
2025年12月11日 30 207 3
数据集概述 该数据集围绕阿兹特克神话中科约尔齐瓦基的传说及特诺奇蒂特兰大神庙出土的科约尔齐瓦基石展开,包含相关图像与模型文件,为研究阿兹特克文化与考古发现提供资料。 文件详解...
-
维基数量与维基测量数据集
2025年12月11日 30 132 115
数据集概述 该数据集包含Wiki-Quantities和Wiki-Measurements两个子数据集,分别用于支持数量识别与测量上下文提取任务。数据从维基百科文章和维基数据事实启发式生成,部分样本添加S2ORC数据集引用以增强模型鲁棒性,为测量提取系统的开发与评估提供支持。 文件详解 核心压缩文件: Wiki-Quantities.zip:...
-
大众媒体中人群事故报道数据集
2025年12月10日 30 99 90
数据集概述 该数据集包含对人群事故相关新闻报道语料库的分析结果,按类别组织文件以支持在线可视化和离线分析。内容涵盖新闻报道源信息、维基百科语料库、词汇分析结果及情感分析数据,为研究媒体对人群事故的呈现提供多维度支持。 文件详解 分类0(0_data_all.zip):所有文件的结构化压缩包,便于直接下载和分析,包含词汇分析、情感分析等全部数据。...
-
圣母与圣婴石膏模型数字化数据集
2025年12月10日 30 176 107
数据集概述 该数据集为圣母与圣婴石膏模型的数字化成果,是首次通过摄影测量技术制作的模型。包含图片文件和三维模型文件,标注文本源自维基百科,为艺术数字化研究提供基础数据。 文件详解 图片文件(共5个,JPEG格式): 文件名称:thumb0.jpeg、thumb1.jpeg、thumb2.jpeg、thumb3.jpeg、thumb4.jpeg...
-
AHXIOM系统形式化与结构_强调AhxCLASSS数据集
2025年12月9日 30 203 104
数据集概述 本数据集为PDF文档,内容是AHXIOM系统的形式化与结构说明。AHXIOM是整合数学、逻辑等多领域概念的完整系统,强调语义、句法、符号学(SSS)的一致性,核心内容为AhxCLASSS(逻辑原始预设)、Ente Objeto(EO,基本元素)及“Hacer”(动态核心机制)。 文件详解 数据集包含一个PDF格式的文档文件,具体如下: -...
-
意大利入侵哺乳动物维基百科搜索与贝叶斯结构时间序列补充材料2022
2025年12月7日 30 103 85
数据集概述 本数据集是关于意大利入侵哺乳动物的维基百科搜索量与贝叶斯结构时间序列分析的补充材料,为研究入侵物种黑名单对公众好奇心的影响提供支持,源自相关学术研究的附加文档。 文件详解 文件名称: oo_641585.pdf:该文件为PDF格式,是Cerri J等人2022年研究的补充材料文档,内容可能包含研究方法细节、额外分析结果或数据说明。 适用场景...
-
ENwikIR1k_维基百科检索开发数据完整集合
2025年12月7日 30 24 1
数据集概述 该数据集是通过wikIR工具获取的开发数据集,包含一个压缩文件,未进行训练/测试、数据/标签或原始/处理的拆分,为相关研究提供基础数据支持。 文件详解 文件名称: wikIR1k.zip 文件格式: ZIP (.zip) 内容说明: 压缩包内包含通过wikIR工具获取的开发数据集内容,具体字段及结构未提供预览信息 适用场景...
-
法国格拉斯市莱昂_奇里斯纪念碑数据集
2025年12月7日 30 203 99
数据集概述 该数据集包含法国格拉斯市历史建筑“莱昂·奇里斯纪念碑”的三维模型及图片资料。纪念碑建于1914年,数据由Autodesk Maya建模、Substance Painter纹理处理生成,涵盖图片与三维模型文件。 文件详解...
-
维基百科网络分析的制药公司与国家_癌症及罕见疾病互动数据集
2025年12月6日 30 180 83
数据集概述 该数据集基于维基百科英文网络(超500万篇文章),通过REGOMAX算法分析34家大型制药公司、195个国家、47种罕见肾病与37类癌症间的互动关系,包含PageRank敏感度及友谊网络等分析结果。 文件详解 文件名称:...
-
Objaverse_Xochipilli_Based_Chalca文化晚期雕像数字化完整数据
2025年12月5日 30 13 2
数据集概述 该数据集包含与Chalca文化晚期古典时期(公元1250-121年)的Xochipilli雕像相关的文件。Xochipilli是阿兹特克神话中掌管艺术、游戏、美丽、舞蹈、花朵和歌曲的神祇。 文件详解 图片文件(JPEG格式,共5个):...
-
西班牙奥伦西亚城堡三维模型与图片数据集
2025年12月4日 30 183 180
数据集概述 该数据集包含西班牙奥伦西亚城堡的三维模型及配套图片资源,基于YouTube视频帧与维基百科信息构建,记录了城堡的建筑结构特征,如方形主体、塔楼布局等,为城堡的数字化展示与研究提供视觉化数据支持。 文件详解 三维模型文件:...
-
俄语拼写纠错开放数据集
2025年11月29日 30 101 41
数据集概述 本数据集为俄语拼写纠错开放数据,包含训练和测试两部分,核心内容是俄语错误拼写与正确形式的单词对,通过维基百科语料库词频分析生成,用于俄语拼写纠错模型的开发与测试。 文件详解 文件名称:test_pairs.csv 文件格式:CSV 字段映射:包含两列,“incorrect”列存储错误拼写的俄语单词,“correct”列存储对应的正确拼写形式...
-
语义指纹图谱示例_年度词汇内涵数据集
2025年11月29日 30 205 161
数据集概述 本数据集展示语义指纹图谱技术的应用,包含维基百科定义的二百零六个情绪相关词汇的语义指纹,以及二零一零至二零二三年间Dictionary.com评选的年度词汇数据,为分析词汇语义特征提供支持。 文件详解 文件名称: woty_data.csv 文件格式: CSV 字段内容:...
-
维基百科双语单标签语料库
2025年11月28日 30 39 37
数据集概述 该数据集是一个西班牙语-英语双语单标签语料库,包含英文文档3019篇、西班牙文文档832篇,覆盖文化艺术、地理与地点、数学与逻辑三类主题,可用于自然语言处理相关研究。 文件详解 文件名称: wikipedia_corpus.zip 文件格式: ZIP (.zip) 内容说明: 可能包含语料库的核心数据文件,如文本数据及分类标签等 文件名称:...



