-
大英图书馆残片Or_8210_S_9498与དབའབཞ_ད_版本1_1_比对数据集
2025年12月18日 30 163 3
数据集概述 本数据集为大英图书馆残片Or.8210/S.9498与དབའབཞེད་(版本1.1)的比对资料,核心围绕残片与DBA' BZHED手稿的文本内容匹配展开,旨在解决残片原页布局重建、特定人物名称空间验证及缺失文字位置推断三个问题。 文件详解 文件名称: BL S9498 + S13683.pdf 文件格式: PDF (.pdf) 文件内容:...
-
不同磁毯上悬浮的不同PyC圆盘受力数据集
2025年12月7日 30 5 3
数据集概述 该数据集包含二十一张图片文件,记录了不同尺寸的PyC圆盘在不同类型磁毯上悬浮时的受力相关情况,为研究磁悬浮中圆盘与磁毯的相互作用提供直观的图像数据支持。 文件详解 图片文件集(共21个): 文件格式:JPG(.jpg)...
-
金融新闻文本挖掘平行语料库数据集2007_2020
2025年12月15日 30 186 18
数据集概述 本数据集为金融领域的英汉平行新闻语料库,包含2007至2020年的60,473篇双语文档,涵盖新闻的标题、正文等核心内容,可用于金融领域的平行双语文本挖掘研究。 文件详解 文件名称:FT-en-zh.rar 文件格式:RAR压缩包...
-
Objaverse_Courthouse_Side_Based_建筑侧景三维数字化完整数据
2025年12月15日 30 133 76
数据集概述 本数据集包含与“Courthouse Side”相关的三维模型文件和图片文件,由Polycam.ai创建,文件类型涵盖GLB三维模型与JPEG图片,为相关场景的三维可视化或模型分析提供数据支持。 文件详解 文件名称与格式: 4d12900470704423b615edf8aa152225.glb:GLB格式三维模型文件...
-
ORB算法图像相似度检测数据集
2025年12月8日 30 164 21
数据集概述 该数据集包含印刷电路板(PCB)、汽车保险丝盒、真实及过滤处理的人脸图片,共48张JPG格式图像和1个说明文档,用于支持基于ORB算法的图像相似度检测Julia代码运行,需通过调整汉明距离和关键点数量优化检测效果。 文件详解 图像文件(共48个,.jpg格式):...
-
ENwikIR1k_维基百科检索开发数据完整集合
2025年12月7日 30 10 4
数据集概述 该数据集是通过wikIR工具获取的开发数据集,包含一个压缩文件,未进行训练/测试、数据/标签或原始/处理的拆分,为相关研究提供基础数据支持。 文件详解 文件名称: wikIR1k.zip 文件格式: ZIP (.zip) 内容说明: 压缩包内包含通过wikIR工具获取的开发数据集内容,具体字段及结构未提供预览信息 适用场景...
-
Objaverse_Nazario_poste160_Based_三维模型与图像关联完整数据
2025年12月6日 30 81 36
数据集概述 本数据集包含与"Nazario_poste160"相关的文件集合,由图片文件和三维模型文件组成,未进行训练测试、数据标签或原始/处理数据的拆分,无说明文档或内容预览,可用于相关三维模型与图片的关联分析。 文件详解...
-
ARASAAC黑白象形图数据集_第十部分_共十四部分
2025年12月6日 30 158 67
数据集概述 本数据集为ARASAAC项目的第十四部分中的第十部分,包含一千张由Sergio Palao创建的黑白象形图,涵盖医疗、图像视觉、音频等语义主题,以PNG格式存储。 文件详解 核心文件组: 包含一千个PNG格式文件,无目录结构...
-
词汇释义与上下文一致性数据集
2025年11月29日 30 26 12
数据集概述 该数据集包含基于俄语大解释词典的词汇释义、词汇使用上下文及释义与上下文一致性标注的三元组数据,用于验证词汇释义与实际使用场景的匹配关系。 文件详解 文件名称:Gloss-Context Consistency/gloss_context.csv 文件格式:CSV(逗号分隔值) 字段映射: Gloss:俄语大解释词典中词汇的释义文本...
-
社交媒体宗教信仰数据集_基于Tumblr宗教标签的帖子与博主数据
2025年11月29日 30 126 40
数据集概述 该数据集包含2007年以来Tumblr平台上8类含宗教标签的帖子及博主的语言与上下文元数据,涵盖帖子、博主、标签、互动笔记等多维度信息,为研究社交媒体中的宗教信仰表达提供支持。 文件详解 文件名称: Tumblr_Religious_Conflicts.sql 文件格式: SQL (.sql) 核心数据模块: Tumblr Posts...
-
知识问答推理数据集
2025年11月23日 30 19 13
知识问答推理数据集_Knowledge_Question_Answering_Reasoning_Dataset 数据来源:互联网公开数据 标签:知识推理, 问答系统, 自然语言处理, 关系抽取, 机器学习, 文本匹配, 语义理解, 知识图谱 数据概述:...
-
科研论文引用关系数据集
2025年11月22日 30 63 44
科研论文引用关系数据集_Research_Paper_Citation_Relation 数据来源:互联网公开数据 标签:论文引用, 学术研究, 文本分析, 自然语言处理, 知识图谱, 数据挖掘, 文本匹配, 数据集构建 数据概述: 该数据集包含来自学术研究领域的文本数据,记录了科研论文的标题、摘要以及它们之间的引用关系。主要特征如下:...
-
商品文本描述分类数据集
2025年11月22日 30 166 18
商品文本描述分类数据集_Product_Text_Description_Classification_Dataset 数据来源:互联网公开数据 标签:商品描述, 文本分类, 商品识别, 文本清洗, 自然语言处理, 机器学习, 电商, 产品信息 数据概述:...
-
商品文章SVD特征数据集
2025年11月21日 30 188 140
商品文章SVD特征数据集_Product_Article_SVD_Feature_Dataset 数据来源:互联网公开数据 标签:商品推荐,文本分析,奇异值分解,降维,特征工程,机器学习,文章向量,自然语言处理 数据概述: 该数据集包含商品文章的SVD(奇异值分解)特征数据,用于商品推荐和文本分析。主要特征如下:...
-
教育内容推荐预测数据集
2025年11月9日 30 154 108
教育内容推荐预测数据集_Educational_Content_Recommendation_Prediction 数据来源:互联网公开数据 标签:推荐系统, 教育学习, 文本匹配, 自然语言处理, 知识图谱, 数据建模, 机器学习, 学习资源 数据概述:...
-
学术论文数据集标题生成与标注数据集
2025年11月7日 30 106 51
学术论文数据集标题生成与标注数据集_Academic_Paper_Dataset_Title_Generation_and_Labeling 数据来源:互联网公开数据 标签:学术论文, 标题生成, 数据集标注, 文本摘要, 自然语言处理, 机器学习, 命名实体识别, 文本匹配 数据概述:...
-
数学教育内容相关性评估数据集
2025年11月1日 30 150 48
数学教育内容相关性评估数据集_Mathematics_Education_Content_Relevance_Evaluation 数据来源:互联网公开数据 标签:教育, 数学, 文本匹配, 相关性分析, 自然语言处理, 对比学习, 数据集, 机器学习 数据概述:...
-
文本信息实体识别与匹配评估数据集
2025年11月1日 30 94 4
文本信息实体识别与匹配评估数据集_Text_Information_Entity_Recognition_and_Matching_Evaluation_Dataset 数据来源:互联网公开数据 标签:实体识别, 文本匹配, 自然语言处理, 机器学习, 评估数据集, 命名实体识别, 关系抽取, 文本标注 数据概述:...
-
知识内容相似度匹配数据集
2025年10月31日 30 184 121
知识内容相似度匹配数据集_Knowledge_Content_Similarity_Matching 数据来源:互联网公开数据 标签:文本匹配, 相似度计算, 自然语言处理, 教育, 机器学习, 数据集, 文本分析, 对比学习 数据概述: 该数据集包含用于评估和训练知识内容相似度匹配模型的数据,记录了数学相关的课程内容和题目。主要特征如下:...
-
金融合规问答数据集
2025年10月26日 30 118 2
金融合规问答数据集_Financial_Compliance_Question_Answering_Dataset 数据来源:互联网公开数据 标签:金融合规, 问答系统, 自然语言处理, 文本匹配, 信息检索, 知识图谱, 机器学习, 语料库 数据概述:...



