-
语义地址匹配数据集
2025年12月7日 30 30 12
数据集概述 本数据集为语义地址匹配研究提供支持,包含训练、开发和测试三个子集,每个子集均包含原始地址对、地址元素的索引表示及匹配标签,数据来源于相关学术论文研究。 文件详解 该数据集包含多个文本文件,具体说明如下: - 训练数据集文件: - train.txt:训练数据集,格式为文本文件 -...
-
多语言错误信息推文数据集
2025年12月7日 30 94 58
数据集概述 该数据集包含多语言错误信息推文(MMTweet)相关的标注指南、结构化数据文件、代码脚本等资源,覆盖推文分类、声明匹配等任务,支持多语言错误信息检测与分析研究。 文件详解 标注指南文件: Data Annotation – Tweet Classification.pdf:PDF格式,推文分类任务的标注规范文档 Data...
-
信用卡欺诈检测FAIR实践数据集
2025年12月6日 30 7 3
数据集概述 本数据集是信用卡欺诈检测的FAIR合规实践项目资料,包含训练/验证/测试数据拆分、训练好的随机森林模型、评估输出及模型卡片,还有带文档的代码文件,支持可复现的欺诈检测研究与应用。 文件详解 数据文件: training_subset.csv:CSV格式,训练子集数据,字段包括交易编号、商户ID、日平均交易金额、交易金额、是否拒绝等...
-
乌克兰合成车牌数据集2024
2025年12月5日 30 195 147
数据集概述 本数据集包含10000张合成乌克兰车牌图像,覆盖2004-2021年标准格式的普通车辆及电动车辆车牌,含光照、角度、地区代码等多样场景,用于解决车牌识别数据稀缺问题,支持LPR模型训练与验证。 文件详解 文件名称:synthetic_LP_examples_grid.png 文件格式:PNG...



