ISO/IEC 29124:2021 — 生物特征识别 — 呈现攻击检测性能

评估生物识别系统的防欺骗机制

ISO/IEC 29124:2021 是生物识别安全领域的关键标准。它规定了评估呈现攻击检测(PAD)机制——通常称为防欺骗——的性能指标、测试流程和报告格式,涵盖指纹、人脸、虹膜和语音等多种生物特征模态。

随着生物识别认证在移动设备、边境控制和金融服务中变得无处不在,呈现攻击(使用打印照片、硅胶面具或录制语音片段等人工制品)的威胁也大幅增长。ISO/IEC 29124 提供了一种标准化的方法,用于评估给定的 PAD 子系统区分真实生物特征呈现和攻击呈现的能力。

成功的呈现攻击会造成严重的经济影响。仅在2023年,基于深度伪造的生物识别欺诈造成的全球损失估计超过120亿美元。实施稳健的 PAD 评估已不再是可选项。

攻击类型与分类

该标准将呈现攻击分类为一个明确定义的分类体系,每一位 PAD 工程师都必须了解:

攻击类别 描述 影响最大的模态 PAI(呈现攻击工具)
2D 打印/显示 展示打印的照片或屏幕图像 人脸、虹膜 纸张、LCD 屏幕
3D 面具/雕塑 使用带纹理的假体或 3D 打印复制品 人脸 硅胶、树脂、明胶
潜指纹 利用残留在传感器上的指纹 指纹 残留油脂
重放/录制 回放之前捕捉的语音或视频 语音、人脸 扬声器、显示器
合成生成 使用 AI 生成的图像或语音(深度伪造) 人脸、语音 GAN、扩散模型输出

对于每个攻击类别,标准定义了呈现攻击工具(PAI)的特征,并规定了测试时应如何构建或获取这些工具。目标是确保不同实验室之间的测试结果具有可重复性。

性能指标与评估方法

ISO/IEC 29124 定义了两个互补的主要性能指标:

攻击呈现分类错误率(APCER)。被错误分类为真实的攻击呈现比例。较低的 APCER 表示对欺骗的防御能力更强。这是对安全敏感型应用最重要的指标。

真实呈现分类错误率(BPCER)。被错误分类为攻击的真实呈现比例。较低的 BPCER 表示更好的用户体验。在实践中,APCER 和 BPCER 之间存在权衡。

标准要求使用检测错误权衡(DET)曲线来报告性能,显示所有操作点上的 APCER 与 BPCER 的关系。此外,还规定了在固定 BPCER 下 APCER 的报告格式,例如 APCER@BPCER=5%。

对于高安全部署,目标是在 BPCER 为 5% 时 APCER 低于 2%。对于用户体验至上的消费类应用,BPCER 低于 2% 且 APCER 低于 5% 通常是可以接受的。
不要仅使用已知攻击类型进行测试。标准强调了’未知攻击检测’的重要性——即 PAD 系统拒绝其未经过明确训练的攻击类型的能力。始终在评估中至少包含一种新型 PAI。

测试协议设计

标准规定了一个严格的测试协议,包括:

协议要素 要求 理由
数据集规模 每种模态至少 1000 个真实 + 1000 个攻击呈现 统计显著性
环境变化 至少 3 种不同的光照/背景条件 鲁棒性评估
PAI 多样性 每种攻击类型至少 5 个不同的 PAI 实例 泛化能力
跨时段采集 至少在 2 个不同的日期收集数据 时间稳定性
算法版本 整个评估过程使用固定版本 可重复性

该协议设计为与模态无关,但针对每种生物特征特性提供了具体指导。标准还涉及评估结合多种模态的 PAD 系统(多模态 PAD)。

常见问题

ISO/IEC 29124 与 ISO/IEC 30107 有什么区别?
ISO/IEC 30107 是呈现攻击检测的基础标准,提供术语和框架。ISO/IEC 29124 在此基础上,规定了详细的性能评估方法、指标和报告格式。
可以使用 29124 进行深度伪造检测评估吗?
可以。标准的攻击分类包括合成生成(AI 生成内容),其评估方法直接适用于人脸和语音模态的深度伪造检测系统。
如何为我的 PAD 系统选择操作点?
选择取决于应用的风险承受能力。使用 DET 曲线找到最小化加权代价的点,其中权重反映了安全漏洞与用户体验不佳的相对代价。
是否支持跨模态评估?
是的。标准为评估包含多种生物特征模态的 PAD 系统提供了指导,包括如何融合分数以及报告特定模态和融合后的性能。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注