Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
ISO/IEC 27565 提供了在人工智能系统全生命周期中保护个人可识别信息的全面指南,涵盖从数据收集和模型训练到部署、推理和退出的各个环节。随着 AI 系统在训练和运行过程中处理大量个人数据,它们引入了传统数据保护方法无法充分应对的独特隐私风险。这些风险包括从模型输出重建训练数据的模型反转攻击、确定特定个人数据是否被用于训练的成员推断攻击,以及训练数据集中稀有或独特记录被意外记忆的风险。
标准将 AI 特有的隐私风险分为三类:训练数据隐私风险(发生在数据收集和模型训练阶段)、模型隐私风险(嵌入在训练模型的参数和行为中)、推理隐私风险(在模型处理新数据或生成输出时产生)。每个类别需要不同的缓解策略和工程控制措施。
| 风险类别 | 具体攻击/威胁 | 受影响生命周期阶段 | 主要缓解措施 | 有效性 |
|---|---|---|---|---|
| 训练数据隐私 | 数据收集或标注过程中泄露 | 数据收集、准备 | 数据最小化、访问控制、加密 | 高 |
| 训练数据隐私 | 通过模型进行非授权数据推理 | 模型训练 | 训练过程中的差分隐私 | 高(可证明) |
| 模型隐私 | 模型反转攻击 | 部署、推理 | 输出扰动、模型剪枝 | 中等 |
| 模型隐私 | 成员推断攻击 | 部署、推理 | 正则化、差分隐私训练、输出限制 | 中高 |
| 模型隐私 | 通过API查询进行模型窃取 | 部署、推理 | 查询频率限制、输出扰动 | 中等 |
| 推理隐私 | 从模型输出推断属性 | 推理 | 输出过滤、置信度分数掩码 | 中等 |
| 推理隐私 | 意外记忆 | 训练、推理 | 去重、差分隐私、记录抑制 | 高 |
ISO/IEC 27565 提供了在 AI 系统全生命周期中实施隐私保护的详细工程指南。对于训练数据,它建议通过主动学习技术实现数据最小化,仅选择最具信息量的样本进行标注,并对最容易受到记忆攻击的稀有或独特记录进行系统筛查。在训练过程本身方面,差分隐私随机梯度下降被列为主要技术控制措施,并提供了基于应用领域敏感性的隐私预算(ε值)分配指南。
在部署阶段,标准建议实施推理隐私控制,包括 API 端点的输出扰动、防止提取攻击的查询频率限制,以及减少信息泄露的置信度分数掩码。对于部署在医疗和金融等受监管领域的模型,鼓励尽可能采用设备端推理,以避免将原始 PII 传输到基于云的推理端点。
标准阐述了 AI 隐私的组织和治理维度,强调没有适当的治理结构,仅靠技术控制是不够的。它建议建立 AI 隐私审查委员会,在部署前评估新的 AI 用例,开展针对 AI 特性的隐私影响评估(模型可逆性、参数中的数据保留、推理泄露潜力),并维护带有 PII 处理分类的 AI 系统清单。标准还提供了透明度义务的指南,包括披露训练数据来源、应用的去标识化方法、消耗的隐私预算以及重标识风险已知限制的模型卡和数据集文档。