Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
ISO/IEC 27038:2014 是首个专门针对数字脱敏的国际标准——即在保留其余内容完整性和可用性的同时,从文档中永久移除敏感或涉密信息的过程。与简单的文档清理技术(如黑色方框或白色高亮,这些通常可以被逆转)不同,标准要求永久性移除,使被脱敏的信息不可恢复。
本标准适用于需要发布同时包含公开和敏感信息的文档的组织,例如响应信息公开请求的政府机构、制作证据开示文件的法律团队、披露去标识化患者记录的医疗保健机构,以及发布董事会材料的公司。标准涵盖了文本文档、电子表格、演示文稿、PDF、包含文字的图像以及结构化数据格式的脱敏。
| 文档类型 | 脱敏挑战 | 标准要求 |
|---|---|---|
| 隐藏层、元数据、注释 | 移除所有内容层、展平注释、清理元数据 | |
| Office 文档(DOCX/XLSX/PPTX) | 嵌入数据、修订历史、批注 | 剥离嵌入数据、移除修订标记、删除批注 |
| 图像(扫描文档) | OCR 文本层、图像元数据 | 移除 OCR 文本层、清理 EXIF 数据、覆盖像素区域 |
| HTML/XML | 标记、脚本、链接资源 | 移除敏感元素、清理属性、清理嵌入资源 |
ISO/IEC 27038 规定了脱敏工具和流程必须满足的多项技术要求。脱敏过程必须从文档的所有层面移除被脱敏信息,包括可见内容、隐藏文本、元数据、批注、修订标记、嵌入对象和文件属性。脱敏后,必须验证文档,确认无残留敏感信息。标准建议使用专用脱敏软件而非通用文档编辑工具,因为后者通常会留下可恢复的脱敏内容痕迹。
标准引入了脱敏验证的概念——一种结构化的质量保证流程,用于验证脱敏是否正确执行。验证应包括对脱敏后文档的视觉检查、对隐藏或残留数据的自动扫描、特定于文件格式的验证检查,以及与原始文档的比对以确认只有预期内容被脱敏。工程团队应实施多人复核工作流,其中脱敏操作员和验证员应分别由不同人员担任,以降低疏忽风险。
超越技术层面,ISO/IEC 27038 阐述了数字脱敏所需的治理框架。组织必须建立脱敏策略,明确角色与职责、批准的脱敏方法、验证程序和审计要求。标准建议为每次脱敏操作维护审计日志,记录操作员、日期、文档标识符和验证结果。对于高敏感度脱敏,标准建议由第二位合格人员进行独立验证,并定期进行程序审计。
从工程角度来看,本标准最有价值的贡献在于其对自动化和工具验证的强调。组织不应依赖对单个文档进行手动脱敏,而应投资建设自动化的脱敏流水线,与文档管理系统集成,根据文档分类和数据敏感度应用一致的规则,并生成适合监管审查的审计追踪。应按照标准的要求评估基于云的脱敏服务,特别是在数据驻留、加密和服务提供商访问未脱敏内容方面的要求。实施自动化脱敏工作流时,建议采用”先分类、再脱敏、后验证”的三步法,确保每个环节都有明确的责任人和质量门禁。