Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
IEC TR 63038 提供了一个用于评估数字视频监控系统中视频分析性能的标准化框架。随着视频监控部署呈指数级增长——从智慧城市交通管理到零售客流量分析——对客观、可重复的性能指标的需求变得至关重要。本技术报告定义了目标检测、分类、跟踪和事件识别的测试场景、真实标注方法和统计报告规范。
TR 63038 涵盖四项核心分析任务:(1) 目标检测(边界框输出),(2) 目标分类(标签分配),(3) 多目标跟踪(跨帧的 ID 保持),(4) 事件检测(徘徊、越线、遗留物)。每项任务都有专门的指标、测试数据集和最低报告要求。
标准规定每次分析评估都必须报告以下指标:
| 指标 | 定义 | 报告要求 |
|---|---|---|
| 精确率 | TP / (TP + FP) | 按目标类别和环境条件 |
| 召回率 | TP / (TP + FN) | 按目标类别和环境条件 |
| F₁ 分数 | 2 · (精确率 · 召回率) / (精确率 + 召回率) | 调和平均值,总体和按类别 |
| MOTA | 多目标跟踪准确率 | 仅限跟踪场景 |
| 处理延迟 | 输入帧到输出结果的延迟 | P₅₀、P₉₅(毫秒) |
| 吞吐量 | 每秒处理的帧数 | 原始分辨率下 |
TR 63038 规定测试数据集每项任务必须包含至少10,000个标注帧,每种环境条件(日光、低光照、雨天、雾天、夜间红外)至少500帧。标注格式基于改进的 COCO JSON 架构,扩展了时间字段(track_id、occlusion_flag、confidence)。边界框在像素级别的真实标注精度须达到≥99%,分类标签须达到≥99.5%。
TR 63038 框架下的视频分析性能高度依赖于边缘设备的计算能力。典型的深度学习加速器(如 NVIDIA Jetson Orin、Hailo-8、Intel Movidius)在1080p分辨率下使用轻量级目标检测网络(YOLOv8n、MobileNet-SSD)可实现30-60 FPS。标准建议以目标部署分辨率而非训练分辨率报告性能,因为降采样伪影会显著影响小目标的召回率。
展望未来,IEC 正在考虑制定第二版,纳入神经网络鲁棒性测试(对抗性补丁攻击)和隐私保护分析评估(设备端推理与云端推理的对比)。TR 63038 中定义的基础指标框架仍将是这些未来扩展的核心。