Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
ISO 25062:2025(原 ISO/IEC 25062)定义了可用性测试报告的通用行业格式(CIF)。它为报告软件可用性测试的方法论、结果和上下文信息建立了标准化结构。通过提供一致的报告格式,ISO 25062 使组织能够跨产品、供应商和开发周期比较可用性发现,将可用性从一门主观艺术转变为客观工程学科。
ISO 25062:2025 中规定的通用行业格式(CIF)远不止是一个报告模板;它是一个用于可用性证据的结构化数据模型。CIF 要求明确记录以下内容:测试参与者画像(包括人口统计和经验特征)、所使用的测试环境和设备、参与者执行的任务、实验设计(被试内或被试间)、所收集的具体可用性指标以及每个指标的原始数据或汇总统计量。
2025 修订版对 CIF 进行了现代化改造,以应对当代可用性评估场景,包括远程无主持测试、移动应用程序可用性以及针对残障用户的无障碍评估。早期版本(可追溯到最初的 2006 版本)主要面向基于实验室的、有主持的桌面应用程序测试。2025 版认识到现代可用性测试涵盖多种范式,CIF 必须适应这些变化同时保持可比性。
| 可用性指标 | 定义 | 数据采集方法 | CIF 报告要求 |
|---|---|---|---|
| 任务成功率 | 无严重错误完成任务的百分比 | 自动记录或观察者记录 | 均值、标准差和置信区间 |
| 任务用时 | 从任务开始到成功完成的时间 | 屏幕录制时间戳分析 | 均值、中位数和第95百分位 |
| 错误率 | 每次任务尝试中的错误数量 | 从会话录像中人工编码错误 | 错误频率分布和严重性分类 |
| 满意度评分 | 标准化任务后问卷(如 SUS、ASQ) | 参与者通过调查工具自评 | 均值分数与规范性基准比较 |
| 效率 | 单位时间内的任务成功数 | 从任务成功和时间数据派生 | 效率评分与基于时间的细分 |
从工程设计角度来看,ISO 25062:2025 引入了上下文完整性的关键概念。脱离上下文——用户画像、任务场景、环境条件——报告可用性指标对于比较目的而言基本上毫无意义。CIF 强制规定了任何报告指标必须附带的最小上下文属性集,确保结果可以被正确解释并可能由其他评估者重现。
标准还提供了关于统计报告严谨性的详细指南。对于每个可用性指标,CIF 要求提供:(a)集中趋势度量(均值或中位数);(b)离散度量(标准差、四分位距或置信区间);(c)样本量;(d)用于计算指标的特定公式或算法。2025 版增加了针对小样本可用性研究的贝叶斯方法指南,这在实践中很常见但传统上难以仅用频率统计进行分析。
另一个关键工程洞见是可比性前提条件。ISO 25062:2025 定义了不同研究的可用性测试结果可以进行有意义的比较的条件:相同的指标定义、等效的任务难度校准和重叠的参与者人口统计特征。如果不满足这些前提条件,研究之间的定量比较在统计上是无效的——这是供应商基准比较中的常见错误。
在实践中实施 ISO 25062 涉及围绕 CIF 的七个强制部分构建可用性评估报告:(1)执行摘要;(2)产品描述;(3)测试目标;(4)参与者画像;(5)测试设计与方法论;(6)结果;(7)包含原始数据和详细分析的附录。组织可以在其首选文档平台(Confluence、SharePoint、LaTeX 或 Markdown)中创建 CIF 模板,并尽可能从自动化测试工具中填充部分内容。