ISO/IEC TR 29119-11:软件测试——可用性测试

软件测试框架中的可用性评估综合部署包

ISO/IEC TR 29119-11 在 ISO 29119 软件测试框架中扩展了针对可用性测试的专门指导。它定义了一个结构化的流程,用于评估用户在有效性、效率和满意度三个维度上与软件产品交互的质量——这也是 ISO 9241-11 中定义的可用性三大支柱。

可用性测试是投资回报率最高的测试活动之一。仅需五名参与者的单次可用性测试通常能发现80%的关键可用性问题。在开发阶段发现这些问题的成本只是发布后修复成本的一小部分。

可用性测试流程

该标准定义了一个包含五项主要活动的可用性测试流程,从规划到报告。每项活动都包括具体任务、输入工件和输出交付物。

活动 输入工件 关键任务 输出交付物
可用性测试规划 测试目标、用户画像、被测系统 定义测试目标、确定参与者画像、选择测试方法、准备测试环境、制定测试场景和任务 可用性测试计划
参与者招募 用户画像、招募标准 筛选和招募符合目标用户画像的参与者、安排测试时段、获取知情同意 参与者时间表、知情同意书
测试执行 测试计划、场景、测试环境 进行测试(主持式或非主持式)、收集观察记录、录制屏幕和音频、记录问题和偏差 测试录制文件、原始观察日志
数据分析 观察日志、录制文件、指标数据 计算可用性指标、识别关键事件、按严重性分类问题、必要时进行统计分析 数据分析报告、问题列表(按优先级排序)
报告编制 分析结果 记录发现、提供建议、呈现指标、传达严重性评级和业务影响 可用性测试报告、执行摘要
可用性测试中的一个常见错误是用错了参与者。与熟悉系统的同事或朋友进行测试会产生虚高的可用性分数,并漏掉真实世界的问题。始终招募符合实际目标用户画像的参与者——理想情况下是以前从未见过该产品的人。

可用性指标与评估技术

ISO/IEC TR 29119-11 定义了一套全面的可用性指标集,与 ISO 9241-11 质量模型保持一致。三个主要维度是:有效性(用户能否完成任务?)、效率(需要多少努力?)和满意度(用户对体验感觉良好吗?)。

标准中指定的关键指标包括:任务成功率(每个任务的二元完成状态)、任务耗时(效率指标)、错误率(每个任务的错误数量)、SUS 评分(系统可用性量表,一种标准化的满意度问卷)和 NASA-TLX(任务负荷指数,用于衡量感知工作量)。标准还涵盖了定性技术,如出声思维法、协同发现法和回顾性探究法。

无障碍测试集成

部署包明确解决了无障碍测试(WCAG合规性)与可用性测试的集成问题。无障碍问题不仅影响残障用户,也影响在具有挑战性环境中的用户(强光照射、嘈杂环境、连接受限)。标准建议将无障碍检查——屏幕阅读器兼容性、键盘导航、色彩对比度和字幕——纳入可用性测试场景中,而不是将其视为一项单独的活动。

一个医疗软件团队在临床仪表板设计阶段按照 ISO/IEC TR 29119-11 进行了可用性测试。在编写一行生产代码之前,通过让五位临床医生进行测试,他们发现所提出的数据可视化方案在时间压力下难以解读。重新设计方案简化了图表并添加了可配置阈值,将平均任务完成时间从45秒减少到12秒,直接提升了临床决策速度。

常见问题

问:有效的可用性测试需要多少参与者?
答:Nielsen Norman Group 的研究表明,每个用户群体5名参与者可以发现大约80%的可用性问题。对于关键系统(医疗、航空、金融),建议每组8-10名参与者以获得更高的置信度。
问:可用性测试和用户验收测试有什么区别?
答:用户验收测试从用户角度验证系统是否满足合同或法规要求。可用性测试评估用户交互的质量——易用性、效率、满意度。用户验收测试问”它能工作吗?”而可用性测试问”用户能有效地使用它吗?”
问:可用性测试可以自动化吗?
答:某些方面可以部分自动化——热力图追踪、点击流分析、A/B测试——但可用性测试的核心(观察真实用户执行真实任务)需要人工观察和定性分析。自动化工具可以补充但不能替代主持式测试。
问:29119-11 与 ISO 9241 有何关系?
答:ISO 9241 提供了可用性的基础定义和原则(有效性、效率、满意度)。ISO/IEC TR 29119-11 将这些原则操作化,形成了 ISO 29119 测试框架内的一个测试流程。这两个标准是互补的。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注