ISO/IEC TR 29119-11：软件测试——可用性测试

ISO/IEC TR 29119-11 在 ISO 29119 软件测试框架中扩展了针对可用性测试的专门指导。它定义了一个结构化的流程，用于评估用户在有效性、效率和满意度三个维度上与软件产品交互的质量——这也是 ISO 9241-11 中定义的可用性三大支柱。

可用性测试是投资回报率最高的测试活动之一。仅需五名参与者的单次可用性测试通常能发现80%的关键可用性问题。在开发阶段发现这些问题的成本只是发布后修复成本的一小部分。

可用性测试流程

该标准定义了一个包含五项主要活动的可用性测试流程，从规划到报告。每项活动都包括具体任务、输入工件和输出交付物。

活动	输入工件	关键任务	输出交付物
可用性测试规划	测试目标、用户画像、被测系统	定义测试目标、确定参与者画像、选择测试方法、准备测试环境、制定测试场景和任务	可用性测试计划
参与者招募	用户画像、招募标准	筛选和招募符合目标用户画像的参与者、安排测试时段、获取知情同意	参与者时间表、知情同意书
测试执行	测试计划、场景、测试环境	进行测试（主持式或非主持式）、收集观察记录、录制屏幕和音频、记录问题和偏差	测试录制文件、原始观察日志
数据分析	观察日志、录制文件、指标数据	计算可用性指标、识别关键事件、按严重性分类问题、必要时进行统计分析	数据分析报告、问题列表（按优先级排序）
报告编制	分析结果	记录发现、提供建议、呈现指标、传达严重性评级和业务影响	可用性测试报告、执行摘要

可用性测试中的一个常见错误是用错了参与者。与熟悉系统的同事或朋友进行测试会产生虚高的可用性分数，并漏掉真实世界的问题。始终招募符合实际目标用户画像的参与者——理想情况下是以前从未见过该产品的人。

可用性指标与评估技术

ISO/IEC TR 29119-11 定义了一套全面的可用性指标集，与 ISO 9241-11 质量模型保持一致。三个主要维度是：有效性（用户能否完成任务？）、效率（需要多少努力？）和满意度（用户对体验感觉良好吗？）。

标准中指定的关键指标包括：任务成功率（每个任务的二元完成状态）、任务耗时（效率指标）、错误率（每个任务的错误数量）、SUS 评分（系统可用性量表，一种标准化的满意度问卷）和 NASA-TLX（任务负荷指数，用于衡量感知工作量）。标准还涵盖了定性技术，如出声思维法、协同发现法和回顾性探究法。

无障碍测试集成

部署包明确解决了无障碍测试（WCAG合规性）与可用性测试的集成问题。无障碍问题不仅影响残障用户，也影响在具有挑战性环境中的用户（强光照射、嘈杂环境、连接受限）。标准建议将无障碍检查——屏幕阅读器兼容性、键盘导航、色彩对比度和字幕——纳入可用性测试场景中，而不是将其视为一项单独的活动。

一个医疗软件团队在临床仪表板设计阶段按照 ISO/IEC TR 29119-11 进行了可用性测试。在编写一行生产代码之前，通过让五位临床医生进行测试，他们发现所提出的数据可视化方案在时间压力下难以解读。重新设计方案简化了图表并添加了可配置阈值，将平均任务完成时间从45秒减少到12秒，直接提升了临床决策速度。

常见问题

问：有效的可用性测试需要多少参与者？
答：Nielsen Norman Group 的研究表明，每个用户群体5名参与者可以发现大约80%的可用性问题。对于关键系统（医疗、航空、金融），建议每组8-10名参与者以获得更高的置信度。

问：可用性测试和用户验收测试有什么区别？
答：用户验收测试从用户角度验证系统是否满足合同或法规要求。可用性测试评估用户交互的质量——易用性、效率、满意度。用户验收测试问”它能工作吗？”而可用性测试问”用户能有效地使用它吗？”

问：可用性测试可以自动化吗？
答：某些方面可以部分自动化——热力图追踪、点击流分析、A/B测试——但可用性测试的核心（观察真实用户执行真实任务）需要人工观察和定性分析。自动化工具可以补充但不能替代主持式测试。

问：29119-11 与 ISO 9241 有何关系？
答：ISO 9241 提供了可用性的基础定义和原则（有效性、效率、满意度）。ISO/IEC TR 29119-11 将这些原则操作化，形成了 ISO 29119 测试框架内的一个测试流程。这两个标准是互补的。

📥 标准文件下载

🔒

请等待 10 秒，广告加载完成后将显示下载链接

暂无下载文件

可用性测试流程

可用性指标与评估技术

无障碍测试集成

常见问题

📥 标准文件下载

发表回复取消回复

Trending now