IEC 62731-2018:电视语音合成(TTS)通用要求

通过标准化TTS功能,让视障人士也能轻松使用电视

一、引言与范围

IEC 62731-2018 由 IEC TC 100(音频、视频和多媒体系统及设备技术委员会)制定,规定了数字电视接收器的语音合成(TTS)功能要求。第二版替代了2013年第一版,引入了多项重大改进,包括通过网络更新TTS发音词典的能力和增强的通告质量等级。该标准适用于固定和半固定数字电视接收设备,如机顶盒、数字一体机和支持电视功能的录像机,但不适用于以电视为次要功能的产品(如带有电视接收卡的PC或游戏机)。

提示:该标准认可两种系统架构:集成TTS生成功能的单设备方案,以及电视与外部TTS设备配合的双设备方案。这种灵活性允许制造商利用现有的外部辅助设备来节约成本。

二、视障用户的核心需求

2.1 五大关键需求领域

标准基于对视障电视观众的调研,确定了五个关键需求领域:频道导航(播报频道名称、编号和当前节目信息)、输入源切换(识别HDMI输入、AV源和连接设备)、附加数据服务(阅读图文电视、字幕、电子节目指南和交互内容)、电视操作(为菜单导航、音量控制和设置调整提供语音反馈),以及电视功能使用(管理录制、暂停/直播和回看服务)。

2.2 上下文感知通告

该标准的一个重要创新是上下文感知TTS概念。电视系统能够识别用户所处的上下文(观看电视、浏览EPG、调整设置),并提供相应的语音反馈。例如,换台时应播报频道名称、节目名称和起止时间,而在EPG上下文中则应播报节目描述和排期信息。

重要:标准规定优先级音频信息(如紧急警报)必须立即中断正常TTS输出,确保视障用户及时收到关键安全信息。

三、TTS配置文件与功能要求

IEC 62731定义了三种TTS配置文件,功能等级逐级递增:

配置文件 级别 功能特点 目标应用场景
基本型 入门级 换台播报、音量指示、简单菜单导航 低成本接收器、基础无障碍需求
主流型 标准级 完整EPG阅读、节目信息、字幕渲染、输入切换 注重无障碍的主流电视
增强型 高级 包含主流型所有功能,外加交互服务、智能电视应用、高级导航 高端智能电视、全面无障碍方案
工程见解:2018版本引入的通过网络连接接收更新发音词典和转换规则的机制是一项重大改进。它允许在不更新固件的情况下纠正专有名词、品牌名称和外语词汇的错误发音。工程师在设计TTS系统时应包含可网络更新的发音数据库和版本管理功能。

四、电视事件与TTS数据映射

标准定义了电视事件与TTS播报数据之间的完整映射关系。事件状态机包括:频道切换、节目开始/结束、EPG导航、菜单选择、弹出消息、输入源切换和上下文切换。针对每个事件,标准明确规定了TTS输出中必须包含的信息要素。

关键实施提示:TTS集成中最具挑战性的方面之一是处理上下文切换——当用户在电视的不同功能之间切换时(如从直播电视切换到EPG)。标准要求TTS在提供详细信息之前清晰地播报新上下文。工程师需实现跟踪当前上下文的状态机,并据此筛选TTS数据,避免信息过载。

五、常见问题

问1:IEC 62731仅适用于广播电视,还是也适用于流媒体设备?

答:该标准适用于以接收电视内容为主要功能的接收器。虽然重点在于广播电视,但TTS原理和配置文件也适用于流媒体和混合设备。不过,以电视接收为次要功能的PC和游戏机被明确排除。

问2:TTS系统需要支持哪些语言?

答:标准要求支持用户界面和广播内容的语言,但未强制指定具体语言种类。实践中,制造商为其目标市场使用的语言实现TTS功能。2018版引入的网络可更新发音功能有助于处理多语言内容。

问3:字幕/隐藏式字幕的TTS如何处理?

答:字幕被视为TTS数据,在字幕显示激活时需要朗读。TTS可以即时朗读字幕,也可以按需朗读。标准包含了处理字幕格式转换、多字幕轨道以及与节目音频同步的相关规定。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注