ISO 26162-1:2019 术语数据库 第1部分:设计

术语资源管理 — 术语数据库 — 设计

一、术语数据库设计基础

ISO 26162-1:2019是ISO 26162系列的第一部分,为术语数据库的设计提供了全面指南。随着组织越来越多地管理多语言术语资产用于技术文档、软件本地化和企业知识管理,结构良好的数据库设计对于运营效率变得至关重要。本标准建立了术语管理系统的概念框架和数据模型要求,重点是概念导向方法,即每个术语条目代表一个概念而非一个词条。这种方法与传统词典式数据库有根本区别,为跨不同技术领域的多语言术语工作提供了更优越的支持。

该标准采用模块化数据模型方法,将概念层、语言层和管理层分开,这种设计模式最大限度地提高了跨不同学科领域和语言的灵活性和可重用性。这种分层方法允许独立管理每个信息层面,同时保持概念完整性。

核心设计原则是多个术语(包括同义词、缩写、拼写变体和翻译等效词)可以通过同一概念标识符跨语言关联。这使得翻译人员能够直接导航到任何支持语言中的等效术语,技术作者能够在文档集中保持术语一致性,知识管理者能够构建丰富的概念网络。概念导向方法还支持高级功能,如自动术语识别、翻译记忆集成和从文档语料库中提取术语,所有这些都依赖于干净的概念级数据组织。

数据层级 描述 关键要素
概念层 构成数据库基础的核心条目标识符 概念ID、定义、领域分类、概念关系
语言层 每个概念在所有支持语言中的特定语言信息 术语、语法信息、用法说明、上下文示例
术语层 不同使用场景和语域的变体详情 拼写变体、缩略语、同义词、术语类型分类
管理层 确保质量和治理的元数据管理 创建日期、最后修改、批准状态、负责人

二、核心数据类别与建模

标准规定了与ISO 12620和TBX格式一致的全面数据类别集。每个类别都经过精心定义,包括其用途、允许值和用法约束,确保不同实施和组织的应用一致性。数据类别支持从初始术语创建到维护直至最终退役的完整术语生命周期,为专业术语管理提供了一个完整的框架,可从小型项目特定术语列表扩展到包含数十万条目的企业级术语资产。

实施ISO 26162-1原则的良好设计术语数据库可通过提高术语一致性将翻译成本降低高达30%,消除技术文档中的歧义,简化多语言环境中的法规合规性,并通过向翻译人员提供即时批准的术语访问来加速内容本地化周期。

主要类别包括使用标准分类法的学科领域分类、定义类型(描述性、规定性和操作性,具有特定的结构要求)、语法信息(词性、性、数和形态丰富语言的屈折范式)、用法标签(推荐、允许、弃用、过时和替代)、区域语言变体的地理用法限制,以及建立相关概念间关系的交叉引用。标准特别强调记录术语关系的重要性——属种层次、整体-部分分解和关联主题联系——因为这些关系支持智能概念导航和语义查询扩展。

三、工程团队的实施策略

成功实施需要在任何软件选型开始之前进行仔细的预先规划。工程团队应进行领域概念清查,将学科领域分类映射到现有组织分类法,定义质量指标和验收标准,并建立具有明确角色和责任的治理程序。标准推荐基于角色的访问控制模型,术语专家、领域专家、翻译人员和审核人员拥有与其责任相匹配的明确定义的权限,确保在整个内容生命周期中保持术语质量。

术语数据库实施中一个常见且代价高昂的陷阱是将系统视为简单的词汇表或词典工具。ISO 26162-1强制要求采用概念导向方法,其中定义和元数据附加到概念而非单个术语。忽视这一原则的组织不可避免地会遇到数据冗余、概念不一致和重大的返工成本,这些成本可能使项目预算成倍增加。

通过状态指示符(首选、允许、弃用)、带有记录程序的强制性审查周期、带有审计跟踪的全面版本管理以及检查完整性、一致性和数据类别规范合规性的自动验证规则,质量控制被嵌入数据库中。标准建议设立一个由技术写作、翻译、工程和法律部门代表组成的术语管理委员会,监督从创建到退役的完整术语生命周期,确保与组织目标和法规要求保持一致。

跳过系统设计阶段直接实施术语软件的组织几乎总是面临后续大量的数据迁移和重构成本。关于数据类别、概念关系类型、多语言映射策略和质量指标的设计决策对数据质量、可用性以及与下游系统(如内容管理平台和机器翻译引擎)的互操作性具有长期影响。

四、常见问题解答

问1:概念导向数据库与词条导向数据库在实际应用中有何区别?
概念导向数据库中,每个条目通过共享的概念标识符表示一个概念及其所有关联术语,确保跨语言的概念完整性。词条导向数据库将每个术语视为独立条目,使得多语言管理变得明显更复杂且更容易出错。
问2:ISO 26162-1与TBX交换格式有何关系?
TBX(定义于ISO 30042)是术语数据的基于XML的交换格式。ISO 26162-1建立概念设计原则并规定所需数据类别,而TBX提供在不同术语管理系统间交换数据的机器可读语法。
问3:合规术语数据库最少需要哪些数据类别?
至少需要:唯一概念标识符、至少一种语言的术语、定义或说明、词性分类、学科领域分配和管理状态指示符。专业应用还应包括用法标签、地理限制和全面的交叉引用。
问4:术语数据库应多久进行一次正式审查?
标准建议持续维护,结合不超过12个月间隔的正式记录审查。支持安全关键或监管领域的术语可能需要每季度审查,每个条目应带有审查日期和下次计划审查日期以进行合规跟踪。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注