ISO 25964-1:2011 信息检索用叙词表

叙词表构建、维护与互操作性的全面指南

一、叙词表结构与信息检索

ISO 25964-1:2011 为信息检索系统中叙词表的构建、维护和管理提供全面指导。叙词表是一种受控词汇表,通过层级、关联和等同关系展示概念关联。该标准取代 ISO 2788 和 ISO 5964,统一了单语和多语指南。三种基本关系为层级关系、关联关系和等同关系。层级关系细分为属种关系、整体-部分关系和实例关系。

从分面分析入手,确保全面覆盖和逻辑一致性。
关系类型 标签 示例 规则
属种 BTG/NTG 车辆到汽车 下位是上位实例
整体-部分 BTP/NTP 欧洲到法国 下位是上位部分
实例 BTI/NTI 行星到火星 下位是命名实例
关联 RT 诊断/治疗 非层级关联
等同 USE/UF 汽车代轿车 同义词控制

二、词汇控制与术语选择

术语选择是叙词表构建的关键。标准提供语法形式、大写、标点和特殊字符处理的指导。复合术语需特别关注,通过决策树确定预先组合还是后组配。等同关系包括准同义词,是一种务实管理词汇量的方法。第8章详细说明了这种方法。多语种叙词表中的跨语言等同关系需要处理不同语言的语义结构差异。

避免过长复合术语,后组配提高标引一致性和检索灵活性。

三、数据模型、交换格式与互操作性

第15章引入关系表形式和 XML Schema 的正式数据模型。关键实体包括概念、术语、关系和注释,支持多语种环境。该模型与 SKOS 兼容。标准涵盖展示格式、字符编码、排序规则以及与标引和搜索应用的集成。第17-18章涵盖交换格式和协议。

采用该数据模型可降低系统迁移成本,SKOS 兼容性在语义网应用中极具价值。

常见问题

问:与 ISO 2788 有何区别?
答:ISO 25964-1 取代两者,提供统一指导包括分面分析、正式数据模型和 XML 交换格式。
问:可用于本体吗?
答:原则适用于分类法,本体方面 ISO 25964-2 提供指导。
问:处理同形异义词?
答:括号限定词消除歧义,每个作为独立概念。
问:有哪些支持软件?
答:Synaptica、PoolParty、VocBench 等支持该数据模型。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注