医疗卫生信息基础知识解析

一、医疗卫生信息标准认知

1. 基础介绍

标准是通过标准化活动,按照规定的程序经协商一致制定,为各种活动或其结果提供规则、指南或特性,供共同使用和重复使用的文件。

2. 标准类型

在标准体系模型中,按照标准的适用范围或级别,可以分为国家标准、行业标准、地方标准、企业标准。其中在GB/T 20000.1-2014中对规范文件进行了相关说明,指规范用于规定产品、过程或服务应满足的技术要求的文件,可以是标准的一个部分或标准以外的其他标准化文件。标准文件类型分为:国家标准、行业标准、地方标准、团体标准与规范性文件,具体介绍如下:

医疗卫生信息基础知识解析

3. 标准分类

目前,国内没有医疗健康信息标准的分类规范,国外不同的标准组织对医疗健康信息标准的分类方式也不一样。

在2009年原国家卫生部卫生信息标准化专业委员会提出信息标准体系架构图上,将卫生信息标准分类为:

基础类标准、数据类标准、技术类标准、安全类标准、管理类标准,这也是目前国内通常引用的卫生信息标准分类,具体介绍如下:

  • 基础类标准:信息模型、医学术语、标识、体系框架;
  • 数据类标准:数据元与元数据、分类与编码、数据集、共享文档规范;
  • 技术类标准:功能规范、技术规范、传输与交换;
  • 安全类标准:信息安全、隐私保护;
  • 管理类标准:建设指南、测试评价、运维管理、监理验收。

结合信息标准体系架构与实际标准的发布情况,目前元数据服务中信息标准文件的分为12类,具体介绍如下:

医疗卫生信息基础知识解析

医疗卫生信息基础知识解析

医疗卫生信息基础知识解析

医疗卫生信息基础知识解析

医疗卫生信息标准分类图

4. 标准性质

《标准化法》第二条规定:国家标准分为强制性标准、推荐性标准,行业标准、地方标准是推荐性标准。《行业标准管理办法》第四条规定:行业标准分为强制性标准和推荐性标准,相关标识如下:国家标准:GB为强制性标准,GB/T为推荐性标准,GB/Z为指导性标准。卫生行业标准:WS为强制性标准,WS/T为推荐性标准。

5. 标准状态

标准状态分为现行、废止。

二、医疗卫生信息标准之数据元

1. 数据元概念

数据元概念(data element concept DEC)是能以一个数据元的形式表示的概念,其描述与任何特定表示法无关。一个数据元概念由对象类和特性组成。如下图左侧:

医疗卫生信息基础知识解析

2. 数据元组成

数据元是一组属性规定定义、标识、表示和允许值的数据单元。数据单元是信息的基本单位,例如住院病案首页中的病案号、姓名、入院诊断、主要诊断等都是基本的数据单元,为数据单元赋予属性就称为数据元。

数据元的目的是建立标准化的数据表达、采集、存储和传输格式,以实现数据的正确表达和理解。

在一定语境下,构建一个语义正确、独立且无歧义的特定概念语义的信息单元,同时可理解为数据的基本单元。数据元是卫生信息的最基本的结构化(标准)单元,每一项医疗卫生业务信息都可由若干数据元组成,例如一张标准格式的病案首页就由100多个数据元组成。围绕一定业务主题形成的数据元集合称为数据集,数据元的实际应用通常是以基本数据集的形式实现的。

一个数据元由数据元概念和表示组成,其中表示描述数据的形式,包括值域、数据类型、表示类(可选的),必要时还包括计量单位。如下图右侧:

医疗卫生信息基础知识解析

示例一:数据概念 值域;

【数据元】黄疸部位代码表

【数据概念】黄疸部位,黄疸是对象词,部位是特性词。

【值域】代码表是表示词。

医疗卫生信息基础知识解析

示例二:数据概念 计量单位;

【数据元】儿童体检年龄(月)。

【数据概念】儿童体检,儿童是对象词,体检是特性词。

【值域】年龄(月)是表示词。

医疗卫生信息基础知识解析

3. 数据元基本模型

数据元的基本模型是由数据元概念和数据元两部分组成。

4. 数据元概念与数据元关系

一个数据元由数据元概念和表示组成。

一个数元概念对应多个数据元。

5. 对象

对象类是可以对其界限和含义进行明确的标识,且特性和行为遵循相同规则的观念、抽象概念或现实世界中事物的集合。

它是我们希望采集和存储数据的事物。对象类是概念,在面向对象的模型中与类相对应,在实体-关系模型中与实体对应,

例如,患者、医生、卫生机构等。对象类可能是一般概念。当对象类所对应的对象集有两个或多个元素时,就是一般概念。患者、医生、卫生机构等都是一般概念对象类也可以是个别概念。

当对象类对应的对象集仅有一个元素时,就是个别概念,例如“北京市医疗机构”就是个别概念。

6. 特性

特性是一个对象类的所有成员所共有的特征。它用来区别和描述对象,是对象类的特征,但不一定是本质特征,它们构成对象类的内涵。特性也是概念,对应于面向对象模型或实体-关系模型中的属性。

例如身高、体重、血压、脉搏、血型等。特性也可是一般概念或个别概念。作为个别概念的例子有:病床总数或医疗收入。

卫生健康信息数据元是卫生这一特定领域的数据元,它的概念和结构遵循通用数据元的概念和结构,但具有自身的特点。医药卫生领域包括基础医学、临床医学、公共卫生、中医药学等多个专业,其数据元的表现形式复杂,例如数字人体、医学影像、基因图谱、中医经络等,除具有通用数据元的属性外,还具有其鲜明的领域特殊性。

7. 数据类型与表示符

医疗卫生信息基础知识解析

8. 数据元值的表示格式中字符含义描述规则

医疗卫生信息基础知识解析

9. 数据元值的表示格式中字符长度描述规则

医疗卫生信息基础知识解析

应用示例:

示例1:S字符型

AN10 固定为10个字符(相当于5个汉字)长度的字符。

AN..10 可变长度,最大为10个字符长度的字符。

AN4..10 可变长度,最小为4个最大为10个字符长度的字符。

AN..20X3可变长度,最多3行每行最大长度为20个字符长度的字符。

示例2:N数字型

N4固定长度为4位的数字。

N..4最大长度为4位的数字。

N6,2最大长度为6位的十进制小数格式(包括小数点),小数点后保留2位数字。

示例3:T日期时间型

T8采YYYYMMDD格式(8位定长)显示年月日。

T15采用YYYYMMDDThhmmss格式(15位定长)表示日时分秒。时分秒之前加大写字母“T。

如2010年1月5日8时10分9秒为20100105T081009。

资料参考:

WS/T 303-2023 卫生健康信息数据元标准化规则

WS/T 363.2-2023 卫生健康信息数据元目录 第2部分:标识

三、医疗健康信息标准之值域

1. 值域基本模型

值域的基本模型由概念域和值域两部分组成,一个概念域对应多个值域。

医疗卫生信息基础知识解析

2. 值域

值域(vale domain,VD)是允许值的集合。一个允许值是某个值和该值的值含义的组合。该关联含义称为值含义。值域是一个或多个数据元有效值的集合,用于在信息系统和数据交换中确认数据的有效性。它也是描述一个数据元的元数据的必要构成部分。特别是,值域是数据元所表示的数据内容、形式和结构的指南。

值域有两种(非互斥的)子类:

可枚举值域:由允许值列表规定的值域;

一个可枚举值域是包含了它的所有值及值含义的一个列表,例如:患者血型类别代码。

医疗卫生信息基础知识解析

不可枚举值域:由描述规定的值域。

一个不可枚举值域是由一个描述来规定。不可枚举值域的描述须准确描述属于该值域的允许值。例如,“传染病死亡率”数据元的值域是大于等于0且小于等于1的实数。

描述数据有时需要计量单位。例如描述血压的值域记录时,为了准确理解值含义,需要使用计量单位moHg或kPa: 年龄值域记录的计量单位可使用年、月、周、日:血糖值域记录的计量单位可以是mg/d或mmol/L。所以,计量单位与值域关联。

3. 概念域

概念的外延构成了概念域,一个概念域是一个值含义集合。一个概念域的内涵是它的值含义。概念域也有两种(非互斥的)子类:

一可枚举概念域:由值含义列表规定的概念域:一不可枚举概念域:由描述规定的概念域。可枚举概念域的值含义可以明确地列举。该类型概念域对应于可枚举类型的值域,例如:

医疗卫生信息基础知识解析

不可枚举概念域的值含义由“不可枚举概念域描述规则”来表述。该规则描述了不可枚举值域中允许值的含义。这种类型的概念域对应于不可枚举类型的值域,例如:

医疗卫生信息基础知识解析

如果一个计量单位的任何量可以转化为另一种计量单位下等同的量,则这些计量单位彼此之间是等价的。所有等价的计量单位被认为具有相同的维。例如,长度计量单位(米,厘米等)具有相同的维,年龄计量单位(年、月、周、日) 具有相同的维。所以,维与概念域关联。

四、医疗卫生信息标准之数据集

在卫生领域信息化的快速发展过程中,积累了大量来自于不同系统、不同机构的异构数据资源。伴随着对这些数据资源进行整合与交流的需求不断增长,数据集这一数据组织方式得到了应用和推广。

1. 数据集

具有一定主题,可以标识并被计算机处理的数据集合,旨在为相关业务数据的登记提供一套术语规范、定义明确、语义语境无歧义的标准,数据元是卫生信息的最基本的结构化(标准)单元,每一项医疗卫生业务信息都可由若干数据元组成,例如一张标准格式的病案首页就由100多个数据元组成。围绕一定业务主题形成的数据元集合称为数据集,数据元的实际应用通常是以基本数据集的形式实现的。

主题:围绕着某一项特定任务或活动进行数据规划和设计时,对其内容进行的系统归纳和描述。通常数据集主题应具有划分性和层级性。划分性是指主题间可通过不同的命名,将相同属性的主题归并在一起形成相同的类,将不同属性的主题区分开形成不同的类;层级性是指主题可被划分成若干子主题或子子主题。

可标识:指能通过规范的名称和标识符等对数据集进行标记,以供识别。标识与名称的取值需要通过具体的命名或编码规则来规范。

能被计算机处理:指可以通过计算机技术(软硬件、网络),对数据集内容进行发布、交换、管理和算机系统中以数值、日期、字符、图像等不同的类型表达。

数据集合:指由按照数据元所形成的若干数据记录所构成的集合。例如,病案首页数据集由主索引、基本信息、诊断信息、入出院信息、手术信息、费用信息等不同数据组成。

2. 卫生健康信息数据集

卫生健康信息数据集是在卫生健康领域,为满足政府卫生决策、业务处理、科学研究、信息发布与绩效评价等需求,按照数据集概念设计、归纳、整合的主题信息集合。卫生健康领域的数据集主要可以

归纳为三个方面:

  1. 信息发布类统计数据集:如中国卫生健康统计年鉴中卫生机构设置及规模、卫生人员资源的地区分布、卫生经费的筹集及分配等数据集,各类卫生机构的统计月报、年报,以及满足某一专项统计需求通过统计收集、归纳、整理、报告形成的数据集。例如:卫生统计指标。
  2. 业务系统建设类的基本数据集:包括医疗服务、公共卫生、药品供应、医疗保障、卫生管理等领域为了满足业务信息系统规范化建设和领域内部以及领域间数据交换与共享需求,设计归纳的各个子系统(或者功能模块)所包含的最小数据元素的集合。如:儿童出生登记、个人健康档案、住院病人入出转、居民死亡登记报告电子病历基本数据集 、疾病管理基本数据集等数据集。
  3. 为满足特定目的收集整理制作的数据集:包括通过调查、观察、监测、检测、试验、实验等方式获取的满足科学研究、业务咨询或卫生服务决策等需求的数据集。如:近年来国家投入建设的国家人口健康科学数据集、卫生服务调查数据集、疾病及危险因素调查等内容的数据集。

五、医疗卫生信息标准之指标集、统计指标、分类方案

1. 指标集

指标集有一组统计指标组成,目的是衡量特定部门或地区提供、改善服务的情况。

例如,《全国医院上报数据统计分析指标集 (试行)》目的是为加强医院上报数据的分析和应用;

《病案管理质量控制指标(2021年版)》、肿瘤专业质量控制指标(2023年版)等,目的是为进一步加强医疗质量管理,规范临床诊疗行为,促进医疗服务的标准化、同质化。

2. 卫生统计指标

卫生统计指标(indicators of health statistics ,IHS)是反映一定时期、一定地区居民健康状况、健康影响因素、公共卫生服务、医疗服务、药品与材料供应保障、医疗保障、卫生资源和计划生育的统计指标。通过对卫生统计指标值的分析,可以:

  • 了解人群的健康状况、卫生系统绩效及健康影响因素的现状;
  • 可以监测人群健康整体目标的实现进程,为卫生健康政策制定和资源分配等提供支持;
  • 为公共卫生政策制定和实施有效的疾病防控措施提供依据;
  • 对卫生干预效果进行评估。

3. 分类方案

分类方案是根据对象具有的共同特征将对象进行排列或划分成组的描述性信息。分类方案是一般是一种官方术语系统,得到国家或国际机构的认可和认可,用于对数据进行分类。

如疾病分类与代码、手术/操作分类与代码、职业分类与代码等。分类方案项是分类方案的内容项,它可以是分类或本体中的一个节点,叙词表中的一个术语等。

值域是信息层面的数据,分类方案业务层面的数据。通常情况下,分类方案为值域提供相关业务参考,是值域的一个组成部分。但某种情况下,分类方案可以直接被数据元所使用。如分类方案“疾病分类与代码(ICD-10)“等分类系统得到行业的一致认同与使用。如数据元“疾病诊断代码”可以直接连接到分类方案“疾病分类与代码”。

六、医疗卫生信息标准之元数据

1. 数据元的元数据总体模型

数据元的元数据总体模型由概念层和表示层两个部分组成。概念层包括数据元概念类和概念域类。这两种类都表示概念。表示层包括数据元类和值域类。这两种类都表示数据值的容器。

医疗卫生信息基础知识解析

数据元的元数据总体模型

可以给出4个类(数据元、多个数据元、值域、数据元概念)的若干基本事实:

  • 一个数据元是一个数据元概念和一个值域的结合体;
  • 多个数据元可以共享相同数据元概念,这意味着一个数据元概念可以用多个不同方式表示。例如,患者入院时间是一个数据元概念,它可以有多个表示方法,例如用YYYYMMDD表示患者入院的年月日,如果需表示小时和分,则用YYYYMMDDhhmm表示。“患者性别代码-英文全称”、“患者性别代码-1位字母代码”共享同一个数据元概念患者性别。
  • 多个数据元可以共享相同的表示,这意味着一个值域可以被不同数据元重复利用。例如,“住院病人结算费用-元(人民币)”和“门急诊就诊费用-元(人民币)”数据元共享相同的值域“费用-元(人民币)”。
  • 值域不是必然与一个数据元关联,可以单独管理:
  • 不同值域所有允许值所对应的值含义都相同时,这些值域在概念上是等价的,因此,对应相同的概念域。例如,前述关于性别的值域:性别代码-1位数字、性别代码-英文全称及性别代码-1位字母代码的允许值所对应的值含义相同,均表示“男性、女性、未知的性别、未说明的性别”。所以这些值域对应同一个概念域“性别”。
  • 不同值域部分允许值所对应的值含义相同时,这些值域在概念上是相关的,因此,在包含有其各自概念域的概念体系中共享一个由共同的值含义构成的概念域。例如,性别代码-符号的允许值是“♂和♀”,分别表示“男性和女性”。无其他符号表示“未知的性别”和“未说明的性别”,那么性别代码-符号与性别代码-1位数字、性别代码-英文全称及性别代码-1位字母代码值域在概念上相关,共享由共同的值含义“男性和女性”构成的概念域“性别”。
  • 一个数据元概念仅与一个概念域相关,因此共享相同数据元概念的所有数据元共享概念上相关的表示。例如,“新生儿体重-N5,2(千克)”和“新生儿体重-N4(克)”是两个不同的数据元,共享一个数据元概念新生儿体重。两个数据元的表示在概念上是相关的,共享概念域“体重”。千克和克都是重量的计量单位,称具有相同的维度。因此计量单位与值域相关,维度与概念域相关。
  • 许多数据元概念可以共享相同的概念域。例如,患者体重和新生儿体重是两个不同的数据元概念,共享一个概念域“体重”。

2. 元数据概念

元数据(Metadata)是描述其它数据的数据(data about other data),或者说是用于提供某种资源的有关信息的结构数据。元数据是描述信息资源或数据等对象的数据,其使用目的在于:识别资源;评价资源;追踪资源在使用过程中的变化;实现简单高效地管理大量网络化数据;实现信息资源的有效发现、查找、一体化组织和对使用资源的有效管理。对元数据不了解的可看这边书《元数据:用数据的数据管理你的世界》[美]杰弗里·波梅兰茨。

3. 元数据管理模型

元数据管理是领域内数据类标准的数字化呈现,可提升医疗数据的准确性、一致性和互操作性。这对医疗健康数据,数据的治理至关重要。所有在设计医疗健康相关产品的数据就要有这个思维,也要这也去实施。

医疗卫生信息基础知识解析

版权声明

本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部