书城教材教辅医学信息学
19084100000054

第54章 临床决策支持系统(3)

由于当时尚未出现视窗技术,用户界面只提供基于文本的问答过程和结果显示。

MYCIN的知识库以前提条件——产生式规则来表示诊断和治疗细菌感染性疾病的专家级医学知识,以实现专家级诊断和治疗能力。MYCIN系统建立的初期按照下述格式在知识库中收集了200多条规则,其中047号规则表示为:

[规则047]

如果:(1)培养物取自血液,且

(2)病原体的身份未鉴别,且

(3)病原体的染色是革兰氏阴性,且

(4)病原体的形态为杆状,且

(5)患者被烧伤。

那么:该病原体的身份应鉴别为假单胞细菌,且可信度为0.4。

12.3.7规则推理的优缺点

规则推理的优点在于:

(1)与临床专家进行推理的过程相似。

(2)规则推理可以用于临床指导。

(3)将知识和工作流程分离。

另一方面,规则推理的局限包括:

(1)在一个较大的知识库中,难以避免规则之间的冲突。

(2)系统难以进行更新和维护,向大型的规则库中加入新规则会导致许多无法预见的结果,从而直接导致系统难以进行调试。

(3)许多类型的知识都难以通过规则的形式表达出来,如存在非确定性的知识以及随时间信息不断变化的知识内容。

(4)操作呆板,对于专业领域外的信息束手无策。

12.4CDSS 的方法——案例推理

12.4.1案例推理的特征和要求

用于决策支持的案例推理,与其他方法相比更接近人们进行实际决策的过程。该方法依据先例和对比结果进行推理。一些方法学诸如人工神经网络是基于案例的,某些传统的教学方法如临床住院医师的培养也是基于案例的。案例推理假定先前案例的解决方可能适用以后相似的案例。无论是车间中的技师还是临床医生,他们都会借助旧有案例的知识解决新问题。案例推理的方法仅仅是把先例和现例进行匹配,找出相同或相似案例,评估先前对应的解决方案是否可以直接使用或调整借鉴,然后应用到现有问题中。

案例参照的方法主要由推理模型和决策系统构建法两个方面组成。案例推理要求:

(1)案例的知识库要由一个以上的案例内容描述和解决方案组成。

(2)具备查询识别相似案例的能力。

(3)可以对先例的解决方案进行调整和使用。

(4)知识库具备添加新案例和解决方案的扩展能力。

12.4.2简单示例

一个15岁的男孩腹部疼痛、发烧、恶心且局限性触痛,抬起右腿时感觉有疼痛感。目标:诊断症状原因并选择适当的治疗方法。病历中记录着具体情况和解决目标。在医学案例的知识库中应该包括与其所有相关特点的描述、产生原因以及成功的诊断和治疗策略。

根据本例提供的信息,决策支持系统需要在知识库中寻找描述内容相近的案例以便评估先例的致病原因和治疗方案是否能够适用于现有问题。

可以看到,两个案例有很多相似之处,只不过属性值稍有不同,且第一个案例比后一个多出一项属性内容。事实上,案例推理的优点之一就是相似案例并非一定需要完全相同的关键属性或关键值,不同属性数量虽然不会阻碍知识库中案例间的匹配结果,但却增加了决定案例相似性的难度。

如果所有案例的属性都是相同的,我们只需要对比属性值的大小。但即使如此,仍旧需要考虑每个属性的重要程度。比如在上例中,当诊断内容为阑尾炎时,性别男或女都无关紧要,但当诊断内容为卵巢囊肿破裂时,性别的值就是一个关键指标了。

因此对于知识库中的每一个案例来说,相关专家都会根据具体情况为属性分配一个代表重要程度的权值。这个值可能是一个从0(无关)到10(具有决定性)的数。同时,通过对新案例和先例对比,得到对应属性的相似度用一个介于0到1的数表示,0代表两者完全不同,1代表匹配识别。

与此数值相比,第一个先例与问题示例之间计算出的相似度得分较低。但需要注意的是,通常在进行决策的过程中,仅参考与问题案例匹配分数最高的一个案例是不够的,系统往往要参照多个案例,以取得最佳方案。

12.4.3案例推理组成部分

一个典型的案例推理专家系统中通常包含以下几个部分:

(1)案例库——保存先前案例,以及对于案例内容的概括描述,并对案例进行索引以便快速查询。

(2)数据获取模块——当基于案例推理系统中录入新的案例时,此模块负责确定数据相似度。通过对比两例之间的单一属性确定局部相似性,再通过局部相似性和属性重要性权值全面地对两个案例进行对比。具体的寻找工作是以将新案例的属性为索引,在案例库中查询实现的。

(3)适配器——适配模块用来检查新旧案例所针对问题的不同,同时根据规则对旧有解决方案进行调整,以适应新案例面对的问题。

(4)提炼模块——用以根据先例的结果审阅经调整的解决方案。即参照重要性权值以及匹配相似度这两个参数与先例解决方案进行对比。如果先例的解决方案存在已知错误,则需要确定两例之间的相似性是否足以说明新的方案同样会失败。

(5)执行模块——一旦解决方案通过审定,执行模块将会在案例中应用此解决方案。

(6)评估模块——如果结果与预期相符,则不对其做进一步分析,并且案例及其解决方案将会被保存到案例库中以留后用;如果与预期不符,则需要进一步的修改纠正。

12.4.4基于案例推理的CASEY 诊断系统

由Koton博士于1988年开发的CASEY在心脏病管理程序中加入了基于案例诊断推理操作能力。CASEY不仅能够对诊断方法进行方法对比,同时还可以寻找相似案例进行案例对比。CASEY的运转模块可以通过输入的数据、因果诊断模型以及案例库进行工作。系统工作的第一步是通过输入临床表现在案例库中搜索相似先例。CASEY系统并未对临床表现的重要性进行分级划分,所以此阶段中所有的临床表现只是用来搜索匹配。

随即,通过因果诊断模型,CASEY可以对不同临床表现进行相似性评估。一旦匹配选定,下一步就是根据新例的临床发现内容与库中先例进行适配。最终通过因果诊断推理模块得到假设内容,且此假设可以完整解释所有的临床表现。最后,新案例的推理结果和背景信息将会被加入到案例库中。一个仅包含50个案例的知识库,涉及大约10种不同的疾病,基本上就可以满足相关的80%的新案例的诊断要求。通常,概率推理程序得到的结果较优,但在某些案例中,CASEY 反而能取得比较好的结果。甚至在不同案例的临床表现相似度很小的情况下,由于同时具备了案例推理和因果模型推理的优点,CASEY能较为高效地进行案例的联合推理。事实上,CASEY也是第一个有效地兼顾了两类推理方法的系统。

12.4.5案例推理的优点和局限

由于容易获取疾病案例和其解决方案的数据,所以用以支持案例推理的知识库易于构建;通过案例推理的方法能够较快地得出问题解决方案。由于其依靠的是大量旧有案例,因此在不熟悉的领域内案例推理的方法仍然有效。

同样,案例推理也有其局限性,包括:

(1)难以获取足够多的先例匹配所有案例,所以当遇到某些罕见案例时,案例推理无法发挥作用。

(2)在无法正确判定新例的前提下盲目参考先例内容带来误导。

(3)对于可参考的内容存在获取和调整的问题,案例库中存取的不良的解决方案可能会在案例推理的过程中产生副作用。

12.5CDSS的设计与实施

从20世纪70年代开始,许多研究人员对于医学人工智能系统(如MYCIN,CASNET)的发展前景非常乐观。当时的观点认为个人计算机系统成为临床诊断中的一个标准部分只是一个时间问题。在过去的几十年中,计算机系统成功地应用于很多临床诊断乃至更为广泛的临床应用领域,如医生医嘱录入中提供了有效的提示、建议等辅助功能。

然而,CDSS至今为止仍然无法在医疗环境中得到广泛使用。在本节的内容中,我们会讨论导致现状的原因和改进机遇。

12.5.1CDSS的挑战

从使用角度上看,个人计算机和其他硬件设备不足,软件不够友好,医生对软件程序存在不信任和惧怕的态度,以及决策程序覆盖范围较为单一的问题,阻碍了CDSS 的大面积采用,但此类问题随时间推移会逐步得到改善。而另一方面,限于目前医学信息学发展现状,很多科学难题在短期之内难以得到理想的解决,如难以实现较完整的医学数据库,高效的决策规则集,计算机诊断结果正确率低等问题,导致临床医生很难在临床中大面积使用CDSS。尽管有些系统(如利兹腹痛辅助决策系统)在专科领域取得了良好的效果,但因专科的性质,加之其他决策支持系统在多病种环境中失败的案例,削弱了CDSS在更广阔的范围内获得成功的可能。

此外,由于缺乏基于标准信息系统之间的整合能力,繁忙紧张的临床医护人员不得不为CDSS进行重复性的数据录入,这种耗时乏味的工作极大地打消了用户乃至应用部门的热情和积极性,阻力自然不言而喻。尽管如此,医学领域存在的复杂性和大量的不确定性使CDSS系统整合理论的构建和实践经验积累工作变得格外的困难。与CDSS相比,其他领域的专家系统要轻松得多。

根据Luger和Stubblefield对于专家系统的分析,目前的CDSS普遍存在的五个问题:

(1)缺乏临床内容之间的因果关联,计算机系统自身不可能理解应用生理学知识内容,确定因果性。

(2)系统缺乏稳定性和灵活性。在无法从知识库中找到新问题时,既无法解决问题,更不可能提出整套的解决方案。

(3)难以提供内容详细深入的解释。

(4)难以对决策结果进行确认核对。

(5)系统无法根据经验进行主动学习。

因此为了使CDSS的性能得到改进并广泛实施,除了解决推理方法、知识表达和知识的技术设计问题,还需要了解目前人机交互配合过程中产生的问题及原因。

12.5.2推理方法概述

早期CDSS的设计强调人工智能,这跟当时程序设计人员的研究兴趣是紧密相关的。

当时,大量诊断专家系统的工作机理都是模仿医学专家的推理过程,比如MYCIN,利兹腹痛系统等等。虽然系统具有一定的决策能力,但实际上还无法在推理方面和人相提并论。因为其既不能理解什么是解剖病理学,也无法处理时间的概念,更不可能主动学习并由此推理得到新内容、新结论。虽然在一个比较有限的专业范围之内,某些系统的诊断能力能与医学专家媲美,可一旦扩大其使用范围,性能便会毫无悬念地急剧降低。不过专科诊断支持系统在研究过程中积累的各种经验推动了CDSS在更广阔临床领域的发展。在前面的几节中,我们已经详细介绍了概率推理、规则推理以及案例推理的方法。除此之外,因果推理、决策理论推理、常识推理等方法并不在本书的讨论范围之内,有兴趣的同学可以自行参考相关书籍进行更进一步了解。

12.5.3知识表达

CDSS完成各种推理决策任务的基础是由数据内容和表达模式构成的临床决策知识库。独立的数据在未经关联前通常是难以理解的,如数字17000。只有在与其他内容,如“白血球计数”关联之后才具有实际意义。所以在知识库中如何充分高效地表达某领域知识内容,并为相应的智能计算机系统提供格式化的专业数据,从而提高信息处理效率则变得非常关键。到目前为止,知识表达形式可以大致分为:逻辑知识表达法、程序化知识表达法、网络表达法以及结构表达法。

命题逻辑:在基于逻辑的知识表达中,命题逻辑是在人工智能研究中第一个被广泛使用的表达格式。命题指不置可否的陈述内容。陈述语句可以用单一的字母来表示,如P。不同的语句根据and,or和not 逻辑连接成完整句子,以表达内容之间的逻辑关系。

举例说明,两个命题“缺铁性贫血MCV(红血球体积)减小”和“恶性贫血MCV 增大”用字母表示为P和Q,则符合命题逻辑的句式应为“P and Q”,“P or Q”以及“P and not Q”等等。

在命题逻辑中,P 或Q 作为一个整体同时存在,每个短句中的片段内容不能独立使用。

一阶谓词演算:而一阶逻辑表达法则没有以上的限制。谓词演算提供的逻辑表达方法允许使用断言的片段内容作为变量,而不需要像命题逻辑一样把整个句子内容紧紧绑定在一起。上例使用一阶逻辑可以表达为MCV(增大,恶性贫血),MCV(减小,缺铁性贫血)。MCV 被称为谓项,表达括号内多个对象之间的关联信息。借助这种灵活特性,还可以通过如MCV(x,缺铁性贫血)提出“在缺铁性贫血的情况下,MCV 的值是怎样”的问题。一阶逻辑通过向知识库中加入谓词并借助谓词进行提问的能力推动了逻辑规则在专家系统中的使用。其中着名的编程语言PROLOG(名称源于PROgramming in LOGic)。

它通过一阶谓词演算的知识表达法,帮助研究人员设计开发了许多着名的专家系统。