19084100000090

第90章医学信息学展望(1)

医学信息学是一门新兴的、跨学科的、综合性的边缘学科，该领域的研究者来自于医学、生物学、计算机科学、信息管理科学、认知科学、电子学等领域。研究者利用自己的特长，加上和不同背景的同事间的合作，推动了这一行业的发展。经过十几年的快速发展，医学信息学的研究成果为提高医院管理效率、降低医疗成本、提高医疗质量、降低医疗风险等方面作出了卓越的贡献。那么，医学信息学发展的下一步将走向哪里？我国医学信息学面临着怎样的特殊状况？医学信息学工作者们又肩负着怎样的使命？本章我们将从医学信息学所面临的挑战谈起，进而展望本学科的未来。学习了本章以后，你应当能回答下列问题：

医学信息学所面临的挑战有哪些？

这些挑战中哪些是技术上的，哪些是政策上的？

我们通过什么样的手段来攻克这些挑战？

医学信息学发展中所拥有的机遇有哪些？

医学信息学在我国的发展中面临哪些特殊的挑战和机遇？

20.1医学信息学面临的挑战和机遇

我们目前所处时代的信息技术发展迅猛，在民众中的普及程度飞速提高。在医学信息应用领域，医学信息系统的用户，包括医护人员（医生、护士等）、患者及健康人、公共卫生管理及决策人员等，对信息质量的要求也随之快速提高。用户期望医学信息系统可以自动处理以及管理日常医疗服务中产生的海量数据，可以为不同的患者提供个性化的数据和信息服务（包括基因等分子水平数据及临床数据），能够提高信息的利用效率并减少其存储成本，从而降低医疗机构的运营管理成本。总的来说，用户要求医学信息系统可以完成海量数据处理，满足个性化需求，提供公共卫生管理及决策，优化成本控制等基本任务。当今的医学信息系统研究者及生产商们都在努力满足用户的各种需求，为了更好地推进本学科的发展，美国得克萨斯大学休斯敦医疗中心Dean F.Sittig 教授曾在1994年提出了九条医学信息学所面临的具体挑战（Sittig，1994）。尽管15年过去了，这些挑战还没有一个被真正征服。这九个挑战能够给读者提供在医学信息学领域当今和未来研究方向的具体印象，所以本节我们对这九个挑战进行较为详细的探讨。需要注意的是，这九个挑战并不是医学信息学发展的全部问题，随着科技的进步，其他方面的挑战也会应运而生，另外政策层面的考验也会对医学信息学的发展起到很大的影响。

20.1.1医学信息学的九大挑战

Sittig 教授（Sittig，1994）提出的九大挑战既是独立的科技难题又互相依赖，例如完整的可以作为资源库实现区域性资源共享的电子病历系统以及自动的纯文本信息编码系统都需要统一受控医学词汇库的支持。当代医学的一个重要发展方向是为患者提供高质量、便捷且灵活的医疗服务，这就需要医疗服务的内容载体——医学信息，能够及时、高速且准确地传递给患者本人或医疗服务提供者。这样一个看似简单的过程就需要这九大挑战中的多项研究成果来协同实现。下面逐个介绍这九大挑战。

1）统一受控医学词汇库

统一的受控的医学词汇库是一切医学信息系统的基础。能否成功建立一个这样的词汇库决定了医学信息能否在各种系统间.通无阻，也决定了医学信息能否由计算机来进行自动处理。

研究者在建立这样一个词汇库上投入了大量的精力，目前已经开发并投入使用的主流医学词汇库有ICD，LONIC，CPT，SNOMED，GO，UMLS等等。但是每一种词汇库的应用都有其局限性，因为每种词汇库都是建立在医学信息的不同时代、不同层面或不同方面的抽象模型上。目前还没有一个词汇库拥有对所有医学信息及其逻辑关系进行编码的能力。例如，ICD 只适用于对诊断进行编码；LONIC 则适用于对与化验相关的事务进行编码；而CPT 则着眼于对医疗器械及费用的编码（Shortliffe，2006）。目前这种每一个词汇库只专长于某一方面的情况，使得医学信息系统开发者在应用时要使用不同的词汇库。学习和维护这些不同的词汇库对系统开发者是一个艰难的负担。每一个词汇库都希望能被更广泛地使用，但是，由于其模型只是对医学的一个片面的抽象，所以，即便设计为通用编码词汇库的SNOMED 也还远远不能编码所有医学中产生的数据、信息及其逻辑关系等。所以，一个统一且受控的词汇库就显得至关重要了。

为此，研究者们正在进行很多尝试，例如SNOMED RT 就是要解决如何描述SNOMED 编码逻辑关系的问题。为了解决各个词汇表之间互通性的问题，美国国家图书馆领导了UMLS通用医学语言系统的开发，UMLS的角色是几个主流编码词汇库的中继站，它收集了包括ICD、MeSH、ICPC、SNOMED、WHO 药物不良反应术语库及英国临床词汇库在内的主流词汇库。又通过UMLS同义词表收集各个词汇库实现统一性，并通过UMLS语义网（Semantic Web）描述词汇之间的逻辑关系以实现受控性。UMLS还提供了专家词典来协助开发自动编码自然语言病历的智能系统。可以说UMLS是迈向统一受控词汇库的一大步。但是UMLS的复杂性，以及由于基于其他词汇表导致词汇间的逻辑关系容易出现冗余，而在一定程度上阻碍了UMLS的进一步应用（Coiera，2003）。

2）完整的电子病历系统

完整的电子病历系统，可以作为区域性、国家性、跨国家性的资源库，并且允许系统间进行信息的交互。

电子病历在很多方面优于传统病历，其中之一就是允许病历信息较为自由地交互。

一个区域、一个国家乃至世界范围，如果电子病历的普及程度达到很高水平，那么该区域、国家甚至世界范围的病历信息交互、病历资源共享就是可能的。这种规模的资源共享可以使得很多在纸质病历时代无法或难以实现的任务变为可能或易于实现。例如公共卫生监控、远程会诊、病例分析研究等需要对大量病历信息进行分析，或需要在多地点同时分析病历信息。阻碍这种资源库发展的因素，除了电子病历的普及程度以外，就是电子病历接口的标准化程度限制。

不同医院会根据自己的需求选择不同开发者提供的系统，如果这些系统没有标准化的信息接口，那么各个系统间的交互和汇总就会成为很大的问题，并需要开发者重新编写对应其他系统的接口。由于这些要求，医学信息行业的标准化组织也就应运而生了。目前医学信息行业所采用的标准有专注于某一特殊领域的标准，如影像领域的DICOM 标准，也有涵盖整个医学领域信息交互的HL7标准。目前HL7标准处于第三版的修订阶段，第三版的HL7标准添加了含有逻辑关系的词汇表，并采用了基于XML的临床文本结构（clinical document architecture，CDA）作为信息传播的方式，这些新的特性使得HL7标准可以更精确和高效地传播信息。这里我们需要注意的问题是如何健全其词汇表，并提高其普及度。

3）对纯文本格式的报告、病人历史、出院摘要等进行自动编码

即便在计算机化医嘱录入系统（computerized physician order entry，CPOE）中大力推广可以直接得到编码信息的结构化数据录入（structured data entry，SDE），但就目前来讲，纯文本录入更符合用户录入数据的习惯，所以大部分病历数据还是以纯文本的形式存在着。纯文本形式的信息虽然符合人类的读写习惯，但是计算机系统很难处理纯文本信息。只有将纯文本信息编码后，才能将其内容和逻辑关系转化为计算机系统能够处理的信息。该编码过程可以由专门的工作人员完成，但是由于需要处理的信息量相当庞大，手动编码过程的成本是难以承受的，这样我们就需要有能够自动将纯文本信息编码的计算机系统。自然语言处理（natural language manipulation，NLM）方面研究的突破将是这种自动编码系统的基础。

如何从纯文本的自然语言中提取有意义的词汇及词汇之间的逻辑关系，并将提取出的信息根据统一受控词汇表进行编码、校验，最终生成计算机可以处理的结构化数据是医学信息学的一个研究攻关方向。

4）对病历进行自动分析

我们期望通过对病历进行自动分析得到：①支持某一诊断的临床表现、病程演变以及临床差异；②由于诊断、治疗方案、临床转归、患病地点以及患者的不同而导致需求资源的异同。

医学信息化的一大优点就是可以较轻松地利用信息技术所提供的各种便利功能，对已有病历信息进行自动分析，从而进行回顾性研究。电子病历中记录着患者从入院到出院的一切信息，我们可以基于相应的临床逻辑关系，结合数据挖掘技术，按需筛选海量数据中有意义的部分，进行比较研究。如果这种灵活的数据筛选机制成为可能，那么某一临床治疗在不同患者间的差异性研究就将随之实现。我们所面临的问题就是如何将上述逻辑关系精确地与数据挖掘技术集成，以避免筛选出冗余的数据或是遗漏重要的数据。这些逻辑关系可以来自于统一受控词汇表，亦可以来自针对某一研究而特别建立的相关领域的本体模型（Ontology），以提高对某一研究数据挖掘的效果。由此可见，对病历进行自动分析并进行回顾性研究涉及从词汇表到本体建模的一系列问题。在该方面，已经有很多自动分析系统投入使用，但研究者们还很难完全信任这些系统所筛选的数据，这些系统更多地是作为研究者的辅助设备而存在的。如何让自动分析系统真正“自动”地精确筛选数据，还需要很大的努力。

5）统一、直观且有前瞻性的用户界面

医学信息系统同其他领域的信息系统一样，也需要通过用户界面来与医生、护士、收银员甚至患者等用户进行交流。熟悉普通信息系统使用的我们深知用户界面的好与坏在多大程度上影响着我们的工作效率。而在医学这一性命攸关的领域，如果医学信息系统的用户界面设计不良，导致医疗工作者对患者的误操作，就可能引发致命的医疗事故，从而使原本为提高医疗质量、降低医疗事故发生率而设置的医学信息系统产生反面作用。

这并不是危言耸听，事实上有研究报道，在某医院采用了CPOE 系统后该医院的死亡率有所上升。

那么，什么样的用户界面才是合格的呢？一个合格的用户界面首先是能使用户容易熟悉，也就是界面设计和操作风格应该保持统一。根据分布性认知理论（distributed cognition theory），用户界面分为内在界面及外在界面，内在界面是用户对他所面对任务的内在理解，而外在界面就是我们通常意义下所说的用户界面。一个好的外在界面应当做到：①辅助短时和长时记忆；②提供无需分析而可以直接理解并使用的信息；③提供用户不具备的知识和技能；④提供易于识别的系统功能；⑤提供与用户认知模式相符的信息显示；⑥不改变任务的本质；⑦控制时间；⑧ 避免用户进行过多的抽象从而辅助任务的处理；⑨ 制定决策计划优化精确，并能降低成本（Zhang，1997）。

由此看来，用户界面设计不是简单的计算机方面的技术或美术问题，更重要的是用户方面的诸多问题。例如，不同的用户是否对系统会有不同的期望？用户是否能够通过这个界面来完成其所有的任务？对各种功能的展现方式是否是最优化的？用户通过这个界面完成一项任务所经过的步骤是否合理？以上每一个问题都需要进行详细而科学的分析。然而现实中，系统开发者们对用户界面的关注程度远低于对信息技术的关注程度。

阻碍系统开发者关注用户界面设计的原因是我们缺少一个系统的架构来指导用户界面的设计。如何建立一个完整的体系来分析医学信息系统用户界面设计的方方面面，进而统一所得到的分析结果，并将结果应用到用户界面的设计中，是一个医学信息学中亟待解决的难题。

6）人类基因组计划以及各类医学信息数据库的整合

人类基因组计划由上世纪末启动，于本世纪初完成对人类全部基因组的测序。人类基因组本身是一个庞大的数据库，在完成了测序后我们只是得到了元数据（核酸序列），至于如何理解这些数据（如测定功能区等）还需要庞大的工作。基因决定人体的生长发育，由基因突变而引起的遗传性疾病则是人类生存的一大威胁。研究者建立了专门的数据库，如OMIM 数据库（Online Mendelian Inheritance in Man，OMIM），以便于研究这类疾病。如果电子病历系统可以整合患者基因层面的数据，并与OMIM 等数据库进行互动，就能在遗传性疾病的诊断过程中起到积极的作用。而人类基因组与OMIM 等数据库的互动则有可能辅助研究者测定正常人类基因组的各个功能基因。更进一步整合了患者基因数据的电子病历系统可以比对患者的基因与正常的基因，从而发现未知的遗传性疾病。

第90章 医学信息学展望(1)

第90章医学信息学展望(1)