19099100000040

第40章企业信息的分析和决策(2)

6.3预测和决策模型

6.3.1模型的特征和作用

一切客观存在的事物及其运动形态都称为实体。一般说来，实体是一个复杂的对象、过程或系统。为了理解和研究实体，人们总是把自己对客观实体的观测及认识加以组织，形成概念系统，这种概念系统称为模型。模型是人们为了理解和研究实体，对客观事物及其运动形态的主观描述。模型主要有以下几个特征：

（1）是实体的特征和变化规律的抽象；

（2）包括与所分析问题有关的一些因素和条件；

（3）体现了各因素之间的关系。

模型是研究复杂实体的一种手段。利用这种手段，可以认识实体的某些本质和规律。在决策活动中，实体就是所要解决的问题及该问题的环境。决策模型就是对问题状态与相应对策方案之间关系的描述。决策过程是一个信息处理过程。

为了达到决策目的，首先要有充分的信息资料作为分析的依据，提出目标，分析问题的状态；接着提出各种行动方案，找出评价方案的准则，列出各种可能出现的自然状态，以及它们发生的可能性；然后选择决策方案；最后确定最佳方案。

在决策过程的各个阶段中，模型起着不同的作用。例如，在状态分析阶段，需要根据对以往的统计资料分析，建立预测模型，对未来进行预测，为决策提供未来的信息。为了尽可能减少失误，要对决策者的个人素质进行抽象的描述，这就是专家模型。模型在决策中的作用可以归结如下：

（1）研究决策对象的变化规律；

（2）提供决策方案；

（3）帮助决策者选择方案；

（4）对决策方案进行仿真；

（5）评价决策效果。

6.3.2模型的表示

在信息系统中使用模型，首先要考虑它们在计算机上的表示方法和存储形式，使模型便于管理，能够灵活地连接，容易参加推理。为了增强管理的灵活性和减少冗余，模型的表示趋向于将模型分解为基本单元，然后根据使用由基本单元生成模型。对应于不同的管理模式，基本模型单元可以采用不同的存储方式。主要的存储方式有3种：程序、数据和逻辑。

（1）模型的程序表示

用一段计算机程序表示模型是传统的模型表示方法。包括输入、输出格式和算法在内的完整程序段就表示一个模型，例如线性规划模型可以表示成执行单纯形算法的程序。这种表示方法有两个主要缺点：一是求解程序与模型联在一起，使模型难于修改；二是存储和计算上的冗余。比较新的想法是把模型及其解程序相分离，并且将程序表示的模型分解成基本模块，不同模型中的相同算法可以调用相同的模块，这样就可以减少冗余。基本模块还可以适当组合，构造新的模型。

另一种程序表示方法是以程序语言来表示模型。例如MDL（模型定义语言），是一种用通用高级程序语言设计的一套建模语言。模型的不同方程、约束条件和目标函数都对应相应的语句，进而对应一段程序或者句子。这种表示方法适用于熟悉建模和算法的专家，他们可以用这种语言构造一个建模程序或者运行模型的程序，而不涉及每个建模语句如何实现。

（2）模型的数据表示

把模型看成是数据从输入集合到输出集合的映射，模型的参数集合确定了这种映射关系。Blanning和Konsynski从不同的角度研究了用数据表示模型的问题。

Blanning建立了关系式模型库技术的基本理论，Konsynski的主要工作在于模型的实际求解技术。

模型作为数据表示就是通过数据转换来研究模型。其优点是可以引用数据库的管理技术实现对模型的管理，从而可以用数据仓库的概念把两者统一起来，例如，把模型描述为由一组参数集合和表示模型结构特征的数据集合的框架。输入数据集合在关系框架下进行若干关系运算，得到输出的数据集合。这样，模型运算就变成数据的关系转换。这种方法使模型单元易于与其他单元通信，并且使模型容易更新。

（3）模型的逻辑表示

模型不仅表示其输入与输出之间的运算关系和数据转换关系，而且还确定了输入与输出之间的逻辑关系。逻辑关系既可以描述定量模型的输入与输出的关系，也可以描述更广泛的模型（定量的、逻辑的和概念的模型）的对应关系。因此，模型的逻辑表示对于描述含有定性、定量、半结构化和非结构化的决策模型具有特别重要的意义。在把人工智能技术应用于模型管理方面，模型的逻辑表示是实现模型智能管理的基础。模型的逻辑表示方法主要有谓词逻辑、语义网、逻辑树、关系框架、神经网络等。由于这几种方法都是表达知识的基本方法，所以又称模型的逻辑表示为基于知识的表示方法。

6.3.3模型库

模型库是提供模型表示模式、存储模型和管理模型的计算机系统。与数据库必须有数据库管理系统（DBMS）一样，模型库也必须有模型库管理系统（MBMS）。

它包含一个以上的存储模式以支持对模型的生成、提取、访问、更新、修改、合成等操作。模型库（modelbase）和模型软件包（modelpackage）的重要区别在于：在模型库中模型的存储模式不和求解过程相连，它不是为某一个目的而建立的独立程序或程序集合，而是以基本模块和基本要素为存储单元的集合，利用这些基本单元，理论上可以构造任意形式和无穷多个模型。

模型库是决策支持系统的共享资源，具有一些支持不同层次决策活动的基本模型，其中有一些为支持频繁操作的单一模型，还有一些是用于生成新模型的基本模块和基本要素。模型库是一个“产生”模型的基地，而不是已建立模型的集合。

模型库通过模块组合来灵活变更模型，因此，动态性是模型库的基本特征，也是研究模型生成技术的前提。

6.3.4模型的生成

6.3.4.1模型生成过程的特点

模型生成是指在系统内产生一组能够反映实体运动形态的模型，这种模型不一定是数学模型，或者不完全是数学模型。

模型生成过程具有以下几个特点：

（1）模型在系统内的主要存储方式是非程序式的。基于数据的模型表示和基于知识的模型表示都可以作为模型的基本形态，当然，可能在某些局部仍然用程序表示模型。

（2）在模型生成的过程中，采用定量建模、推理分析和分析员干预相结合的技术。定量建模用于确定模型的数学形态和有关参数；推理分析在建模之前、建模过程中和建模完成后都可能起作用；分析员在关键点进行干预，以保证建模过程沿正确轨道前进。

（3）模型生成在人机交互中完成。在传统的建模过程中，人的作用与机器作用的分界线十分明确；而在模型生成技术中，这种分界线变得模糊了。整个模型生成过程都存在着人机交互。

（4）模型生成是一个动态过程。模型作为描述实体的概念体系，应该随实体的变化而改变，特别是在实体所处的环境变化时，模型的生成环境也要随之变化，即使按照同样的工作步骤，所生成的模型也不会完全相同。

6.3.4.2模型生成的步骤

模型的生成步骤与模型的表示方法有密切关系。不同的表示方法具有不同的工作细节，它们之间的差别很大。这里介绍的是一般的工作步骤，对各种不同的模型表示方法，可以参考它们来拟定具体的模型生成方案。

（1）背景分析

背景分析由人和机器共同完成。机器的作用是提供实体的仿真环境，并利用推理功能分析达到决策目标的途径。人的作用是观察仿真环境和现实环境的差别，及时予以必要的校正；有时，分析员还应该对如何达到目标做出自己的分析和判断，分析的主要内容是实体向目标运动所涉及的内因和外因、定量和定性的因素及研究方式。

（2）确定描述形式

定量描述一般要使用数学模型。因此，要确定数学模型的结构，例如微分方程、差分方程、代数方程等；还要确定数学模型的性质，例如随机的、模糊的、时变的、定常的等；最后还要确定模型的阶次、约束条件、优化准则等。对于半结构化或非结构化问题，确定推理形式是重要问题。

（3）参数设定

首先利用推理系统检查模型参数的含义，确定能否用已有的知识直接得到参数的数值。含义不明确或者无法直接得到的参数值则调用参数估计的程序求解。

分析员的介入有时能够带来极大的方便，特别是确定一些具有明确的含义但是推理系统没有得出结论的参数数值，人的直觉往往是一条捷径。

（4）模型求解

预测模型一般是计算指定年份的估计值；对于规划问题，则要求解各种规划问题，例如线性规划、非线性规划、动态规划、整数规划等。这一步骤通常以定量计算为主，所用的计算程序应该随模型的生成而建立起来。

（5）结果检验和模型评价

可以用人的直觉、实际数据、推理系统、仿真实验来对模型做最后评价。如果对模型满意，则转入下一步；如果对模型不满意，那么还要重新生成模型，或者寻找失败的原因，对模型做局部修正。

（6）报告输出

报告是总结模型的一种文本，不仅包括必要的数据和分析，而且还应该包括一套立即可以投入使用的软件，这套软件可以帮助用户达到当前设定的目标。

6.3.4.3模型的动态生成

根据实体内因、外因变化修改模型，使之跟踪实体运动形态的过程称为模型的动态生成。模型动态生成建立在模型生成的基础上。如果系统内还没有描述实体的模型，那么动态生成的第一步就是生成一个模型。模型动态生成包括以下内容：

（1）仿真环境跟踪

实体的仿真环境主要用来模拟影响实体运动形态的外因。数据放在数据仓库内，数据之间的关系则用模型来描述。仿真环境的跟踪主要涉及：数据修改、增加或删除，知识更新，模型或者参数发生变化，仿真系统变化。

（2）模型参数更新

模型参数更新是指当实体的内因和外因发生变化时，模型结构不变，仅变化模型参数来跟踪实体。在这种情况下，主要是根据原始数据的变化来修改模型的参数。定量预测理论对于时变参数模型的讨论为模型参数更新提供了一些方法。

（3）模型重构

由于实体内因和外因的变化而引起模型结构变化，称为模型重构。模型重构主要是指在模型中增加或者减少一些影响因素，不是模型的重新生成。当参数更新不能提高模型对于实体的表达能力时，可以考虑模型重构的问题。模型重构是一个复杂的问题。不同的模型生成原理对应着不同的模型重构方法，例如基于线性空间理论的模型生成技术，模型重构就是重新确定线性空间的基底。

（4）调整推理

实体的内因和外因的变化不仅影响模型的定量计算，而且还影响模型的推理分析。在研究社会、经济现象时，一项政策的变化往往迫使管理人员的思维方式发生变化，因此，模型的推理机制也应该做相应的调整。

6.4数据仓库和知识发现

6.4.1数据仓库

6.4.1.1数据仓库的概念和参考模型

通俗地讲，数据仓库是一个结构复杂的多维数据库系统。该数据库的资料来源于基础数据库，例如第2章谈到的实时数据库、管理数据库、工程数据库等，而不是来自输入的原始数据。数据仓库对基础数据有较强的加工处理能力，能够提供一系列功能和函数以支持企业决策过程，并且与数据仓库范围以外的其他业务处理过程相呼应。数据仓库包含一种潜在的能力。它存储着关于企业经营、管理、工程、现场控制等各种主题的信息，而加工、显示、组织和报告这些信息的任务就由附属于数据仓库的工具来完成。值得注意的是，数据仓库的这种潜在能力，只有当报表和分析工具应用于其内部数据时才能发挥作用。数据仓库应该支持由最终用户操作的各种访问工具，还必须存储和管理服务于各种用户的信息。数据仓库又是一个历史数据库。它存储了多年的在线事务信息，按照存取效率高、易于检索的原则存储数据。因此，它可以用来有效、紧凑地组织大量数据，并为最终用户了解过去的情况提供概括技术。数据仓库有时还是基础数据的存储库，通过从基础数据库中复制数据，可以向广大用户传递基础数据。因此，数据仓库必须能够将运作数据高效、有效地分配给各种用户。另外，数据仓库还要对数据做一些技术上的修改，以便从基础数据库复制数据。

目前，数据仓库还没有统一的定义。可以把数据仓库的结构描述为：

（1）支持查询、分析和决策的基本数据集合；

（2）形成综合信息及其分析模型的软件环境；

（3）支持复杂查询、分析和决策的应用程序工具箱。

按照该参考模型，数据仓库在水平方向分为单元模块，在垂直方向分成若干层。单元模块是特定数据或者工具的集合，主要有基础数据、综合信息、模型库、存取和使用等。层则表示单元模块之间的相互支撑关系，主要有元数据管理、技术平台和基础结构。应用接口处在系统的最上层。

6.4.1.2基础数据单元

在企业信息系统中，数据仓库的数据来源可以分为如下4类：现场数据、管理数据、工程数据和社会信息。这些数据（信息）的产生和采集方法已在第2章做了介绍。数据仓库对它们重新进行了组织和分类。值得注意的是，当时并没有强调时间维的概念，直到介绍综合信息查询系统时我们才指出数据的时间维对于决策者的重要作用。在建立数据仓库时，必须考虑时间和地点对数据的影响。

第40章 企业信息的分析和决策(2)

第40章企业信息的分析和决策(2)