书城心理学心理学通论
14929200000009

第9章 心理统计学

心理统计学严格地说并不是一门独立的学科,它是运用数理统计学的原理和理论来量化心理现象的事实、探究个体心理现象间的差异、探讨各种心理现象之间联系与变化关系的一种工具。从运用的环节来看,它主要是指研究中实验之后对数据的处理(实验设计除外)。

在数学领域,统计学是研究客观世界中的随机现象的工具,而心理学研究中的许多概念、结构都可以看作随机现象,因为在任何时候都无法确切地知道这些心理现象到底是什么以及受到哪些因素的影响,更不用说精确地预测它们在某个时候是什么状态。也正因为如此,统计学才在心理学研究中找到了用武之地。强调数学是心理学研究的工具主要就是指的统计学作为研究“系统”的重要的二级方法学对心理学研究的意义。

心理学的进步与统计学是密不可分的,在某种程度上可以说没有统计学等数学方法的支持,心理学可能到现在还是哲学的附庸。

第一节 心理统计学概述

心理统计学的重点不在于公式的推演和证明,而在于如何将理论假设用量化的方式表达出来,并用适当的统计手段证实(或证伪)之。所以不同条件下使用不同的统计方法,这是运用心理统计学要特别注意的问题。

一、心理统计学的基本内容

心理统计学的内容可以按照不同的标准来划分。比如,传统上一般按照统计手段的功能将心理统计分为描述性统计和推断性统计两个分支。前者是用以概括和理解研究中的数据或者说所研究心理现象的数量特征,常用几个简单的数据来反映一组数据的全貌以及多组数据之间的联系;后者主要根据样本所提供的信息,运用概率的理论进行分析,在一定可靠程度上,对总体分布特征进行估计、推测。推断统计内容包括总体参数估计和假设检验两部分。

这两个分支大致都是上世纪20年代产生并且并行发展的。而最近几十年发展起来的实验设计越来越显示出其在心理统计学乃至心理学研究中的重要性。它是指实验者为了提示试验中自变量与因变量的关系,在实验之前所制定的实验计划。包括被试的选择、实验的对照形式、如何安排实验因素和控制无关因素、选定统计方法处理及分析实验结果等。主要研究如何科学、经济和有效地进行实验。

尽管统计学的核心是以不完全归纳为基础的推断,但是并不能认为推断统计比描述统计“高级”或者实验设计并不重要,任何一个成熟的心理研究都不能将这三者割裂。前面强调统计方法使用的条件性主要就是指的不同的实验设计应采用不同的方法。

所以,心理统计学的基础内容主要包括三个部分:描述性统计、推断统计和实验设计。

二、数据特点与变量取值

(一)数据特点

1.随机性

心理学研究中的数据具有随机性,即相同实验条件下所有可能的结果在可知的范围,但某次实验出现什么结果事先无法确定,具有偶然性;而且观测到的数据也不只一个,是随机波动的。

2.离散性

心理学研究中的每一个数据都是离散的,并不连续。即在相同的实验条件下,或对同一个刺激,不同人的反应是不同的,数据分散。

3.变异性

数据的变异性是指数据的波动有一定规律,在一定范围内波动。因此,波动是可以预测的。通过数据的收集及数据分析最终达到能准确预测波动的水平,也即发现了某种规律。

(二)变量的取值

心理学的一些概念在实证研究中是以变量形式出现的,即它的取值是不固定的。由于心理现象的随机性,所以大部分变量都是随机变量。数据就是变量的具体取值,一次实验的数据就是对一组变量的一次抽样。一个变量的一切可能值(在无穷多次抽样中)称为总体,而抽取其中的若干次即成为样本。

变量的取值数据可以按如下两个角度进行分类:

计数数据表示具有某种属性事物的个数。计数数据往往和称名数据共同用来表示事物,称名数据表示事物的分类,计数数据表示在某个类别下事物的个数。测量数据是指借助于一定测量工具或依据一定测量标准所获得的数据。测量数据具有不同的测量水平。

三、数据分布形态及统计方法

1.总体正态假设

数据分布是选择统计分析方法的重要前提,也是对数据进行初步整理的重要步骤。

在心理学中,许多变量都服从一种单峰、对称的钟形分布,称作正态(常态,normal)分布,它反映了在许多外界随机因素的影响下,某个变量取各种可能值的概率分布,即取中间值的多,离中间值越远可能性越小。由于这种分布非常普遍,所以它常常作为统计推断中对变量总体的一个基本要求,称为总体正态假设。

2.参数统计与非参数统计

根据研究的变量是否满足这个假设,统计方法又大致可以分为参数统计方法和非参数统计方法。参数统计方法对数据的分布形态有严格的限制,一般要求是正态分布,而且进行参数统计的数据都是以等距数据或等比数据为主,而非参数统计相对而言限制较少。这两类统计方法在心理学研究中均被大量应用。但相对而言,在心理学研究中,参数统计方法的应用更为广泛。

四、统计过程

抛开抽象的原理不谈,统计方法实际上是一些数据挖掘技术,即如何尽可能简洁、准确地分离数据中的有用信息。集中量和离中量就是这其中两类最基本的概念。

(一)集中量与离中量

集中量是指一组观察值的集中位置或平均水平,表示数据的代表性,主要有算术平均数、中数和众数;离中量是表示数据的分散程度,是对数据变异性(整齐程度或离中程度)的度量。变异性实质上刻画了集中量数的代表程度,主要是方差和标准差。这些概念的定义或公式都非常形象直观。而又以平均数和方差为最常用的量,大部分统计方法都是基于这两个量。当进行完实验得到一组或多组数据(通常将从一个被试身上取得的所有数据放在同一行,称为一个“记录”。显然,一个记录中记录的是该被试在许多个变量比如性别、年龄、收入、文化程度、在若干道题目上的答案或者若干次试验中的反应量,这些变量构成列。这样整个数据构成一个矩阵。)后,最先做的工作就是计算各个变量的集中量和离中量。由于这些量都是基于样本计算的,因此统称为统计量。在日常生活中所见到的国民生产总值(GDP)、人口统计数据等就是统计量。通过对统计量的报告,可以一目了然地掌握数据的整体信息,这就是所谓的描述性统计。

(二)相关及因果

任何研究本质上都要关心变量所代表的各种现象之间的关系,所以描述性统计也包括对心理变量之间关系的研究。相关分析就是其中之一。

1.相关分析

相关的概念最早是由英国学者高尔顿在研究“优生学”的时候提出来的,后来皮尔逊(K。Pearson)、斯皮尔曼(C。Spearman)等人陆续提出一些计算公式,用“相关系数”来度量变量之间的相互关联的程度,使得这种方法发展成熟。相关概念的意义还在于它是一个真正的“系统论”的概念——事物之间的关系并不是像传统自然科学所认为的那样就是简单的A决定(影响)B的关系,而多半是一种不严格确定的依存关系(相关关系)。心理现象之间往往存在着错综复杂的相互作用关系。即使是认为理所当然的某种“因果关系”,其背后往往也存在着被忽视的反向的作用。比如,可能会在计算得到经理人管理的员工数目(变量A)和其紧张程度(变量B)之间的高相关之后轻易地认为是A引起、导致了B,但是实际上也可能是B导致了A,因为也许表现得比较紧张的经理人常被视为工作努力,于是上司可能会委派给他更多的下属。所以,相关关系是心理现象间的主要关系。相关分析作为一种分析手段,常被应用于“相关研究设计”中。不能因为它的不确定性,就认为它比其他用在真实验设计中的统计方法“低级”。即使可以通过实验严格地控制无关变量得出变量A对变量B的影响,也不能将这种影响轻易视为是一种“因果关系”。

2.回归分析

同样是A、B两个变量,如果研究的重点在于用A解释和预测B,就应当使用回归分析。这种方法最初也是高尔顿提出来的,虽然它和相关分析紧密联系——一般来说,相关越高,预测越准确;反之,预测误差就越大。在统计分析时,都关心r(相关系数)、r2(决定系数),但是它们却建立在不同的统计假设基础上,适合不同的研究目的。这种方法的特点是通过适当的方法(称为参数估计),从样本数据中得出关于变量总体的一个关系,而且以方程的形式表达出来(称为回归方差)。最简单的回归方差就是用一个包含B变量的公式表达A,从而可以实现A对B的预测。值得一提的是,回归分析虽然区分了预测指标和因变量,但是它探讨的仍然不是因果关系。

3.因果分析

要考察所谓的“因果关系”,就得依赖严格的实验控制。比如要检验A(某教学法)对B(学生成绩)是否有影响(成绩提高),最简单的方法就是将对B的观察设成两组,一组是自然状态,可以通过描述性统计掌握它,另外一组上施加A,将实验后两个组的B状态进行比较,就可以得出A是否对B有影响(这里还要保证A施加前两个组的B状态是一样的)。考察因素的影响在统计方法中被巧妙地转化成比较两组数据的差异性。联系到前面的总体和样本的概念,显然如果仅仅知道一次抽样中施加A的一组成绩明显提高是称不上“研究”的,我们关心的实际上是A对B的影响是否具有普遍性(因为这才真正反映了两个事物之间的关系),不会因为样本的变动而得出不同的结论,即总体上差异的显著性。这就得依赖推断性统计。但这并不意味着描述性统计和推断统计是截然分开的。实际上在相关分析中,也需要考察由样本计算得出的“相关”是否反映了总体的相关,只有后者才是真正的相关。推断性统计的内容主要是各种差异显著性检验的方法,常用的包括t检验、方差分析等。

第二节 假设检验概述

推断性统计当中最核心的思想就是所谓的“假设检验”思想。这种模式被广泛地用来解释人类思维、问题解决甚至科学发现活动,同样,它也是推断统计的基础。

一、假设检验的定义

假设检验是指先对总体提出某项假设(对总体参数或分布所作的某一假设),然后利用从总体中抽样所得的样本信息,根据一定概率来检验所提出的假设是否正确,从而做出接受或拒绝的决策。所要检验的这个假设称作统计假设。

在统计学中,由于统计假设检验的目的在于检验差异,故这种检验又叫差异显著性检验。

二、假设检验过程

关于假设检验的逻辑存在着许多观点和争议,目前普遍盛行的一种观点是利用反证法和统计上的小概率事件原理,通过考察研究假设(H1)的对立命题零假设(H0)的真伪来推断研究假设的真伪。假设检验归根结蒂是为利用局部数据(即所谓样本)提供的信息推断数据来源的总体的情况服务的。不论是研究几个变量之间的何种关系,也不论变量的性质如何,只要有抽样,几乎都牵涉到假设检验过程。由于是利用样本来推断总体,所以,总体参数的估计方法也是推断统计的重要研究内容,尽管一般的心理学研究者只需运用现成的方法实施这一过程即可。但是参数估计作为一个重要领域,却一直是心理统计学以及测量测验领域的研究热点之一。最常见的假设检验是考察某心理量(因变量)在一外在标准(自变量)的各个类别(水平)上的差异显著性检验。如果自变量类别多于两个,就用方差分析;否则用t检验。

(一)T检验与方差分析

在T检验中,先假设比较的两个组在总体上没有差异,这个假设符号化了就是两个组的总体平均数相等。当两个总体没有差异时,在分布形式上(称为抽样分布),两个总体的分布是重合的。如果基于这个共同总体进行抽样,那么在绝大多数情况下,数据(在这里是指原始数据的代表值,即样本平均数)应当集中在分布的中间部分。于是将分布尾端(两侧)不大可能(这个概率一般很小)在一次抽样中抽到数据(小概率事件原理)的区域称为“拒绝域”。如果实际数据恰恰落在“拒绝域”中,就说明这种情况不是因为抽样引起的,而是因为该样本实际上来自于不同于零假设中那个“重合”总体的另外一个总体,从而说明原假设是错误的而拒绝它并接受相反的假设,即两个组的平均数差异显著。当然,t检验的具体计算比较复杂,尤其是在不同情况下计算抽样分布。这里仅仅是一个说明。至于方差分析,则更为复杂。

(二)统计方法总结

根据研究和实验设计的复杂度,传统推断统计已经发展出相当完善的方法体系。另外,推断统计中还有一类非参数统计方法,也是统计学家根据实际研究的需要发展出来的。只是其前提假设不如参数统计方法严格,因而精确度不够高,但是应用范围却比后者广泛得多。

三、未来展望

心理统计学的内容远不止上述这些内容。近代以来发展起来的多元统计的方法,比如多元方差分析、多元回归、协方差结构分析等都是当今心理学研究方法中的主流。掌握它们需要一定的数学基础知识。总的来说,心理统计学作为心理学研究的必不可少的工具,其地位越来越得到重视和加强。在心理学的发展史上,往往是一种新的方法的诞生带来了整个心理学研究的扩展和腾飞,比如因素分析法、项目反应理论的创立。这实际上说明了心理统计学不仅仅是科研的工具,更担当了为其提供哲学依据和理论基础的责任。从学科的发展来看,心理学在不断地借鉴生物学、经济学、社会学等其他学科的研究方法和统计方法,这种方法上的交叉发展是和心理学本身越来越综合化的趋势相一致的。从这个意义上说,心理统计学又足以构成一门独特的学科,需要心理学研究者更努力地去学习、掌握。遗憾的是,目前国内学界对这门学科的重视和投入都还不够。从教学角度看,已远远落后于实际科研的需要。比如,本科的心理统计学几乎不涉及多元统计分析,硕士和博士高级课程也几乎不涉及新理论和新方法,专门的心理统计学高级学位课程在国内还几乎没有。这些都亟待努力加以改进。

复习思考题

1.心理统计学的基本内容是什么?

2.什么是假设检验过程?