第75章开路先锋及行家里手(25)

我从来将自己在把随机点立体图引入心理学中所起的作用看做伟大的成就，尽管它的许多成果对大脑研究确有裨益。这只是一种幸运的巧合，是两种文化的碰撞，是一个会说两种语言的人的大脑中两种语言的联想（心理学家和工程师的语言）。

关于深度知觉还有另外一种较现代的理论。它既不强调神经方面，也不强调认知方面。这并不是说研究者将两者机智地合并在一起，实际上正相反，他将神经理论和认知理论全部视做无用之物，认为它们是以错误的假设为基础的。

只有胆识过人的怪杰才有可能将一个世纪以来对深度知觉的研究全盘抛弃，并宣布自己已找到一种全新的正确办法。只有真正的违背传统者才有可能确切地说，我们感知深度既不是通过神经检测器，也不是利用线索进行推理，而是“直接”和自动地产生知觉的。只有性急的人才会提出一种激进的认识论，认为光线给我们眼睛的东西即是深度的准确和实际的体验；我们不需要解释看到的东西，因为我们看到的就是实际的东西。

这个人就是詹姆斯·J·吉布森（James J．Gibson，1904—1980）。他的崇拜者认为他是“20世纪视知觉方面最重要的学者”和“知觉心理学领域里最有创见的理论家”，但其理论被大部分知觉专家看做是“令人难以置信的”（一位评论者甚至认为他的理论太过“愚蠢”，根本不值得讨论），更没有行家倡导这种理论。

吉布森在1950年和1980年间形成其激进的知觉概念，但对其事业并无显著的帮助。他对现存的知觉理论以及主流心理学都嗤之以鼻。他的典型评论是：“心理学，或至少是美国心理学，是次等学科……主要原因是，它对自己的主题没有敬畏感”，“心理学是在寻找错误问题的答案；选来加以研究的都是易于研究的，而不是有意义的问题”。然而，尽管其观点听上去充满着怨气，而且其听力也不太好，但他的为人非常平和，甚至非常迷人，友善，跟他接触过的几乎所有人都喜欢他。一位热情的编年史学者认为他“非常迷人，有活力，也很可爱”。

吉布森出生在俄亥俄州的一座河边小镇，在中西部的不同地方长大成人。他的父亲是铁路巡视员，他也因此而拥有许多搭乘火车的机会，并在铁路上体验了很多后来成为他的视知觉理论核心元素的东西。他在一份简短的自传中说道：“8岁时，我就从铁路上知道了世界看上去是个什么样子。站在列车后部观察这个世界时，它看上去是内向流动的；而从火车头上望去，它又是向外扩展的。”

吉布森考入普林斯顿大学，但发现自己与这里的成员格格不入，宁愿接近他称其为“神经病”的怪人。他一度在哲学和社交活动（他一头卷发，方脸，长相极帅，是领袖人物的苗子）之间摇摆不定，但到高年级之后，开始选修心理学，而且立即喜欢上它了。他继续在普林斯顿攻读心理学研究生，深受行为主义的影响。1928年，他到斯密斯学院任教，在那里遇到了科特·科夫卡（Kurt Koffka）。他虽然没有成为格式塔信徒，但受到了格式塔心理学中有关组织和结构等概念的影响。

有这么几年，吉布森对社会心理学和相对传统的知觉研究均有兴趣。二战期间，“陆军航空人员航天心理学计划”请他参与开发深度知觉测试，以确定谁具有飞行，特别是成功起飞和降落，所必备的视觉能力。

也许得益于吉布森早年在火车上的经历，他认为传统的深度知觉线索，包括阴影和透视，都没有价值。在他看来，这些东西全都基于油画和客厅里的立体照相机，而不是基于现实中的三维特质；全都基于静态的图像，而不是基于运动。对他来说，最为有用也更现实一些的是两种线索：一是纹理梯度，就像飞行员在接近地面的最后阶段所看到的跑道上纹理密度的一致性变化；二是运动透视，或一个人在环境中运动时物体之间产生的不断流动中的关系，包括飞行员在起飞和降落时看到的所有东西。这些线索很快得到接受，至今仍成为深度知觉中以线索为基础的理论中的一个重要部分。

吉布森的航空人员研究中包含着他日后观点的精华部分。深度知觉中最为关键的机制（按照吉布森的说法，在所有的知觉中）不是视网膜图像，尽管它可以产生很多线索，而是物体之间相对关系的不断流动及其在感知者运动环境中的表面现象。

这一概念后来主宰了吉布森在50年代和60年代的思想。当时，他在康奈尔大学进行了大规模的研究工作，并对纹理梯度概念进行测试。在一些测试中，他将一些呈发散状的奶瓶放在观察者和有纹路的表面之间；在另一些实验中，他使观察者的眼睛扩展开来，以避免过于集中于纹理。他还在其他实验中，将乒乓球剖成两半，做成护目镜，使受试者看到的东西就像一团迷雾一样，没有外貌，也没有体积。类似的实验，加上他对航空人员的研究，使吉布森慢慢抛弃了纹理梯度理论，将观察者在环境中的运动强调为深度知觉的关键。不管运动有多大或多小，它都会给视觉排列带来变化——从环境抵达眼睛的光线的结构模式。

视觉排列包含着从任何角度所看到的信息。这些信息将随着观察者的运动而变得无限丰富。即使是头部的最微小变化也会改变这种排列，传递物体以及物体之间关系的信息，从而得出这种或那种物体的光学流动。吉布森渐渐相信，在视觉排列与流动里存在着无限丰富的信息，它们可直接传递深度和距离，根本不需要心理计算或根据线索进行推算。

这就是吉布森在其总括性的“直接知觉”、“生态学”理论中所解释的深度知觉。可惜的是，作为局外人和怪杰的吉布森，按照一位心理学同事的说法，“极端固执，毫不让步”，执意将洗澡水和婴儿一同泼洒出去。这是因为，人们有可能承认的是，深度知觉的神经和认知观点全都正确地解释了一个现象的不同方面，吉本森的观点则是对两者的补充。但对于詹姆斯·J·吉布森来说，这是不可能的。

§§§第六节对视觉的三种视角

“视知觉，”贝拉·朱莱茨近来说道，“所存在的状态，就像伽利略之前的物理学，或华生和克里克发现DNA双螺旋之前的生物化学一样。”对他自己及其他视觉研究者来说，这句话显然过于苛刻了点；但两种主要探索方法的任何一种——如果将吉布森的理论也放进来的话，就是三种——的确是只就视觉现象的某一些现象进行了解释，至今还没有形成综合性的视知觉理论。这可能意味着，人们还没有发现某种大型的有组织的概念，或视知觉可能过于复杂，人们无法用某一种理论来穷尽它的所有方面，只能以不同的方法对不同的课题进行解释。

我们已经熟悉了这些不同的方法。在这里，我们要做的只是收尾工作，即将这些研究者对视知觉的解释在总体上作一个回顾。

神经探索方法：这种方法回答的是19世纪生理学家们一直着迷的一个问题：在结构上一模一样的感觉神经是如何将不同的感觉传递到大脑里的？

他们所做出的极为详尽的答案是，神经冲动本身并没有差别；反过来，对某些刺激有反应的感受器将信号分开发送至纹状体，即视皮层的主要区域。胡贝尔和他的现任同事玛格丽特·利文斯通（Margaret Livingstone，威塞尔在与胡贝尔合作20年后另分一支，现为洛克菲勒大学校长）最近显示，由形状、运动、深度和色彩生成的冲动经由不同的平行通道抵达皮层，并在那里形成一个整体。（色彩是另一个争相研究的课题，但并不是本书的焦点，因而在此忽略。）

主要的视觉皮层仅约15平方厘米，但其内部建筑却极为庞杂。几十年来，神经生理学家一直在探索这一结构及其内部的线路原理。他们得知，传递进来的信息首先进入“简单”细胞，在这里经过谐调后，再对具体的刺激产生反应。这些细胞把他们的冲动通过大部分是由基因决定的复杂线路送入“复杂”细胞。复杂细胞开始整合单个的冲动，并将来自两眼的信息混合起来。结果是，视网膜图像作为复杂神经元的集体激发而“映射”视皮层，但这些激发的模式根本不同于视网膜上的图像，也不同于眼睛之外的场景。按胡贝尔和威塞尔的说法是：

视觉场景在投射入视皮层里时，看起来呈什么样呢？假设动物盯着某个点，这个点偏上和偏左的地方有一条直线，这是动物视野中惟一的一个物体。如果每一活跃的细胞都被点燃，如果一介入是站在皮层之上朝下望去，这个图案会是什么样子呢？为使这个问题更加有趣，再假设这个图案只由一只眼观看……所呈现出来的图案琢来并不是一条直线，只是一组有规则地分布开来的块状物。

换句话说，它不是一个图像，而是一个编了码的图像表达，有点像录音带上磁场的图案；它不是声音，而是一种编了码的声音的表达。然而，这种表达还不是知觉；如胡贝尔和威塞尔所言：“初级视觉皮层绝对不是神经传导的终结。它只是一个阶段，就它所处理信息的抽象程度而论，它也许只是一个早期阶段。”

部分集合和整合起来的信息从纹状体发送至视皮层的另一个区域，再被发送至超出其范围的更高级的皮层区域。在这里，信息终于得到思维的关注，被认定为属于某种熟悉或从未见过的物体。这个过程是如何发生的，大部分神经生理学家认为是一个谜。但少数人大胆地猜想到，在大脑较高级的水平上，有一些细胞以突触连接或分子沉积形式表现出来以前见过的物体的“痕迹”，而这些细胞只有在一个输入的信息符合痕迹时才会有所反应。这种对能匹配的一方做出的反应是一种意识（“我见过这张脸”）；不能匹配的不会引起反应，但它也是一种意识（“我没有见过这张脸”）。研究者半开玩笑半严肃地将这些假设性的视觉系统神经元称作“祖母”细胞，因为其中的一些只在看见自己祖母的编码时才会有所反应，而对其他的信号置之不理。

除开这些想像的东西不说，神经理论告诉我们许多关于视知觉在微观水平上的运行机制，但没有形成宏观的理论；它告诉我们许多视觉的机制，但没有说明这些机制的拥有者和操作者；它还告诉我们许多神经元的反应，但没有论及知觉经验。如一位认知理论家所说：“只研究神经元以理解知觉，就像只研究羽毛以理解鸟的飞行一样。”

认知探索方法：这种方法主要处理在诸如形状恒常性、特征觉察、外形辨认、从线索中得来的深度知觉、大部分信息丢失后辨认图形等知觉现象中发生的心理过程。

得出这些结果的心理过程由几十亿的神经事件构成，但认知理论家认为，解释这些过程的是宏观理论，而不是微观方法。研究波浪如何改变形状并在接近海滩时粉碎的物理学家，绝不会从数不胜数的水分子的相互作用中得出波动机械学的法则，即使其利用巨型计算机也无法得出这样的结果。这些法则所要表达的是集体效应，它们存在于完全不同水平的组织里。一个人与我们谈话时发出的声音是由大气中的分子的震动构成的，但这些话的意义却不可能以分子振动的形式表达出来。

视知觉的心理过程亦是如此。它们是有组织的神经现象的集体效应，表达它的是心理法则，而不是神经生理学法则。我们已看到过这方面的证据，但一个特别有趣的例子很值得在这里讨论：我们从记忆中调出一个图像，并在思维之眼中观看它时，会发生什么？在什么水平上发生？

认知理论家所做的实验显示，这种过程只能以高级认知理论进行解释。最出色和表现力最强的实验，是斯坦福大学的罗杰·谢泼德（Roger Shepard）所做的“心理旋转”。谢泼德请受试者说出下列三组中的物体是否一样：

大多数人在研究这些图案后会得出，A里的物体与B里的物体是一样的。c里的物体不同。当问及如何得出结论时，他们说，他们把这些东西在他们的头脑里面进行旋转，好像在现实世界里转动真实的东西一样。谢泼德通过另一项实验显示出这个过程是如何反映真实的转动的。在这项实验中，受试者从相差不同角度的位置看一个给定的形状。

给受试者观看这些图案时，他们辨出这些图案彼此所需的时间与这些图案位置的角度差成正比。也就是说，两个图案进行比较时需要转动的角度越大，辨认所需要的时间就越长。

这只是许多知觉现象中的其中一例。这些知觉现象涉及以外部世界的内化符号进行操作的更高级的心理过程。最近几年，一系列知觉研究者在尝试形成一个综合性的认知理论以解释这些过程，解释其如何产生出知觉。

这些探索无外乎两种方法。

其一是利用从计算机科学的分支——人工智能——中得来的概念及过程。人工智能的基本假定是，人类心理活动可通过一步一步的计算机程序加以模拟，并按同一步骤一步一步地发生。人工智能专家们一方面想让计算机辨认出他们正在看的东西，另一方面想获取对人类知觉的更好的理解，因而编写出许多辨认形状的程序。为了辨认一些基本的形状——譬如辨认三角形、方形及其他规则的多边形——程序也许会按一系列的“如果——就——”步骤进行。如果有一条直线，它就会一直跟着直线下去，测量它，直到其末端；如果另有一条线从这里继续下去，它就会将这个点叫做一个角，并测量这个角，并在这个角上改变方向；如果另一条线也是一条直线，它就会一直跟踪它，直到……等等，直到边和角的数字全部被测量过，并与由多边形及其一系列特质匹配。

赞同人工智能法适用于视知觉的主要论据是，大脑里没有投射器或屏幕，也没有想像中的小侏儒在里面观看事物；因此，思维肯定不是在处理图像，而是在处理编了码的数据，处理方式是一步一步地进行，就像计算机的程序一样。

反对人工智能法的主要论据是，没有任何机器的视觉程序可与人类的相匹敌，也没有哪一种机器可辨认出平面形状，更不说辨认三维图像；更没有哪一种程序可感知周围世界里的三维分布，或理解其是否置身于环境之中，或辨认出岩石、椅子、沙发、水、面包或任何所能看见的东西的可能的物理属性。乌尔里克·赖塞尔总结道：

机器视觉设计里碰到的许多困难，都可归结入一个简单的来源：设计者进行的工作缺乏有效的理论。在大多数情况下，他们将视知觉看做辨认特别刺激模式的物质。果真如此的话，我们早就应该生产出可以看见东西的计算机了。基于这种理论的模式的失败可合乎情理地作为这些理论自身缺陷的明证，也可给用以支持其他探索方法。

第75章 开路先锋及行家里手(25)

第75章开路先锋及行家里手(25)