第十一章第四节 成为最好的捕鼠器
一个平常得不能再平常的工作日。
Google的工程师克里什纳?巴拉特在对搜索排行的词汇进行汇总。很奇怪的是,他们发现前一天搜索排行的榜首居然是一个相当冷僻的词条——“卡罗尔?布雷迪的娘家”。《布雷迪家庭》是美国20世纪70年代的情景喜剧,在此之前几乎名不见经传,人们怎么会突然对这一喜剧兴趣猛增呢?
后来,克里什纳?巴拉特终于找到了原因。
原来是头一天晚上,在美国电视有奖竞猜节目《谁想成为百万富翁》中,最后一道决定百万美元归属的关键问题是:“卡罗尔?布雷迪的娘家姓什么?”节目主持人刚刚提出这个问题不足数秒,就有数以千计的人登录Google来搜索答案。
有意思的是,这个条目的查询特征图依据时间推移相继出现了两个邻近高峰,很显然这是美国东西两岸的搜索统计;而相隔较远的地方出现了第三个比较小的峰值,是夏威夷的搜索统计。
你想知道问题的答案吗?那么请点击你手中的鼠标吧,每个人与任何问题的答案之间的距离变得只有点击一下鼠标那么远。
Google通过这件事情告诉人们,现在人们的生活对Google是多么依赖。在今天的美国,Google已经成为一个种生活习惯、一种文化现象。生活中的打赌,邻里的小矛盾,模糊的记忆,弹指间的灵感。美国总统小布什生于何时何地?姚明在哪一年登陆MBA并打第一场球?2008北京奥运会开幕式什么时候在电视上首播?
只要打开Google页面,敲入几个键,一张清晰、方便以供查询的网站清单就出来了,你可以一一点选去找你想要的答案。1995年的时候,有谁知道网络将在我们的生活中和工作中变得那么重要?
对许多人来说,正因为Google的存在,网络才真的变得十分实用和强大。我们可以不去看网易的新闻,可以不用MSN,也可以不安装QQ,但我们无法不用“Google”这样的强大工具去寻找我们想要的东西。
Google作为目前互联网上功能最强大的免费搜索引擎,其索引目录中储存了80多亿个网页及网页快照,10多亿张图片,用户可以使用100多种语言文字进行搜索。现在,Google平均每天接受的搜索次数为1.5亿人次,全球大约80%的搜索目标是通过Google来完成的。
由于远比以前的任何搜索引擎好用得多,事实上Google改变了许多人使用网络的方式。几乎一夜之间,它让网络变得实用许多,尤其是对“非专家”使用者而言,其中许多人现在把Google当做进入互联网世界的前门。微软公司CEO鲍尔默不得不承认:“Google证明了一个事实:更好的捕鼠器果然重要。”
1998年诞生的Google,当然不是第一个搜索引擎。当时的其他搜索引擎,能够扫描或者“抓取”网络的一大部分信息、建立索引,然后找出符合特定字词的网页。
市场上已经有Alta Vista、网景(Netscape),以及美国在线(AOL)的“网络爬虫”(Web Crawler),更别提Lycos、雅虎(Yahoo!)和其他许多网站提供的搜索服务。可惜它们的搜索功能都是雷同的。它们在呈现搜索结果网页时,有时多达数十万条的条目,叫人从何看起?Google相信自己能够提供不同于它们的搜索。
Google从一开始,追求的就是一个完美的搜索引擎。佩奇和布林认为,所谓完美的搜索引擎,就是能跟你进行智能对话,能够丝毫不差地了解你的意思,同时丝毫不差地提供给你想要的东西。
这两位年轻人的成就,在于拒绝接受技术方面的限制,埋头持续努力创新,发展出佩奇位阶(Page Rank,也翻译为网页级别)技术。该运算法则是Google成功的核心,使其区别于以前所有的搜索引擎并赋予其从浩渺网络中为用户找出最有用网页的神奇能力。它决定哪些网页可能有你最想要的信息,并在搜索结果网页上根据相关性高低整理排序,从而改变了网络搜索的方式。
比如,你想搜索“北京奥运”,Google会搜索出所有涉及“北京奥运”的网站,然后将其中出现频率最高的网页列于首位。所以,Google的每一个搜索结果都是“纯技术选择”,是计算机程序按照点击率规则自动排列出来的。正是由于它的真实性和权威性,人们现在已经习惯于通过一家公司、一种商品在Google上的位置和查询结果数量来判断其知名度和重要性,这就是所谓的“Google”指数。有人评论说:“由于Google的举足轻重,它能决定网上营销企业的成败。地段的选择历来是零售商的头等大事。而对于网上零售商而言,角逐Google排名无异于争夺黄金地段。”
佩奇和布林早期还有一项叫“anchortext(锚文本,作为页面价值评估参数)”的重要发明。锚文本一般以蓝色字体显示并以下划线标示,构成网页之间的链接文字。两位创始人均认为锚文本对链接页面提供了极为精练的内容描述。此外,当用户使用人名或公司名称搜索时,锚文本的使用还可有效确保最佳网站能够出现在搜索结果的顶部。
另外,佩奇位阶一直被不断修改,避免人们将此套系统用作他途。现在,网页在Google搜索结果的排名逐渐被人们所重视,尤其对于依靠搜索引擎吸引潜在客户的商家来说更加重要。于是,SEO(搜索引擎优化)技术应运而生,它可以提高网页在Google及其他搜索引擎上的排名。Google原始的运算法则被按照一种简单直接的模式操作,通过建立网页“链接工场”增加目标网页的导入链接数量,从而夸大该网页的重要性。比如,搜索优化公司可以拥有许多网站,在这些网站上链接某一个网站等。于是,Google对佩奇位阶做了修改,最初的排名原则已经逐渐被复杂化,目前已经能够识别并把那些作弊网页记录下来。
Google发展出来的这套演算式,让其竞争对手难以望其项背,在搜索技术领域构成很高的“进入壁垒”。Google专有的佩奇位阶,以客观的方式衡量网页的相关性和重要性时,必须运用公式中的5亿多个变量和20亿个词汇。
在这个演算过程中,没有人为的介入或者操纵。Google表示,它的使命是“世界所有信息的有效组织者”,佩奇位阶为Google立下了汗马功劳。