《星球Google:我们的生活将怎样被一家公司彻底改变》

下载本书

添加书签

星球Google:我们的生活将怎样被一家公司彻底改变- 第9部分


按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
笱П弦档募扑慊蒲Ъ遥�1995年获得博士学位,当时正在加利福尼亚大学圣芭芭拉校区工作,霍尔茨勒每周有一天在斯坦福大学。当时他妻子正在进行她的毕业设计,于是布林和佩奇便请他给他们的系统检查一下。
  和大部分运行繁忙网站的计算机公司一样,谷歌也是把机器放在租来的地方,那里是专门为了与公司自己的办公室不在一起的电脑服务器提供的数据中心。中心有可靠的电力和后援系统,防止出现断电事故,还有冷却系统可以处理——或至少被认为可以处理——由机器所产生的过热现象。空间按平方米为单位出租,所以租户都会尽可能地在指定的空间里摆放更多的计算机。

能力无限(4)
霍尔茨勒应邀看了一下谷歌的硬件,它们放在圣克拉拉的一个数据中心,路程约15分钟,由首屈一指的数据中心经营公司艾克赛达斯通信公司(Exodus munications)负责管理。谷歌的狭小空间里摆了四个搁架,塞满了使用个人电脑元件组装的机器。搁架又放在两个小笼子里。这个地方都是用钢丝编成的防护网制作的围栏,从地板一直延伸到天花板,外边还有一个安了锁的大门。围栏可以让空气流动,便于散热,而且可以保护机器免受其他租户(如eBay和Hotmail,它们的机器也放在旁边同样狭小的空间里)的恶作剧。谷歌的机器还是极其朴素的。
  当霍尔茨勒1999年2月接受布林和佩奇提供的工作时,他看中的是建造一个能够与网页增长速度保持同步的系统所面临的技术挑战。同时他也欣赏布林和佩奇对技术问题的浓厚兴趣一点也不亚于他。还令他高兴的是他们不是混迹于商业的羊群中,追求快速获利、伺机退出的人,不过他也不明白谷歌是如何挣钱的。不管怎样,他签下了合同。
  团队一致认为,公司目前6000万页面的索引还是太少了,新的目标应该更加远大:最好是扩大到10亿网页。但谷歌里里外外的人都无法估算当时的Web到底有多大,而且谁也不知道他们应该处理的网页的正常数量究竟是3亿、6亿还是20亿。“我们不知道。”霍尔茨勒后来说。他们确切知道的是,谷歌如果能够成功地找到并检索出10亿网页,它就能远远超出最大的搜索引擎Alta Vista 亿网页的规模。在谷歌的历史上,这么早就定下如此之高的目标,这也使得它在形成阶段就具有了公共机构的文化特征,在谷歌人心中种下了期待:公司应该把系统的标尺定得比他们所有的竞争对象都高。
  在1999年,谷歌系统连6000万网页的水平都未达到,遑论10亿网页。对搜索量的要求提高得很慢,足以让霍尔茨勒在自己的显示器上就能看到每一个滚动的页面。甚至在处理相对小量的搜索请求时,服务器也必须花费3到秒的时间才能逐一做出回应。当搜索请求如潮水般涌来,系统就会不堪重负,网站也会陷于瘫痪。
  当第20位雇员玛丽莎·梅耶尔于1999年6月24日来到公司开始她第二天的工作时,公司共有约300台计算机在处理请求,这也是谷歌通过它新加入的附属公司Netscape接受搜索请求的第一天。由于没有自己的搜索引擎,Netscape只得同时依靠好几个搜索引擎公司。谷歌原打算在开始阶段只接受从这个新的信息源转来的数量有限的搜索请求,并已经要求Netscape起步时不可太猛,只将收到的全部请求中的1/5转给它。但是Netscape却忘记或是忽略了谷歌的要求,将当天的请求全部发给了谷歌。这可真是太多了,被迫关闭。
  那天早晨,梅耶尔在公司的厨房边停下脚步,注意到拉里·佩奇正站在房间的一个角落里,看不出他要干什么。她问佩奇在干什么。“我在躲避。”他说,“网站倒了。一切都变得可怕而怪异。” 梅耶尔说,看见公司的首席执行官是这种状态,她不由得猜测,谷歌翻身的可能###只剩下2%。
  核心问题似乎很明确:用廉价的PC机元件拼凑起来的系统既没有足够的可靠###,也没有足够的力量来处理每天几千个请求,它简直就不合格。所有的主要搜索引擎和门户网站采用的都是专业厂家生产的服务器,机器的设计也能满足高效率地搜索大量Web网页的需要。它们的元件符合最严格的规范,失败的可能###被降到最低。相反,谷歌用的却是廉价而不可靠的硬件。

能力无限(5)
但霍尔茨勒在检查谷歌的系统时却认定,搜索引擎的问题和反应速度的问题根源不在硬件上。他的结论正好相反。他认为,佩奇和布林的功课都做得很好,使用PC元件也没有问题,它是###价比最优的选择。问题出在软件上,它是在忙碌的大学校园环境下写出来的,并没有考虑到当请求的量持续上升,或当硬盘驱动器及其他元件出现故障时,将会###出哪些缺陷。霍尔茨勒重写了全部代码,他相信,这一下谷歌不仅用不着放弃使用PC元件这种省钱的方式,而且在速度与可靠###方面将取得双赢。
  在对谷歌的软件系统全面检查完成后,霍尔茨勒在斯坦福大学计算机科学学术报告会上解释道:“PC机有其杰出的一面,它很容易买到,价格又便宜,就其价位而言,运行速度相当快。但它还不是世界上最可靠的机器,所以人们还是担心它会出故障。”在获得了更多的经验后,谷歌的工程师们确立了一个标准的设计:在一个支架里摆放40~80台服务器,每一台服务器都有与大型驱动盘配套的中型台式PC机相同的处理能力。在2003年,用大约万美元就可以装备一套有176个微处理器、176×1012比特的存贮器和7×1012比特的磁盘空间的设备。如果要购买知名厂商的产品,价值万美元的服务器却只能装备8个处理器、1/3的存贮量和大体相同的磁盘空间。因此,谷歌的###价比还是令人满意的。它因此而拥有了如何用比较少的钱获得比竞争对手更杰出的表现的能力。
  谷歌在2000年春天迈出的一步使它走到了当时网络公司排头阵营的前列,并将这个优势一直保持到今天:除了早先在加利福尼亚的第一个数据中心外,谷歌又在东海岸创办了第二个数据中心。这个具有多重目的的中心的建立是为了处理被工程师们称作“冗余”的数据,即提供一种并行的运行能力,它时刻准备着,一旦何处出现系统故障,就可以替代上阵。在谷歌,冗余数据的处理由分布在两个不同地理位置的数据中心的数千台机器完成,不管哪个网站出现重大事故,谷歌都有能力为其所有用户提供不间断的服务。
  增加第二个数据中心,对于任何一个希望提供不间断服务的网络公司来说都是最基本的要求。在2007年7月,Craiglist、Technorati、Second Life、Yelp、LiveJournal、RedEnvelope、TypePad及其他位于旧金山的365个主要公司的价值亿美元的数据中心都陷入了黑暗——Craigshist更是长达11个小时,原因是某个电站的断电事故影响了这座城市的部分地区,被指望在这种情况下提供电力支持的柴油发电机却在此时出现了故障。
  当谷歌增加第二个数据中心时,它不仅增加了第一个数据中心抗击病毒攻击的保护能力,而且缩短了信息比特的移动距离。即便是电子的运行速度,物理距离仍会对反应速度造成影响。即使只将回应时间减少几分之一秒,也是用户所介意的。谷歌曾经做过试验,看看用户是否能注意到秒得到25个结果(一般水平)和秒得到10个结果之间的区别,结果显示,用户们在等待那个中间水平的秒之后,显然很容易产生厌烦情绪并离开谷歌网站。
  为了加快哪怕是一点点速度,谷歌也认识到它应该继续在全世界不同地区设立数据中心,并尽快做到这一点,因为它不需要建设自己的设备,而可以用便宜得可笑的价格租用商业###数据中心的多余设备。这样一来,2000年初期对谷歌的扩张来说就成了一个最难得的时机:对新启动的商业网站的疯狂投资以及向它们提供数据中心等技术服务等。这些行为都在2001年年底戛然而止,这与股票市场上股价猛跌正好是同一时间。数据中心失去了租户,签约新用户又毫无指望,谷歌的计划真是赶上了好时候!书 包 网 txt小说上传分享

能力无限(6)
于是公司开始通过租赁获得更多的数据中心的架子,然后是整间房子,然后是几个楼层,然后是整座大楼,它起初的房东Exodus公司终于破产。其余几家数据中心的所有者也遭遇了同样的命运,谷歌抓住了这次人工造成的供应过剩的机会,租借了它们的数据库。2004年,埃里克·施密特在斯坦福大学商学院的一次谈话中,对谷歌的好运开了点玩笑。在出示一张装有轮子的服务器架子的照片时,他问听众:“谁知道轮子为什么如此重要?把架子推到屋里?不,在数据中心破产时把它们推出去。我们全部的数据中心都破产了。因为我们的能耗是如此之高,因为我们的谈判效率是如此之低。”
  事实上,谷歌并没有在数据中心破产后将它的架子推走;相反,它可以开出更好的条件就空间租赁一事与房东谈判。房东所能要求的只不过是租金应与它们的价值相符。当谷歌和其他租户将可用空间全部塞满,并签下2003年和2004年的租赁合同后,谷歌便开始以 “火灾受损物的价格”(用施密特的话说)购买数据中心。谷歌还全部买下了廉价的从未使用过的光纤容量,这是在20世纪90年代后期那个最容易利令智昏的年代所埋设的;谷歌正好利用它将各个数据中心连接成一个网络,这便使得分散的机群可以像一台力量非常强大、智能化水平非常高的机器那样高效运转。别的计算机服务公司,如IBM和EDS等,虽然运行的数据中心比谷歌多,但谁都没有这么多机器在这么多中心里执行一套统一的软件应用程序。
  由于谷歌所依赖的设备中相当一部分是由别的公司匆忙制造出来的,所以它不得不面对由此而产生的许多麻烦。冷却是一个极其重要的功能;如果热量不能及时散发,机器就会出故障。在过于狭小的空间摆放过多的机器,对大楼的冷却系统而言,实在是一个不小的负担。
  摆放机器的屋子里总是产生令计算机和人类难以###受的高温,这几乎是自计算机有史以来就无法解决的问题。1950年,通用自动计算机的5000个管子产生的热量使得工程师们只好穿内衣工作。埃里克·施密特有一次回想起1970年当他还是一名年轻的程序员的时候,在中央处理机旁边工作的情形:因为必须用水来降温,所以主机上都装有精密的水管。
  尽管计算机领域的半导体技术越来越复杂,但是散热的问题一直都未能解决;事实上,随着计算机的功率日益提高,这个问题在某些方面还出现了恶化趋势。机器运行越快,消耗的能量就越多,发出的热也就越多。能耗急剧增加也是因为电路板上集成了过多的晶体管。但由于电路板变小,所以每块板上的晶体管数量也相应减少,但在###能提高20倍的情况下,每块电路板的能耗仍比过去提高了400%。早在2005年,谷歌首席工程师路易兹·安德烈·巴罗索(Luiz Andre Barroso)就曾预言,为一台谷歌服务器提供能量的价格不久就将超过该服务器的购买价格。他设想应该有这样一种“奇怪的商业模式”,“只要你签署一个长期的用电合同,电力公司就会向你免费提供硬件设备”。
  谷歌曾经研究过从电力供应环节入手,对计算机进行节能改造,但这需要采用更加昂贵的元件;通过节能省下的钱很快全都用到元件开支上去了。公司也曾指望通过对买来的数据中心进行改装,减少它的冷却需求从而提高能效。但是,随着谷歌的需求持续增长迫使其数据中心能力必须不断提高,公司在2004年准备采取一种新措施,在缓解现存设备的压力的同时减少能源开支:它将破天荒地第一次从零开始建设自己的数据中心设施,并将它们建在靠近发电厂的地方。

能力无限(7)
第一个要建的数据中心是在俄勒冈州的小城达尔斯(The Dalles),在哥伦比亚河沿岸,距波特兰约85英里,顺便说一句,这里就是18万千瓦的水电站“达尔斯坝”的所在地。一个已经建成的光纤通信网也坐落在这里。这一动向体现了公司的决策开始朝着审慎的方向调整。到2005年2月,谷歌已经能够做到增加数据中心的能量而不必引起别人的注意了,因为它都是与私方当事人签署租借合同和购买房地产的交易合同的。公司接管的现存设施都是地方当局已经批准允许转让的。但俄勒冈的这个项目包含建设一座新厂房,这尚待地方当局另行批准。
小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。 赞一下 添加书签加入书架