Google提出的分布式运算技术,让开发人员很容易开发出全球性的应用服务,云计算技术可以自动管理大量标准化(非异质性)计算机间的沟通、任务分配和分布式储存等。
云源自分散平行运算,但比网格更擅长数据运算
「云技术可以算是网格技术的一个子集合,」林诚谦说:「两者目的相同,都是要把系统的复杂性隐藏起来,让使用者只要使用而不需要了解系统内部如何运作。」
林诚谦认为,网格技术涵盖了云技术,但是,网格能够处理更复杂的问题,而云技术则可视为是网格技术的一种商业化结果。
「云计算是从网格技术的分散平行运算技术和观念发展出来,业界再用新名词来包装原有技术,只是使用的比喻不同。」他进一步说:「对计算机产业而言,这么做很重要,因为有助于推广大众对这项技术的了解。」
同样地,高速网络与计算中心企业与计划管理组计划主持人黄维诚认为,大体上来看,云计算和网格运算背后的哲学是一致的,他说:「对使用者来说,不需要了解服务器是什么?在哪里?就是把需求丢进去,就会得到结果,这是云计算的想法,也是网格运算的想法。」
再进一步分析两者的差异,黄维诚说:「虽然云计算源自平行运算的技术,不脱离网格运算的哲学,但是云计算更专注在数据的处理。」
单次数据处理量小,让云计算发展出不同于网格运算的实作方式
从处理的数据型态来看,黄维诚认为:「云计算适合的任务,多半是数据处理次数频率高,而每一次要处理的数据量小。」 云计算vs.网格运算云计算网格运算主要推动者信息供货商(如Google、Yahoo、IBM、Amazon等)学术机构(如欧洲粒子研究中心CERN、中研院、国家高速网络与计算中心)标准化程度无标准化,各家采用的技术架构也不同。有标准化的协议和信任机制开源幅度
部分开源,目前有开源Hadoop框架,但Google GFS和数据库系统BigTable则未开源。完全开源网域限制企业内部网域可跨企业、跨管理网域单一运算丛集可支持的硬件
相同标准规格的个人计算机 (如x86处理器、硬盘、4GB 内存、Linux等)可混合异质性服务器(不同处理器、不同操作系统、不同编译器版本等)擅长处理的数据特性
单次运算数据量小(可于单台个人计算机上执行),但需要重复大量处理次数的应用。单次运算数据量大的应用。例如单笔数GB的卫星讯号分析。
例如像是网页搜寻的工作,每一次运算只需要比对一个网页,比对数据的大小可能不超过1MB,但是,全世界有几十亿个网页,若要全数比对,要比对的总数据量就非常可观。黄维诚认为,这种特性与网格运算擅长的类型不大相同,网格运算适合解决科学研究,例如分析卫星回传的信息,每一次要分析的讯息档案就高达数GB。
即使云计算与网格技术同是采用平行运算的哲学,但因为云计算较适合执行单次数据处理量较小的任务,黄维诚认为,云计算在实作方式上就会与网格运算不同。
他进一步解释:「例如搜寻网页,每一次要比对的网页,其实档案都不大,所需耗费的处理器资源不多,所以用大量的个人计算机就可以来执行网页搜寻的运算,但是,要用个人计算机来架设网格运算就比较难,因为网格运算所需的处理资源较大。」
所以,实作的差异就是,云计算可以组合大量的个人计算机来提供服务,而网格运算则需要依赖能提供大量运算资源的高效能计算机。
网格技术的理想,是要让任何服务器,都能加入到一个运算网格中,以提供庞大的运算量,因而在技术上的困难,就是要解决不同服务器、操作系统、甚至是程序编译器版本差异等异质性问题。
然而,以Google的云计算做法为例,则是使用大量规格相同的个人计算机等级服务器,来执行云计算的程序,所以不需要处理异质性的问题,可以简化平行运算的系统架构,更容易协调服务器间的信息传递,让分布式处理的整体效能更好。许多Google的产品或服务,例如Google搜寻、Gmail、Google Maps、Google Docs等,都使用到云计算的技术,藉由大量低价服务器的运算资源,来满足大量使用者的需求。
云名词解释
●云计算(Cloud Computing):Google提出的分布式运算技术,让开发人员很容易开发出全球性的应用服务,云计算技术可以自动管理大量标准化(非异质性)计算机间的沟通、任务分配和分布式储存等。
●网格运算(Grid Computing):在网络上,透过标准化协议与信任机制,整合跨网域中的异质服务器,建立运算丛集系统来共享运算资源、储存资源等。
●服务在云(In-the-Cloud)或云服务(Cloud Service):供货商透过因特网提供服务,使用者只需透过浏览器就能使用,不需了解供货商的服务器如何运作。
●MapReduce模式:Google运用在云计算中的关键技术,让开发者开发大量数据的处理程序。先透过Map程序将数据切割成不相关的区块,分配给大量计算机处理,再透过Reduce程序将结果汇整,输出开发者需要的结果。
●Hadoop:使用Java开发的开源云计算框架,也是采用Google云计算技术实作的框架,但所用的分布式档案系统与Google不同。2006年Yahoo成为该计划最主要的贡献者和使用者。