农夫山泉HANA尝鲜 味道有点甜
农夫山泉有点甜的广告深入人心,这同时也意味着农夫山泉在国内巨大的营销规模。作为知名的消费品企业,农夫山泉年销售额近百亿,在全国拥有七个生产基地、数十家工厂、三百多个办事处和一百多万客户,业务涉及生产、销售、计划、调度、物流、市场营销等多个方面,对企业的综合管理和整体运营能力提出了很高的要求。
“我们已经部署了移动商务系统,数据量在2011年扩大到了大约3TB,并以每个月将近70~80GB的数据量在递增。”农夫山泉CIO胡健在接受比特网记者采访时表示,“这就对我们原有的系统造成了极大的压力,一方面是数据展现非常慢,二是数据运算速度难以忍受,三是采用传统的ETL(数据抽取、转换、装载),农夫山泉的分析系统数据基本上一天才能更新一次。这对我们来说是难以忍受的。” 实际上,由于消费品行业竞争激烈,企业需要在瞬息万变的经济环境中根据实时数据分析进行准备、做出快速决策,这对企业的长远发展至关重要。IT系统在此时已成为企业进一步提高竞争力的瓶颈。农夫山泉急需寻找一个合适的解决方案,以实现实时的数据分析,并提供快速的数据展现。
HANA上线帮助业务提速
在此前,有必要介绍一下农夫山泉的IT系统进化历程。早在2004年,农夫山泉就已经部署了SAP的ERP应用系统,采用了Arap直接从OLTP中抽取数据的方法,到2008年IT团队意识到只有构建OLAP才能满足当时的数据量以及逻辑运算需求,选择了Oracle的数据集市(Data Mart),通过SAP的BO展现。但随着业务的发展,企业对数据系统实时性要求越来越高。“容量大只是一方面,速度快才是决定性的。海量数据应该让用户快速查询到,为企业高管进行科学决策提供支持,才真正有意义。”胡健说,“通过将来自SAP系统和其他异构数据源的数据实时同步到HANA,使农夫山泉摆脱了传统的IT运维和数据滞后问题,整个生产环境正呈现出更顺畅的运营、更准确的数据和更高效的性能。”
农夫山泉CIO胡健先生
实际上,胡健决定选择SAP的HANA,也是经过仔细斟酌和思考,并带领其IT团队研究过很多产品之后才决定的。“HANA已经是一个可以实际使用的、成熟的数据库产品。”胡健说,“HANA可以真正实现实时数据分析,这是为了满足企业实时业务分析需求而诞生的一个产品。在这个层面上,HANA是可以作为传统数据库来使用的,而不仅仅是作为Abap数据库。”胡健还实际对比了SAP HANA和Oracle数据集市的性能。由于内存计算在I/O方面的强大优势,HANA的性能要远胜过对比产品。“同一个脚本,在SAP HANA Studio中运行要比Oracle平台的返回结果快200到300倍。例如,SQL写入在HANA平台上只需要2.113秒,而在Oracle平台上需要的215.063秒;在Oracle平台中要24小时才能执行完的存储过程和功能,HANA只需要37秒;在对账流程上,HANA帮助农夫山泉整整缩短了1天的时间。”胡健说。“实际上,在Demo的环节中,几乎所有的业务响应时间都在10秒以下。这里还要考虑BO4的渲染要比BO3复杂许多的因素。而同样的SQL脚本在HANA中运行的速度要比Oracle快更多,HANA还可以替代传统的数据库被外部系统调用或者作为SOA的接口部署。通过SLT工具也终于能够满足数据的实时同步需求。”
HANA实施经验谈
需要指出的是,农夫山泉是全球第三家、亚太第一家上线SAP HANA的企业,并且只花费了2个月就完成了整体实施。“做第一个吃螃蟹的人很累,但收获也是巨大的。累是因为在国内没有先例可供借鉴,需要自己在网上看英文资料。同时,国内的专家数目也不够,还需要通过SAP研究院、惠普等提供支持。实际上,我们上线前有很多工作要做。”胡健说,“在最终的实施方案确定之前,我们也设计了多种架构,中间也走了很多弯路,最终才确定了目前的架构。”胡健介绍,农夫山泉的HANA项目实施分成两个阶段:第一个阶段,他们没有打破原来的架构,只是把Oracle的数据集市(Data Mart)到BO上展现的链条打乱,通过数据服务(Data Service)把数据集市中的数据抽取到HANA中去,通过BO4在门户上呈现。这个过程可以解决两个问题:其一,实现了数据的快速展现;其二,在HANA中做一些逻辑计算,解决了一些逻辑计算在传统数据仓库中受限的问题。
但同时,实施的效果也是非常好的。胡健表示,实施能获得如此好的效果,主要源于三方面的因素。首先,农夫山泉的IT团队有相应的积累。其次,在做安装和调试的时候,惠普和SAP在产品线、客户线上都提供了非常多的支持。“HANA有一个非常重要的特点,其中有很多高效的逻辑计算,在里面计算逻辑和运费报表非常节省时间,可以从原来的24小时降低到现在的5秒。”胡健说“此前,我们自己在HANA上编写的程序需要36秒,而经过惠普的优化之后,以并行方式运算,现在就只需大约5秒。”第三,在实施的时候,是以三个小组并行工作,第一个小组主要是把以前的Oracle数据加载到HANA上面去。这其中,IT团队需要做非常多的安装工作,而惠普的销售和支持团队也提供了大量支持,配合农夫山泉一起把HANA、DS、BO4等系统安装好,并且我们上线的机器也是惠普提供的ProLiant DL980G7。第二个小组的工作主要是负责HANA的数据展现;第三个小组主要负责实时同步。
硬件平台也需给力
在接受比特网记者的采访时,胡健还特别强调,HANA目前只支持经过认证的x86服务器。“我接触过的、经过SAP HANA认证的x86服务器包括IBM、惠普以及富士通。”胡健说,“我们与惠普有长期合作,并且ProLiant DL980G7在硬件上也非常有特色,其处理器、内存、总线结构等都与其他厂商都有不同,更能体现快速高效。尤其是其中的I/O加速卡,能够扩充硬盘和内存之间的总线带宽,更适合HANA这类应用。”
中国惠普有限公司关键业务服务器产品部产品经理周庆青先生表示,PREMA架构是ProLiant DL980G7有别于其他8路x86服务器的最大不同。在传统架构当中,每两颗CPU之间的通信回路(Loop)并不相同,在最糟糕的情况下,两个处理器之间需要有3~4跳才能通信,平均特需要1.57跳,这就占用了较多的系统资源。相对而言,ProLiant DL980G7的PREMA架构是一种粘连的系统架构,通过4个节点控制器形成了交换机式的矩阵结构,保证了任意两颗处理器之间的通信都是1跳,并且都有冗余。不仅如此,ProLiant DL980G7的管理工具也非常齐全,其可用性也比传统的x86服务器提高了很多。
据悉,惠普已经经过SAP HANA认证的ProLiant服务器根据不同的用户数据库大小分为5类配置,农夫山泉所应用的ProLiant DL980G7的配置属于M+(中大型配置),对应的数据量为1.5-2T。据悉,农夫山泉所应用的ProLiant DL980的配置为4个处理器、512GB内存,应用了4块IO加速卡,除了两块300GB的SAS硬盘作为本地存储外,还外接了1个外部盘柜。胡健表示,该配置就足以满足企业的实际应用需求了,而不必用更高配置的产品。此外,胡健还表示,交易型数据库还是用小型机合适,而分析型数据库用x86更具性价比。
中国惠普有限公司副总裁、关键业务服务器产品部总经理_吴坚申
中国惠普有限公司副总裁、关键业务服务器产品部总经理吴坚申先生表示,如今的市场瞬息万变,企业和市场环境对IT也提出了更多新的要求。惠普通过全面的方案,从软件、硬件、服务等方面尽可能地帮助客户全方位考虑他们对IT的要求,真正地实现信息和技术之间的融合。他强调,惠普的业务遍及全球170多个国家,有超过8万家零售商销售惠普的相关产品,拥有超过40年的经验。因此惠普总结客户的需求和自身经验,提出了“瞬捷”战略来解决上述难题。



