Q 2013年“双十一”王坚博士专门从英国飞回国督阵,阿里云是怎么帮助天猫、淘宝度过这么大一个“洪峰”的?
A 阿里云支持“双十一”主要是从三个角度:支付问题、淘宝自身和来自客户的挑战。支付的难点在银行,2012年淘宝和天猫的总交易额有191亿,交易笔数是1.028亿笔。结算笔数非常重要,因为在银行承担不了的前提下,支付宝的技术能力决定了系统的承载能力。以前,交易量过大时支付宝就会对交易进行排队,延迟交易。但“双十一”的交易量太大,延迟时间太长会产生很大的用户体验问题,所以支付宝提前鼓励用户先充值进支付宝,这笔钱的规模当时达到了几十亿,把对银行系统的压力直接转嫁到了支付宝系统上,使得“双十一”当天的交易顺利进行。并且在2013年,中国的中小银行系统也可以跟支付宝对接了。
淘宝自身的挑战在于面对突然出现的并发流量和意外情况时,如何保持系统的稳定性并完成天文数字的交易量。在意外情况下,淘宝无法预测用户行为,任何一个局部的问题都有可能演变为一个全局的问题,这是困难所在。“双十一”当天阿里集团近千名技术和业务人员坐在一起,用一个指挥体系处理问题,准备了几百种预案。
解决淘宝客户的问题主要依靠阿里自身的技术力量,比如 “聚石塔”项目将天猫和淘宝卖家的全部交易流程都部署在阿里云平台上,保证交易系统的稳定性才能保证交易顺利完成。把卖家的ERP系统完全架设在云上,这件事的难度和意义比只解决网站流量扩容要大,因为从发票打印到发货都要通过这个系统,不同的ISV(独立软件开发商)也在其中起了关键的作用,让人们体会到一个生态的价值。2013年,淘宝的目标是让75%的交易在云上完成。
Q 为什么商家在云上跟在本地部署会有这么大的区别呢?
A 首先,现在中国的IT不像大家想象的那么好,很多小企业的IT建设不仅受制于成本,还受制于人才,云计算可以帮这类商家把业务搬到互联网上来处理。其次,一笔交易从一个数据中心转到另一个数据中心,这当中有很大的不确定性,因此互联网基础设施非常重要,云技术可以帮助大家解决互联网基础设施问题,“双十一”时每个商家承担比平时大十倍、百倍甚至千倍的容量,这些因素加起来是让云计算变成唯一可以解决这个问题的方法。
Q 我记得2012年您大概为“双十一”准备了几百个预案,2013年有没有什么不同的准备?2013年的“双十一”跟上年的“双十一”有什么不同?
A 2013年“双十一”时整个系统的成熟度更高。上年花了大概37分钟支付宝里有了第10亿销售额,2013年大概只花了6分钟就到了10亿。对云计算最有挑战的不是在下单那一刹那,是第二天要发货打单,所有东西都要上云,有的商家最后会因为打发票机器数不够发不出货。