比如说我们物流的应用,在物流端我们做到了什么?双11过完之后,有很多人看我们笑话,看我们的物流体系垮到什么程度。当我们跨过300亿的时候,它代表什么?代表着我们的物流企业,一天要处理的包裹量,是他往年一个星期,甚至半个月所处理的包裹量。他所用的车,所用的占点面积,所用的人员,毕竟不是一个互联网的企业,是一个传统的企业,每一个包裹,都需要同样的手段,同样的人搬同样的路径。这时候他怎么能够伴随互联网企业的成长,同步进行产业的升级,这其实是我们大家一起为这个事情做努力的。
刚才从业务上介绍了我们在数据方面所做的一些事情的点。这也仅仅是冰山一角。刚才说的这些,其实是在整个的阿里体系里面,都是在解决里面不同的东西,刚才说的是我这个团队,近期所做的一些应用为主。其实这些应用背后,我们要做的事情,其实更多的是在这一页片子里面,他要解决的一些基础的东西。
比如说我们的会员,刚才看到会员他的诚信,那样的一个业务,要用到会员的诚信,要有我们很好的数据的应用算法,解决我们的会员,是不是诚信的问题,我怎么判断一个会员他的行为是不是合法,这个时候我们需要一系列的模型去解决。
当我们很好的营销我们的消费者的时候,当我们一个妈妈在买奶粉的时候,我怎么知道他的小孩多大了。怎么知道他买的东西适合哪个年龄段,这个时候我们就需要解决,宝宝年龄的问题。宝宝年龄的问题,并不是说我们的妈妈买了东西,她就告诉我她小孩多大了。我们通过她买东西的时间点,以及她的轨迹,知道她小孩大约的年龄段,特别是切换奶粉,一段到三段,到四段,有严格的年龄阶段。她在换的时候,大概知道她宝宝的出生日期,我们很好的知道她的宝宝,每次上这个平台购物的时候,她宝宝大概的年龄,以及身高、年龄、参数。很快她就能找到她想要的东西。
我们的平台里面,大家知道不管是支付宝也好,淘宝也好,天猫也好,有一些实名认证。实名认证,并不一定全。当我们真正在我们的业务里面用到年龄和性别的时候,其实我们要解决的把不准、不全的那些东西补全了。这就是我们数据挖掘应用里面,要去解决的数据的预测的模型。我把年龄不准的,给它修正掉,把没有提交年龄的,根据它购物的行为,包括它的偏好,以及购物可能会存在年龄梯度的信息,反向的给它匹配掉。他不能解决100%的问题,不能说我算出来就100%的准,但是目前能达到83%的准确度,基本上在很多的业务产品下,可以提供到业务里面去用。
我们对商家来说,我们有几种,一个是在平台上,我要不要给他更多的机会,另外是我能不能帮助到商家,更好的去与这个平台对接,让他更好的服务我们的消费者。这里面会有很多,包括我们搜索的时候,商家有一些排序。我们申报活动的时候,哪些商家可以参加,哪些不可以参加,我们会有一系列的针对商家的模型。前几年我们看到筛选活动,更多的是小二的智慧去筛选。这两年大家发现,一个商家能不能参加活动,当这个活动出来之后我就可以知道。
为什么双11我能够很清楚的知道,我们能卖多少?是因为我们有了这一系列基础的工作,我知道商家,知道了消费者。知道了消费者大概多少人这一天来到我的平台上购物。每个人会花多少钱。我知道这些商品大概由哪些商家贡献,在之前我就知道哪些商家是符合我这个活动要求,进来参与这个活动,哪些商家不行,就是因为有了这一系列的模型能力解决这些东西。
当商家在成长过程中,遇到问题的时候,我们怎么能够很好的提示给商家,说你今天可能要做一些调整,或者说你要做,不管是货品、流量,资金,你需要做一些优化的时候,我们会有一些对商家的提示等行为。
在商品方面,其实我们对消费者的服务,主要是通过交易购买的商品来传递。其实我们对商品的一些算法的研究,也是蛮多的。这里能看到的商品的生命周期,一些标签,这里面有一系列的逻辑,来解决业务上的要求。包括品牌,我怎么知道这个品牌,与另外一个品牌是同一个诚实的。我们会说国际的一些大牌,进入中国,进入电商的时候,他特别的排斥,想要一块自己的地,不愿意跟很低端的品牌放在一起,觉得丢不起这个脸。但是到底哪些品牌可以放在一起,怎么放到一起,这就是我们算法要去解决的问题。哪些品牌是同一个城市,哪些品牌调性差不多,服装的品牌怎么知道这一系列品牌,是适合同一个消费群体的,这就是我们要解决的一系列的问题。
解决了这些问题,在我们导购的时候,就可以说这些品牌可以放在一起。另外一些品牌他不会放在一起。当一个消费者在选择家电品牌的时候,他选择某一个品牌,我就知道他要买家具等一系列东西的时候,他要选择什么品牌,这就是我们要做的基础的东西。