像刚才在左边这幅图当中所显示的那样,我们真正利用数据就需要做出改变,首先我们去探测并且了解到有趣的背景和上下文,在此基础之上,我们可以根据这一个上下文,根据这个背景直接做出决定。我们所要实现了解上下文之后做出直接的反映,这样帮助我们更好提高效率。
要实现这一点,我们应该怎么做呢?这就要求我们需要有新的能力,可以让我们去探测到文本,探测到情景,而且我们还要进行批次处理,还有帮助我们建立起效率模型。我觉得这其实非常有意思的,因为这可以要求我们建立起更加高效的计算模式,而且我们还要把计算模式拓展开来,稍后会给大家做一个详细介绍。
首先看一下怎样去进行情景的探测。我们当然就是要寻找到事件的模型,我们要找到事件与事件之间的关系,包括我们可以按照时间来作为一个联系的基础或者用其它的指标来寻求事件之间的联系。所以简要来说,我们背景,我们上下文可以在不同的案例当中适用,比如在市场营销当中,如果用户在网站上面搜索,你就可以直接给他做出精准定位的推广,这就是我们所说有关联的事件,在这种有效的情景当中我们希望可以做出相应的决定。比如说给他提供一些在线手机购买的链接和广告,这是在谷歌所使用的案例,我想大家可以看到在这里你也应该会比较熟悉了,就是我们在搜索谷歌地图的时候,它就会有一些相应的推送,它是基于事件和用户市场的推广和营销。
那在右边,右边这一个案例是IT系统,这个系统是融合性、整合性的,而且它也可以让我们去进行一些匹配,比如说如果有两套IT系统,一个系统是市场系统,那么一个是运营系统,这些系统之间可以实现互动,可以实现融合,帮助你更好挖掘数据之间的价值。
这就意味着实现在第一张幻灯片的目标,这就要求实现以下的任务,包括刚才说事件流的处理,我们要有非常完整事件处理,也就是CEP,还要实现模型匹配引擎。到底什么是模型匹配搜索呢?我想大家可能都觉得这一块稍微有点晦涩,其实它就是说我们要去首先找到事件流的处理,我会把我跟我同事的事件流进行一些比较,进行处理之后我要实现比较完整事件的处理,所以我会给大家展示一下在这三者之间的区别。如果我们可以在大的背景之下去识别一些具体的事件,那我们就可以更好去进行一些整合性的可预测的模型建构,这非常酷,因为我们可以更好去建立起模型,而且我们也找到一些更加精准的推荐,比如说可以帮助人们实现实时推荐,即使说你只是在搜索一个产品,你并不是马上购买这个产品,但是我们通过这一次的推送,通过这一次的探索会把信息收集起来,会让我们下一次进行更加精准的推送。
所以它就意味着我们不需要再重新进行计算,而是我们可以把计算的能力融合起来,可以更好来使用模型,而这个模型将会不断增加用户黏性,越来越精确,而且它的可预测性也越来越高。
下面我们再来看一下,刚才所提到的技术之间是存在差别的,现在来看一下流处理。流处理,在IBM、雅虎,他们都有跟流处理相关的技术,他们目标就是可以对流信息进行处理,他们使用了DFG,DFG也就是数据的一种拓扑处理,典型来说他们没有临时支持,你没有办法直接在这一个事件,在处理当中表示数据源与数据源之间的关系,但是你必须要进行不同的元素之间的时间关系。所以我们再来看一下第二个,也就是CEP,就是完整的事件处理。