这个架构是用现行结构来组成的,我们也花费时间来建构的,我们架构怎样的,我们需要怎样的预测模型呢?我们深入研究一下。
第一步,除了刚才所提到的流处理层之外,我们还有其它的层级,比如PME等等,这些就是帮助我们去寻求一些有意思的情景,然后不会在这里等待客户端的指令,而是就是根据情景就来产生文本,这是第一步。
第二步,我们可以有一个机器学习体系,而这个机器学习系统,我们可以基于它建立起一个预测模型,如果真的能够做成的话,那将会非常棒。因为我们可以再进一步定义新的可靠的预测模型,我们不光是根据用户在这段时间的搜索的结果,因为像这种搜索的结果可能不能够完全保存下来,比如说你要换发型,你肯定会思前想后,你要了解到不同的人他们有怎样不同的建议,而且换了发型之后会大概怎么样,这些都是通过数据处理帮助你的。
好,这是一个例子。现在我们来看一下这个迈克杰克逊有新的专辑出来,我们通过它搜寻席琳迪翁上个月发行的专辑,在这种情况下,我们必须要实现一个回应,在实时的时候这一层可能会问你这个问题,我们应该给这个人提供什么样的选择,我们可以给他提供相关的建议,比如说有的时候,在某种情况下在哪个商店,他的专辑是打7.5折然后在线是怎么来卖等等,所以这个就是我们能做的,就是提供实时信息告诉他相关打折信息。
最后,我们要能够进行纠错,我们能够对这个模型进行纠正,那简直是太酷的一件事情了,我们可以在线购买一些打折扣的音乐专辑,有的时候在过去会出现一些错误,我想说在这里推出回馈的循环,也就是说我们可以所有的一些反馈,我们可以能够提出一些相关反馈说建议,有些时候建议是错误的,然后我们来引入到一些相关反馈进行一定的纠错,所以说我们有一定的能力来接受我们的客户反馈。我想说,这对于机器学习有一定的问题,有了机器学习我们可以把模型不断的更新,因为我们可以采取不同的步骤把相关内容进行更新就可以了,因为你不能说基于去年的一些相关数据给这些客户提供,给消费者提供相关信息,告诉他这个专辑正在打折等等,我们需要实时不断数据的更新了。所以我们需要来进行累积的学习,持续不断的学习,能够获取到现实所有的这些信息,包括获取到所有的一些我们购买方的一些相关信息。这样的话,我们就需要有一个机器学习后端来处理这个方面的问题。大约在三年前,在美国,我们开展了这个方面的工作,我们的工作是不是能够衡量一下高性能,这个速度是不是足够快,我们效率是更高的,而且是应该能够实现累积的学习。所以从过去我们所得到的这个结论,我们实际上所得出的结论也是今天早晨所达成的结论,所谈到最后总结的结论是一样的,
MapReduce有一个问题,作为一种模型来讲,我们要实现积极的学习并不是非常容易的,我们需要来对它进行更新,对于机器的学习或者累积学习对于MapReduce来讲可能是比较困难。另外在其它的一些相关的文献当中已经谈到了,我们应该要解决这些相关的问题,后来想我们做两个方面的工作,第一,我们可以设计一个新的架构,把机器学习进行进一步的优化,然后从操作的角度或者从机器学习的角度,对机器学习平台优化实现它的性能进一步的提高。实际上主要都是针对机器学习进行的一个平台的优化,我们做了这个方面的工作。