这些年来,医学诺贝尔奖很多颁给了医学企业的发明,所以现在的高明医生,要么是器械的发明,要么他们能从医疗数据发现价值。你排队5分钟,医生一看没问题,他从这个数据里发现了价值。大数据时代你会发现,你只要知道了是什么,就知道怎么做。
这样问题就淡化了,为什么不仔细诊断了,因为这么多病案,你这个情况在他的病人库里非常清楚,所以怎么做很简单。
我们认为科学是解决的形而上,技术解决的是形而下,我们研究的对象是认知、智慧。现在把我们的对象是什么的问题,可以用大数据来解决,在这样的情况下,对大数据对不同案例对象的处理,也可以用大数据来解决。因此这个社会更多研究的是关联,把科学放在后面。科学解决因果问题,要解决主次问题,解决前后问题。所以人们能更多的解决问题就是好汉。
我们对曾经认为的科学是技术的先导产生了怀疑。在当今情况下,因为IT技术的发展,技术也可以成为科学的先导,要求认知自学的数字化,这是我们大数据对认知科学的认识,以及认知计算的不同。认知计算是技术。
这样的情况下,大数据时代对计算正在告别认知科学。
对人的认知而言,欧盟在上世纪就进行了脑科学的研究。今年澳门又提出了人类大脑计划的,奥巴马也发动了脑计划。这和我们信息工作者关联得太少,全是生命科学家,我觉得我们人类的大脑,从生命科学的角度来讲,大家和猴子的大脑区别不是太大,因为已经有研究表明,脑结构差不多。
我就在想,我是在英国学习的,撒切尔后来得了老年痴呆症,我个人认为她的老年痴呆和一般人的老年痴呆没有多大的区别。因为我认为脑计划的研究有一点偏了。
人类和其他动物相比,都有灵感,有语言,唯独人有文字,因为有文字,才有文明,才有传承。我们的青年人到大学,都要学习知识,学习文明,这个很重要。如果没有文字,我们和其他动物差不多。
另外还要研究人类认知的社会属性,这两个不清楚,认知科学搞不清楚,我建议要把这两点作为人类认知的切入点。
要研究脑认知的后天属性,认知不仅是前面的天性所决定的,DNA、基因、遗传,还要看后天学习和积累的结果,是与社会环境、社会实践,群体交互相关联的。
在移动生活时代,我们怎么办呢?
大数据时代自然语言处理技术正在改变我们的移动生活。
语言是思想的直接现实,这句话是马克思讲的,语言是人类思维的载体,语言是认知科学和认知计算要应对的首要问题。我们的移动生活首先要讲语言,你哪一天不说话不行,能听会说是我们必须具备的能力。让我们迎接语音时代的到来。人类走向文明的四个重大里程碑中,语言和文字占了重要的地位。
人类运用自然语言进行交流获得的效果。你跟人家沟通得到的效果当中,很重要的就是你的强度和语调,要占38%,还有你的面部表情,它有情感在里面。从我们认知科学来说,半个世纪的自然语言理解的研究中,我们对此关注了多少?
人们在思考和解决任何问题时,通常是定性的,对量的规定性往往是是非数值。我们研究大数据,它有一个定性,定量转换的问题。科学研究当中,人们用对象语言表达一个特定的精确学科,比如物理数学、C语言,都是用自然语言来表达。
我们就变成两个学派的争论,脑科学认为自然语言是不可计算的。
如果一个问题不能全部形式化,那么其中的局部问题可不可以形式化?自然语言可以在什么程度上被形式化,取决于能否把不确定性形式化。研究不确定性,我认为是一条道路。
科大讯飞做了一个客服中心,移动客服录音大数据,可实现一秒钟对100万小时音频数据的检查。这就是一个很大的变化。你是雇佣500位客服人员还是启用一台服务器?所以还是用一台服务器。在半个世纪的自然语言理解的研究中,我们对此关注了多少?
我们看报纸,有这么一段文章,但是你仔细看的时候,发现这个字序不对,但是它又能影响我们多少东西?在半个世纪的自然语言理解的研究中,我们对此关注了多少?
再看一个例子,我们网上动不动要区分对方是人,我们经常出来一个识别码,叫你再输入一遍识别码,证明你是人。在半个世纪的语言文本理解的研究中,我们对此又研究了多少?
我觉得要创新,要新思维才能解决。机器人能听会说,能看会想,正在改变我们的生活,这就是移动生活的产品。