何为人工智能
到底什么是人工智能呢?我觉得大概来说可能是有几个部分。
首先是感知,感知就是包括视觉、语音、语言;然后是决策,刚刚讲的做一些预测,做一些判断,这些是决策层面的;那当然如果你要做一套完整的系统,就像机器人或是自动驾驶,它会需要一个反馈。
(图2:人工智能是什么)
在这些例子上可以看到,感知可能更多的是帮助识别图里面一个婴儿在沙发上抱着泰迪熊这种。在推荐上面,我举的例子是一个用Google now通过你过去做的一些事情推测你下面要做什么,在最下面的例子你会看到有一个无人驾驶的汽车,它有各种的sensor,它捕捉的信息可以用来做最后的决策,比如怎么去操作方向盘、油门、刹车等等的。其实这三件事情的总和就是今天所被归纳为的人工智能。
(图3:人工智能的发展里程碑)
再从博弈、感知决策以及反馈四个方面回顾一下人工智能的发展历程。博弈今天就不讲太多了,但是基本上我可以看到从我在大学做的Othello到Checkers再到DeepBlue chess,经过很长的一段时间,终于有了今天AlphaGo打败了围棋世界冠军。我们从中可以看到,这是一条长达三十多年的路程。
在感知方面,从我的博士论文发表到Nuance成为一个顶尖的公司,从中国诞生了科大讯飞到美国的Deep Face、中国的Face 等等做得越来越好的企业,这些年也有很多的进步。还有一些很特殊的例子,比如最近看到一些搞笑的比较Microsoft Tay在Twitter上开始跟人家交流一下子就讲了一堆不堪的话,就被Microsoft撤回了,所以这里有很多的成功例子,也有很多有趣的事件。
决策方面,从早期Microsoft Office里的工具到Google广告的推荐,然后到金融行业的很多智能决策公司的出现,进步迅速。Google auto mail可能大家还没有看过,但是如果你现在还在用gamil的话,会发现你有时候收到email,Google会跳出来问要不要发回复,有时候它连回复都帮你写好了,而且写的很精确。这也是人工智能的体现。可能以后我们讲话都不用,助理能帮我们搞定,人工智能的助理肯定也是一个方向。
最后是反馈,从CMU Boss早期的无人驾驶到Amazon用Kiva推动物流,再到最近的Pepper、Google car,我们可以看到这个领域过去三四年特别的热,有很多看起来商业化已经做的非常好。
科普深度学习
在这里,我要稍微深度讲一下深度学习。
深度学习是一种神经网络,与但与之前的相比,它的特点是使用了多层网络,能够学习抽象概念,同时融入自我学习,而且收敛相对快速。收敛快速可能是一种技巧,不见得是一个理论,但是有一批人通过它解决了很多重要的问题。
简单的来说,如果我们有很多笑脸,然后我们把笑脸的像素输入到一个神经网络里面去,最后你那儿希望让机器能识别这是姚明,那是马云,但是因为你这个深度学习的网络很深,要一次性学会这么多也会比较困难,所以就需要用到一个比较快速收敛的技巧——自我学习。通过自我学习,机器会逐步从大量的样本中逐层抽象出相关的概念,然后做出理解,最终做出判断和决策。
比如它可以有好几层的nodes和connection,经过这些nodes和connection,它在每一个层次会感知到不同的抽象特征,且一层比一层更为高级。这些都是通过自我学习实现的,而不是人教的。经过自我学习,从一个脸输进去再从同样的一个脸输出来,它就从里面抽象的学习到了一个人的脸重要特征。
(图4:分层无监督训练)
经过这个学习之后,我再去做监督训练,看机器是否能够识别他们,如果不能,就在训练之后做微调。例如,如果我输入了马云的脸,出来的却是王宝强,那训练系统就会告诉你的网络说这个是错误的:这不是王宝强,这是马云。那接下来就是要进行微调,以便于下一次机器看到这个脸时,能识别出是马云的概率高一些,出来王宝强的概率低一些。