
Roomba 吸尘器在进行清理——全球已购买超过 1000 万台。
第一个家用机器人(2002 年)
Rodney Brook 的衍生公司 iRobot 创造了第一个家用商业成功——扫地机器人Roomba
清洁地毯与早期人工智能先驱者的野心相去甚远。但 Roomba 是一项巨大的成就。它的多层行为生成系统远比 Shakey the Robot 的算法简单得多,更像是半个多世纪前 Gray Walter 的机器人。尽管传感器相对简单且处理能力最低,但它仍具有足够的智能来有效地清洁家里的地面。Roomba 迎来了特定任务机器人的新时代。
2006年杰弗里辛顿在这一年发表了《一种深度置信网络的快速学习算法》,其他重要的深度学习学术文章也在这一年被发布,在基本理论层面取得了若干重大突破。这是深度学习发展史的分水岭。
这无疑为接下来人工智能的第三次浪潮打下了基础:
2000年后互联网行业飞速发展形成了海量数据。同时数据存储的成本也快速下降。使得海量数据的存储和分析成为了可能。

据谷歌称,截至 2015 年,其语音识别技术的单词错误率为 8%。
开始解决大问题(2008)
2008 年 11 月,新的 Apple iPhone 上出现了一个小功能——具有语音识别功能的 Google 应用程序。
这似乎很简单。但这预示着重大突破。尽管语音识别是人工智能的主要目标之一,但数十年来的研究从未将其准确率提高到 80% 以上。谷歌开创了一种新方法:数千台功能强大的计算机,并行神经网络,学习从谷歌众多用户输入的大量数据中发现模式。起初它仍然相当不准确,但经过多年的学习和改进,谷歌现在声称它的准确率为 92%。

斯坦福教授 李飞飞
ImageNet 人工智能催化剂(2009 年)
李飞飞看到她在学术界和人工智能行业的同事们都持这样的信念:无论数据如何,更好的算法都会做出更好的决策。但她意识到这种方法的局限性——如果学习到的数据不能反映现实世界,那么即便是最好的算法也不能很好地工作。
她的解决方案是:必须构建更好的数据集。“我们决定要做一些历史上前所未有的事情。我们将绘制出整个物体世界。”
李飞飞发布了 ImageNet,这是一个包含 1400 万张图像的免费数据库,这些图像已被成千上万的 Amazon Mechanical Turk 工人标记。人工智能研究人员开始使用 ImageNet 训练神经网络来分类照片和识别物体。许多人将其视为当今世界正在经历的人工智能繁荣的催化剂。

跳舞的NAO
舞蹈机器人(2010)
在大型数据库正在改变人工智能的方式的同时,新技术意味着小的算法也可以发挥更大的作用。这些新技术使类人机器人成为可能,例如 NAO 机器人,它可以做像 Shakey 这样的前辈发现几乎不可能的事情。NAO 使用了过去十年的新兴技术,例如神经网络支持的学习。在上海的 2010 年世博会上,这些机器人的非凡能力尽情展现: 20 个机器人完美和谐地共舞了 8 分钟。