当前的问题关键在于理解语言需要理解世界,而只接触语言的机器是无法获得这样的理解。人类理解“跑车超过邮车因为它开得更慢”的含义相比机器要广泛和深层的多。“跑车超过邮车因为它开得更慢”的人类理解含义是:开跑车的人嫌邮车开得慢,人的理解是建立在人驱动车的基础上,而不是跑车与快、邮车与慢的关联性统计。语言真正代表的是人类思想的表达,而不是当前人工智能数据关联性的统计。
人工智能的机器可以在阅读测试中击败人类,但他们真的明白吗?
通过最新生物神经学的研究成果,人脑神经网络的复杂程度和工作模式远远不是现在的人工智能比拟的,人类大脑仅仅百万分之的神经元映射数据就需要1.4 PB(计算机存储单位1.4 PB=1024TB)计算机存储空间。人类大脑拥有860 亿个神经元,每一个神经元都与其他神经元之间会有数十个至上千的连接,甚至于神经元的连接也有可能拓展至量子领域,计算这种网络结构的复杂性已经不亚于天文学和量子力学的计算量,这也是人类大脑可以用无数种方式做事的根本原因。(关于人类大脑神经网络的最新科研进展,有兴趣的读者可以查阅作者之前发布的文章“科学家即将揭示人类大脑神经网络结构的奥秘”)
为什么像AlphaZero这样的人工智能在现实世界中遇到诸多麻烦?所有这些机器遇到的问题都是我们人类认为理所当然的常识,但这些常识现在还无法内置到机器中,也没有可能性写在任何语言模型的训练文本中。人类依赖于空间、时间和许多其他先天的、语言之前就具备基本属性来学习和理解语言。
神经网络使用的是统计捷径——而不是实际展示对人类语言的理解能力!语言代表的是思想,而解析人类复杂的大脑和看似无限的神经元连接结构是一项极其宏伟的挑战,考验着人类和人工智能的极限。
当前社会的“量子热”、“人工智能热”需要以发展的角度“降降温”、“去去火”,要知道任何科学技术的突破是都是逐步积累的过程,没有积累便不会有飞跃。在人类生物神经学和量子计算两大领域方向没有取得重大实质性突破前,当前的人工智能很难产生第三次飞跃,人工智能领域也将迎来第二次技术沉淀期,当然技术沉淀不代表不进步,目前人工智能的应用领域还是十分广阔的,现有的研究成果也足够促进人类文明前进一大步。