
tesla ExaPOD 图源:google
特斯拉在此前参加的半导体行业会议Hot Chips 34上分享了大量关于Dojo超级计算机和芯片架构的信息。
特斯拉的埃米尔·塔佩斯(Emil Talpes)之前在AMD工作了大约17年,负责皓龙(Opteron)处理器。他在Hot Chips 34中分享了Dojo的详细信息,但这些信息仅仅是关于块(tile)的硬件和功能以及Dojo整体的。Dojo的具体表现将在特斯拉2022人工智能日上进行讨论。

半导体行业会议Hot Chips 34海报 图源:google
据马斯克的说法,Dojo的目标是“真正擅长视频训练。我们可能拥有世界上第四或接近第三强大的人工智能训练计算中心。我们为Dojo设立的第一个目标是使其具有竞争力,相比于一堆GPU更有效,更具神经网络训练能力。”
由于特斯拉需要大量的计算能力来处理车队中车辆的视频数据,因此它构建了一个独有的晶圆上系统解决方案。
据网站ServeTheHome介绍,“每个D1裸片都集成到一个具有25个15kW裸片的块上。除25个D1裸片外,还有40个较小的I/O裸片。”

D1芯片构成 图源:tesla官网
所有的电源和冷却都直接集成在训练块上,它在块上的对分带宽为10TB/s,在块外的聚合带宽为36TB/s。此体系结构允许块之间使用9TB/s链路进行扩展。它们也可以插电,不需要自己的服务器。
“我们应用的核心目标是可扩展性,” 塔佩斯在介绍的最后说道。“我们不再强调传统CPU中的几种机制,如一致性、虚拟内存和全局查找目录,因为当我们扩展到非常大的系统时,这些机制不能很好地扩展。相反,我们依赖于整个网格中非常快速和分布非常分散的SRAM存储。与典型分布式系统相比,互连速度高出一个数量级。”

SRAM存储 图源:tesla官网
自去年发布Dojo超级计算机以来,特斯拉的FSD(完全自动驾驶能力)的开发进程持续加快。
在今年的年度股东大会上,马斯克透露,FSD 10.13版的研究已经持续了一段时间,特斯拉已经做出了“一些非常重要的架构改进”,例如提升了左转时的精密性。

teslaFSD技术 图源:tesla官网
他表示,特斯拉目前已在北美广泛部署FSD测评版,并将于今年开始对完全自动驾驶能力(FSD)软件进行大规模测试,该软件的测评版已运行超过4000万英里,预计年底将超过1亿英里。
马斯克在去年的人工智能日活动上说,“我们在特斯拉所努力做的是制造人们喜欢的、有效的人工智能……毫无疑问,这将是一种好的人工智能。”
马斯克今年会带来什么惊喜?让我们拭目以待。