
再比如六个方向的交叉路口,即便车上配8个摄像头,如遇到其他车遮挡,预测难度也不小。

基于种种复杂场景,特斯拉方公布一个详细架构,让各路摄像头信号通过RegNets,却不同摄像头使用不同RegNet,再进入Special attention层,该架构同样适用于车辆、行人行为预测等场景。

视觉路线一直在圈内质疑不断,现场特斯拉以一个案例作为回应。
他们公布了一种通过语义识别预测周边车辆的方式,即便高速路上,前车捡起雪花挡住视线,使摄像头无法「看见」前车,但算法仍能通过语义预测前车的存在并做出适当决策。

此外,为支撑种种复杂场景的模型训练,其全栈式开发平台已能做到每8分钟生产一路算法模型,以1.4万个GPU组成阵列提供计算支持,此外他们还使用了Accelerated Video Library,增加了30%训练速度。
在边缘端,他们还进行了轻量化处理,让系统降低延迟,8个摄像头通过神经网络快速实时识别建筑及不同路面场景,更快完成3D场景生成。
指的一提的是,在今年4月奥斯汀超级工厂开业庆祝活动及Q1财报电话会上,马斯克都提及了不带方向盘和踏板的自动驾驶出租车产品,不少人预测他会在今天聊聊RoboTaxi,但在现场特斯拉并未提及。
芯片与超算
去年AI Day上,特斯拉公布了D1芯片及超级计算机平台DOJO,用以加速自动驾驶模型训练,一时吸引不少眼球——
后续提问中,有人质疑了他们如何将芯片组合并实现高效编译,今年,他们拿出了具体的答案。
首先关于芯片连接上,他们考虑到芯片连接处热膨胀系数(CTE)问题,于是,干脆做了个外部「骨架」将一个个芯片放入其中,底部配备高速记忆模块,搞了个「铁锁连环阵」:

然后整体封装,放进机柜里:

那么一通操作下来成绩如何?
按特斯拉的说法,他们在经典项目RESNET-50上的计算能力击败了A100:

在替代性方面,他们以自动标注为例,宣称4个DOJO机柜可替代72个GPU RACKS:

对未来,他们更是充满自信,认为不仅现在吊打100,到2023年Q1即可实现多倍超越:

在现场,马斯克也强调特斯拉被外部认为是一家自动驾驶和造车公司,但事实远不止于此,他将特斯拉称为前沿人工智能公司,并补充半导体也是技术的一种体现,紧接着他号召更多人才加入公司,画足了技术愿(大)景(饼)。
其实活动之前,马斯克就早早发出预告,称这次活动是为了招募人工智能和机器人工程师/芯片超算工程师,如此看来,种种秀技术肌肉之举,也带着一鱼两吃的盘算。
One More Thing
马斯克本人在今天的活动中戏份并不多,下台后转头就开始高强度网络冲浪
比如宣称未来会有“猫女”版擎天柱机器人。
