汽车在运行过程中将会产生大量的数据,而这些数据也需要进行标注。
在进行标注的时候,特斯拉最先尝试了手工标注,但费时费力,之后有考虑过供应商合作的方式,但从最终的结果来看,无论是时效性还是质量都不是很好,而特斯拉需要非常高效且具备可扩展性的标注。
目前特斯拉采用的人机合作的标准方式,既有人类标注,也有机器标注,但整体而言,机器标注的效率更好,机器30分钟的工作量,人类可能需要更长时间,因此特斯拉正在构建自动标注系统。
特斯拉基于自动标注的数据训练模型
通过高效率的标注,让现实世界中的时空片段转化为可以使用的数据,从而让FSD更加智能和高效。
及时自动标注也需要进行梳理,之前特斯拉方面并没有投入太多精力在这方面,而现在已经有很多工程师在做这方面的工作。
此外,在自动驾驶中,非常重要的一部分就是仿真系统,这可以提升车辆对于长尾场景的应对能力。
特斯拉建立一个场景生成器,最快在五分钟内就可以生成一个场景,速度提升了1000倍,还可以扫描现实物体投射到屏幕上,可以模拟信号灯、停车标志等,尽可能接近真实世界。
特斯拉的场景生成器
这对于训练来说,意义非常重大。
而通过数据引擎,可以让神经网络更加真实,能够带来更多的确定性,去解决现实世界的不确定性。如在路口转弯时,要判断横停的车辆究竟是停车状态还是缓慢行驶,只用创建更多的网络进行评估,就能解决这样的场景。
目前特斯拉的数据集,一部分来自车队传回的信息,另一部分来自模拟数据,都可以更方便的对场景做出判断。
而对于特斯拉FSD Beat的推广情况,特斯拉今年年底将具备在全球推出FSD的能力。但北美之外,需要跟监管方进行沟通,而在有些国家和地区,监管还很滞后。
03.
Dojo不断迭代 正促进特斯拉发展
在之前关于机器人和自动驾驶的介绍中,特斯拉工程师已经多次提到了Dojo超算平台。
在去年的首届特斯拉AI Day上,特斯拉展示了其首款AI训练芯片Dojo D1,以及基于该芯片构建的完整Dojo集群ExaPOD,用于执行AI训练任务,为其上路车辆庞大的视频处理需求提供支撑。
当前特斯拉已经拥有基于英伟达GPU的大型超算,以及一个存储30PB视频素材的数据中心。
特斯拉还展示了一组过去两年间从交付定制冷液分配单元(CDU)到安装第一台集成Dojo机柜、再到2.2MW机组负载测试的照片。
特斯拉研发Dojo超算的关键节点
特斯拉一直试图优化Dojo设计的可扩展性,并以“快速试错”的心态来克服挑战。Dojo加速器具有单个可扩展计算平面、全局寻址快速存储器和统一的高带宽+低延迟。
特斯拉技术工程师特别谈到电压调节模块,它具有高性能、高密度(0.86A/mm²)、复杂集成性。
电压调节模块
其电压调节模块在24个月内更新了14个版本。
热膨胀系数(CTE)很重要,因此特斯拉与供应商合作提供电力解决方案。其CTE降低了50%以上,Dojo的性能是初始扩展的3倍。
会上,Dojo团队展示了通过Dojo实现Stable Diffusion在火星上运行Cybertruck的图像。
据介绍,只用4个Dojo机柜就能取代由4000个GPU组成的72个GPU机架。Dojo能将通常需要几个月的工作减少到了1周。
此外,特斯拉自研的D1芯片也发挥了作用。D1采用台积电7nm制程工艺,在645mm²的面积上塞了500亿颗晶体管,BF16、CFP8算力可达362TFLOPS,FP32算力可达22.6TFLOPS,TDP(热设计功耗)为400W。