以上,就是毫末在系统量产上车之后,获得的数据和场景的反馈作用力。
而在另一端,毫末延续本色,把AI最前沿创新技术的吸收作为进步的另一重保证。
现如今,大模型和Transformer落地应用自动驾驶已是业内所有玩家的共识,但熟悉行业前情的人或许多少还有印象,最早把Transformer作为新手段用于感知的,正是毫末。
最新前沿判断方面,顾维灏此次特别强调了Attention机制下的大模型带来的惊喜。
Attention大模型背后的机制,主要是用统一模型的思路解决问题,告别不同AI任务使用专门模型的范式。这种机制其实早在2014年便已经提出,但主要在NLP领域被应用,直到2020年起在计算机视觉领域也取得明显突破,从谷歌的VIT到微软的SwinTransformer,轻松刷爆各大排行榜。
基于Attention机制的Transformer结构,更是在各种通用任务中表现惊人,展现出有效的通用AI模型范式的潜力。
而且Attention机制结构简洁,可以无限堆叠基本单元得到巨大参数量模型,随着参数提升效果也在提升。
顾维灏认为,基于Attention大模型,辅助驾驶获得的大规模人机共驾数据就有了更高效地转换,随着量产车交付和上路,数据量不仅大而且足够多样,就能更快抵达自动驾驶终局。
这也是毫末认为“辅助驾驶是通往自动驾驶的必由之路”的技术底层自信,现阶段没有比辅助驾驶能更高效地积累到足够规模和多样性的数据。
但欲享Attention大模型之利,就得解决其落地之不易。
最核心的就是超大参数对于算力的需求:高需求、高成本,高落地难度,让摩尔定律不再有效。
顾维灏透露,毫末的方法是通过低碳超算来降低训练成本,通过改进车端模型和芯片设计来实现车端落地。云端和终端两头并举,两头优化。
于是毫末超算中心也正式亮相,成为首个构建超算的自动驾驶公司。
毫末方面还透露,毫末超算中心的目标是满足千亿参数大模型,训练数据规模100万clips,整体训练成本降低200倍。
自动驾驶的3.0时代?
量产、规模化、数据智能……
这是毫末智行谈到最多的词、强调最多的词,也是对于自动驾驶发展阶段的最新认知的总结。
在自动驾驶的落地探索征程中,有过路线的划分,比如Waymo为代表的终极派和特斯拉为代表的渐进派;有过传感器的阵营,如激光雷达阵营和纯视觉阵营;甚至以商用模式为基准,还有To C、To B和To G的划分。