与“中国芯”一同成长
2002年,陈云霁本科毕业,来到了中科院计算所,跟随胡伟武研究员硕博连读,成为当时龙芯研发团队中最年轻的成员,并在博士毕业后留在了计算所工作。近十年间,陈云霁在导师的带领下一直在国产芯片领域深耕。25岁时,这个一直被称为天才的年轻人,已经成为8核“龙芯3号”的主要架构师。29岁,他成为中科院计算所的博士生导师。
“龙芯3号”已从单核发展到多核,用陈云霁的话说,就是“一桌菜要给8桌客人吃”,任务和性能要求都大大提升。陈云霁不断摸索,提出访存协处理器结构,缓解了龙芯3B运算带宽比问题;提出快速完整的内存一致性验证方法,解决了多核处理器功能验证中的难题。
“要向无人区进发”随着科研的深入,陈云霁脑海中的这个声音越来越响。此前的工作大多是"追赶",虽然一些成绩填补了国内相关领域的空白,但终究是和国际上的芯片研究者在同一个赛道竞争。陈云霁想做的是“开创”,另辟一条新赛道,让中国成为领跑者。于是,他把研究领域转向人工智能与芯片设计的交叉研究。
开辟一条新路绝非易事,何况那时人工智能领域的研究才刚起步,前景未知。陈云霁和学生做了大量调研,却鲜有收获,甚至最前沿的国际会议上都缺乏相关论文。
渐渐地,有的学生想打退堂鼓,有的同行也认为找不到这样的路。
陈云霁不信!那时对机器学习的计算、访存和通信的基本规律并不清楚,问题层出不穷,他仍鼓励大家:“凭龙芯项目时期打下的坚实基础,慢慢算,总能算出来。”
像导师曾经做过的那样,陈云霁把床搬进了研究所,一心扑在研究上。经过几年努力,第一个深度学习处理器问世,这是国际首个深度学习处理器芯片。
2008年,北京奥运会举办期间,他窝在一个没有空调的宿舍里写论文。那篇论文最终被国际计算机体系结构领域三大旗舰会议HPCA录用,这也是HPCA上第一篇第一作者来自中国大陆的论文。
在生活中,他把狭窄的折叠床都支在了办公室的书架下面,并开玩笑地说,这就是程序员生活的“标配”。桌旁还有一块挂在墙上的白板,以供他随时捕捉灵感。就像大多数人对程序员的刻板印象那样,格子衬衫和眼镜,就是陈云霁的标准行头。
尽管智能算法规模快速增长,硬件系统的发展却异常缓慢,为了解决这个矛盾,研究计算机架构的陈云霁与计算所研究人工智能的同事展开了交流合作。他们设想,从计算机体系结构的角度,来设计神经网络芯片。在此之前,计算机硬件的速度和功能,已经成为神经网络应用发展的瓶颈。