首次公开:世界最神秘的半导体生产设计基地,向我们打开了大门

你可以把这张卡看成是一个“超级模拟器”,它能够模拟显卡、存储、内存、网络等各种各样的设备,但它更重要的作用是监控并记录测试对象芯片对于 PCIe 5.0 设备的控制性能表现。并且由于它是一台 FPGA,工程师可以轻松地使用 DIP 开关以及重新编程的方式来快速修改它的功能和性能——也即调节测试当中的变量。
除了这张 FPGA 卡之外,英特尔还自主开发了很多灵活调节的测试装备。比如测试视频输出,CPU 集成显卡需要支持多显示器,但是在实验室里每台试验台都装一堆显示器太占地方了,于是英特尔开发了一个像是 U 盘一样的装置,能够模拟多台显示器插入的状态,直接插在主板上就行了。
下面这个东西也是英特尔自己攒出来的,专门测试各种 USB-C 接口的性能。大家知道 C 口支持的 USB 版本、传输协议、功能非常多,相当混乱,买错线/转接头是常有的事。而英特尔希望能够确保芯片在尽可能多的情况下设备都能够正常工作,于是设计了这么一个能够模拟各种传输协议、菊花链等情况。

以及下图红色管道的装置:这并不是什么 CPU 风扇/AIO 之类的东西,它正式的名字是液压气动冷却系统 (HPCS),也可以叫热管 (thermal head),作用是模拟各种可能出现的温度变化情况,比如冷启变热、热启变冷、急热急冷等,从而确保最终芯片在各种情况下都能够保持可靠性能。

既然是芯片测试实验室,如果测出了问题该怎么办?
答案当然是送去检修了。而这些最重要的工作,都在地下的 debug 实验室完成。
最后,我们来到了 debug 实验室。这里的工程师的任务是根据楼上汇报的问题找到问题究竟出在在哪里,确认原因,并且试图通过各种不同的方式来进行修复,然后将修复结果交给设计师,让他们去重新修改芯片的设计。
一位 debug 工程师告诉我,按理来说,如果自己的设计师同事都在认真无误地工作,他们应该是失业的……不过现实情况并非如此,在指甲盖大小的一块晶粒上,可能要分到几十甚至上百设计师,每人负责一个区块。而在区块之间,很可能因为电路的顺序搞错了,而导致芯片无法正常工作,“在我们这再正常不过了。”
而且,一年到头出 bug 的概率还是挺小的,所以这支 debug 工程师团队也并不大(当天在办公室里的就五个人)。
麻雀虽小,五脏俱全。debug 部门拥有我在整个芯片测试实验室里见到的最酷的装备。
图中右侧的 LADA 机器,能够用高功率激光改变芯片工作原理 图片来源:硅星人 via 英特尔
首先是下面这台机器,它的名字叫做 LADA,全称“激光辅助期间改变”(laser-assisted device alteration)。比方说 debug 团队发现了芯片中的某根晶体管出现了问题,想要验证一下修改建议是否有效——只需要把芯片放到这台机器下方,用超高精度和高功率的激光对芯片的指向部位进行照射,就可以修改那根晶体管的属性,从而改变芯片的工作方式。


而如果激光也不能完全解决问题,需要对芯片动手术,怎么办?
我被带进了一个更神秘的房间:

房间中间的机器名为 FIB,也即聚焦离子束 (focused ion beam)。这台机器真的堪称芯片的手术台:它先用激光对已经封装好的芯片进行烧灼。在封盖上切出一个微米级别的“创口”,然后再用 FIB 对芯片上的电路进行亚微米级别的“修改”。
英特尔没有透露公司一共有多少 FIB 工程师,只是表示达到该公司要求的技术操作级别的操作员,在全世界可能也就两位数。

以下图为例:离子束能够在极微小的电路上架设出新的桥梁,把设计错误的电路用正确的方式连接起来。用 FIB 技术对芯片进行物理修改,能够减少设计方案修改次数,加速方案的验证流程,最终缩短芯片研发时间和周期,确保满足英特尔对于一代芯片24-36个月不等的研发周期 deadline。