首页
第331章 天权4号的可靠性
返回
关灯 护眼:关 字号:小

第331章 天权4号的可靠性长周期测试

章节报错(免登陆)
下载APP,无广告、完整阅读

一秒记住【笔趣阁】
biquge365.net,更新快,无弹窗!

    芯谷地下二层的验证中心,在这座建筑里是一个特殊的存在。它不像研究院那样窗明几净,也不像追光厂房那样充满工业感。这里的走廊只有一米二宽,天花板上的灯管每隔一根就拆掉了一根,照度刻意保持在偏暗的水平——不是因为省电,而是因为亮度过高会影响某些光学检测设备的精度。
    走廊两侧是一扇扇厚重的金属门,每扇门后面都是一个独立的环境测试舱。这些测试舱是两年前天权3号流片时建的,当时只有六个,现在扩展到了十八个,占据了地下二层将近一半的面积。每个测试舱都可以独立控制温度丶湿度丶气压丶振动频率和电磁辐射强度,模拟从北极圈到热带雨林丶从海平面到高原丶从实验室到发动机舱的各种极端环境。
    章宸站在六号测试舱的观察窗前,手里拿着一个平板,屏幕上显示着天权4号在过去七十二小时里的全部测试数据。他穿着一件深灰色的工装外套,口袋里插着三支不同颜色的马克笔,胸前的工牌背面写满了今天要确认的测试项。
    (请记住读台湾小说选台湾小说网,??????????.??????超流畅网站,观看最快的章节更新)
    六号测试舱里,一块天权4号的工程验证板被固定在振动台上。验证板上有十二颗晶片,每一颗都连接着独立的电源监控丶温度传感器和功能安全监测电路。振动台以每分钟三千次的频率丶三个方向同时施加随机振动,模拟的是汽车发动机舱在颠簸路面上的工况。验证板旁边的温控箱显示实时温度:零下四十度,湿度百分之八十五。
    这个测试条件,比车规级标准要求的最严苛工况还要高出百分之二十。
    章宸不是个喜欢「加码」的人。但天权4号的情况特殊——它是因为NPU调度器效率问题回退RTL丶流片延迟五周的晶片。延迟的五周被用在了修改和验证上,但修改后的设计能不能在真实环境中稳定运行,不是仿真能完全回答的。所以他在测试大纲里加了三组比标准更严苛的条件:更宽的温度范围丶更长的测试周期丶更复杂的复合应力组合。
    「七十二小时,零故障。」站在他旁边的测试工程师老葛说,语气里带着一种小心翼翼的乐观。「十二颗晶片,七十二小时,每颗晶片跑了两百四十万个测试向量,没有发现任何功能错误。温度循环丶振动丶电压拉偏丶时钟抖动注入,全部通过。」
    章宸没有接话,而是用手指在平板上滑动,调出了每一颗晶片的温度曲线。十二根曲线在七十二小时的时间轴上几乎完全重合——最高温度六十二度,最低温度零下四十度,温度变化率每秒钟十五度。在这么剧烈的温度冲击下,晶片内部不同材料的热膨胀系数差异会导致微米级的形变,长期累积可能造成焊点疲劳丶封装开裂丶甚至晶片和基板之间的连接断裂。
    天权4号的封装团队在流片前做过仿真,理论寿命是两千次温度循环。但章宸知道,仿真和实测之间有一道鸿沟。这道鸿沟的名字叫「现实」。
    「温度循环还要跑多久?」他问。
    「计划是跑一千次,现在跑了三百二十次。按目前的进度,还需要大概五天。」老葛调出测试计划,「但有一个问题——七号舱的温控系统昨天下午出了点异常,温度过冲超过了设定值三度,持续时间大概两秒。虽然很快恢复了,但按照测试规程,那批晶片的测试数据需要标记为『有异常干扰』,不能作为有效数据。」
    章宸皱眉:「七号舱里跑的是什么?」
    「天权4号的另一组工程样片,十二颗,跑的是高温高湿加速寿命测试。温控系统异常发生在测试开始的第十七个小时,之后我们重启了测试,但已经跑的那十七个小时的数据不能用了,要重新跑。」
    「异常原因查清楚了吗?」
    老葛调出了七号舱的温控系统日志:「温控系统的PID控制器参数漂移了。这台设备用了三年,PID参数是出厂时设定的,没有做过自适应校准。温度过冲的原因是控制器的积分项累积误差过大,导致输出超调。」
    章宸在平板上记下了这个问题,然后走到七号舱的观察窗前。里面的测试已经重新开始了,十二颗晶片正在八十五度丶百分之八十五湿度的环境下运行。这个测试条件模拟的是热带地区高温高湿环境下的长期可靠性,通常跑一千个小时相当于设备在真实环境中使用三年。
    「所有测试舱的温控系统,今天之内全部做一次PID参数校准。老化的设备标记出来,排进更换计划。」章宸说,语气不是责备,而是陈述一个必须完成的任务。「天权4号的可靠性测试不能因为设备问题中断或失真。如果设备不行,就换设备;如果设备要修,就等修好了再跑。测试周期可以延长,但数据必须可信。」
    老葛把任务记下来,然后问了一个章宸已经在想的问题:「测试周期延长了,天权4号的量产时间表要不要调整?」
    章宸没有立刻回答。他走到地下二层的中央监控室,这里有一整面墙的屏幕,显示着十八个测试舱的实时状态。六号舱的振动台还在震动,七号舱的温控曲线稳定爬升,九号舱在跑电磁兼容测试,十一号舱在跑电源瞬态响应。每一块屏幕上都有数字在跳动——温度丶湿度丶电压丶电流丶频率丶误码率丶错误计数。
    天权4号的量产时间表,是两个月前就定下来的。流片延迟五周已经让天衡5的量产计划承受了巨大压力,如果可靠性测试再延期,整条产品线都会受影响。但章宸更清楚一件事:晶片量产最怕的不是延期,而是带着隐藏问题上线。隐藏问题会在用户手里爆发,到那时,损失的不是时间,是信任。
    「时间表先不调。」他说,「我们先把能并行的事情并行。可靠性测试继续跑,量产准备工作同步推进。等测试数据出来,如果有问题,再决定要不要延期。」
    老葛点了点头。
    章宸在监控室坐了半个小时,看着每一块屏幕上的数字。十八个测试舱,两百一十六颗天权4号工程样片,正在同时经历着高温丶低温丶高湿丶振动丶电磁干扰丶电压波动丶时钟抖动的轮番考验。这些考验是残酷的,但晶片的设计目标就是在残酷中保持稳定。
    他想起林薇在追光设备国产化会议上说的那句话——「晶片是承诺,不是妥协。」
    天权4号的承诺,就是在零下四十度到零上八十五度的温度范围内丶在百分之五到百分之九十五的湿度范围内丶在每秒三千次的振动下丶在几十伏每米的电磁场中,依然能正确地执行每一条指令,依然能稳定地输出每一个计算结果。
    这个承诺,过去七十二小时里,两百一十六颗晶片全部兑现了。
    但七十二小时不够。章宸要的是两千个小时丶一万个小时丶十万个小时。他要的是天权4号在真实世界中被用户用三年丶五年丶七年之后,依然能兑现这个承诺。
    下午,赵静来了。
    她不是来参加测试的,而是来送小芯对天权4号测试数据的分析结果。悟道算力平台的负载调优和天程车规晶片的样车集成占用了她大部分时间,但章宸一周前就请她帮忙跑一组分析——用小芯的异常模式识别能力,在天权4号的测试数据里找那些人类工程师可能会忽略的微小异常。
    「小芯在温度循环测试的数据里找到了一个模式。」赵静把分析报告递给章宸,然后走到监控墙前,指着六号舱的数据曲线。「你看这十二颗晶片的温度曲线,表面上看完全重合,但如果把温度变化率放大一百倍,就能看到差异。」
    她调出了小芯的分析结果——一张放大后的曲线图。十二根曲线在温度变化的拐点处出现了微小的分离,有的晶片温度上升得快一点,有的慢一点,差异在零点零几度的量级。
    「这不是问题。」章宸说。
    「单独看不是问题。但小芯把这种微小差异和另一组数据关联起来后,发现了一个规律。」赵静调出了第二张图,是这些晶片的电源纹波数据。「温度上升快的晶片,电源纹波也稍微大一点。纹波大的晶片,功能安全监测电路的自检周期会稍微长一点。所有差异都在规格范围内,但它们之间存在相关性。」
    章宸盯着那几张图看了很久。
    「小芯的判断是什么?」
    「不是故障,是特徵。这些晶片的物理特性存在细微差异,导致它们在温度响应丶电源纹波丶自检周期上表现出不同的特徵。这些特徵在规格范围内,不会影响功能和可靠性。但小芯发现,这些特徵和晶片在晶圆上的位置有强相关性——晶圆边缘的晶片和中心的晶片,表现不一样。」
    章宸明白了赵静的意思。
    这不是一个需要修复的问题,而是一个需要被理解的现象。天权4号的晶片从晶圆上切下来的时候,因为晶圆制造过程中的工艺偏差,边缘和中心的晶片确实会有细微差异。这些差异在设计阶段就被考虑到了,规格范围也覆盖了这些差异。但小芯的分析提供了一个新的视角——这些差异不是随机的,而是有规律的,可以被预测丶被分类丶被用于更精细的筛选。
    「这个分析结果,我要用到天权5的设计里。」章宸说,「晶圆边缘和中心的差异,我们之前在设计余量里已经覆盖了,但没有做针对性的优化。天权5可以在版图设计阶段就把这种差异考虑进去,让边缘的晶片和中心的晶片在关键参数上更一致。」
    赵静把这句话记了下来,然后问了一个更实际的问题:「天权4号的这批工程样片,按现在的测试数据看,能进入小批量试产吗?」
     章宸沉默了几秒。
    「能。但不是因为测试数据完美,而是因为我们知道所有不完美的地方在哪里,知道它们的影响范围,知道怎么在量产测试中把它们筛出来。晶片量产不是追求每一颗都一样,而是追求每一颗都在规格范围内,并且我们知道每一颗在规格范围内的具体位置。」
    赵静点了点头,离开了监控室。
    章宸一个人坐在监控室里,继续看那些屏幕。
    下午四点,方程来了。
    方程不是来参加测试的,他是来问一个问题的。天罡生态的商业化服务试点需要跑在天权晶片上,方程需要知道天权4号的可靠性数据,才能确定商业化服务的SLA——服务等级协议。如果晶片的可靠性不够,天罡生态就不敢承诺百分之九十九点九的可用性。
    章宸把今天的测试数据调出来,一页一页地给方程看。
    「七十二小时,两百一十六颗晶片,零功能故障。温度循环丶振动丶高湿丶电磁兼容丶电源瞬态,所有测试项都通过了。但这不是最终结论,可靠性测试要跑完完整周期才能下结论。」
    方程看着那些数据,问了一个章宸没想到的问题。
    「天权4号和天权3号比,可靠性是提升了还是下降了?」
    章宸调出了天权3号在同样测试条件下的历史数据。两张表并排放在屏幕上,对比一目了然。天权4号的温度循环寿命预期比天权3号高了百分之四十,电源纹波低了百分之三十,功能安全诊断覆盖度从百分之九十七点二提升到了百分之九十九点一。
    「提升了。」章宸说,「不是因为天权3号做得不好,而是因为天权4号在设计阶段就把天权3号在可靠性测试中暴露的所有问题都解决了。NPU调度器的修改不只是解决了效率问题,也顺便优化了电源管理和热管理,所以可靠性反而比预期更好。」
    方程在笔记本上写了几个数字,然后抬头看着章宸。
    「天罡生态的SLA,我可以定在百分之九十九点九了。」
    章宸没有反对。他知道方程不是在问他,而是在告诉他一个决定。天罡生态的商业化服务需要给开发者一个承诺,百分之九十九点九的可用性是那个承诺的数字。天权4号的可靠性数据,支撑得起这个承诺。
    方程走后,章宸继续看测试数据。
    傍晚,林薇来了。
    她是来确认一件事的。天权4号的可靠性长周期测试结果,会直接影响天衡5的量产时间表。如果天权4号不能按期通过测试,天衡5就要换备用方案——用天权3号先顶一阵,等天权4号成熟了再切换。但切换方案的成本很高,而且会给供应链增加不必要的复杂度。
    「天权4号的测试,能不能按期完成?」林薇问。
    章宸调出了测试计划的时间轴。
    「温度循环还要五天,高温高湿加速寿命测试还要七天,电磁兼容和电源瞬态测试已经完成了百分之八十。如果不出现设备故障或测试异常,全部测试可以在十二天内完成。但今天七号舱的温控系统出了点问题,导致高温高湿测试重跑了一次,所以实际完成时间可能会延迟两到三天。」
    「两到三天,能接受。」林薇说,「天衡5的量产准备还有十五天才能完成,你有两到三天的缓冲。但不能再多了。」
    章宸点了点头。
    林薇走到监控墙前,看着那些屏幕。十八个测试舱,两百一十六颗晶片,正在被极端环境反覆折磨。她想起自己当年在实验室里第一次跑晶片可靠性测试的时候,只有一台老旧的温箱丶二十颗工程样片丶一个破旧的万用表。那时候她要在温箱前坐一整夜,每隔一个小时记录一次数据,困了就喝咖啡,咖啡喝完了就掐自己大腿。
    现在,地下二层的测试中心有自动化的数据采集系统丶智能的异常检测算法丶小芯的辅助分析能力。但本质没有变——晶片的可靠性,不是靠设备测出来的,是靠工程师一个参数一个参数调丶一个测试项一个测试项跑丶一个问题一个问题解决,硬啃出来的。
    「天权4号的测试数据,每天晚上发一份给我。」林薇说。
    章宸知道她不是不信任他,而是天衡5的量产太重要了,她必须在每一个关键节点上都保持对风险的直接感知。
    「好。」
    林薇走后,章宸又坐了一个小时。
    他看着六号舱的温度曲线从零下四十度爬到零上八十五度,再降回零下四十度。一个循环两个小时,三百二十个循环,六百四十个小时。每一秒钟,温度都在变化,晶片都在膨胀和收缩,焊点都在承受应力,封装都在经历形变。
    六百四十个小时后,如果所有晶片都还能正常工作,天权4号的可靠性就有了第一份实打实的证据。
    但六百四十个小时不够。章宸要的是两千个小时丶五千个小时丶一万个小时。他要在天权4号量产之前,就把它在真实世界中可能遇到的所有极端情况都跑一遍。
    不是因为他对设计没有信心,而是因为他对「承诺」这两个字有执念。
    晚上九点,章宸离开地下二层,回到一楼的晶片设计中心。办公区里还有十几个人在加班,有人在看仿真波形,有人在改RTL代码,有人在分析测试数据。天权4号的NPU调度器修改虽然已经完成了,但天权5的架构设计已经启动了,团队正在做早期的微架构探索。
    章宸坐到自己的工位上,打开终端,把今天所有测试舱的数据又看了一遍。温度丶湿度丶电压丶电流丶频率丶误码率丶错误计数,每一个数字都正常,每一个曲线都平滑,每一个测试项都通过。
    但他知道,正常不代表完美,通过不代表没有问题。那些被小芯发现的微小差异——温度拐点的零点零几度偏差丶电源纹波的微弱波动丶自检周期的毫秒级变化——都说明天权4号还有优化的空间。
    他把这些观察写进了一份内部备忘录,标题是《天权4号可靠性测试阶段性总结及天权5优化建议》。备忘录里列出了十七个可以进一步优化的方向,从封装材料的选择到电源管理单元的控制算法,从时钟分布网络的拓扑结构到功能安全监测电路的灵敏度配置。
    写完最后一个字,他靠在椅子上,闭了一会儿眼。
    终端震动了,是老葛发来的消息。
    「六号舱温度循环测试,第四百次通过。所有晶片功能正常,参数无漂移。」
    章宸回复了一个字:「继续。」
    然后他关掉终端,站起来,走出晶片设计中心。
    走廊里很安静,只有中央空调的微弱嗡鸣。他沿着走廊往电梯走去,经过一间间已经关了灯的办公室,一扇扇紧闭的门。走到电梯口的时候,他看到门边贴着一张纸,上面写着:「天权4号可靠性长周期测试——倒计时:预计完成时间,十一天零八小时。」
    十一天后,天权4号的可靠性测试会有一个初步结论。
    但章宸知道,真正的测试不在实验室里,不在测试舱里,不在振动台上。真正的测试在用户手里,在真实世界里,在每一个需要晶片稳定运行的时刻。
    天权4号还没有面对过真实世界。
    但等它面对的时候,章宸希望它已经准备好了。
    电梯门开了,他走进去,按了一楼。
    电梯门关上的那一刻,他听到地下二层深处传来的微弱嗡鸣——那是十八个测试舱在运转,是两百一十六颗晶片在经受考验,是可靠性测试在每一秒中积累着证据。
    证据证明天权4号值得被信任。
    或者证据证明它还需要再改一版。
    章宸不知道十一天后会看到什么结果。
    但他知道,无论结果是什么,他都会面对它,拆解它,解决它。
    就像过去五年里,他面对过丶拆解过丶解决过的每一个晶片问题一样。
    电梯门在一楼打开,章宸走出去,穿过大厅,推开门。
    夜风吹在脸上,有一点凉。
    芯谷的灯光还在亮着,研究院顶楼丶追光厂房丶旧楼三层丶地下二层,每一处都有光。
    他抬头看了一眼天空,云层很厚,看不见星星。
    但他知道,那些星星还在。
    就像天权4号的可靠性,还在被测试丶被验证丶被证明。
    十一天后,答案会出来。
    而明天,追光产线的工艺改良投入评估会议,会在同一栋楼里举行。
    那是另一条战线,同样硬,同样不能妥协。
    章宸走进夜色里,身后是芯谷的光海,头顶是看不见的星空。
    十一天。
    倒计时还在走。
章节报错(免登陆)
下载APP,无广告、完整阅读
验证码: 提交关闭