当前位置: 国联资源网 > 公司 > 公司新闻 > 朝阳区电子元件公司新闻 > 《华为人》--华为Fellow硬件及互连专家伍漫波

《华为人》--华为Fellow硬件及互连专家伍漫波

来源: 北京天华中威科技有限公司 | 时间:2023-09-07 | 阅读量:11

把每一件事都做到精彩绝伦!

伍漫波,华为 Fellow ,2012 实验室最资深的专家之一,在公司从事硬件方面工作已经 20 年时间,历经主控业务、服务器以及路由器等众多产品的硬件开发,目前在中央硬件工程院。

平时同事们都亲切地称呼她为“伍姐”,有同事对她工作中的评价是“功夫深”又“不折不扣”,形容她的性格则是“实、真、直、爽”。伍漫波非常景仰乔布斯,“乔教主”说过的一句话“把每一件事都做到精彩绝伦”,也成了她的座右铭。

伍漫波曾作为湖北省的理科高考状元考入清华大学,每当别人提及高考状元的“头衔”,伍漫波总是截住话头,“太久了,太久了,多少年前的事了,还是聊聊别的吧。”

今年“妇女节”的下午,2012 实验室的会议室,坐满了几十名以女员工为主的听众,她们在等待着今天的分享者。时钟指向三点,伍漫波风风火火地走进房间,快速接好电脑,开始了自己的分享。她的第一句话是,“1997 年 1 月 6 日进入华为,已有 20 年 3 个月,部门去年来了个新员工,岁数是我的一半,让人很感慨。”伍漫波说,其实自己并不擅长分享心得体会之类的内容,工程师还是用做过的事来说话。

01 牛刀初试

1997 年伍漫波加入华为。那时的华为在硬件可靠性设计方面还相对薄弱,甚至连 386 主板都做的不太稳定。那一年,公司决定做奔腾(586)主板。在硬件业界有一句老话,“产品质量是设计出来的”,伍漫波是这个理念的“信奉者”,在设计环节宁可慢一点,也不能出现差错,否则后续的“修修补补”会耽误更多时间。

带着这个理念,伍漫波开始主导设计奔腾主板。从原理图到器件选用,到布局、布线,她花费大量时间一一检查和确认。比如为了保证管脚定义万无一失,她用了个“笨”办法,将整套原理图打印出来,每检查一个管脚,就用荧光笔在图纸上涂掉对应的管脚标识。投板之前,她还有很多花费时间但是有效的小招数,来确保没有错误。

可当设计完成时,领导对伍漫波的工作进展不是很满意,认为效率太低,拖延进度。第一次上电也并不顺利,原来是加工环节的钢网做错了。修订了这个问题,系统再次上电,顺畅运行,一口气“跑”到 Windows 界面出来。主管很意外,首次上电调试就有这么好的进展,这在公司可是很少有的。

接下来的各种测试相当顺利,在设计环节“浪费”的时间,全部找补回来了。量产发货后,可靠性也表现理想。这时,伍漫波一直说的“产品质量是设计出来的”有了说服力。之后她负责设计 PowerPC 系统主板时,主管说,“我不催你了,你慢慢做,争取跟奔腾主板一样的质量如何。”

“呵呵,那个时候我心里还是很得意的。”伍漫波事后回忆此事时笑着说。

02 闪亮的日子

2000 年前后传统电话网络面临更新换代,崭新的控制与交换分离的通信系统开发提上日程, 用于取代传统的程控交换机系统。2001 年伍漫波进入 UMG8900 系统分析组和硬件平台组,在组长王战峰的带领下,大家花了大半年时间反复讨论方案,目标很明确,要么就不做,要做就最好的,要在集成度、容量和性能等各方面规格都要领先业界,超越友商。领先的规格当然需要采用当时最领先和最复杂的技术。这个方案的容量是百万级用户,同事间还开玩笑说,几台设备就可以支撑一个省的需求,怎么上销量呢。

整个硬件系统的开发又用了大半年到快一年的时间,基本上都是一板调通。一个规格指标全面领先的复杂系统,还采用了最先进的技术,没有做什么预研,为什么能够一板成功?靠的就是全面的仔细的分析与设计。整个硬件团队一起,花大量时间反复讨论各种可行方案,互相检视,互相“找茬”。每块单板投板之前伍漫波都让大家先问自己,“假设板子回来以后上电有问题,首先会检查什么?”把所有觉得应该确认的工作在投板之前都做完。比如,为了保证背板槽位不会上下反或左右反,团队想出多种方式进行核对。最后,伍漫波又花半天时间,对照 PCB,按照上下左右的方位把背板槽位的一段管脚定义画在一张 A4 纸上,把管脚对应的网络名称也写上去,网板和主控板背板接口也同样处理,然后把“单板”“插”到“背板”上,再次确保万无一失才投板。板子回来调测都很顺利,很快打通第一个 3G 电话。而且量产发货后无网上硬件事故。

2004 年,华为凭借 UMG8900 产品一举反超友商,奠定在广东移动核心网 TOP1 的地位。后来,UMG8900 获得公司内部多个奖项,包括 2006 年的公司最佳 PDT,以及 2007 年的公司可靠性大奖——产品上市几年以后获得可靠性大奖,是伍漫波自己觉得最得意的一件事了。

一直到现在,UMG8900 都在持续发货,为公司挣了不少利润,每每想起自己曾经参与其中,伍漫波总觉得相当自豪。有时她和当年团队成员碰到一起,还经常回忆起那段闪亮的日子,互相“吹牛”说,当时怎么就把公司一群硬件“牛人”聚集到一起来了呢。

03 “姜还是老的辣”

2003 年早些时候领导让伍漫波去分析一下友商的服务器和小型机,应该可以说,伍漫波是公司服务器领域的第一个工程师。由于曾经在 IT 领域工作过几年,她深知其艰难,不过被服务器的老领导王丙福抓住,还是积极参与了服务器的产品开发,做过几个产品 SE。后来专门负责服务器开发能力提升工作,并负责带领团队建立服务器内存、电源、硬盘等全流程质量工作与测试体系。

2009 年 7 月份,公司首款机架服务器 RH2285 已经快 TR4A 了,开始出现较大比例的烧板故障,问题相当严重。十几个人的攻关团队日夜定位,测试也能看到一些方向,但是在这些方向加压力并不能必现问题。问题的解决进展缓慢。

那时,领导希望伍漫波将更多精力放在架构方面,少去做硬件开发的事情。但是这次问题确实复杂,她实在坐不住了,主动请战。这一头,原有的攻关团队继续进行,那一头,伍漫波按照自己的思路和判断来解决问题。一攻关就“上瘾”的她连续加班 21 天,从控制器、MOS 管、电感、电容、PCB 布局、层叠、走线、过孔,到 Remote Sense 信号的处理等等所有方面,全部进行了改进。优化后的单板,加工回来的第一批产品在 72 小时内进行过上千次上电测试用例的严酷测试等,单板没有问题。后面单板上量,电源质量稳定。后来领导悠悠地说过一句话,“姜还是老的辣啊”。

2009 年到 2014 年,RH2285 V1 发货数万台,累计网上零事故、零批次整改,产品在 2013 年拿到公司和企业 BG 两个最佳质量奖。

04 400G 升级成功!再升级,成功!

2010 年伍漫波在 IP 开发部,有一段时间,6G 多框路由器产品每天都有零星链路存在少量误码。有一天,她不知怎么想起来问了下坐在附近的项目成员,“今天这几条有误码的链路跟昨天的一样吗?”

“不一样。”

“不一样?”伍漫波蹭的站起来,接着问,“那跟前天的一样吗?”

回答还是“不一样”。伍漫波当时就急了,意识到问题远不是日报里看上去的那么简单,这是设计裕量不足,很难解决。

后来的故事,当然就是在主管孙路遥的大力支持下,伍漫波负责攻山头、解决问题。由于早期系统设计时,对高速还没有足够的认识,系统中存在短链路问题、阻抗控制问题、PCB 制造良率问题等等,再加上光模块生产测试控制问题等,情况很是复杂。伍漫波仔细分析系统,一块一块单板看 PCB,对比现有各种测试问题,寻找系统链路瓶颈,从部件和设计两个环节,和团队一起找出了影响高速系统可靠运行的瓶颈,优化后产品一次通过可靠性环境实验。

6G 多框问题的解决表现不错,领导紧接着又给伍漫波派了新任务:继续升级到 10G+,单槽位容量 400G。2011 年,作为高速设计小组技术负责人的她,依然以“产品质量是设计出来的,细节决定成败”为中心,抱着战战兢兢、如履薄冰的心态,从器件选型到 PCB 设计,所有环节的工作,她都实际着手参与。

为了做好当时最高速度的产品升级,伍漫波还出差去跟多个供应商学习取经。网板高速 SerDes 芯片的电源纹波要求很高,伍漫波直接负责电源供电系统的所有实现细节,包括电容选用、电容数量、层叠、布局、走线等等。板子做回来,调测非常顺利,当时其它产品线工程师认为不可能达到厂家对纹波的严苛要求,派人带着示波器过来测纹波,测完之后不得不相信了。

值得一提的是,400G 升级在设计时间上出现了不短的延期,产品线一度想把该项目从产品开发版本改为技术研究项目,可伍漫波坚持认为,这样仔细花时间设计出来的产品应该能在调测阶段会把所有耽误的时间找回来。大约是因为 6G 多框攻关的信誉,领导给予了伍漫波支持。

没多久传来好消息,NE5000E 6.4T 成功通过欧洲的第三方测试即 EANTC 测试,收发 125 万亿包零丢包,产品线领导刚开始听到这么好的测试结果时都不大敢信呢。这是全球首个 400G 满框测试,如此卓越的可靠性极大提升了华为公司的路由器产品形象。网上稳定运行三年多,该产品在 2016 年获得军功奖。

产品线乘胜追击,继续提出要求,希望实现 EX 平台 20G+ 设计,继续把核心路由器容量翻翻到 1T ,支撑产品竞争力进一步提高。因为现有框架下链路长度实在没有办法进一步缩短,速率又翻倍导致链路损耗大幅上升,想不到任何办法可以满足 SerDes 链路的裕量要求,所以虽然伍漫波和团队接到任务就一直研究,但始终不敢给出承诺。

产品线总裁查钧总请喝茶两次,对升级的事情高度关注。带着挑战成功的希望,日思夜想,伍漫波和团队反复脑力激荡,和业界的大牛交流、碰撞,去 PCB 板厂学习。受到启发后回来马上投板测试验证,经过将近一年的多方探索,终于验证了进一步升级的关键突破点,找到了可以让系统可靠升级的方法。又经过了半年多的开发工作,产品终于升级成功。该项技术突破使华为 NE5000E 集群路由器成为业界唯一的可从 40G、100G、400G 一直平滑升级到 Tbit 的路由器硬件平台,不但大幅延长产品生命周期,而且用业界领先的工程技术支撑产品持续领跑网络高端市场,持续保持对竞争对手的技术领先,获得了商业成功。

对话伍漫波

问:做了这么多年的硬件,而且做得非常成功,有什么心得可以和大家分享一下吗?

答:这么多年下来,觉得硬件和工程领域的工作最重要是坚持,该做的事情一定要做到位,不打折扣,即使在面对挑战,面对进度压力的时候。虽然产品形态各不相同,但硬件设计始终应该关注的是如何让产品在合理的成本代价下长期可靠工作。要做好硬件,特别是复杂系统的硬件,其实还是研发人员口中的那句老话最能说明问题——“产品质量是设计出来的”;随着产品速率不断上升,多个领域挑战工程极限,如果要再加上一句,还是一句老话“细节决定成败”。

问:产品质量是设计出来的”在您分享的故事中已经体现得很多了,“细节决定成败”怎么理解?

答:“细节决定成败”,多年以前这句话多指“细节决定是否一板成功”,随着速率的上升和挑战工程极限,“细节决定成败”还可以是决定产品最终的成败,有些重要细节处理不当,无论后续如何努力,也做不出可靠的产品。而且,一板成功从来不是我的第一目标,它只是认真做事的结果。硬件设计始终应该关注的是如何让产品在合理的成本代价下长期可靠工作。

问:所以哪怕再小的细节也不能放过。

答:对,但是除了关注细节外,我还一直强调硬件工程师要有系统观,如果不了解全貌,无法做好局部。比如做高速设计,一定要对所有相关环节比如结构、散热、板材、PCB 制造与组装等等都有清楚的了解,知道不同选择的收益和成本代价,才能做出最合理的折衷。

问:你一直是很认真的。

答:具体说,其实就是这两点:一,凡是自己负责的交付,所有的事情一定要清楚;二,凡是参与的项目,所有环节的问题都要当作自己的问题。曾经服务器产品线的资料都是“电信风格”而不是 IT 产品风格的,我主动申请,直接投入资料体系架构建设和资料模板写作整整三个月,改进后的服务器资料获得过公司嘉奖。

问:做硬件,您在讲座中还提到过选择好的合作伙伴也很重要。

答:目前产品实现所需要的技术更新非常快,我们对合作伙伴的选择和评估很重要。这首先要求我们自己能跟得上。需要持续升级的器件,一定要从当前版本的供应商合作过程中,及该供应商与其它客户的合作情况中去判断对方的理念和能力。要知道能力不够,再好的承诺都有可能落空。

问:您自己也说过,你在公司硬件领域被认为是偏“保守”的,因为更关注产品的可靠性,那么你怎么看待可靠性和创新的关系?

答:关于创新,好奇心是最根本的源动力。保持广泛的好奇和探索精神,对所有自己有可能理解的事物,包括不在自己专业领域的都多探寻一步,有时候就会出现灵光。另一方面,在工作中做好当前的产品交付才能有最好的创新,只有把当前的工作做到 100 分,才能更加准确的对未来的演进做出判断,工程领域尤其如此。

问:您在讲座中说过做事如做人,可否多说两句?

答:做事如做人,是我几十年工作的一个体会,就像苹果的成功充分说明了“文如其人”在技术领域就是“产品如其人”。所以我们一定要进取,开放,实事求是,追求卓越,这样才能真正把工作做好,把产品做好。

公众号

小程序

在线客服