首富从入职阿里开始薅羊毛 作者:佚名<br />
第363章 六十一!<br />
十一月九號。周一。<br />
老周来得比林彻早。<br />
林彻八点半到办公室的时候,老周已经坐在会客区的沙发上了,手里拿著一个平板,屏幕亮著,上面是一封邮件。他穿的是上周那件灰色卫衣,领口有点皱,像是昨晚没回家。<br />
“等多久了?“林彻问。<br />
“二十分钟。“<br />
林彻放下包,没坐到自己的椅子上,直接走到会客区坐在老周对面。<br />
“说。“<br />
老周把平板递过来。<br />
是一封发件人地址很长的英文邮件,林彻扫了一眼抬头,某美国晶片公司的亚太区合规办公室。<br />
“三个型號,上周五下午收到暂停发货通知。“老周说,“主控晶片一款,ai训练卡两款。邮件措辞是因出口合规审查需要,暂停向贵司交付以下產品型號,恢復时间另行通知。“<br />
另行通知。<br />
林彻把平板放在茶几上。<br />
“库存多少。“<br />
“主控晶片库存够用五个月。两款ai训练卡库存不一样,a100系列只够三个半月,v100系列够六个月。综合来算,如果三个型號全停,维持当前服务规模的话,库存撑四个月。“<br />
四个月。<br />
林彻没说话,等他继续。<br />
老周往前坐了一点,平板搁在膝盖上。<br />
“我周末算了一遍国產替代方案。寒武纪的mlu270可以替代v100的大部分推理任务,华为昇腾910可以替代a100的部分训练任务,主控晶片用飞腾或者鯤鹏都行。“<br />
他顿了一下。<br />
“但性能只有61%。“<br />
61%。<br />
打了六折。<br />
“具体差在哪。“<br />
“推理速度差20%左右,可以接受,用户端感知不明显。但训练速度差40%以上,同样的模型训练时间从两天变成三天半。更大的问题是良率,国產卡的故障率是进口的三到四倍,批量部署之后运维压力会很大。“<br />
老周说到这里停了。他在等林彻的反应。<br />
林彻靠在沙发上,手指搭在扶手上,没动。<br />
他在想。<br />
61%的性能。听起来很难看,快接近不能用了。但“不能用“和“勉强能用“之间有一条线,这条线的位置取决於你怎么用。 单晶片跑不动的事情,多晶片可以跑。一张卡算不完的任务,四张卡並行可以算。推理速度差20%,可以用缓存和预加载对冲,用户那边感知不到。训练速度差40%,可以把非紧急的训练任务挪到夜间跑,白天只保留推理和在线服务。<br />
异构计算。<br />
上辈子2022年以后,所有被制裁的中国科技公司都在做这件事。用不同架构的晶片混合部署,用软体层的调度算法弥补硬体层的性能差距。不完美,很笨重,调度代码写起来想骂人。但能跑。<br />
关键不是跑多快,是能不能跑。<br />
用户不能感知到卡顿。企业核心业务不能受影响。微光协同的视频会议不能掉帧,信用购的风控模型不能延迟出结果,abyss的数据查询不能超时。<br />
这三条守住了,61%就够了。<br />
守不住,100%也不够。<br />
他在脑子里过了一遍微光的业务优先级。第一梯队:信用购风控+abyss实时查询+协同视频会议,这三个对延迟最敏感,必须用最好的卡。第二梯队:云仓调度+企业服务后台+ai训练任务,可以容忍一定程度的降速。第三梯队:日誌分析、数据备份、离线任务,完全可以跑在国產卡上。<br />
分三层切,从第三梯队开始换,第一梯队最后换。进口库存优先保第一梯队。<br />
这个方案不完美。但能跑。<br />
“良率的问题呢。“他问。<br />
“故障率高意味著要多备冗余机器。我算了一下,如果要保证跟进口晶片同样的服务可用性,冗余率要从现在的15%提到35%。机器多了,电费多了,机房面积也得扩。“<br />
“钱的事找沈南。“<br />
老周张了一下嘴,又闭上了。<br />
他大概想说“不只是钱的问题“。冗余率从15%提到35%意味著机房要扩容,意味著运维团队要加人,意味著整个基础设施的架构要重新规划。这不是加钱就能解决的,是整个技术底座要翻一遍。<br />
但他没说出来。<br />
因为他知道林彻听得懂“冗余率提到35%“这句话背后有多少东西。<br />
林彻看著他。<br />
老周的眼睛有点红,跟前几天沈南来匯报的时候一样,但原因不同。沈南是算完数字之后哭的,老周是一个周末没怎么睡。他的平板上除了那封断供邮件,还有至少二十个瀏览器標籤页开著,都是国產晶片的技术文档和评测数据。<br />
他周末把能找到的资料全翻了一遍。<br />
来之前已经有方案了。<br />
只是方案不好看。<br />
“61%够不够跑全套?“林彻问。<br />
老周想了一下。不是犹豫,是在组织措辞。<br />
“勉强。得软体做很多適配。调度层重写,缓存策略重做,推理引擎的底层要改。至少三个月。“<br />
“三个月之內呢?“<br />
“混著用。进口库存撑著核心业务,国產卡先上非核心的任务,边切边调。过渡期会很难看,但不会崩。“<br />
林彻点了一下头。<br />
“那就做。“<br />
三个字。 老周看了他两秒。<br />
“真做?“<br />
“真做。“<br />
老周把平板收起来,站了起来。他没有再问別的。没有问“如果进口恢復了怎么办“,没有问“如果61%扛不住怎么办“,没有问“如果三个月不够呢“。<br />
这些问题他自己会在做的过程中解决。<br />
林彻知道他会的。<br />
因为老周来之前就已经把方案想好了。他需要的不是方案,是一句“做“。<br />
老周走到门口,拉开门,走廊的灯照进来。<br />
他回头看了一眼。<br />
“设备那边,陈维说有一笔荷兰的订单可以走第三方转口,但溢价40%。“<br />
“走。“<br />
“还有一台二手光刻设备,七成新,日本渠道,价格还在谈。“<br />
“能用就买。“<br />
老周点了一下头,走了。<br />
门关上了。<br />
林彻听著他的脚步声在走廊里远去。<br />
脚步比来的时候快。<br />
…………<br />
办公室安静了。<br />
他坐在沙发上没动,面前的茶几上放著老周刚才搁过平板的位置,留了一小块手汗的痕跡,过了几秒就干了。<br />
手机在桌上震了一下。<br />
陈维。<br />
“荷兰那笔,转口路径已確认。走新加坡。溢价42%。合同今天能签。“<br />
他回了两个字。<br />
“签。“<br />
放下手机。<br />
窗外是杭州十一月的早晨,太阳在云后面,光是白的,没有温度。<br />
四个月。<br />
倒计时开始了。