(原标题:华为云CEO张平安:如何打破算力天花板?)
本文来源:时代财经 作者:王夏
7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议在上海开幕。华为常务董事、华为云CEO张平安在产业发展主论坛上指出,我国要通过架构性的创新构建可持续发展的AI算力基础设施;要积极开放行业场景,推动AI在行业应用端抢占优势。
“中国的AI创新道路要怎么走?”张平安在演讲伊始抛出了这样一个问题。
在他看来,从我国现有的发展格局来看,推动AI发展,应当从芯端算力上云、面向AI进行网络架构升级、做好云基础设施系统架构创新三方面出发。
智能时代正加速到来。在手机、PC等设备越来越“聪明”的当下,为什么还需要将部分端侧的算力释放到云端?
“我们不能将AI算力需求全部放在终端。”在张平安看来,由于芯片、能耗等因素制约,端侧算力存在一个“天花板”。
因此,当前最重要的是思考如何释放对芯片和端侧AI算力的需求,做好芯、端、云、网的融合,在云端构建我国的算力基础。
创新架构离不开网络的支持。张平安认为,我国的网络优势来自丰富的光纤传输带宽资源和在5G网络建设方面的领先地位。
据张平安介绍,我国在去年开始了5G-A(5G-Advanced,也称5.5G)的网络创新。5G-A是传统5G网络带宽的10倍,且传输时延能从原来的10毫秒降低到1毫秒。这无疑能为端侧算力上云、端云算力协同带来坚实保障。
在AI时代,人们对算力的需求产生了变化。因此,云基础设施方面也需做好创新。
过去,CPU服务器是计算中心,包括GPU在内的设备都被看作“外设”、“附件”。在AI时代,多元算力需求飞速增长,围绕CPU构建的传统的数据中心面临极大的挑战。
今年,华为云发布了全新的CloudMatrix架构,将CPU、NPU、GPU等算力资源全部互联和池化。“在这种架构的基础上,我们可以实现一切可组合的数据中心的设计,从算力规模、扩展模式和使用模式上,匹配未来大规模的算力需求。”张平安指出。
在演讲中,他提到,华为云对昇腾集群就进行了打破设备边界的端到端优化,保障千亿参数模型在云上训练可实现40天无中断,平均故障恢复时间小于10分钟。
中国拥有千行万业的业务场景,也拥有全球最大的软件创新人群。在张平安看来,全力支持AI技术发展的根本目的,是推动不同行业积极拥抱AI,开放行业业务场景。“接下来更重要的是探索B端或C端的行业场景应用,让AI在行业应用层面构建起领先优势。”他说。
据悉,华为盘古大模型聚焦在行业,致力于助力千行万业智能升级。张平安透露,华为的盘古大模型已经在宝钢的一条热轧生产线上线。在大模型的帮助下,预测钢板精度提高5%,每年有望多生产2万吨钢板,增收9000多万元。