(原标题:从AI智能体到DeepSeek,GDC大会勾勒AI国产化发展前景)
近年来,人工智能技术快速发展,驱动着全球范围内开始崛起“智能产业经济”的新范式,并正以前所未有的速度重塑人类文明图景。
未来,人工智能领域会有哪些变革和成果?行业内对人工智能有哪些期待或诉求?中国人工智能产业将面临哪些新机遇、哪些新挑战?
2月,在以“模塑全球,无限可能”为主题的2025全球开发者先锋大会(GDC)上,多位行业专家、大咖齐聚一堂,一起探讨未来人工智能领域发展的新趋势和新动向。
智能体将在toB领域爆发
人工智能公司英伟达认为:2025年将成为AI智能体发展历程中的关键节点,即所谓的元年。
近期,“AI智能体(Agent)”一词逐渐成为市场热议的焦点。智能体区别于此前的AI大语言模型(LLM)。被认为是一种能够自主感知环境、进行决策并执行相应行动以达成特定目标的系统。
业内普遍认为,随着可训练预料和数据的消耗殆尽,大模型将趋于收敛。而智能体或将是人工智能行业的下一个爆发拐点。
蚂蚁数科AI技术负责人章鹏则进一步提出:2025不仅是智能体元年,还是智能体toB爆发的元年。
章鹏认为,智能体的发展趋势是自然而然的,在业内对大语言模型的缺陷进行弥补和优化的过程中,各项技术的结合最终形成了智能体。而智能体的行业应用将在数字化水平比较高的领域率先展开,例如金融、教育、医疗领域。
事实上,在一些对数据治理和流程优化有长期需求的领域里,AI已经早已切入了多个场景,实现了行业内的效率加速。
例如在医疗领域中,据统计全球范围内已有数十家顶尖医院引入了AI辅助诊断系统,能够通过对医学影像资料的分析,快速准确地识别出病变部位,为医生提供有力的诊断依据。
金融领域中,全球金融机构对于AI的接入更为广泛,多家银行采用AI技术来优化业务流程、提高服务质量和降低运营成本。同时,AI也逐渐在智能风控识别防范金融风险,保障金融市场的稳定和健康发展方面崭露头角。
章鹏认为:“智能体会出现新的摩尔定律,也就是每隔一年我们大模型的能力会翻倍,它的价格会继续下降”。不过,章鹏同时指出,当前智能体在全面落地阶段仍面临一定的挑战。
目前,智能体主要面临的双重困境:包括复杂任务的规划能力不足;和在线推理效率存在瓶颈。
首先,toB的场景复杂多变,且容错率较低。在需要多步骤、多工具协同的复杂场景中,往往难以实现可靠的任务分解和正确的路径规划。
其次,在落地方面还面临在线推理效率的瓶颈问题。其原因包括昂贵的生产资料,如GPU硬件、电力成本等;以及随着大模型参数规模的扩大和多模态的发展,进一步提高了推理成本。
阶跃星辰CEO姜大昕认为“智能体爆发至少需要2大能力,一个是多模态的能力,一个是推理的能力”。其中,多模态的能力可以帮助智能体更好地感知和了解用户所处的物理世界,更好地理解用户的意图和任务;而推理的能力则决定了智能体任务完成的成功率。
目前,DeepSeek发布的R1模型在推理能力方面已拔得头筹。而在多模态方面,阶跃星辰则走在行业前列。今年年初,阶跃星辰一周内批量更新了6款模型,全方位涵盖语言、语音、推理、图片理解、视频生成等多类别。
国产化长坡厚雪
近年来,曾被技术禁运与专利壁垒层层封锁的中国高科技产业,正在全球创新版图上撕开一道裂缝。从芯片断供后“麒麟芯片”的绝地突围,到算力封锁下DeepSeek的四两拨千斤。国产化浪潮正在从由内而外地重塑着全球高科技产业链。
在人工智能领域,AI算力GPU作为核心硬件,最为被市场所关注。当前,虽然国产AI算力GPU近年来取得了显著进展,如华为的910B系列、摩尔线程的S4000系列等,越来越多的企业开始采用国产GPU替代进口产品。但在市场占有率上仍难以与英伟达相抗衡。
临港算力上海科技有限公司,国产算力智算专家张佳伟博士认为:“在特定的大模型推理场景中,国产GPU展现出与NVIDIA的GPU相媲美的性能”。张佳伟称:“国产GPU如华为、沐曦、海光等开始在大规模模型推理中发挥作用,提升了推理效率。”
但同时,张佳伟也承认,国产AI芯片要实现替代还有一定距离。
其中,算力与能效比是衡量GPU性能的关键指标。根据专业机构测评,当前国产AI算力GPU的单卡的综合能力还难以撼动英伟达的市场地位。
国内企业目前探索的解决方案包括两种,一是以量取胜,创建“万卡集群”。
目前,临港算力上海科技有限公司已建立了从基础设施到算力底座,再到上层管理平台,最终到场景和服务等,完整的端到端算力服务解决方案。未来两年还将具备二十万张高性能算力卡的基础设施能力,从而支持国内厂商追上国际水平。
其二是优化兼容,针对国产GPU开发稳定、高效的底层算法和中间层软件。
华为云昇思生态副总监林翰,从软件技术的角度,介绍了AI框架在人工智能产业中的重要地位。
据了解,AI框架的主要作用之一是连接底层硬件与上层AI算法。目前,PyTorch作为业内主流框架,与英伟达GPU及CUDA生态的适配性和契合度在业内最为成熟。而国产AI框架则一直是追赶者的角色。
但国产软硬件产业需要发展壮大,作为中间层的AI框架也必须迎头赶上。近年来,随着国内企业和开发者的前赴后继,中国IA框架也越来越成熟和具有竞争力。
林翰介绍:根据IDC的统计数据,截至2024年底,昇思的MindSpore在中国AI框架的市场份额已经超过了30%,市场份额增速已连续两年保持第一。2024年基于MindSpore发表的AI领域论文是超过了一千九百篇,排名到了全全球第二。
目前,AI大模型仍在持续跨越式的演进,对AI框架在解决计算、效率、调度等方面提出了更高的挑战。或将成为国产AI学习框架实现弯道超车的最佳机遇。
DeepSeek,不止是普惠
在GDC大会的众多分享中,DeepSeek是被提及最多的中国人工智能企业。在有限的算力资源情况下,DeepSeek以极低的成本训练出了媲美openAI的大模型,并自主探索出了并行计算、混合专家、长思维链等领先技术。
上海科学智能研究院院长、复旦大学特聘教授漆远教授指出:“DeepSeek是一个普惠智能”。事实上,从经济和商业角度来看,DeepSeek极大得促进了大模型的普遍应用。”
漆远以“杰文斯悖论”为例,认为当技术进步提高了资源的效率后,资源消耗不仅不会减少,反而会激增。
“对于大模型而言,DeepSeek无疑推动了人工智能的大规模普及。目前大量海外云厂商,如微软云、亚马逊云;国内包括华为云、阿里云等均部署了DeepSeek。说明大家正海量使用着DeepSeek开源的技术。而开源也加强了行业间、用户间的信任。”
对于业内人士而言,DeepSeek的创新和开源更像是一盏指路明灯。
中科曙光智能计算产品事业部总监高璇称:“DeepSeek除了让我们能低成本地用上了大模型以外,还从底层技术、算法以及一些软件工程等多方面,带给我们一些新的创新机会。
高璇总结了DeepSeek带给行业的的三点创新启发。从底层来看,DeepSeek让业内开始重视起类似于汇编等更底层的技术优化。而在此之前,这一块的创新往往被忽略。
中间层里,DeepSeek验证了FP8精度的有效性,未来或将引发国产厂商更多的去侧重开发对于FP8精度的支持。另外包括一些通算融合、PD分离的策略,要求模型跟算力做到深度的耦合。
从上层模型来看,包括对强化学习(RL)以及思维链(CoT)的应用,或将带动未来推理应用场景的大幅增加。
高璇称:“未来AI思维链这一层将会有非常多的机会点,要把整个行业跟技术去做到一个更深层次的结合,这样才能带来AI应用思维的全面升级。”
章鹏也认为,DeepSeek带来的AI普及会进一步推动智能体的繁荣,因为推理模型能帮助智能体提升在“任务规划”等艰难环节的效率。