首页 - 财经 - 公司新闻 - 正文

瞄准大模型推理市场, 英特尔一天更新两款CPU

来源:36氪 2023-12-18 11:42:32
关注证券之星官方微博:

(原标题:瞄准大模型推理市场, 英特尔一天更新两款CPU)

#AMD VS 英特尔 谁能成为芯片行业领头羊?#

#英特尔Q3净利润68亿美元同比增长60% CFO将退休#

12月15日,英特尔$英特尔(NASDAQ|INTC)$举办了名为“AI无处不在“的发布会。英特尔显然把中国和美国市场当做是AI的两大重要市场,在硅谷和北京前后脚各办了一次发布会。

尽管在北京场的发布会上,英特尔并没有公布万众期待的GPU Gaudi 3的最新进展, 但英特尔在中国的AI探索重心,慢慢放在了如何引导用户采用CPU的产品来做大模型推理——从这两款产品的升级点也可以明显看出,英特尔在CPU上补充起GPU、NPU的短板。

在发布会上,英特尔此次更新了两款CPU:一款是面向企业端的云服务器CPU第五代至强处理器、另一款是面向普通消费者的酷睿Ultra处理器。这也是英特尔过去这么多年来,罕见在同一天同时更新云侧、端侧的产品。

在AI芯片三足鼎立格局即将形成之时,英特尔打算先两把抓,占住AI在云端和端侧的市场。

01.酷睿处理器:补上CPU以外的短板

肉眼可见的是,英特尔越来越重视CPU之外的能力。

本质上,这次发布的酷睿Ultra处理器其实是一颗复合芯片:在CPU的模块外,英特尔还塞入了一个用于图形处理的锐炫GPU、以及集成了用于人工智能推理的NPU模块。

这恰恰也是这颗处理器最大的看点。这颗酷睿Ultra处理器上,英特尔贡献了历史上最大的一次GPU升级。具体而言,这一模块支持硬件光追,还集成了多媒体引擎和显示引擎等等,整体性能相比上一代提升了两倍。

英特尔显然希望这款产品能够为AI大模型的落地增色,也首次加入了 NPU的模块,用于大模型推理。

大模型可以分为推理和训练两个环节,训练可以简单理解为制造大模型的过程,推理则是用大模型的过程。而随着大模型厂商格局的逐渐稳定,大模型未来逐渐走进千行百业,训练的需求未来有望快速增长——这正是多数芯片厂商虎视眈眈的蛋糕。

目前对于企业来说,挑战更大、对速度要求也更高的大模型训练,首选的还是英伟达A100,这也是英特尔在内的厂商都难以动摇的江山。而在场景更细碎、丰富大模型推理环节,厂商们一般会基于实际情况,有更加多元的芯片架构选择。

比如,并行度最高的GPU,往往适合更高吞吐的应用,比如文生图和大参数的大语言模型;NPU属于高算力、低能耗的芯片,更适合运行需要持续在后台运作的任务,比如视频会议里持续不断的视频声音处理等等;而CPU的特点是算力更高,且编程最简单最熟悉,可以进行更多普适性的任务。

有行业人士告诉 36 氪,尽管大模型推理场景下主流的选择是GPU或NPU,但目前行业内基于成本和产能考虑,已经在考虑是否可以用CPU来跑大模型推理的。

此次,英特尔把更强的GPU和NPU也封装到一颗CPU里面,显然希望从大模型推理侧开始突围,吃下更多的AI市场,也同时避开与英伟达的正面竞争。

02.第五代至强:狙击云端大模型

英特尔这代至强处理器主要围绕AI加速性能,进行升级,在算力、内存、AI推理性能上做了大幅度升级。

值得注意的是,第五代至强处理器,相比上一代的平均性能却提升了21%。不过,英特尔并不是通过卷芯片制程的方式来实现——两代芯片一样采用了Intel 7 制程,却另辟蹊径,通过调整芯片底层架构来提升性能。

具体而言,英特尔第五代至强处理器采用的是64核(上一代是60核),但每一个核还可以再分为2个模块,而上一代是4个——这意味着每一个CPU模块中,被塞进了2倍于上一代的内核数。此外,第五代至强处理器的缓存也有了大幅提升,内存带宽高达5600MT/s。

从综合效果来看,第五代至强处理器的云计算自然语言性能提升了23%、边缘计算的性能提升了 24%,AI推理性能提升 42%。

此外,针对云端跑大模型时可能存在的数据安全和隐私问题,英特尔还升级了TDX功能。在传统云计算中,大部分应用是在虚拟机上运行,下层是操作系统,上面承载用户数据。而在英特尔的TDX模式中,虚拟机是被隔离的状态,也给用户提供了更大的可信空间。

英特尔也在加紧商务推进,已与多数大模型厂商适配,第五代至强处理器已经能跑20B参数大模型,还实现了软件和平台兼容。

在发布会上,英特尔还特意邀请了京东云、百度来为他们站台。英特尔方面称,在Llama2的70B大模型上测试时,4台第五代至强处理器在100G高速网络下,总体性能提升相比上一代提升2.8倍、时延降低到87ms。

总体而言,英特尔至强处理器此次在架构、内存、算力、安全隐私上的提升,都是为了云服务厂商的需求考虑,提升了云端大模型的效率和性能。英特尔方面称,目前已经有超过20家OEM/ODM厂商、超过7家云厂商使用至强处理器。

在北京场的发布会上,英特尔没有提到Gaudi 3的任何消息。但在美国场发布会,英特尔CEO基辛格表示,其GPU芯片Gaudi 3即将在2024年上市,性能可能比英伟达H100更强,将用于深度学习和生成式AI。

在GPU领域,慢慢形成三足鼎立的局面——英伟达上个月发布的H200,在内存容量、计算性能等方面疯狂升级;AMD$超威半导体(NASDAQ|AMD)$也在不久前升级了MI300系列。AMD首席执行官苏姿丰称,MI300系列在训练端与英伟达的H100相当,但推理方面表现得更好。

不过,英特尔和AMD的GPU产品线还没真正动摇英伟达江山,战火还不算真正烧起来。但在此之前,英特尔想要先构筑自己稳固的CPU江山,先占住AI在云端和PC端的机会,蚕食更广阔的大模型推理市场。

作者丨邱晓芬

编辑丨苏建勋

微信
扫描二维码
关注
证券之星微信
APP下载
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-