(原标题:亚马逊云科技“反攻”:投资、投资再投资,从“云时代”向“AI时代”狂奔)
21世纪经济报道记者倪雨晴 西雅图、深圳报道
硅谷和西雅图是美国AI的两大高地,顶尖的AI工程师掀起了一波波浪潮。
OpenAI在硅谷的楼里打开AI魔盒、谷歌的Transformer架构为大模型奠定基础;一路向北,西雅图的微软、亚马逊正在从“云时代”往“AI时代”狂奔。
尤其是2024年的亚马逊云科技(AWS),营收体量已经接近1000亿美元,2024年第三季度的营收同比增长19%。但资本市场是苛刻的,对比微软Azure等云服务同期33%的增幅、谷歌云35%的增幅时,外界依然会询问AWS增幅不及同行的影响。
对此,AWS CEO Matt Garman在近期接受21世纪经济报道在内的媒体采访时谈道:“如果你从绝对规模来看,我们的业务仍在增长,AWS的业务仍然领先于并且大于所有其他公司的业务,我们需要继续专注于客户。”
(亚马逊云科技CEO Matt Garman)
对于云市场的竞争,他进一步强调,这个市场规模巨大,它并不是一个“赢家通吃”的行业,这个领域会有多个赢家,“如果你看和我们最接近的竞争对手,比如微软,他们有些举措实际上是在将现有业务的市场份额转移到这个新业务中。因此,并不能进行简单类比,需要看其他业务和整体情况。”
同时,Matt Garman指出,现在大约80%到90%的工作负载仍然运行在本地,对所有的云服务竞争者来说,如何将这部分迁移到云端,目前是最大的机会所在。
而AWS并非从零开始,客户经验积累是它优势,“但我们也意识到,必须始终保持饥渴感,必须不断为客户进行创新。我们需要继续为客户降低价格、增加新功能,同时也要不断拓展地理覆盖范围。因此,我们绝不会因为今天是最大的云服务提供商而停下脚步。”Matt Garman说道。
在2024年的re:Invent全球大会上,AWS确实迈出了大步伐,推出Amazon Nova系列基础模型并强化Amazon SageMaker、Amazon Bedrock和Amazon Q等核心服务;宣布AI训练芯片Trainium2实例正式可用,并推出新一代Trainium3。
当前,AWS正在AI产业链的各个环节上秣兵历马。正如亚马逊标志性的球体建筑(Amazon Spheres)中繁盛生长的植物,AWS也在构建生成式AI时代热带雨林式的新生态。
投资、投资再投资
AI,毫无疑问已经成为AWS、乃至亚马逊的主题词。就连卸任CEO的亚马逊创始人Jeff Bezos(杰夫·贝索斯),也回归一线,领导AI工作。
在2024年12月的一场媒体访谈中,杰夫·贝索斯久违地露面,并宣布自己仍然在亚马逊,并投入很多时间在亚马逊,目前参与的工作中95%聚集在人工智能。
同在2024年12月,AWS一年中最重要的re:Invent大会上,亚马逊CEO Andy Jassy也亲自上台,发布新款基础大模型Amazon Nova系列。目前,Nova包括6款大模型,涵盖语言、图像生成和视频生成模型。
此前,AWS已经有Titan模型,现在更多的模型正在路上,不论自家模型还是第三方模型,都将在其AI应用开发平台Bedrock上提供。
同时,AWS推出的新一代AI芯片Trainium3,将采用3纳米工艺制造。而Adobe、Poolside、Databricks、Qualcomm等企业已大规模投入使用Trainium2。
相比2023年围绕Bedrock和强化英伟达合作,显然2024年AWS的节奏更快。
谈及AWS的生成式AI策略,Matt Garman提到,AWS在生成式AI方面采取了与众不同的应对方式。
作为在AI领域深耕20多年的企业,AWS早在十年前就推出了SageMaker,帮助客户在云中构建AI模型。大约两年前,AWS已着手尝试生成式AI模型开发,并认为这是一项极具前景的技术。ChatGPT的出现震撼了世界,点燃了人们的想象力,改变了客户对AI的看法。
但是AWS采取了长远布局,而非匆忙推出功能。AWS相信生成式AI将成为每个应用程序的核心技术。此外,Matt Garman强调,他们认为不会有单一模型主导市场,考虑到生成式AI高昂的运行成本,AWS选择构建一个平台,确保数据隐私与安全内置其中,为企业提供更全面的支持。
2024年AWS确实在AI领域火力全开,投资也更凶猛。
在2024年11月底,AI初创明星Anthropic宣布与AWS进一步加深合作,同时亚马逊将新增40亿美元投资。这意味着,亚马逊对Anthropic的总投资达到80亿美元。
在2024年三季度业绩会上,Andy Jassy还表示,2025年预计花费750亿美元在AWS和生成式AI之上。
大笔的资本支持,也反映了AWS要补齐AI板块的巨大野心。
与此同时,微软和谷歌等巨头也在持续投资建设。尽管近日微软CEO纳德拉在采访中表示算力投资要谨慎,微软不会轻举妄动、大肆采买,但是从规模上看依然很可观。
摩根士丹利(Morgan Stanley)2024年11月发布的报告显示,亚马逊、Google、Meta和微软2025年的资本支出合计将达到3000亿美元左右,2026年将进一步增长至3365亿美元,这些支出多数将投入固定资产,例如数据中心和房地产。
其中,摩根士丹利将亚马逊2025年资本支出预估值调高22%至964亿美元,主要是数据中心加码采购AI GPU与服务器,2026年预估将进一步增长至1050亿美元。
从数据中也能看出,亚马逊正在加速投入,但是生成式AI能否达到如此高的回报,也成为资本市场的拷问。
对于投资回报问题,Matt Garman表示,当前客户案例中已经初现生成式AI的潜力。这并不仅仅是“请为我写一首关于咖啡杯的俳句”这样的简单应用。尽管计算机程序能够生成这些内容,这种能力虽有趣,但并非能支撑万亿美元市场的想法。如今,AWS已经看到了一些实际案例的出现,比如在医疗领域,一些公司已经利用生成式AI尝试突破性的研究。
在Matt Garman表看来,尽管许多模型的能力尚不够强大,工具仍需完善,数据的应用也有待优化,但从投资角度来看,这是一条正确的道路。这些技术正不断进步,经历了从第一代到第四代的持续改进。相信这种趋势将继续下去,生成式AI将带来深远的影响。
“6页文档”和芯片路径
在Matt Garman谈完战略后,西雅图市中心一家历史悠久的餐厅Virginia里,AWS副总裁兼杰出工程师James Hamilton向记者讲述了AWS Silicon(芯片)的诞生。
James Hamilton在AWS内部也是颇具传奇色彩的人物,在他往返工作和家庭(一艘轮船)的路上,经常会来到Virginia。用他的话说,AWS Silicon,也就是芯片业务就是在这家餐厅起步的。
“我每周会有2到3次来到Virginia,和初创公司、供应商、客户等人会面,花一个小时详细了解别人的东西。我总能学到一些东西,偶尔我也会有新想法,在这里还遇到了建立AWS硬件部门的伙伴。”James Hamilton说道。
因此,他选择在Virginia和媒体交流AWS的芯片事业,在十年前,即2013年左右,他提出让亚马逊投资芯片,还写了一份“6页文档”(6 page document)。
亚马逊内部有一个独特的“6页纸”(6 pager)文化,包括研发团队的技术工程师都要写文档,文档从分析客户需求开始入手。而当会议开始时,大家先埋头读文档20分钟左右,然后再进行提问沟通环节。
James Hamilton回忆道:“那是2013年8月,已经是很久以前的事了。当时AWS的CEO Andy Jassy让我整理一份文档,重点是硬件创新,而我们当时是一家软件公司。他是一个具有前瞻性思维的人,他认为硬件是这个行业的重要组成部分。因此,我写了这份文档,并向Jeff Bezos、Andy Jassy以及AWS团队的管理层进行了展示。”
这份文档中有两个基本论点,第一个论点是“规模总是胜出”,高出货量会推动创新。他以ARM处理器为例,现在每部手机、每台电视里都有一个ARM处理器,它们无处不在,目前ARM出货量已超2000亿个。
第二个论点是公司需要创新服务器,简化团队的工作流程,“我们希望从硬件最底层、从服务器的核心开始进行创新,为客户创造独特的价值,必须要这么做。2013年至今,所有的创新和组件都被整合到芯片上。”James Hamilton谈道。
AWS计算与网络副总裁Dave Brown进一步表示,AWS于2017年开始开发第一款生成式AI芯片Inferentia,这也是一款专注于机器学习的芯片,于2019年推出,“我们一直在追求的目标是,帮助客户每花一美元获得更多性能。这有点像过去的摩尔定律,但摩尔定律基本上在2003年左右就已经失效了,我们都接受了这一点。但AWS定律是新的,它一直在持续发展。”
他还提到,AWS将芯片从流片到数据中心部署的周期缩短至一两个月,大幅加快了开发进程,帮助客户更快获得性能提升。以Graviton系列为例:2018年推出第一代,2019年推出第二代,如今第四代芯片已于2024年初发布。AWS大约每18个月推出一款新的Graviton芯片,涵盖从设计、流片到部署,再到为客户提供服务的完整流程。
此外,AWS还有自研AI训练芯片Trainium系列,最新的Trainium3基本上所有设计都会围绕生成式AI。而在芯片层面,绕不开的话题就是和英伟达等芯片巨头的竞争,当前不论AWS、谷歌、微软,都已经有自己的芯片业务,大多是用于自家业务,但是AWS的芯片和服务器对外销售。
谈及竞争,Dave Brown回应道,NVIDIA、Intel和AMD是AWS最紧密的合作伙伴之一,客户在AWS可选择Intel、AMD或Graviton,每种方案都有不同的优缺点。部分客户选择Intel或AMD以利用x86架构和成本节约,而另一些客户则倾向于Graviton,因为其可提供约40%的性价比提升。
在AI领域,这种选择权同样适用。有些客户偏爱NVIDIA的生态系统,而另一些客户则尝试AWS的训练芯片和Inferentia,以实现成本节约并完成更多任务。他还提到,AWS还与Intel合作,使Sapphire Rapids芯片在AWS上的性能提升约18%,AWS与NVIDIA合作推出GB200的集群,用于训练大型语言模型和支持DGX Cloud。
而AWS强调最多的就是多方合作降低成本,不论是对自身业务还是客户业务。多位分析师也向21世纪经济报道记者表示,互联网巨头自研芯片多是出于成本和业务发展考虑,目前尤其是在推理市场上,定制化芯片正在和英伟达形成竞争之势。
在谈及AI推理带来的新需求时,亚马逊云科技大中华区产品技术总监王晓野告诉21世纪经济报道记者:“一方面在模型控制上,智能体调用时模型能力至关重要;另一方面在底层,不仅要优化延迟latency,还有一点值得关注,那就是底层算力中CPU和GPU计算的配比。以前在模型能力优化时,大家多聚焦预训练阶段(此阶段GPU使用较多),但如今在优化推理能力时,很多做法是预训练到一定程度后,在后续一步推理中采用强化学习等方式,并且会根据CPU计算结果来判断和调整,这必然会使CPU算力比例发生相应变化。”
展望芯片领域的技术趋势,James Hamilton表示:“过去几年大多数创新都集中在芯片本身及其如何缩小尺寸方面。现在,我们进入了大规模多芯片封装的阶段。当前关注的重点是,多大规模的多芯片封装实际可行?我们如何通过光互连技术来提升性能?以及接下来四到五年内,这一领域将会发生什么变化?我非常确信,这将是未来五年内创新的核心领域。”
云厂商的“ABCD模型”竞赛
云厂商的竞争如今愈加激烈,或许我们可以用“ABCD模型”来衡量厂商综合能力的标准。
一位AI资深从业者向21世纪经济报道记者表示,要在当前阶段胜出,一家云厂商至少需要具备AI(人工智能)、Business(业务)、Cloud(云计算)、Data(数据)四项能力,成为“全能型选手”,而非仅仅专注于某一领域。
AI作为核心技术框架无疑是整个模型的领头概念,各家都在不断发力。但商用的关键性常常被忽视。许多公司盲目投资AI,希望通过技术突破业务瓶颈,正确的路径应是业务优先,通过明确的业务场景推动AI技术的落地。
从当前的竞争来看,业务先行方面,亚马逊集团电商垂类业务领先,微软整体增长较快,直接将C端一系列应用迁移上云。
云则是基础能力,根据Gartner的统计,2023年全球基础设施即服务(IaaS)市场上,亚马逊在2023年继续位居IaaS市场第一,微软、谷歌、阿里巴巴和华为紧随其后,以39%的市场份额继续领跑。
而数据是应用AI的关键,数据的丰富性和多样性直接决定了AI训练和应用的效果。亚马逊整体有丰富的电商数据优势,微软数据类型较为多样化,谷歌在数据领域同样表现出色,依托搜索引擎积累的海量数据优势,但在云上的表现稍显一般。
整体而言,AWS的优势则在于云的强大能力,集团电商业务垂直领域的基础扎实,数据也多元,目前它在AI领域投入巨大,补齐相关的短板。对照ABCD四个指标,微软、谷歌也各有优劣。
展望未来,AI厂商要想真正扩大AI和云的规模,必须更加依赖业务的驱动,这也是2024年以来业界关注的商业模式话题。
从全球竞争态势来看,AI市场的竞争仍在加剧。DeepSeek发布的新一代大语言模型DeepSeek-V3,与全球顶尖大模型比肩,这表明国内AI初创企业正另辟蹊径,试图在这场竞争中占据一席之地。在全球AI排行榜中,OpenAI、谷歌的Gemini、Anthropic等依然占据领先位置,但新的竞争者不断涌现,为市场注入了新的活力。
与此同时,基础设施的能耗问题成为云厂商发展的新挑战,换言之,ABCD之外,E所代表的能源(Eenergy)也将成为关键因素。
数据显示,在美国,基础设施的耗电量目前占电网总负荷的2%,而未来十年可能上升至6%-7%甚至更多。能源成本和效率已经成为云厂商无法回避的问题,影响着基础设施扩展和AI技术的部署。
Matt Garman表示,高效利用能源是AWS的重要目标之一。云数据中心相较于传统本地数据中心,效率更高,利用率更强。然而,过去简单申请更多电力的时代已经结束,现在需要从长远角度规划电力供应,特别是零碳能源的容量问题。AWS将电力规划延伸至2024年、2030年乃至2040年,着力推动可再生能源项目的扩展。
但风能和太阳能可能不足以满足未来需求,核能成为重要补充。AWS此前与核电厂达成合作协议,并对小型模块化反应堆(SMR)进行了大规模投资。这些自包含的反应堆可部署在靠近数据中心的位置,有效减少电力传输损耗。尽管SMR的部署或需等到2030年,但AWS对其潜力充满期待,视其为未来几十年满足需求的关键机会。
谷歌也宣布将从SMR 开发商Kairos Power购买电力。微软也与Constellation Energy合作重启三哩岛核电站,为其数据中心供电。
云厂商的竞争已从单一领域的比拼转向多维度的较量,各大厂商在巩固核心能力的同时,不断寻求创新路径以应对全球市场的挑战和变化。未来,云厂商的成功不仅依赖技术实力,更需在业务驱动、生态构建和能源规划上实现突破。