首页 - 财经 - 公司新闻 - 正文

第四范式(06682.HK)发布「Virtual VRAM」虚拟显存扩展卡,GPU资源利用率实现突破

来源:格隆汇 2025-09-30 09:30:25
关注证券之星官方微博:

(原标题:第四范式(06682.HK)发布「Virtual VRAM」虚拟显存扩展卡,GPU资源利用率实现突破)

在AI大模型迅速发展的背景下,GPU显存容量正成为制约模型训练与推理效率的关键瓶颈。单卡运行时显存不足,又或是轻负载场景中一模型一卡的部署形态,无不反映出市场对高效、低成本扩展显存资源的迫切需求。

近日,第四范式正式推出了「Virtual VRAM」可插入式虚拟显存扩展卡,该产品通过将物理内存转化为可动态调度的显存缓冲池,实现了GPU算力资源的弹性扩展。第四范式创始人戴文渊,第四范式联合创始人、首席科学家陈雨强出席发布活动。

传统GPU显存容量固定且扩展成本高昂,限制了AI模型规模的扩大与多任务并发能力。用户往往只能通过购置更高端显卡或多卡并行来缓解压力,导致投入成本急剧上升。第四范式的「Virtual VRAM」创新性地构建了显存与内存之间的高速数据通道,将内存虚拟为显存使用,相当于为原有的“固定备菜台”配置了一个可灵活调度的“储藏室”,从而在不大幅变更硬件结构的前提下,突破显存容量限制。

据第四范式联合创始人、首席科学家陈雨强介绍,单张显卡在使用该扩展卡后,虚拟显存容量最高可扩展至256GB。以NVIDIA H20显卡为例,其原生显存为96GB,扩展后相当于10张NVIDIA RTX 4090或6张NVIDIA A100的物理显存容量。用户无需更换硬件,即可在接近原生大显存性能的状态下,运行更大规模的AI训练与推理任务。

该产品主要面向两大应用场景:一是在大模型单卡运行显存不足时,用户可通过调用内存资源继续完成任务,从而避免采购额外显卡,显著降低成本;二是在轻负载场景中,可将多个模型部署于同一GPU,实现资源动态调度,有效解决“一模型一卡”带来的资源闲置问题。

此外,「Virtual VRAM」具备高度兼容性与部署便利性。产品支持物理机、Docker容器及Kubernetes等云原生环境,用户无需修改现有代码或重新编译即可实现即插即用,大幅降低了部署复杂度和二次开发成本。

分析认为,随着AI模型数量与参数规模持续高速增长,显存容量已成为制约企业AI能力构建与成本控制的关键因素。第四范式此次发布的新产品,有望为企业提供更具性价比的算力扩展方案,帮助用户在保持高性能的同时进一步实现降本增效。未来,第四范式计划与更多内存厂商展开合作,持续推动AI基础设施的优化与普及。

微信
扫描二维码
关注
证券之星微信
APP下载
相关股票:
好投资评级:
好价格评级:
证券之星估值分析提示第四范式行业内竞争力的护城河较差,盈利能力一般,营收成长性一般,综合基本面各维度看,股价偏高。 更多>>
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。如该文标记为算法生成,算法公示请见 网信算备310104345710301240019号。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-