首页 - 财经 - 行业新闻 - 正文

两台运行“满血版”DeepSeek,第四范式推出大模型推理一体机解决方案SageOne IA

来源:财经报道网 2025-02-17 17:27:02
关注证券之星官方微博:

(原标题:两台运行“满血版”DeepSeek,第四范式推出大模型推理一体机解决方案SageOne IA)

今天,第四范式推出大模型推理一体机解决方案SageOne IA,进一步减低了大模型推理成本。如满血版的DeepSeek V3/R1仅需要两台一体机即可使用。此外,一体机解决方案还集成了智能算力池化技术,在支持DeepSeek V3/R1、QWen2.5、LLama3.3等主流大模型的基础上,企业可灵活在满血版和多个蒸馏模型之间切换,GPU利用率提升30%以上,推理性能平均提升5-10倍;同时内置大模型应用开发平台,并搭载了丰富的开箱即用AI应用套件,帮助开发者高效开发企业级的生成式AI应用,让企业享受高效的大模型应用服务,加速AI智能化落地进程。

 

SageOne IA大模型推理一体机解决方案,具备三大核心优势:

1) 智能算力池化,资源动态调度,突破物理机架构

传统的物理机架构是单纯的算力堆叠,资源固化使得大模型推理训练任务无法灵活调度,造成GPU资源大量闲置或低效使用。通过业界领先的第四范式GPU资源池化(vGPU)技术,可对算力和显存进行智能切分,对计算任务智能调度,灵活在不同尺寸的大模型中进行切换,GPU利用率提升30%以上。当智算需求增加时,可实现无缝扩展,即插即用。同时,利用多任务共享存储及处理优化技术,推理性能平均提升5-10倍。目前已达到千卡级别分布式调度与管理能力。

 

2) 集成大模型工具链,便捷应用开发

以第四范式大模型工具链为核心的开发平台,包含数百个开放模型服务供给及模型全生命周期管理、可视化workflow流程编排、文档知识自动化解析和向量化存储、Agent智能体框架等,并支持对接业务系统API。融合LLM Ops的理念,使企业开发者可以数周内灵活、快捷搭建企业级的生成式AI应用,开发周期普遍缩短95%以上。

 

3) 内置Sagesuite AI应用套件,众多应用开箱即用

方案支持企业按需选择DeepSeek V3/R1、QWen2.5、LLama3.3等主流大模型,还预装了丰富的AI应用套件,包括AIGC、智能办公、数字员工、智能问答、AI本地搜索、分析决策、大模型开发工具、模型仓库、智能体Agent平台、DevOps等,帮助客户快速落地AI并全方位提升AI算力利用价值。



本文来源:财经报道网

微信
扫描二维码
关注
证券之星微信
APP下载
相关股票:
好投资评级:
好价格评级:
证券之星估值分析提示第四范式盈利能力较差,未来营收成长性一般。综合基本面各维度看,股价合理。 更多>>
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。如该文标记为算法生成,算法公示请见 网信算备310104345710301240019号。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-