(原标题:Tenstorrent,估值30亿美金)
公众号记得加星标,第一时间看推送不会错过。
来 源 : 内容来自半导体行业观察综合 。
据theinformation报道,由Jim Keller领导的芯片公司Tenstorrent在最近一轮融资中估值30亿美金。
Tenstorrent成立于2016年,致力于为NVIDIA的GPU开发可扩展的AI加速器,支持云计算和边缘计算。该公司目前正在研发RISC-V CPU,并将其设计授权给其他实体。值得一提的是,该公司在其开发过程中大量采用开源技术,从而避免了使用NVIDIA目前成本高昂的高带宽内存(HBM)。
Tenstorrent 首批上市的芯片是与 GlobalFoundries 合作生产的。Tenstorrent 的 Tensix 处理器由称为 Tensix Core 的处理器核心组成。每个 Tensix Core 都包含一个用于张量运算的数组数学单元、一个用于向量运算的 SIMD 单元、一个用于在核心之间和芯片之间传输数据的片上网络 (NoC)、五个用于辅助控制 NoC 的小型 RISC-V 处理器,以及高达 1.5MB 的 SRAM。
Tenstorrent推出的RISC-V替代方案Grayskull旨在显著简化编程并提升扩展性。Grayskull是该公司首款Tensix处理器,拥有多达120个Tensix核心,每个核心配备1MB SRAM,支持256位总线上的8GB LPDDR4内存,并同时支持常见的AI精度格式(FP8、FP16、BF16)和内存优化精度格式(BFP2、BFP4、BFP8)。
此外,Wormhole 是 Grayskull 的芯片尺寸缩小和改进版本。虽然 Tensix 核心数量略有减少(至 80 个),但 Tensix 核心的 SRAM 容量增加至 1.5MB,并新增了对更多精度格式的支持(FP32 输出、INT8、INT32 输出和 TF32),迄今为止,公司的大部分订单都来自IP交易时提升了现有格式的整体性能和效率,从而弥补了核心数量减少带来的不足。此外,本地内存容量也增加至 12GB 的高速 GDDR6,并且 Wormhole 可扩展至多芯片部署。
Tenstorrent处理器采用基于网格的架构,由Tensix核心组成,旨在高效处理各种规模的张量计算。每个处理器都配备了集成的网络通信硬件,无需依赖DRAM即可通过网络进行处理器间的直接通信。
在今年九月接受媒体采访时,Tenstorrent表示,公司已开始将其RISC-V CPU和AI内核作为可授权的IP进行产品化。Tenstorrent产品战略副总裁Aniket Saha透露,该公司目前已有包括LG和现代在内的IP授权客户。
Tenstorrent还将向计划开发与其工作站和数据中心硬件产品竞争的芯片产品的公司授权知识产权。“客户通常会采用略有不同的设计,”他们表示说。“即使在同一市场,他们也可以开发互补产品。”
Tenstorrent强调,公司 IP产品的差异化优势主要体现在公司尽可能地开源以及允许对其内核进行定制。通常情况下,IP公司不允许对配置选项以外的内容进行修改,因为这会使IP的维护变得非常困难。
据介绍,第一代Tenstorrent RISC-V CPU Ascalon 的IP 将以 10 到 20 SPECint2006/GHz 的性能实现形式进行产品化。今天发布的是性能最强和第三强的两款产品。Saha 表示,性能最强的 Ascalon-X 将与 Arm 的 Neoverse V2 和 V3 内核展开竞争。性能第三强的 Ascalon-S 则大致与 Arm Cortex-A78 竞争。
经过验证和确认的子系统,以及可配置的 2 到 8 个 Ascalon 内核集群也将可用。Ascalon 接口被指定为 Arm 的直接替代品(内核同时具有一致性接口和非一致性接口)。
Tenstorrent 正在推进每 18 个月推出一代又一代核心的节奏,下一代 Babylon 将提升性能、频率和 PPA。
这款名为 Alexandria 的 CPU 的汽车版本增加了一套用于汽车功能安全的功能集。这也为工业和医疗等领域开拓了市场。
Tenstorrent 表示:“由于工业和医疗领域的订单量通常较低,Arm历来不会涉足这些市场。我们正在寻找方法来整合部分订单量。”
一款名为 Atlantis 的开发板将搭载一颗 8 核 Ascalon-X CPU,其 TDP 为 50W。这款开发板将供 OEM 厂商、一级汽车供应商和独立软件开发商 (ISV) 使用,用于移植需要高单线程性能的软件。
Tenstorrent 表示,Atlantis SoC最终可能会被产品化用于人工智能PC,但这仍在讨论中。
与此同时,Tenstorrent 的下一代 Tensix AI 核心 Tensix-Neo 将发布。
与当前一代的Tensix-Blackhole核心相比,Neo采用了集群架构,在四个核心之间共享内存和NoC,而不是每个核心共享内存和NoC,以提高面积效率和利用率。
“这是我们第一次提前知道我们要将其作为知识产权出售,所以我们以更加模块化、灵活的方式构建了它,”Tenstorrent说。
这种灵活性还体现在指定 L1 缓存大小和数据类型支持等方面。
与 Ascalon CPU 内核类似,客户将负责较为简单的配置,而 Tenstorrent 则负责处理超出这些参数范围的定制。希望自行进行此类定制的客户可以购买创新许可。
“(对于创新许可客户),我们提供RTL代码、验证基础设施和我们搭建的测试平台,然后由他们自行完成验证工作,”Tenstorrent 说。“但这并非易事,所以我们会谨慎选择合作项目。”
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4230期内容,欢迎关注。
加星标第一时间看推送,小号防走丢
求推荐
