(原标题:一款内存新标准,速度飙升)
公众号记得加星标,第一时间看推送不会错过。
Tachyum 发布了其全新的开源TDIMM 内存标准,该标准在带宽和单模块容量方面均有显著提升。
继发布 2nm Prodigy 和 Prodigy Ultimate 之后,Tachyum 又公布了名为 TDIMM 的全新内存标准的计划,TDIMM 实际上就是 Tachyum DIMM 的缩写。这种新型内存设计完全开源,并在带宽和容量方面实现了大幅提升。
据 Tachyum 公司称,DDR5 TDIMM 标准将带宽提升了 5.5 倍,从标准 RDIMM 的 51 GB/s 提升至 281 GB/s。该内存标准采用多种外形尺寸设计,每种尺寸都提供不同的容量选择。标准尺寸的容量为 256 GB,更高尺寸的 DIMM 可提供 512 GB 的容量,而超高尺寸(Extra Tall)的容量最高可达 1 TB。
DDR5 RDIMM 与 DDR5 TDIMM 的比较:
RDIMM: 64 位数据,16 位 ECC,40 个 DQS,14 个 C/A,16 个控制信号,288 针连接器
TDIMM: 128 位数据,16 位 ECC,36 个 DQS,14 个 C/A,16 个控制信号,484 针连接器
首先需要指出的是,TDIMM 需要一种新的连接器布局,其物理尺寸与 DDR5 RDIMM 相似,但数据传输速率翻倍。同时,Tachyum 声称 TDIMM 内存的信号传输量仅增加 38%,但带宽翻倍,所需的 DRAM IC 数量减少 10%,从而成本降低 10%。
未来,该公司预计TDIMM标准将进行革新,带宽将提升至27 TB/s,相比DDR6标准而言,这将是一个巨大的提升——DDR6标准的带宽将从DDR5的6.7 TB/s跃升至DDR6的13.5 TB/s。这些变革预计将于2028年实现。
Tachyum 今日公布了其 TDIMM 技术如何引领人工智能和计算的未来,该技术能够以远低于现有解决方案的成本,实现参数量级远超现有方案的人工智能模型。TDIMM 是降低 OpenAI 数据中心成本的关键,预计其成本将从 3 万亿美元和 25 万兆瓦的电力消耗降至 270 亿美元和 540 兆瓦。
“TDIMM是降低人工智能系统成本的关键,它将基于人类所有知识进行训练的成本从2028年的8万亿美元和276吉瓦降至780亿美元和1吉瓦,”Tachyum创始人兼首席执行官拉多斯拉夫·达尼拉克博士表示。“TDIMM开启了人工智能成本可负担的新时代,该系统将基于人类创造的所有书面知识进行训练,并可供众多公司和国家使用。”
Tachyum 再次做出了重大承诺,我们将拭目以待,看看 TDIMM 内存项目是否会超越公告阶段。
Tachyum 开源 281GB/s TDIMM
Tachyum日前公布了其 TDIMM 技术如何引领人工智能和计算的未来,使人工智能模型的参数量级远超现有解决方案,而成本却仅为其一小部分。TDIMM 是降低 OpenAI 数据中心预计成本的关键,使其从 3 万亿美元和 25 万兆瓦的电力需求降至 270 亿美元和 540 兆瓦。
Prodigy Ultimate 的 AI 机架性能比 NVIDIA Rubin Ultra NVL576 高出 21 倍。Tachyum DDR5 DIMM (TDIMM) 的带宽提升了 5.5 倍,从 51 GB/s 提升至 281 GB/s。Prodigy Ultimate 的 24 个通道可提供 6.7 TB/s 的吞吐量,比 12 通道 CPU 提升了 11 倍。TDIMM 标准高度支持 256 GB 容量,高高度支持 512 GB 容量,超高高度支持 1 TB 容量,而 TSV 技术可将每个 Prodigy 节点的容量提升至 3 PB,最高可达 8 倍。
现有的DDR5 RDIMM内存条采用288针连接器,提供64位数据、16位ECC纠错、40个DQS信号、14个C/A信号和16个控制信号,共计146个信号。Tachyum TDIMM内存条采用484针连接器,提供128位数据、16位ECC纠错、36个DQS信号、14个C/A信号和16个控制信号,共计206个信号。内存带宽翻倍,信号数量仅增加38%。从成本角度来看,TDIMM所需的DRAM数量减少10%,预计成本也将降低10%。
连接器和 DIMM 的物理尺寸与 DDR5 RDIMM 和高型 DDR5 MRDIMM 相同。当服务器机箱高度为 3U 而非目前常见的 2U 时,超高型 TDIMM 可使容量翻倍。触点间距为 0.5 毫米,与 DDR5 SODIMM 相同,因此无需开发新的触点。只需修改塑料模具,这是一项难度较低的工程任务。
DDR5 x4 RDIMM 每次访问激活 20 个 DRAM 芯片,而 TDIMM 每次访问仅激活 18 个 DRAM 芯片,从而节省功耗。DDR5 RDIMM 以高频率切换 124 个引脚(64+16+40+2+2),而 TDIMM 切换 184 个引脚(128+16+36+2+2)。预计 TDIMM 的功耗会高出 30%,但带宽却是 RDIMM 的两倍。使用新型 DRAM 芯片后,TDIMM 的功耗将与旧款 DDR5 RDIMM 的功耗大致相同。
DDR5 TDIMM 内存无需等待数年才能获得昂贵的 DDR6 内存,即可将 DDR5 RDIMM 或 MRDIMM 的带宽和容量提升一倍。与 DDR5 RDIMM 相比,TDIMM 的带宽更是提升了四倍。只需将数据通路从 80 位增加到 144 位,即可轻松更改现有的 DDR5 控制器和 PHY IP。命令/地址和数据缓冲芯片无需更改,因此 TDIMM 内存有望在一年内得到广泛应用。
DDR6 控制器、PHY 和 MRDIMM 芯片的微小改动将在 2027 年将带宽从 6.7 TB/s 提升至 13.5 TB/s,超过英伟达 Rubin 的 13 TB/s。TAI 会将带宽降低至原来的四分之一,使 TAI 推理的带宽达到 54 TB/s 左右。2028 年的演进式改进将使基于 TDIMM 的 AI 芯片的带宽翻倍至 27 TB/s。
将TDIMM开源并免费提供给企业和全球用户(包括JEDEC),这将推动TDIMM的大规模普及和成本降低。中国在DDR5方面起步较晚,但明年推出DDR6时,他们有望实现性能和密度的飞跃,从而在Prodigy发布前实现低成本、大规模生产的TDIMM。有意者请立即联系Tachyum,获取TDIMM技术和相关协议。
“TDIMM是降低人工智能系统成本的关键,它将基于人类所有知识进行训练的成本从2028年的8万亿美元和276吉瓦降至780亿美元和1吉瓦,”Tachyum创始人兼首席执行官拉多斯拉夫·达尼拉克博士表示。“TDIMM开启了人工智能成本可负担的新时代,该系统将基于人类创造的所有书面知识进行训练,并可供众多公司和国家使用。”
Tachyum 坚信其技术应普及化,造福全人类。继今年开放 TDIMM 技术之后,Tachyum 还将开放指令集架构 (ISA) 并发布开源软件。2023 年,Tachyum 宣布 TAI TPU 技术开放授权,以确保 Tachyum 技术能够从数据中心扩展到边缘计算和物联网设备等更广泛的应用领域。
Prodigy 通用处理器可提供数量级更高的 AI 性能,是最佳 x86 处理器的 3 倍,是速度最快的 GPGPU 的 6 倍 HPC 性能。Prodigy 无需昂贵的专用 AI 硬件,并可显著提高服务器利用率,从而大幅降低数据中心的资本支出和运营支出,同时提供前所未有的性能、功耗和经济效益。
(来 源 : 内容 编译自 wccftech)
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4239期内容,欢迎关注。
加星标第一时间看推送,小号防走丢
求推荐
