首页 - 财经 - 产业观察 - 正文

初创公司开发了一款光学NPU

关注证券之星官方微博:

(原标题:初创公司开发了一款光学NPU)

如果您希望可以时常见面,欢迎标星收藏哦~

来源:内容来自eejournal,谢谢。

利用基于光子学的技术进行“光速计算”有明显的吸引力——不仅仅是极高的速度,尽管这当然很重要,而且与基于晶体管逻辑的计算实现相比,其功耗也极低。

过去几年,我接触过几家提供各种光学计算解决方案的公司。但到目前为止,这些解决方案主要涉及将不同频率和相位的多束光注入光纤,并利用干涉进行复杂的计算,如果用硅片进行这些计算,则需要大量晶体管。

好吧,我刚刚接触到光学计算领域的一些新鲜事物。我和Michael F?rtsch 博士聊天,他是一家名为Q.ANT的德国初创公司的首席执行官。当然,当我说“初创公司”时,我们需要记住 Q.ANT 成立于 2018 年,到撰写本文时已经过去了六年。我不知道你是怎么想的,但从技术角度来看,六年前对我来说似乎是一生之久。

简单介绍一下背景故事,迈克尔最初从事的是计算网站的工作,但后来觉得无聊,于是他开始学习数学和物理,最后获得了马克斯·普朗克学会的博士学位。随后,迈克尔在美国国家标准与技术研究所(NIST)工作了几年,还做了一些其他工作,最后他决定重返工业界,创办了 Q.ANT。

在继续之前,值得注意的是,我们(人类)希望执行的计算量现在每三个月左右就会翻一番。这在多个层面上都是可怕的。

这里的一个问题是我们执行计算所消耗的能量。目前,大多数计算都是使用基于 CMOS 技术的硅芯片进行的。较小的晶体管比较大的晶体管消耗的功率更少。我们正在转向越来越小的工艺节点,其中晶体管的尺寸以纳米为单位,所以这很好 - 对吗?

问题是,我们希望执行的计算量呈指数级增长,这意味着我们需要在单个芯片上安装数百亿个晶体管。数百亿个晶体管会消耗大量能源,而当一台服务器中有多个这样的芯片、一个机架中有多个服务器、一个数据中心中有数万个机架时,能源消耗就会加剧。

归根结底,我们目前的计算解决方案 (a) 远没有达到我们所希望的速度,并且 (b) 消耗太多电力。例如,迈克尔指出,他最近参加了一次超级计算机会议和展览。他说每个机架都需要水冷。他还指出,在不久的将来,新的超标量数据中心将开始需要自己的专用发电站——可能是小型模块化反应堆 (SMR) 的形式。

Q.ANT 是一家有趣的公司。它拥有来自 21 个国家的 100 多名专家,拥有约 890 年的行业经验,平均年龄约为 36 岁。该公司的使命是开发光子计算解决方案,以应对当今人工智能 (AI) 时代的两大挑战:1)管理人工智能推理和其他数据密集型应用所需的大量数据(包括复杂的数学运算)。2)显著减少当今全球人工智能数据中心所消耗的大量电力和能源。

现在,我们可以深入研究 Q.ANT 的技术,但我担心深入研究可能会掩盖更大的故事,所以让我们将事情保持在相对较高的水平。让我们从下面的图像开始,这是基于光子学的本机处理单元 (NPU),它建立在公司的光赋能本机算法 (LENA) 架构上。


Q.ANT 的光子芯片是 LENA 的核心(来源:Q.ANT)

与其他产品相比,这款光子芯片的第一个区别在于,它采用薄膜铌酸锂 (TFLN) 制造而成。观察左侧的低损耗波导,它将引入光信号;观察右侧的低损耗耦合器,它将输出光信号。

中间的金色圆圈是电控光调制器。我们可以这样理解,每个圆圈都是一个电容器的极板。通过向该极板施加电压,我们可以调制通过调制器的光信号。多个调制器可以相互结合使用,以实现越来越复杂的计算。

这款 Q.ANT NPU 使用光而不是电子来执行复杂的非线性数学运算,有望实现比传统 CMOS 技术至少高 30 倍的能源效率和显著的计算速度提升。 想想看,傅里叶变换在传统计算中通常需要数百万个晶体管,而现在只需一个光学元件就能完成。这很令人兴奋,不是吗?

基于这一底层技术,Q.ANT 宣布推出其首款商业产品——基于光子学的 NPU,它配备了行业标准的 PCI-Express(PCIe)接口,与当今现有的计算生态系统完全兼容。


PCIe 卡上的 Q.ANT NPU(来源:Q.ANT)

嗯,这确实看起来很棒,但这项技术到底有多好呢?我很高兴你问这个问题,因为迈克尔分享了一张以非常直观的方式“传达这个想法”的图片,如下所示。


LENA 与标准 GPU(来源:Q.ANT)

假设我们试图训练 AI 识别文森特·梵高的《星夜》。我们使用基于 LENA 的 NPU 而不是在传统图形处理单元 (GPU) 上实现的标准人工神经网络 (ANN) 进行训练

上行显示一个训练周期 (epoch) 后的结果。下行显示 150 个周期后的结果。很容易看出 Q.ANT 解决方案有多先进。同样值得注意的是,LENA 仅需要 0.1 百万个参数,仅执行 0.2 百万次操作,而 GPU 则需要 5.1 百万个参数和 10 百万次操作。

现在我已经引起了你们的注意,我会首先告诉你们目前的情况,然后告诉你们我认为未来事情可能会如何发展。

目前的情况是,上图第一张图中所示的 TFLN NPU 安装在一块原始的硅基板上——基本上就是一块没有任何晶体管的硅片。目前,这块基板的主要作用(当然,除了提供放置物之外)是为调制器提供电容器的另一侧(我将其视为可以偏置或至少接地的“大容量电容器板”)。此外,如今,光信号通过常规光纤传入和传出该设备。

那么未来会怎样呢?首先,我可以设想将铌酸锂层直接安装在功能齐全的硅芯片上。在这种情况下,我们可以在芯片顶部(接触 NPU 底面的一侧)使用金属化圈作为各个调制器电容器的表面,并且可以在 NPU 顶面上涂一层导体作为“大容量电容器板”。

其次,与使用光纤将光信号“水平”地传送到铌酸锂层的边缘不同,我们可以使用硅芯片中制造的激光二极管将光信号垂直向上传输到 NPU 的低损耗光波导中。同样,与使用光纤访问从铌酸锂层的边缘“水平”传出的光信号不同,我们可以使用硅芯片中制造的光电二极管从 NPU 的低损耗光耦合器垂直接收这些光信号。

想象一下,将当今任何高端 CPU、GPU、FPGA 或 SoC(目前仅由硅制成)与上述光学 NPU 相结合。所有东西都将放在同一个封装中(不比今天的封装大),在外界看来就像普通芯片一样。我应该指出,所有这些都只是我的猜测;这不是迈克尔说 Q.ANT 正在做的事情,但如果我在 Q.ANT 有话要说,我会调查这件事。

非线性网络的潜在应用可以通过 Q.ANT 技术得到增强,从而提供更高的性能,同时消耗更少的电量,这些应用多种多样。下面列出了一些示例。


非线性网络的示例应用(来源:Q.ANT)

我认为,对于任何参与 AI 和高性能计算 (HPC) 的人来说,这种光子处理在效率和性能方面都非常有趣。当然,这不全是关于我的(应该是,但事实并非如此)。那么,你对这一切有什么看法?

如有硅光流片需求,

欢迎扫码,将有专人对接。

https://www.eejournal.com/article/a-bold-new-twist-on-optical-computing/

半导体精品公众号推荐

专注半导体领域更多原创内容

关注全球半导体产业动向与趋势

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第3976期内容,欢迎关注。

『半导体第一垂直媒体』

实时 专业 原创 深度

公众号ID:icbank

喜欢我们的内容就点“在看”分享给小伙伴哦

微信
扫描二维码
关注
证券之星微信
APP下载
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-