初创公司开发了一款光学NPU_财经频道

（原标题：初创公司开发了一款光学NPU）

如果您希望可以时常见面，欢迎标星收藏哦~

来源：内容来自eejournal，谢谢。

利用基于光子学的技术进行“光速计算”有明显的吸引力——不仅仅是极高的速度，尽管这当然很重要，而且与基于晶体管逻辑的计算实现相比，其功耗也极低。

过去几年，我接触过几家提供各种光学计算解决方案的公司。但到目前为止，这些解决方案主要涉及将不同频率和相位的多束光注入光纤，并利用干涉进行复杂的计算，如果用硅片进行这些计算，则需要大量晶体管。

好吧，我刚刚接触到光学计算领域的一些新鲜事物。我和Michael F?rtsch 博士聊天，他是一家名为Q.ANT的德国初创公司的首席执行官。当然，当我说“初创公司”时，我们需要记住 Q.ANT 成立于 2018 年，到撰写本文时已经过去了六年。我不知道你是怎么想的，但从技术角度来看，六年前对我来说似乎是一生之久。

简单介绍一下背景故事，迈克尔最初从事的是计算网站的工作，但后来觉得无聊，于是他开始学习数学和物理，最后获得了马克斯·普朗克学会的博士学位。随后，迈克尔在美国国家标准与技术研究所(NIST)工作了几年，还做了一些其他工作，最后他决定重返工业界，创办了 Q.ANT。

在继续之前，值得注意的是，我们（人类）希望执行的计算量现在每三个月左右就会翻一番。这在多个层面上都是可怕的。

这里的一个问题是我们执行计算所消耗的能量。目前，大多数计算都是使用基于 CMOS 技术的硅芯片进行的。较小的晶体管比较大的晶体管消耗的功率更少。我们正在转向越来越小的工艺节点，其中晶体管的尺寸以纳米为单位，所以这很好 - 对吗？

问题是，我们希望执行的计算量呈指数级增长，这意味着我们需要在单个芯片上安装数百亿个晶体管。数百亿个晶体管会消耗大量能源，而当一台服务器中有多个这样的芯片、一个机架中有多个服务器、一个数据中心中有数万个机架时，能源消耗就会加剧。

归根结底，我们目前的计算解决方案 (a) 远没有达到我们所希望的速度，并且 (b) 消耗太多电力。例如，迈克尔指出，他最近参加了一次超级计算机会议和展览。他说每个机架都需要水冷。他还指出，在不久的将来，新的超标量数据中心将开始需要自己的专用发电站——可能是小型模块化反应堆 (SMR) 的形式。

Q.ANT 是一家有趣的公司。它拥有来自 21 个国家的 100 多名专家，拥有约 890 年的行业经验，平均年龄约为 36 岁。该公司的使命是开发光子计算解决方案，以应对当今人工智能 (AI) 时代的两大挑战：1）管理人工智能推理和其他数据密集型应用所需的大量数据（包括复杂的数学运算）。2）显著减少当今全球人工智能数据中心所消耗的大量电力和能源。

现在，我们可以深入研究 Q.ANT 的技术，但我担心深入研究可能会掩盖更大的故事，所以让我们将事情保持在相对较高的水平。让我们从下面的图像开始，这是基于光子学的本机处理单元 (NPU)，它建立在公司的光赋能本机算法 (LENA) 架构上。

Q.ANT 的光子芯片是 LENA 的核心（来源：Q.ANT）

与其他产品相比，这款光子芯片的第一个区别在于，它采用薄膜铌酸锂 (TFLN) 制造而成。观察左侧的低损耗波导，它将引入光信号；观察右侧的低损耗耦合器，它将输出光信号。

中间的金色圆圈是电控光调制器。我们可以这样理解，每个圆圈都是一个电容器的极板。通过向该极板施加电压，我们可以调制通过调制器的光信号。多个调制器可以相互结合使用，以实现越来越复杂的计算。

这款 Q.ANT NPU 使用光而不是电子来执行复杂的非线性数学运算，有望实现比传统 CMOS 技术至少高 30 倍的能源效率和显著的计算速度提升。想想看，傅里叶变换在传统计算中通常需要数百万个晶体管，而现在只需一个光学元件就能完成。这很令人兴奋，不是吗？

基于这一底层技术，Q.ANT 宣布推出其首款商业产品——基于光子学的 NPU，它配备了行业标准的 PCI-Express（PCIe）接口，与当今现有的计算生态系统完全兼容。

PCIe 卡上的 Q.ANT NPU（来源：Q.ANT）

嗯，这确实看起来很棒，但这项技术到底有多好呢？我很高兴你问这个问题，因为迈克尔分享了一张以非常直观的方式“传达这个想法”的图片，如下所示。

LENA 与标准 GPU（来源：Q.ANT）

假设我们试图训练 AI 识别文森特·梵高的《星夜》。我们使用基于 LENA 的 NPU 而不是在传统图形处理单元 (GPU) 上实现的标准人工神经网络 (ANN) 进行训练

上行显示一个训练周期 (epoch) 后的结果。下行显示 150 个周期后的结果。很容易看出 Q.ANT 解决方案有多先进。同样值得注意的是，LENA 仅需要 0.1 百万个参数，仅执行 0.2 百万次操作，而 GPU 则需要 5.1 百万个参数和 10 百万次操作。

现在我已经引起了你们的注意，我会首先告诉你们目前的情况，然后告诉你们我认为未来事情可能会如何发展。

目前的情况是，上图第一张图中所示的 TFLN NPU 安装在一块原始的硅基板上——基本上就是一块没有任何晶体管的硅片。目前，这块基板的主要作用（当然，除了提供放置物之外）是为调制器提供电容器的另一侧（我将其视为可以偏置或至少接地的“大容量电容器板”）。此外，如今，光信号通过常规光纤传入和传出该设备。

那么未来会怎样呢？首先，我可以设想将铌酸锂层直接安装在功能齐全的硅芯片上。在这种情况下，我们可以在芯片顶部（接触 NPU 底面的一侧）使用金属化圈作为各个调制器电容器的表面，并且可以在 NPU 顶面上涂一层导体作为“大容量电容器板”。

其次，与使用光纤将光信号“水平”地传送到铌酸锂层的边缘不同，我们可以使用硅芯片中制造的激光二极管将光信号垂直向上传输到 NPU 的低损耗光波导中。同样，与使用光纤访问从铌酸锂层的边缘“水平”传出的光信号不同，我们可以使用硅芯片中制造的光电二极管从 NPU 的低损耗光耦合器垂直接收这些光信号。

想象一下，将当今任何高端 CPU、GPU、FPGA 或 SoC（目前仅由硅制成）与上述光学 NPU 相结合。所有东西都将放在同一个封装中（不比今天的封装大），在外界看来就像普通芯片一样。我应该指出，所有这些都只是我的猜测；这不是迈克尔说 Q.ANT 正在做的事情，但如果我在 Q.ANT 有话要说，我会调查这件事。

非线性网络的潜在应用可以通过 Q.ANT 技术得到增强，从而提供更高的性能，同时消耗更少的电量，这些应用多种多样。下面列出了一些示例。

非线性网络的示例应用（来源：Q.ANT）

我认为，对于任何参与 AI 和高性能计算 (HPC) 的人来说，这种光子处理在效率和性能方面都非常有趣。当然，这不全是关于我的（应该是，但事实并非如此）。那么，你对这一切有什么看法？

如有硅光流片需求，

欢迎扫码，将有专人对接。

https://www.eejournal.com/article/a-bold-new-twist-on-optical-computing/

半导体精品公众号推荐

专注半导体领域更多原创内容

关注全球半导体产业动向与趋势

*免责声明：本文由作者原创。文章内容系作者个人观点，半导体行业观察转载仅为了传达一种不同的观点，不代表半导体行业观察对该观点赞同或支持，如果有任何异议，欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第3976期内容，欢迎关注。

『半导体第一垂直媒体』