科学研究

基于锗硅混合非对称耦合器的全光非线性激活函数

来源:   作者:  发布时间:2022年05月03日  点击量:

由于摩尔定律的放缓甚至失效以及电响应速率的限制,基于传统冯·诺伊曼架构的人工神经网络已无法满足大容量、低延时的数据处理要求。光学神经网络是在光学硬件平台上实现神经形态计算,以低功耗、可并行操作等优势,可以大大提升人工神经网络的数据处理效率。然而,目前非线性激活函数的光学实现是一个巨大的挑战。

已提出的光学非线性激活函数(OAF)分为电光方案和全光方案。而电光方案的响应速率不可避免地受到光电转换设备的响应的限制。同时,由于需要额外的电力,电光方案会引入多余的能源消耗。因为硅材料的非线性较弱,片上实现非线性往往需要大功率和长相互作用长度。目前硅基片上的全光方案都是以微环谐振器为基础,这导致器件工作带宽较小,这限制了光学神经网络的信息处理容量。因此,实现一种大带宽、低功耗、高速率的硅基全光OAF是非常有必要的。

近日,华中科技大学武汉光电国家研究中心的董建绩教授提出并实验证明了基于锗硅混合非对称耦合器的硅基全光非线性激活函数(如图1所示)。

在通信波段,锗通常用做硅平台上的光电探测器的吸收材料。但同样有报道指出,由于锗硅晶格失配引起的双轴压缩应变,锗薄膜在1550 nm处的等离子色散效应比硅更强。利用锗在1550 nm的本征吸收效应和等离子色散效应,使锗的折射率随输入功率升高而发生改变,同时改变耦合器波导间的耦合系数,最终改变器件透射率,从而实现非线性激活。借助锗的等离子色散效应,耦合器的透射光谱发生了显著变化,实验测得1550 nm处的激活函数表现出一种饱和效应,其损耗为4.28 dB,阈值功率为5.1 mW,响应速率在70 MHz左右,并且其以定向耦合器为基础结构,具备较大的工作带宽(如图2、3所示)。同时,将其应用于MNIST手写数字集分类测试任务,该OAF表现出与传统tanh函数类似的性能,最高分类精度可达99.3%,如图4所示,证明其可以达到与传统tanh或ReLU函数相似的精度。该器件结构简单,易于制造,方便集成,有望应用于未来的光学神经网络中。

图1.(a)锗硅混合非对称定向耦合器的三维示意图。(b)器件SEM图

图2.(a)不同输入功率下的透射光谱。(b)净损耗。(c)最终实现的OAF

图3.器件响应速率测试结果

4. MNIST手写数字集分类任务测试结果

相关研究成果近期发表在《IEEE Journal of Selected Topics in Quantum Electronics》期刊上,该工作得到了国家重点研发项目(2018YFB2201901)和湖北光谷实验室创新科研项目No.OVL2021BG001的支持。

文献链接:https://ieeexplore.ieee.org/document/9756290

[1] H. Li, B. Wu, W. Tong, J. Dong and X. Zhang, "All-Optical Nonlinear Activation Function Based on Germanium Silicon Hybrid Asymmetric Coupler," inIEEE Journal of Selected Topics in Quantum Electronics, doi: 10.1109/JSTQE.2022.3166510.