随着人工智能和下一代通信技术的发展,对高性能计算不断增长的需求推动了定制硬件的发展,以加速这一特定类别的计算。然而,随着电子晶体管的特征尺寸和集成度逼近摩尔定律所揭示的物理极限,基于电子硬件的处理器已经遇到了不可持续的性能增长瓶颈。在新兴的人工智能应用中,海量矩阵运算需要高计算速度和高能效。光计算可以在集成光子平台或自由空间实现超低能耗的高速并行信息处理,很好地满足了这些特定领域的需求。光计算使用光子而非电子进行计算,因此光计算可以通过克服电子瓶颈来显着加快计算速度。
在某种程度上,神经形态工程的思想,是将算法的计算过程转移到与其数学本质相似的特定硬件上,实现传统计算硬件难以实现的功能。在基于互补金属氧化物半导体(Complementary metal oxide semiconductor,CMOS)的电子计算中,矩阵计算通常由脉动阵列或单指令多数据单元实现。由于电子元件的特性,执行简单的矩阵操作需要大量的晶体管一起工作,并需要额外的调度程序来协调涉及权重的数据移动。而在光计算中,矩阵计算可以很容易地通过基本光子器件,如微环谐振器(Microring resonator,MRR)、马赫-曾德尔干涉仪(Mach-Zehnder interferometer, MZI)和衍射平面,以及其构成的阵列或系统来实现。因此,从神经形态工程的角度看,与电子计算相比,光计算更符合矩阵计算的数学本质。与集成电路不同,集成光子回路具有超宽带宽、低延迟和低损耗等优异特性。此外,光具有波长、偏振和空间模式等多个物理维度,可实现并行数据处理,与传统的冯诺依曼计算机相比具有显着的加速,这使得光计算成为人工智能加速器的可行且具有竞争力的候选者。
图1光子矩阵计算主流架构的原理与应用
本论文对基于多平面光转换(multiple plane light conversion,MPLC)、片上MRR阵列和片上MZI网络的三种不同的光计算架构的基本原理进行了介绍,阐述了基于不同光计算架构在光子矩阵计算以及光子人工智能硬件方面的最新研究进展。论文归纳总结了近年来具有代表性的光计算架构的性能参数,分析了当前光计算面临的挑战和发展趋势,并对进一步改进光计算架构提出了展望。
与片上MRR阵列和MZI网络等集成方案不同,MPLC方案可以直接在自由空间中传播的光场上构建矩阵计算。在这三种方法中,MPLC是最先在光计算中实现的,最初的可编程矩阵矢量乘积就是用空间光学元件完成的。MPLC方案是目前唯一可以支持超大规模矩阵运算的光计算架构,这使其在脉冲整形、模式处理和机器学习中具有重要价值。
图2基于MPLC的光计算架构。(a)单个衍射平面的波前匹配原理;(b)MPLC架构由一系列用振幅和相位信息编码的衍射平面组成。
微环结构非常紧凑,半径可以小到几微米,这意味着可以大大减少光子器件的占用空间,从而使集成密度更具有竞争力。微环已广泛应用于片上波分复用系统、滤波系统等。此外,微环阵列还可用于非相干矩阵计算的操作,因为每个微环可以独立配置波长通道的传输系数。因此,片上MRR阵列与波分复用结合,非常适用于光子矩阵计算操作。
图3基于片上MRR阵列的光计算架构。微环前端模块可置于片外或片上,其设计用作波分复用器(片外)或将输入向量调制到不同波长(片上)。MRR阵列用于配置N×N矩阵。
作为基本的光子器件之一,MZI已广泛应用于光调制器、光通信和光计算。MZI是一个自然的最小矩阵运算单元,可以在SOI平台上制造以实现最小矩阵乘法。我们可以配置MZI网格来模拟相应的酉矩阵,从而实现光学矩阵运算。一个标准的酉矩阵中的所有行向量或者所有列向量都可以构成内积空间中的一组标准正交基。三角形或矩形MZI网络可以构建酉变换,进而通过奇异值分解可以构建一个任意的传输矩阵。
图4基于片上MZI网络的光计算架构。(a)基于三角形分解的MZI网络;(b)基于矩形分解的MZI网络;(c)一个典型的基于三角形分解的MZI矩阵核。
基于集成光子回路和空间光学元件的光学计算架构在高速矩阵计算和新兴人工智能应用方面展现出巨大的潜力。然而,在可预见的未来,开发通用光学计算系统仍然具有挑战性,其高性能只能通过软硬件结合的灵活设计来实现。一方面,可以应用光学频率梳、高速调制器和新型光学材料,进一步提升硬件性能,主要包括计算密度、速度和延迟。另一方面,智能控制算法可以用于解决可调性和实用性的挑战。目前,光计算系统已经应用于计算机视觉、语音识别、信号处理等领域,未来有望拓展机器学习和信息处理领域的前沿。
《Nanomaterials》期刊近日发表了华中科技大学张新亮教授团队的有关光子矩阵计算的综述论文(Vol. 11, Iss. 7, July 2021),该论文作为封面文章发表。该工作得到了国家自然科学基金项目(62075075)的支持。
文献链接:https://doi.org/10.3390/nano11071683