以深度学习为代表的人工智能技术已在包括自动驾驶、医疗诊断、语音翻译等众多领域带来巨大的变革。随着深度学习算法的迅猛发展,人工神经网络规模的不断增大,迫切需要不断提升计算处理器的运算速度和能效。采用传统电子计算方式已经越来越难以满足未来人工智能对处理器计算性能的需求。近年来,基于光计算高速、低功耗、高并行的颠覆性优势,通过光电融合的方式构建光学神经网络与智能光电计算处理器已经成为国际信息技术前沿的热点研究领域。
然而,现有的光电智能计算技术距离实际应用还面临着以下挑战:(1)模型构架简单,现有的光学神经网络模型复杂度较低,光学非线性实现较为困难,因此模型性能与电子的人工神经网络有较大的差距;(2)系统误差难校正,光计算系统误差大小和系统复杂度成正相关,因此误差校正算法对于构建大规模智能光计算系统至关重要,然而迄今为止尚缺普适性的误差校正方法;(3)系统重构困难,现有光学神经网络结构难以重构,因此计算功能单一,而网络参数编程则依赖较为复杂的光学效应,大规模参数的快速精准写入仍存在困难。
图一:光电智能衍射计算处理器的基本原理
针对上述挑战,来自清华大学信息学院的戴琼海教授研究团队提出并构建了光电智能衍射计算处理器(Diffractive Processing Unit, DPU),能够有效地重构实现包含百万神经元的多类新型光电神经网络,通过自适应的在线训练算法实现了高性能的视觉分类任务,并验证了光电智能计算的优越性。
DPU 的构架采用了光学衍射的物理现象,能够产生大规模的光学互联,从而助力构建高复杂度的光学神经网络(图一)。此外,该光学处理器原理充分利用了光的波粒二象性,神经网络权重的调整通过控制光波传播的波前分布来实现,采用光电效应能够实现人工神经元的功能。DPU 的运行过程光计算部分则几乎承担所有的计算操作,采用高通量可编程的光电器件并结合电子计算的灵活特性,能够实现高速数据调控以及大规模网络结构和参数的编程。“在这项工作中我们定义了光电的衍射人工神经元,能够实现对衍射光场的线性加权求和以及非线性激活响应,这是构建复杂光电深度学习系统的基础。” 林星特聘研究员说到。
图二:DPU实现手写数字识别(GIF图片)
通过软件编程重构 DPU 实现了包括前馈和循环的多种类型的深度神经网络架构,每个神经网络都包含数百万个神经元,具备较高的模型复杂度。这些神经网络通过所提出的自适应在线训练方法校正系统误差累积,从而优化实验计算性能。这种自适应的训练方法通过测量神经网络内部的状态实现对计算参数的实时调整,因此不依赖网络结构,能够普适于现有的光电智能计算系统。
图三:DPU实现人类动作识别(GIF图片)
将所构建的系统应用于分类和识别任务,并在深度学习的标准数据集上进行了性能验证,包括手写数字图像数据集(MNIST,图二)、时尚物品图像数据集(Fashion-MNIST),以及人类动作视频数据集(Wetzmann 和 KTH,图三)。光电智能计算模型性能首次超越了 LeNet-4 电子神经网络模型。系统还能实现高速、高精度的人类动作识别。运行同样的神经网络,光电计算系统与特斯拉 V100 图形处理器(GPU)相比,计算速度提高了 8 倍,系统能效提升超过一个数量级,核心模块计算能效则能够提升四个数量级。
(来源:戴琼海教授研究团队)
戴琼海教授指出,“当前光电智能计算技术的潜力还有待深入挖掘,未来使用超材料构建片上相控阵列,能够极大提升处理器的计算性能,而实现光电计算机的目标则需要多学科的交叉融合。” 未来已来,推动类脑光电子芯片的研发将极大促进人工智能的发展,将为大规模数据的实时智能处理,高速低功耗智能化无人系统,以及从十亿像素到百亿像素光场成像奠定基础,具备极为广阔的应用前景。
这项工作发表在 Nature Photonics 期刊上,周天贶博士研究生为该论文的第一作者,林星特聘研究员(清华脑与认知科学研究院、未来芯片技术高精尖创新中心)、方璐副教授(清华电子系)、戴琼海教授(北京信息科学与技术国家研究中心)为通讯作者。工作得到了国家科技部和国家自然科学基金委的支持。