科学研究
科研成果
胡小永、杨起帆、龚旗煌课题组与合作者在可重构多功能集成光子芯片研究中取得重要进展
发布日期:2025-08-22 浏览次数:
  供稿:现代光学研究所  |   编校:时畅   |   编辑:李洪云   |   审核:吕国伟

北京大学物理学院、纳光电子前沿科学中心、人工微结构和介观物理全国重点实验室“极端光学团队”胡小永教授、杨起帆研究员和龚旗煌院士与合作者在可重构多功能集成光子芯片研究中取得重要进展:提出一种创新的算法-硬件协同设计架构,该架构融合了交叉波导耦合的微环谐振器核心计算单元与光频梳光源,支持全连接神经网络、卷积神经网络和门控循环神经网络的原位切换,实验演示了图像识别、情感分析与语音识别等多模态信息处理任务,展示出强大的计算灵活性与任务适应性。该方案为实现多模型原位切换、兼顾处理静态与动态任务的集成光子芯片提供了新范式,为芯片级光子信息的高效多任务处理提供了新方案。2025年8月18日,相关研究成果以“可重构多功能集成光子芯片”(Reconfigurable Versatile Integrated Photonic Computing Chip)为题,在线发表于《光:快讯》(eLight)。

光子芯片凭借低功耗、高速率和大带宽的优势,为人工智能复杂计算任务开辟了新的路径。已有研究的架构普遍采用单一模块对应单一模型设计方案,且主要适用于基于前馈神经网络的静态任务,难以满足复杂任务对动态信息处理和多模型部署的需求。近年来,混合光子架构尝试通过多模块组合提升系统功能,但是对微纳制造工艺的要求很苛刻,制约了其实用化进程。因此,发展一种基于统一架构的多模型原位切换、同时支持静态与动态任务的多功能光子计算芯片,仍然是当前智能光子计算领域亟待突破的核心难题之一。

研究团队提出了一种全新的可重构多功能集成光子计算架构(图1):以可重构的微环谐振器(MRR)阵列与马赫-曾德尔干涉仪(MZI)阵列作为计算模块,引入光学频率梳作为多波长光源,实现对大规模任务全流程的光学加速支持,包括特征提取、时序推理与输出决策等关键计算流程。核心计算单元为基于十字交叉波导耦合的微环谐振腔,通过调控交叉波导两个输入端口的信息编码方式、并结合光学频率梳的波长复用机制与微环不同自由光谱程(FSR)之间的谐振对应关系,在单一结构内实现了高效的并行光计算。该方案支持在全连接神经网络、卷积神经网络和门控循环神经网络之间原位切换,兼顾包含静态和动态的图像、文本、语音等多模态信息处理,该芯片展示出强大的计算灵活性与任务适应性。

图1. 可重构多功能集成光子芯片。(a) 光子计算芯片构型及部署的三种神经网络模型;(b) 光子芯片配置不同网络模型实现图像分类、情感分析和语音识别任务。

研究团队系统探究了光频梳光源芯片与光计算芯片在器件结构与性能方面的关键特性与实验表现(图2)。光源部分采用基于DFB激光器集成的氮化硅微腔,生成自由光谱范围FSR为 100 GHz 的单孤子光频梳。计算芯片基于SOI平台制备并完成封装,在 3 mm × 8 mm 的芯片面积内集成了208个可重构光子器件。实验结果表明,芯片内的MZI与MRR计算单元均具备高精度的权重调控能力,并且MRR器件的电调谐带宽覆盖超过5个FSRmrr,确保了跨多个通道的高并行计算能力。在典型调制速率为10 GHz的条件下,芯片的算力密度达到2.45 TOPS/mm²。

图2:(a) DFB激光器集成的氮化硅平台微腔;(b) 单孤子光频梳光谱;(c) 基于SOI平台制备并封装的计算芯片;(d) MZI单元器件的电调性能表征;(e) MRR单元器件调控权重精度;(f) MRR 单元器件的超宽带电调性能表征

研究团队利用该芯片演示了图像识别、情感分析与语音识别这三类代表性多模态信息处理任务(图3)。图像识别任务旨在评估所设计光子神经网络在典型计算机视觉场景下的训练效率与学习能力,研究团队在 MNIST 和 CIFAR-10 两个数据集上进行了实验,分别实现了 92.9% 和 56.6% 的测试准确率,即便在仅包含 81,920 个可训练参数的条件下,仍展现出优越的泛化性能与训练效率,充分体现了模型架构的先进性以及所设计芯片在光学计算中的潜力。在情感分析任务中,团队聚焦于网络对时序信息的处理能力。基于 IMDB 数据集构建的情感分类模型实现了 99.2% 的训练准确率与 80.8% 的测试准确率,进一步验证了该可重构光子芯片在处理动态文本数据的鲁棒性与适应性。在语音识别任务中,研究团队构建了集成全连接神经网络、卷积神经网络与门控循环神经网络的混合神经网络结构,演示了从语音波形到文本的完整端到端推理流程,验证了该光子神经网络芯片在高度复杂计算任务中的广阔应用前景。三类任务的系统性实验不仅从静态图像到动态语言、再到语音大模型推理,全面覆盖了主流人工智能应用的核心计算路径,更实质性展现出所提出光子计算芯片在多模型原位切换方面的整体优势,为推动集成光子技术在新一代人工智能系统中的应用提供了新范式。

图3:(a) 图像识别任务示意图;(b) 卷积操作的理论和实验数据对比;(c) 情感分析任务示意图;(d) IMDB数据集训练损失和准确率曲线图;(e) IMDB数据集理论和实验混淆矩阵;(f) LJ-speech数据集样本待推测音频;(g) LJ-speech数据集样本推测文本;(h) LJ-speech数据集样本前30个时间步推理效果

北京大学物理学院2023级硕士研究生王芋霏、博新博士后廖琨(北京大学物理学院2024届博士毕业生)、中央民族大学2021级硕士生张括、北京大学物理学院2022级博士研究生杜卓晨、博士后王泽(北京大学物理学院2025届博士毕业生)为共同第一作者;北京大学物理学院胡小永教授、杨起帆研究员、廖琨博士、北京大学长三角光电科学研究院孙泉研究员、中国科学院微电子研究所杨妍研究员为共同通讯作者;上述研究成果得到国家重点研发计划、国家自然科学基金,以及量子物质科学协同创新中心、极端光学协同创新中心等支持。

论文原文链接:https://doi.org/10.1186/s43593-025-00098-6