新浪新闻客户端

国内光子计算新突破!全球首度支持商用AI算法,能跑大模型,灵活可编

国内光子计算新突破!全球首度支持商用AI算法,能跑大模型,灵活可编
2025年03月25日 21:35 新浪网 作者 芯东西

  

  全球首个支持商用AI算法的光电混合计算产品,下一代光子矩阵规模提升4倍。作者 |ZeR0编辑 |漠影飙涨的算力需求,正拉开数据中心基础设施升级的大幕。硅光技术的优越性日益凸显,从远距离的光通讯到芯片里的光计算掀起技术革新。芯东西3月25日报道,今日,全球光子计算赛道融资规模最高的公司曦智科技,发布全新可编程光电混合计算卡——天枢。这是全球首个支持商用AI算法的光电混合计算产品,在支持科学计算(如伊辛算法)的基础上,加强了对ResNet-50等算法应用的支持,并可支持运行Llama算法,DeepSeek最近也正在调试。天枢采用3D先进封装技术,其核心由光学处理单元(OPU)专用集成电路(ASIC)组成,单芯片面积、器件集成数均大幅提升。

  

  相比日渐逼近物理极限的传统电子芯片,光电混合计算芯片具备高通量、高能效比、超低延迟等优势。上一代光子计算处理器PACE包含64x64光学矩阵,而天枢将矩阵规模扩大4倍128x128,单芯片面积扩大到600mm²,主频1GHz,可应用于深度学习、图像处理、科学计算等场景。

  

  其一大亮点在于可编程性。用户可通过API灵活配置光子计算矩阵的系数,从而运行更多定制化算法,满足多样化的计算需求。天枢还凭借PCIe Gen4 x 16高速接口,实现了与现有计算机系统的无缝集成和高效扩展,以便光子计算技术能够更加便捷地融入各类高性能计算环境。这些特性使得天枢成为光子计算在复杂多变场景下新应用探索的可靠平台。在曦智科技上海办公室,芯东西与曦智科技创始人兼CEO沈亦晨博士、曦智科技联合创始人兼CTO孟怀宇博士、曦智科技COO王泷进行深入交流。此前光计算常被描述为比电计算快10000倍,但在落地中要实现精度与速度的平衡,真实数据远达不到这么夸张。据沈亦晨透露,曦智科技的目标是让光计算尽快在商业场景中可用,实现比电计算3-5倍性价比提升,其光电混合计算芯片已处于可量产状态,接近直接可插拔到现有服务器中。目前,曦智科技产品在供应链上已实现国产自主可控。曦智科技计划到2027年,将下一代超大规模高频光电混合芯片升级到256x256光学矩阵,预计2026年年底出样片、2027年发布。

  

  沈亦晨坦言现有光电混合计算卡运行大模型的速度还不是很快,下一代将提供更大的存储带宽和容量。曦智科技另一条光子网络产品线的最大优势便是提升带宽,计划将片上互连和片间互连技术应用到下一代产品中。下一代预计很多颗光计算芯片和存储芯片将通过光互连方式连接,在大模型推理上发挥优势。01.瞄准低延迟场景,发挥光计算优势,往后发展大模型推理

  2017年6月,沈亦晨博士作为第一作者和通讯作者的论文发表于国际学术顶级期刊《自然·光子》封面。这一研究开创性地提出了光子AI计算新路径,吸引了十几家初创公司相继成立。曦智科技是沈亦晨在2017年博士毕业后成立的第一家公司,核心成员由来自麻省理工学院的顶尖科学家和拥有丰富半导体行业经验的业界知名人士组成,如今已发展成全球光电混合赛道的产品进展、技术研发领跑者,在上海、杭州、南京、北京、新加坡等地均设有办公室及实验室。当前曦智科技拥有近250人的团队,估值约70亿人民币。孟怀宇告诉芯东西,光电混合计算的技术原理决定它在通用性上与CPU、GPU等传统通用芯片存在差距,光器件不能做得比波长小太多。沈亦晨补充说,考虑到能继续缩减的空间有限,提升器件密度,可能更多利用主频和光分复用的方法去优化的空间更大。沈亦晨解释说,光电混合芯片的市场定位与GPU不同,瞄准的是对低延迟有高需求的应用场景,可以跑出电芯片跑不出的效果,还有一些早期客户偏向产教研实验研究,往后发展可能会更聚焦大模型推理方向。在大模型适配方面,曦智科技将在体现光计算优势的情况下,尽可能扩大通用性,押注于以矩阵乘法为核心的主流Transformer架构,继续沿用高带宽,用光做矩阵乘法,电芯片通过引入RISC-V等方式,引入更通用的算子。目前其行业应用案例包括EDA、量化交易、银行安全等,比如用于优化光电混合芯片EDA流程中的应用、在风险价值计量中的应用、在银行账户欺诈识别中的应用。未来曦智科技光计算产品将落地于药物发现、基因工程、金融工程、图像识别、医疗影像分析、工业设计等应用场景。02.光电混合计算通用性令人惊喜,优化重点是提升精度

  大数据越来越大的比例是在做线性运算,曦智科技则发明了一种用光高效做线性计算的方式。光在非均匀介质中传播和散射时,其形态类似于某种形式的数学线性运算。曦智科技利用光执行向量矩阵算法,当光进入系统时,它会被一组光学调制器编码以形成输入光向量,然后进入可编程光学散射介质的区域,输入光向量经过矩阵后,输出光向量自然就代表了矩阵乘法的结果。由于矩阵乘法本身是被动的,这个过程中不会消耗能量,且延迟很低,最后高能效和低时延性能与输入光信号的频率无关,这就意味着光矩阵可以支持高通量。

  

  2019年4月,曦智科技推出全球首款光子芯片原型板卡,运行神经网络模型来识别手写数字图像,用时只有当时最先进电子芯片的不到1%。但这远未发挥出硅光技术的潜力,要将其理论优势变为现实,一个关键的步骤是将大量的光子和电子器件集成在一起。2021年12月,曦智科技推出光子计算处理器PACE,将单芯片集成的光子器件数量提高到超过10000个,运行1GHz系统时钟,在解决伊辛问题(Ising)和最大割/最小割问题(Max-cut/Min-cut)时,PACE的运算速度可达当时高端GPU的数百倍。北京大学研究员常林分享了对曦智科技第一代产品的感受,觉得对其能处理问题的通用性感到惊喜,远超他们的预期。自动驾驶需要借助光技术来实现精密探测,其团队将曦智光电加速卡应用于雷达成像,能够处理规模为5000 x 5000左右的复数矩阵,精度达到8bit70%以上的运算在曦智科技光子计算评估板Gazelle上实现。他期待更大规模的光学计算硬件,进一步提升精度和纠错软硬优化算法,并提供更好的软件支持,包括封装好的conv、linear等常见API接口。03.天枢三大关键技术提升:引入3D先进封装工艺,提升光电集成度和可编程性

  今天,天枢在处理器上进一步升级,采用了将OPU与ASIC优势组合的光电混合处理器,引入Flip-chip + TSV先进封装工艺,将矩阵规模增至128x128,深度融合光与电、硬件与软件优势,实现了光电集成度、光学矩阵规模、精度、可编程性等方面的提升。天枢的关键技术提升总体分三个方面:光计算精度、硬件、软件1、光计算精度提升相比上一代光子计算处理器PACE,天枢采用的光电混合处理器优化了向量调制解调器的设计,主频为1GHz,向量提升到uint4,权重精度支持int4,输出精度提升到8bit。这带来的好处是,增强了天枢处理复杂数据和大规模运算的能力,并显著提高了计算结果的准确性和可靠性,减少了量化误差,能够满足当前主流AI模型的推理需求2、光电混合芯片+3D先进封装天枢采用的OPU+ASIC光电混合处理器,由光芯片核心(PIC)和电芯片核心(EIC)组成,采用被动散热方式,热设计功耗为50W(包含内置激光器)。

  光芯片更多承接线性计算和数据网络等主要任务,由电芯片发出指令以及与客户交互,使处理器能与现有市场软件环境兼容。

  光芯片核心包含光学张量处理单元,支持INT4/UINT4输入精度、时延为200ps,峰值算力达到32TOPS。电芯片核心包含电张量加速计算单元和光计算控制单元,峰值算力同样达到32TOPS

  

  通过将ASIC的并行计算能力与OPU的光处理特性相结合,这种设计极大提高了处理效率,不仅突破了传统电子处理器在速度和能耗方面的局限,还显著提升了光计算的精度。同时,天枢开创性地实现了TSV(硅通孔)+FlipChip(倒装芯片)的光电混合3D先进封装,是曦智科技在光电混合计算技术应用的又一重大突破。据孟怀宇博士分享,曦智科技将光芯片打薄到100μm以下,通过将电芯片与光芯片3D堆叠,如图将光芯片打孔,就可以从基板垂直的有电信号去供电。

  

  Flip-chip通过直接将芯片的有源面朝下安装在基板或另一芯片上,极大提高了光电芯片间的互连密度,减少了互连线长度,从而降低信号延迟并增强数据传输速度。TSV技术作为3D集成和系统级封装的关键组成部分,主要解决了传统封装中常见的IR drop(电压降)问题。该技术可显著缩短电流路径,降低传输延时;减少电阻和电感,进而降低电压,提升散热能力,确保电源更稳定、更有效地供应到芯片的各个部分,提高光电芯片的互连密度,节省芯片面积。此外,TSV还大幅提高了PCIe等高速信号接口的信号完整性(SI)性能,减少了信号衰减和串扰,使得数据传输更加准确可靠。3、软件:提供丰富算子,加速便捷部署曦智光电混合计算算子库包含RVV(RISC-V Vector)算子、电矩阵(dMAC)加速算子、光矩阵(oMAC)加速算子,支持计算机视觉类、大语言模型类模型。用户借助曦智编译器,可以灵活地运用这些算子来构建高效的应用模型。

  

  其平台还支持用户自定义算子,通过OpenCL C/C++语言进行编译和优化,进一步扩展了算法开发的灵活性。曦智科技的软件栈与PyTorch、ONNX等主流框架深度集成。客户以通过软件栈直接使用天枢的光矩阵和电矩阵加速单元,对模型和算法进行加速和验证,也可以将模型通过曦智编译框架编译部署在端侧进行推理。曦智光子计算模拟器是软件栈中的一大亮点,为用户提供了便捷的光计算单元构建与仿真模拟功能,能够显著加速用户在光计算平台上的算法探索与验证过程,助力科研与应用的快速推进。

  

  曦智科技还将积极推进光计算开发者生态建设,通过专项基金培育未来行业人才,与高校及研究机构建立合作伙伴关系,以及推进数百万级别的合作项目。04.两大产品线,三大核心技术

  针对未来计算范式的大趋势,曦智科技以光子矩阵计算(oMAC)、片上光网络(oNOC)、片间光网络(oNET三大核心技术出发,打造光子计算光子网络两大产品线,建立围绕软硬件、开发者、产业三大生态的完整光电混合算力新生态。光子计算产品线利用光子矩阵计算及光子网络的技术优势,为客户在特定使用场景下,提供定制化的解决方案,实现高算力、低延时的优越性能。主要产品有:可编程光电混合计算卡天枢、光子计算处理器PACE、AI推理卡OptiHummingbird、光子计算评估板Gazelle光子网络产品线利用曦智自研集成光子技术,为客户提供卡间(B2B)、服务期间(S2S)、机架间(R2R)等多层级的互连解决方案模块,实现大规模数据中心的性能扩展,主要产品包括其首款适用PCIe和CXL协议的数据中心计算光互连硬件产品Photowave系列还有集成激光光源产品Moonstone,具有小型化、高功率、低功耗、单/多波长等特点,可实现多至8个通道波长的光输出,支持曦智科技所有产品系列,也可以为第三方应用提供激光光源解决方案。曦智科技的三大核心技术如下:oMAC(Optical Multiply Accumulate)光子矩阵计算是一种用光子替代传统电子进行数据处理的模拟计算,可显著提升单节点内算力。它通过光的强度或相位模拟数字信号,在光信号通过光学矩阵的同时完成计算,不消耗额外的能量。oMAC执行的线性运算亦可理解为矩阵-矩阵或矩阵-向量之间的乘法,技术优势有:1)光计算并行能力更强;2)能效媲美甚至更优于电计算;3)光子计算延迟超低;4)硅光对工艺制程和成本要求较低。oNOC(Optical Network on Chip)片上光网络是一种单节点内的互连技术,通过用光波导代替铜导线的方式,让数据在光芯片网络中传递,可实现单个电芯片(EIC)内不同单元间的高速数据传输,及同一封装内部多个电芯片之间的高速数据通信。其技术优势包括:1)高带宽、低能耗、低延迟、距离不敏感;2)通用性强,可实现不同类型电子芯片间高速、低能耗的互连,有效扩大芯片面积,提升单节点性能;3)适用于任何有高带宽需求的应用场景,使计算架构设计更灵活,实现更复杂的拓扑结构,优化提升系统利用率。oNET(Optical inter-chip Networking)片间光网络是一种多节点间的光互连技术,使光芯片起到类似optical BUS的作用,将同一单元内部需要传输的数据集中起来,通过光传播介质(如光纤)与其他单元进行数据交互。该技术的优势有:1)高带宽,低延迟,高能效比,有效提升数据中心内不同计算硬件的工作负载效率;2)对传输距离不敏感,赋能可重构解耦架构数据中心的资源池化和横向扩展。曦智科技开创性的光电混合算力范式将推动电子芯片设计、软件开发、封装等各环节走向新的技术前沿。在电子设计领域,提供领先的模拟设计、数字设计技术,超高速的互连技术,高速高精度的数模转换技术,以及与硅光的超高密度的共封集成技术。在3D封装技术方向,集成硅光芯片与电子芯片需以3D封装形式堆叠而成,从而保证两者无缝协同运作。在激光器小型化技术方向,通过自研技术,将外置激光器小型化,最终实现激光器在板卡上的集成封装,有效降低成本和稳定性。05.结语:突破晶体管限制,光+电是未来的答案

  进入算力需求爆发的时代,传统电子芯片晶体管微缩接近物理极限,算力供应日渐捉襟见肘,功率、通信、内存访问等方面都成为限制算力扩展的瓶颈。有效的技术解决方案包括通过存算一体减少存储和计算之间的数据搬运、打破“内存墙”,或是通过专用架构、把芯片晶体管进行重新排列、针对场景深度优化,以提高计算利用率,这两种方式解决的是存储带宽和晶体管使用效率问题,但并不能从根本上解决晶体管数量限制或绝对算力的问题。囿于铜导线有电阻,在铜导线上的数据搬运会产生热量。随着摩尔定律放缓、登纳德缩放比例失效(集成度提升遇到功耗和散热瓶颈,“功耗墙”问题阻碍晶体管密度持续提升),曦智科技团队认为,光+电会是未来的答案。光电混合计算是一种更偏底层技术的创新,和电芯片一样可以做近存计算或流式计算。光计算可通过提高主频,或者波分复用的波长数量,来进一步增加单位面积的绝对算力提升。光电混合计算有望突破晶体管限制,解决单位面积的绝对算力,无论多大主频,都不会产生热量。当前光子技术无法完全取代电子技术,电芯片提供存储单元,更擅长高精度和非线性运算。沈亦晨博士强调说,光子计算技术当前可以解决部分矩阵计算,暂时还没有解决用光来做高速读取存储功能或一些高精度逻辑算法,这些部分仍需用电子芯片来实现。

特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。

来自于:北京
权利保护声明页/Notice to Right Holders
0条评论|0人参与网友评论
最热评论

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2025 SINA Corporation

All Rights Reserved 新浪公司 版权所有

广告

广告