IBM研发共封装光学技术,加速AI模型训练

2024-12-23

前言:

新的光电共封装技术或取代数据中心中的电互连装置,大幅提高AI和其他计算应用的速度与能效。

作者 | 方文三

图片来源 |  网 络

IBM研发共封装光学技术,加速AI模型训练  (https://www.qianyan.tech/) AI 第1张

IBM新型的共封装光学技术

近日,IBM宣布了一项重大的光学技术突破,该技术可以以光速训练AI模型,同时节省大量能源。

IBM发布的技术论文显示,这项技术是一种新型的共封装光学技术(co-packaged optics),可以利用光速实现数据中心内部的连接,从而替代目前使用的铜电缆。

尽管光纤技术已在全球商业和通信中广泛应用,但大多数数据中心内部仍依赖于铜电缆进行短距离通讯。这导致GPU加速器在训练过程中常常处于闲置状态,浪费大量的时间和能源。

因此IBM的研究团队展示了如何将光的速度和容量引入数据中心,显著提高数据中心的通信带宽,减少GPU的闲置时间,从而加速AI模型的处理速度。

IBM研发共封装光学技术,加速AI模型训练  (https://www.qianyan.tech/) AI 第2张

共封装光学技术的核心理念

共封装光学技术,是将激光器、调制器、光电探测器等光学元件与电子元件共同封装在一个芯片内。这种技术不仅提高了产品的集成度和可靠性,还显著降低了系统成本和复杂度。

通过光纤连接,CPO芯片能够实现高速、高效的光学传输和处理,从而大幅提升系统性能。

事实上,CPO并不是最近才有的新技术。早在一年前,台积电就携手博通、英伟达等大客户共同推进这项技术的研发进度,制程技术从45nm延伸到7nm,原计划2024年就开始迎来大单,并在2025年左右达到放量阶段。

IBM研发共封装光学技术,加速AI模型训练  (https://www.qianyan.tech/) AI 第3张

比现有芯片间通信带宽快80倍

得益于近年来芯片技术的飞速发展,芯片上能够容纳更多、更密集的晶体管。以IBM的2纳米芯片技术为例,其可在单一芯片上植入500多亿个晶体管。

在这样的技术基础上,光电共封装技术致力于扩大加速器之间的互连密度,帮助芯片制造商在电子模组上添加连接芯片的光通路,从而突破现有电子通路的带宽限制。

IBM所研发的新型高带宽密度光学结构以及相关创新成果,通过每个光通道传输多个波长,有望将芯片间的通信带宽提升至电线连接的80倍。

IBM研发共封装光学技术,加速AI模型训练  (https://www.qianyan.tech/) AI 第4张

增加光纤连接数量

与目前最先进的光电共封装技术相比,IBM的创新成果使芯片制造商能够在硅光子芯片边缘增加六倍数量的光纤,即所谓的“鬓发密度 (beachfront density)”。

每根光纤宽度约为头发丝的三倍,长度从几厘米到几百米不等,却可传输每秒万亿比特级别的数据。

这意味着数据中心内部的数据传输能力将得到极大提升,为大规模数据的快速处理提供了有力支持。

通过严格测试确保稳定性

IBM团队采用标准封装工艺,在50微米间距的光通道上封装高密度的聚合物光波导 (PWG),并与硅光子波导绝热耦合。

尤为值得一提的是,此次光电共封装模块采用50微米间距的聚合物光波导,首次成功通过了制造所需的所有压力测试。

这些测试涵盖高湿度环境、 -40°C至125°C的极端温度以及机械耐久性测试,确保了光互连装置即使在弯曲等复杂情况下,也不会出现断裂或数据丢失的问题,为该技术在实际数据中心环境中的可靠应用提供了坚实保障。

IBM研发共封装光学技术,加速AI模型训练  (https://www.qianyan.tech/) AI 第5张

原理简单实际推广上难度并不小

这种所谓的“硅光芯片”,是在硅的平台上,将传统芯片中的电晶体替换成光电元件,进行电与光讯号的传导。对比传统芯片会出现电讯号的丢失与耗损的情况,光讯号不仅损耗少,还实现更高频宽和更快速度的数据处理。

首先,硅光产品并没有到大规模需求阶段。虽说有自动驾驶和数据中心两大领域的需求,但目前还没有主流芯片厂商推出高性能芯片。

其次,硅光产品需要考虑相对高昂的成本问题。受限于大量光学器件,一个硅光器件需要采用各种材料,在缺乏大规模需求的情况下,硅光产品成为一种“高价、低性价比”的产品。同时,器件的性能与良品率难以得到保障。

最后,硅光芯片在打通各个环节还需要努力。例如设计环节,虽然已经有EDA工具支持,但算不上专用;而在制造与封装环节,类似台积电、三星等大型晶圆代工厂都没有提供硅光工艺晶圆代工服务。

即便是已经推出COUPE技术的台积电,短时间内会专注更加成熟的封装方案,很难匀出产能提供给硅光芯片。

结尾:

面对日益增长的 AI 性能需求,光电共封装技术开创了一条新的通信途径,并可能取代从电子到光学的模块外通信,这一技术突破延续了IBM 在半导体创新方面的领导地位。

内容来源于::IBM 发布光学技术关键突破,生成式AI迎来"光速时代";镁客网:IBM官宣全新光学技术,用光也能训练AI?


原文标题 : AI芯天下丨趋势丨IBM研发共封装光学技术,加速AI模型训练

相关推荐