Date: 2023-03-02
数据中心不仅是算力的载体,而且是数字经济的底座。当前,数据中心的能耗问题日益凸显。2021年,我国数据中心的总用电量为2166亿千瓦时,占全国总用电量的2.6%,大致相当于两个三峡电站的年发电量。那么,如此巨大的耗电量究竟用到了哪里呢?应当如何降低数据中心的耗电量呢?
我们通过数据中心的电能使用效率(Power Usage Effectiveness)这一指标来一探究竟。电能使用效率的定义是数据中心总能耗与IT设备能耗的比值。其中,数据中心总能耗包括IT设备以及制冷、配电等其他系统的能耗。可以看出,除去主设备的用电量,还有部分能耗被用于散热和照明。因此,为实现数据中心的节能减排,降低主设备的功耗便成为了一种关键思路。
数据中心的主设备包括服务器和网络设备,分别对应算力输出和网络流量。下面我们对网络设备的三座“能耗”大山,即交换芯片、光模块和串行/解串器来逐一作出分析。
我们首先将目光投向交换芯片。作为网络设备的核心,交换芯片的处理能力在过去12年得到了大幅提高。然而,交换芯片的总体能耗却也是水涨船高。当我们向着51.2太比特及以上的交换芯片代际迈进的时候,亟需克服带宽密度和散热的限制。
我们再来看一看光模块。15年前,单个10G光模块的功耗约为1瓦特。而随着40G、100G、200G乃至于400G光模块的不断涌现,目前单个光模块的功耗可达30瓦特。以具备48个光模块的交换机为例,其光模块功耗高达1440瓦特。
串行/解串器是负责连接光模块和交换芯片的重要器件,其功耗也不容小觑。随着交换芯片能力的不断提升,串行/解串器的速率也在提高,并带动了功耗的大幅增加。在未来102.4太比特每秒的时代,串行/解串器传输速率须达到224G,功耗将高达300瓦特。事实上,串行/解串器的传输速率受到PCB材料工艺的影响。在保证传输质量的前提下,串行/解串器的传输距离会大幅缩短。
综上所述,网络设备在数据中心内部的功耗占比快速攀升。过去12年,交换芯片的功耗提升约为8倍,光模块的功耗提升约为26倍,串行/解串器的功耗提升约为25倍。于是,旨在应对功耗挑战的近封装光学和共封装光学技术在近几年迅速成为研究热点。
简单地讲,近封装光学和共封装光学是将交换芯片和光模块进行“封装”的技术。
数据中心的传统连接方式采用了可插拔模块,光电转换功能在光模块中得以实现。信号通过插接在光模块上的光纤而送入串行/解串器,并最终到达交换芯片。共封装光学是将交换芯片和光引擎装配在同一个插槽上。而近封装光学是将光引擎和交换芯片分开,装配在同一个PCB基板上。可以看出,共封装光学是终极形态,近封装光学是过渡形态。我们追求实现这类“封装”集成,就是为了缩短交换芯片和光引擎之间的距离,使得高速电信号得以高质量地传输,满足系统的通信质量要求。实现光电“近封装”或“共封装”之后,我们可以实现更高密度的高速端口,有效提升交换机的带宽密度,从而达到改进数据中心能量效率的目的。
(解说词来源:沐曦光启智能研究院 韩佳巍)