Astera Labs IPO:AI 基础设施连接市场的王者

随着 AI 基础设施的不断蓬勃发展,提供相关技术的公司迎来了巨大的机会。在这次基础设施建设的浪潮中,并非只有英伟达成为行业的领军者,同时还存在着许多小型企业作为关键的参与者。本次我们将深入探讨 Aster Labs 这家公司,该公司的芯片已悄然应用于 80% 以上的 AI 服务器中。

Astera Labs 是一家专注于数据中心连接的公司,主要服务 3 类客户:超大规模云服务商、AI 加速器厂商和系统 OEM 厂商。目前,Astera Labs 的产品组合包括三个系列:Aries 重定时器、Taurus 有源电缆 (AEC) 和 Leo CXL 内存控制器。

从历史上看,连接是数据中心市场中竞争异常激烈但利润率又极高的领域。就像在交换和数字信号处理器领域尽管存在许多竞争对手,但 Broadcom 和 Marvell 仍然能够以超过 65% 的毛利率占据 80% 以上的市场份额。

大家最关心的问题是,Astera Labs 是否抓住了先机?亦或是先发优势并不重要,竞争对手会乘虚而入,并将其一举击溃。我们将会探讨他们在所有主要市场中的主要竞争对手,包括 Marvell Technologies、Broadcom、Montage Technology、Parade Technologies、Rambus、Microchip、XConn 和 Credo。Astera Labs 可能会逐渐式微,但如果它能够保持较高的重定时器市场份额并向 AEC 和各种 CXL 产品进行扩张,他们有可能成为下一个连接领域的佼佼者。

让我们首先回顾一下 Astera Labs 的发展史。

01

Astera Labs 如何解决连接瓶颈问题

Astera Labs 成立于 2017 年的一个车库里,具有典型的硅谷创业风格。联合创始人 Jitendra Mohan、Sanjay Gajendra 和 Casey Morrison 当时就职于德州仪器的高速接口业务部门。他们看到,随着计算能力呈指数级增长以及 AI 工作负载和超大规模云计算的需求推动,连接的瓶颈问题日益严重。

Astera Labs 致力于消除系统中出现的各种瓶颈 — Jitendra Mohan。

下图展示了 Astera Labs 旨在解决的 3 大瓶颈问题。

公司最初主要关注 PCIe 及其相关协议,如 CXL。2017 年发布的 PCIe 4.0 规范首次正式定义了 “转接驱动器(redriver)”和 “重定时器(retimer)”这两个术语。转接驱动器本质上是一种模拟信号的放大装置,用于抵消 PCB 造成的频率衰减。

简单来说,它就像一个“扩音器”,可以让信号变得更强,但是它的主要缺点是会放大信号路径中的噪音。在 PCIe 第 1 至第 3 代时,转接驱动器运行得十分顺利,但在第 4 代时便开始出现问题,而更快数据传输速率的第 5 代进一步加剧了这一问题。下图显示了各代 PCIe 和 PCB 材料的每英寸损耗情况。

为了弥补信号损耗,首选方案是选用更高质量的 PCB 材料,但这会带来高昂的成本。例如,PCB 材料“Megtron 6”的成本大约是最常用、最具成本效益的材料“FR4”的七倍。

请注意,PCIe 规范对插入损耗有着精确的预算限制;以 PCIe 5.0 为例,其在 32 GT/s 时的插入损耗预算为 36 dB,同时要求误码率低于 10^-12。

Astera Labs 致力于解决 PCIe 4 和 5(规格于 2019 年发布)的连接难题。他们为了解决这些信号的完整性问题,设计了基于重定时器的解决方案。重定时器是一种混合信号数字 / 模拟设备,具备协议感知能力,能够完全恢复数据,提取嵌入的时钟信号,并利用干净的时钟信号重新传输数据的新副本。

简单来说,与转接驱动器不同,重定时器就像是一台高品质的麦克风加上专业的音频设备,将校正后的信号输入到扬声器中。重定时器是一块小芯片,除了执行 PCIe SerDes 功能外,还负责监控和收集关于信号完整性的数据。下图是一个典型的架构示意图。

重定时器可将信号分成两个通道,从而大大减少通道损耗。下图显示了这些芯片是如何集成到 PCB 上的。这也说明了即使采用的是低损耗 PCB(甚至超低损耗 PCB),仍然可能无法达到所需的通道损耗。

Astera Labs 率先将其用于 PCIe 4.0 和 PCIe 5.0 的 Aries Smart Retimer 推向市场,2019 年赢得了首批设计订单。公司于 2020 年开始量产,采用了台积电的工艺,2021 年的收入达 3,480 万美元。该公司的投资者包括富达、Atreides Management、英特尔资本和 Sutter Hill Ventures 等知名机构。他们在 IPO 前的最后一轮融资是在拒绝了 Marvell 收购要约之后进行的。

Astera 的愿景是打造全球连接平台,并推出了两款新的产品系列:CXL 内存控制器和 Smart Cable Module。下图是 Astera Labs 的愿景图。

2023 年伊始,Astera Labs 犯了一些错,Q1 和 Q2 的业绩表现疲软并且下滑,这主要是因为库存调整影响了通用数据中心和网络市场,而这又是由于最大的超级规模云客户的云危机所驱动。但随着 Q3 和 Q4 的到来,业绩出现了爆炸性增长。因此,人们不禁要问,这是如何发生的?这种增长能否持续下去?

要回答这个问题,让我们深入了解一下 Aries 产品系列及其主要应用。

02

Aries Retimers 在 AI 和云应用领域的应用情况

简而言之:随着 AI 加速器需求的持续增长,PCIe 重定时器市场也将迎来增长。事实上,每个加速器卡内都包含了一个重定时器。如下图所示,在服务器头部节点还可以找到其他的重定时器,该市场的主要客户包括 AI 加速器供应商和服务器 ODM 厂商。

在加速计算系统中,重定时器之所以如此受欢迎,是因为信号反射问题。除了距离之外,这是造成 PCB 线路或电缆信号损失的第二个主要原因。简单来说,GPU 系统的密度非常高:上图显示了一块底板(例如 Nvidia HGX)可以包含 8 个 GPU。这种密度带来了信号挑战,需要 PCIe 时序器进行处理。AI 服务器可以在加速器底板和连接的服务器头节点上安装重定时器。每个 GPU 上的重定时器数量因各种因素而异,例如 PCB 和设计布局。不同的超大规模云服务商设计中包含的重定时器数量也不同。

事实上,Astera Labs 的第一个大客户是亚马逊,用于“典型”的(非 AI)云工作负载。在某些情况下,Aries 重定时器可以帮助云服务商实现比高数据速率替代方案更低的总体拥有成本(TCO)。下图展示了重定时器在IT设备中的位置。

Aries 的另一个即将推出的驱动程序是 CXL,这是一个建立在 PCIe 基础上的协议。正如我们在深入研究中解释的那样,内存池采用 CXL 将导致对 CXL 交换机的需求增加,而这将需要重定时器。

03

重定时器市场及其主要客户

Astera Labs 在该领域有两个重要客户:亚马逊和英伟达。如前所述,市场上几乎每台 AI 服务器都配备了 Astera Labs 的 Aries retimer。我们估计,每个 GPU 大约连接有 1.5 个重定时器,但不同服务器的设计情况各不相同。某些超大规模云服务提供商部署了多达 18 个重定时器,而其他的一些则只有 8 个重定时器。通常情况下,加速器底板上的每个 GPU 都有 1 个重定时器(从财务角度来看,亚马逊 / 英伟达是客户),而在服务器端还有额外的单元,可以在交换机托架或 CPU 托架上找到。下图是 Meta 的 Grand Teton 服务器。

我们预计,未来重定时器与 GPU 的比例不会有太大变化。虽然在 Gen 5 时代,人们可以在 CPU 托盘和交换机托盘方面节省成本,但在 Gen 6 时代,这种做法可能不再适用。然而,基于 ConnectX 和 Enfabrica 的解决方案也具备一些功能,可以保持当前的比例。这意味着重定时器的数量增长与 AI GPU 的增长直接相关。

然而,在更广泛的加速器市场上,情况并非总是如此。目前,并非所有定制芯片都包含重定时器。例如,谷歌的 TPU 并不包含很多个 PCIe 重定时器,但亚马逊的 Trainium 和 Inferentia 却包含。我们对 Astera Labs 收入的预测是基于逐个 SKU 的加速器模型。

关于平均售价,我们估计每个 PCIe 5.0 重定时器的价值约为 30 美元,用于大批量销售超级分频器。Astera Labs 采用的是台积电 N16 制造工艺,但其最新产品(用于 PCIe 6.x 的 Aries 3 重定时器)将转用 N5 制造工艺。基于我们在其他类似产品上观察到的情况,我们认为 ASP 可能会增加 80%。尽管由于 Broadcom 进入市场而带来的竞争激烈程度大幅增加,但我们仍然认为这是可能的。

04

Broadcom 会将 Astera Labs 挤出这个市场吗?

自从 Broadcom 宣布推出 PCIe Gen 6 重定时器以来,我们已经注意到了许多对市场份额可能产生影响的错误看法。在我们看来,高速网络业务通常是一个很好的领域,成为先行者并拥有最大的安装基础至关重要。

我们认为 Inphi 是一个非常类似的对比:尽管长期与 Broadcom 等行业巨头竞争,但 Inphi 成功保持了在高速光学 DSP 领域的领导地位,如今仍然是市场的领先者,其市场份额约占 70%。三年半过去了,Marvell 以 100 亿美元收购了这家公司,但市场份额依然很高。如今,Inphi 成为 Marvell 内部最大的独立业务,也是 Marvell 目前估值溢价的主要推动因素。

我们认为,Astera Labs 也能够从同样的竞争壁垒中受益。PCIe 协议的复杂性不言而喻,其向后兼容性需涵盖自第一代以来的各个版本。该协议支持多种不同类型的设备通过同一接口连接,这些设备通常采用不同的 SerDes IP,重定时器必须与所有这些设备连接并保持信号完整性。这就要求在硬件生态系统中进行长期而艰辛的工作,以确保各种设备的兼容性与稳定性。

Parade Technologies 和 Montage Technology 的多次失败尝试显示了资格认证是一个繁重而艰难的过程,至今它们仍未能实现批量出货。在未来,我们认为它们也无法进行有意义的竞争。Montage 由于是中国供应商,其无法进入 AI 服务器市场。Parade 的情况更为糟糕,因为他们的芯片在功能集方面几乎没有任何优势。此外,Parade 采用了自己的 SerDes,这意味着它们与其他设备的互操作性差得很远。相反,Astera Labs 具有与整个行业的 PCIe SerDes 和控制器良好的互操作性。

当然,Broadcom 与众不同,他们拥有全球顶尖的 SerDes IP 技术,这也是他们在谷歌设计中脱颖而出的关键因素。相比之下,Astera Labs 则是通过 Synopsys 许可使用的 IP 来实现其产品。Astera 并不仅仅是使用现成的解决方案,他们进行了一些定制化的修改。Broadcom 在 PCIe 交换机市场上占据主导地位,并积极推动成为唯一提供完整系统的供应商。

尽管在表面上看起来具有一定的说服力,我们认为这并不足以让 Astera Labs 从竞争对手手中夺取所有市场份额。Inphi 再次是一个很好的比较对象,因为光学交换市场在很大程度上被 Broadcom 所主导,但 Inphi 在试图占领 DSP 市场方面并未取得成功。如下所示,Astera Labs 的最新产品与 Broadcom 的规格相同,但(声称)功耗略低。需要说明的是,纸面规格可能与实际规格大相径庭,这一点只有客户在评估这些产品时才能了解。尽管如此,亚马逊和英伟达将继续在 PCI gen 6 资格认证上与Astera Labs 占据主导地位。

我们认为,这种技术上的优势很可能是由于装机量的优势所带来的。Astera Labs 在其芯片中集成了遥测功能,并通过其软件平台 COSMOS 充分利用这些数据。虽然我们认为 Broadcom 也能提供相同的功能,但在我们看来,Astera Labs 的先发优势使其更深入地了解客户需求和物理接口。

此外,英伟达希望尽可能减少与 Broadcom 的合作,这对 Astera Labs 来说是一个巨大的长期利好,因为英伟达将 Astera Labs 视为长期的合作伙伴而不是竞争对手。我们认为这种护城河足以继续在这个市场中保持主导地位,特别是在模拟领域,设计更多地是一种艺术而不是科学。

05

亚马逊与 Astera Labs 的合作关系

亚马逊一直是 Astera Labs 的最大客户,尽管我们预计这种情况将会发生改变,但我们认为这一关系值得深入分析。首先,值得强调的是,Astera Labs 一直坚持采用云优先的战略。在 2019 年,Astera Labs、AWS 和 Synopsys 联合发表了声明,自豪地宣布 Astera Labs 是行业中首家完全依赖云 EDA 工具的公司,而这些工具正是托管在 AWS 上。

各媒体文章将 Astera Labs 描述为一家开创性的基于云技术的半导体初创企业,其创纪录的上市时间为亚马逊带来了良好的宣传效果。根据公司提交的 S1 文件显示,截至 2022 年 12 月,Astera Labs 与一家供应商签订了为期 3 年的云服务协议,主要涉及与芯片设计相关的托管服务。该协议包括在 2024 年和 2025 年至少购买 200 万美元的服务。虽然这笔金额对于亚马逊来说相对较小,但这一承诺有助于巩固双方之间强大的合作关系。

关于认股权协议也值得一提。在 2022 年 10 月,Astera Labs 向亚马逊发行了一份认股权,以每股 20.34 美元的价格(D 轮估值)购买高达 148 万股股份,行权期为 7 年。一旦亚马逊购买了价值高达 4 亿美元的产品(Aries、Taurus、Leo),这些股份将归属亚马逊。该协议规定了具体的付款档次,截至 2022 年 10 月以来,已解除了 23 万股股份的限制。另外,另一份认股权于 2023 年 10 月发行,行权价格和行权期相同,若亚马逊购买了价值高达 2.5 亿美元的产品,则可额外获得 83 万股。

简单来说,亚马逊从 Astera 购买的产品越多,获得的认股权证就越多,促使 Astera 实验室发展壮大并从其购买产品的动力就越大。从表面上看,这是一个双赢的结果。与典型的客户折扣不同,这种机制不会减少现金收入,同时为客户提供了长期激励。

所有这些说明了亚马逊与 Astera Labs 之间特殊的关系。AlphaWave 和 Credo 与亚马逊的关系也是类似的,但它们的效果远远不如预期。它们曾经是第一个为非 AI 工作负载部署大规模 PCIe Gen 4 和 Gen 5 信号整形器的超大规模计算平台。我们曾深入探讨分析过亚马逊的硬件堆栈,我们认为,在 PCIe Gen 6 部署的推动下,这种关系可能会在非 AI 工作负载方面继续发展。亚马逊是在 PCIe Gen 7 方面最积极的公司,这对 Astera Labs 也是个好兆头。

此外,我们预计 Astera Labs 将会推出专门针对第 6 代和第 7 代的中小型成本优化 PCIe/CXL 交换机,以满足亚马逊工作负载(例如其 Nitro DPU 和 Graviton CPU)的特定需求。尽管这些交换机在短期内可能不会立即产生贡献,但我们相信,在每年约 100 万个 Graviton CPU 的部署推动下,这将成为 Astera Labs 业务价值超过 5,000 万美元的关键领域。考虑到高端的 Broadcom 交换机和低端的 Astera Labs 之间的竞争格局,我们认为 Microchip、Xconn 或其他公司很难在交换机市场上取得突破。

06

AEC 的机遇

Astera Labs 另一个引人注目的领域是其 Taurus 产品系列 AEC。AEC 是一种铜缆,两端都包含以太网重定时器。这种设计使得直连铜缆(DAC)的传输距离得以延长。尽管 DAC 目前已经被广泛部署,但受到高数据速率所带来的厚度和距离限制。随着我们向 800G 和 1.6T 的数据传输速率过渡,这些问题将会进一步加剧,可能需要考虑转向光学传输或采用基于以太网的解决方案。

据我们的估计,AEC 在 400G 时开始具备竞争力。然而,在当前的人工智能集群中,大多数互连都依赖于光纤,并且配备了光学数字信号处理器(DSP)。部分原因是因为英伟达积极推动其 Infiniband 解决方案,该解决方案主要依赖于光互连技术。我们预计随着总拥有成本(TCO)成为关注的焦点,这种情况会逐渐发生变化。

在这方面,AEC 相对于光纤表现优异,因为它们的功耗更低,成本更低。下表对 AEC 和 AOC 进行了比较,AOC 是两端带有 DSP 的固定尺寸光缆。而更常用的光纤 + 可插拔 DSP 组合则更为昂贵。除了成本和功耗,光缆的故障率也高于铜缆。Credo 预计,AOC 的年故障率为 0.9%,比 AEC 年故障率低于 0.01%,高出近两个数量级。

虽然从理论上看 AEC 具有吸引力,但需要注意的是,与 GPU 相比,其成本和功耗优势并不十分突出。我们最近在数据中心能源文章中对后者进行了深入探讨。然而,我们认为这种差距会逐渐增大,AEC 的竞争力也会随之增强。在我们看来,800G 应该是一个临界点。考虑到 AI 集群往往更快地采用最高数据速率,我们认为 AEC 是由 AI 驱动的市场。

07

Astera Labs 能否从老牌领导者手中抢占份额?

该市场的先行者是 Credo Technology Group。尽管 Credo 夸大了 200G 和 400G 的 AEC 部署规模,导致市场失望,但我们预计这个业务将在 2024 年下半年迎来起飞。在微软、亚马逊和谷歌的推动下,Credo 和 Marvell 都将受益。其他涉及的公司包括 Broadcom、Maxlinear 等。它们都在更广泛的光学 DSP 市场竞争,并制造自己的 SerDes IP。Astera Labs 是唯一一家从 Synopsys 获得 IP 授权的公司。Point2、Spectra7、Macom 和 Semtech 也都在进入这一市场。

市场规模可能会达到数十亿美元,因为在 ToR 拓扑结构中,每个 GPU 都需要连接一根电缆进行 NIC 到 ToR 通信。下图展示了 GPU 数量与电缆数量的对应关系。我们估计,400G AEC 的平均销售价格约为 130 美元,而 800G 的价格预计将上升到约 180 美元。

在我们看来,Marvell 和 Broadcom 将是从这一增长中受益最多的公司,而 Credo 可能会失去市场份额。市场竞争将更加激烈,预计利润率会低于其他市场。Astera Labs 将尝试利用其在 PCIe 领域的地位和客户关系,尤其是与亚马逊的关系。然而,除了与亚马逊的稳固关系外,我们认为该公司仍将是一家相对小众的企业。

08

CXL 最新动态

Astera Labs 在 CXL 领域是先行者。正如之前提到的,Astera 收到了 Marvell 的收购要约,但被拒绝了。因此,Marvell 在 2022 年转向收购 Tanzanite Silicon。Tanzanite Silicon 展示了首个支持机架规模内存池化的 CXL 2.0 内存加速器,并于 2021 年 11 月推出了他们的 Leo 平台。他们于 2022 年进入预生产阶段,并于 2023 年开始出货。然而,现在已经是 2024 年了,销量仍然非常低迷,我们看不到即将出现的拐点。

内存池化技术的前景或许不尽如人意。这是因为大部分程序已经悄然地被推迟或者取消,而且在人工智能部署中,CXL 技术也不会带来显著的益处。虽然 Marvell 与谷歌的合作项目可能会对 CXL 技术产生某种影响,但其影响可能并不显著。从中期来看,我们预计 CXL 内存扩展技术会逐渐得到一定程度的应用,但其增长速度可能比一些专家预想的要缓慢,且其规模也可能较小。

值得欣慰的是,随着主要内存制造商等各方参与者纷纷退出竞争,市场竞争已显著减小。在这种情况下,我们认为 Astera Labs 将能够在市场中获得最大的价值。我们估计 Leo 内存控制器的平均销售价格约为 70 美元,每个控制器通常连接 2 或 4 个 DIMM。尽管 Montage、Rambus 和 Microchip 等公司推出了内存扩展设备,但 Rambus 和 Microchip 面临着人才流失和组织动荡的问题,同时我们也尚未看到美国的超大规模云服务提供商或原始设备制造商大量采购 Montage 产品的情况。

09

估值与财务预测

根据我们的模型预测,从 2023 年到 2027 年,公司的营收增长年复合增长率为 59%。在这期间,2024 年将会出现爆炸性增长,主要是由于 AI 集群中大规模部署 Aries Retimer,使得同比增长率达到 167%。我们预计公司的毛利率将保持在非常健康的水平,但是其他产品的毛利率将逐步上升,从而摊薄总体毛利率。这主要是由于较低的加价率和规模相对较小的固定成本(主要包括掩模折旧和更多的晶圆设计)的原因。

根据我们的估算,到 2027 年,Astera Labs 的运营利润率将超过 40%。需要注意的是,下表中的数据不包括一次性费用,例如 RSU 的归属,这些费用可能会影响到 2024 年第一季度的财务数据。Astera Labs 商业模式的优势在于,它外包了一些关键的知识产权(如 SerDes),从而在较低的固定成本基础上实现了极高的运营杠杆。

尽管运营支出将继续增长,但我们认为 Astera Labs 已经拥有一个稳固的团队(超过 260 名员工)和客户关系,因此不需要大量增加投资。尽管存货和应收账款的增长可能会对运营资本造成一定的拖累,但自由现金流仍将大幅增长。我们的目标是在 2027 年按非 GAAP 准则实现每股收益为 1.77 美元,这将使得 Astera Labs 的市值达到 2027 年收益的 17 倍。在更短的期限内,按照每股 30 美元的首次公开募股价格计算,我们预计 Astera Labs 在 2024 年的盈利将达到 47.3 倍。

因此,我们认为 Astera Labs 具备市场参与者所青睐的各项特质。该公司在人工智能领域的直接参与度颇具吸引力。预计 Astera Labs 在全年的业绩有望超出市场预期,并且其市盈率可能在 2027 年达到 20 至 25 倍的水平。投资者可能会认为,与 Inphi 公司相比较,Astera Labs 更具投资价值。此外,我们目前对 AEC 的持股比例较低,且对于 Leo 项目的增长前景持谨慎态度,因此,如果我们对 Leo 项目的判断有误,那么其股价可能还有进一步上涨的空间。

此外,此次流通股可能会保持在总流通股的 15% 以下,我们认为这与上一次大型半导体领域的 IPO – ARM 有一些相似之处。

*以上文章翻译自《Astera Labs IPO – The Next Connectivity Superhero or Steamrolled By Competition?》,如需原文,请与我们联系。

WF Research 是以第一性原理为基础的专业顾问服务机构,欢迎关注和留言!

微信:Alexqjl

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注