智通财经APP获悉,今年5月,英伟达(NVDA.US)股价上涨27%,市值达到2.7万亿美元,仅次于微软(MSFT.US)和苹果(AAPL.US)。该芯片制造商报告称,由于对其人工智能(AI)处理器的需求飙升,其销售额连续第三个季度同比增长两倍。
瑞穗证券估计,英伟达控制着70%至95%的人工智能芯片市场,这些芯片用于训练和部署OpenAI的GPT等模型。78%的毛利率凸显了英伟达的定价能力,对于一家必须制造和运输实体产品的硬件公司来说,这是一个惊人的数字。
竞争对手英特尔(INTC.US)和AMD(AMD.US)最近一个季度的毛利率分别为41%和47%。
英伟达在人工智能芯片市场的地位被一些专家形容为护城河。它的旗舰人工智能图形处理单元(GPU),如H100,再加上该公司的CUDA软件,在竞争中占据了先机,以至于转向其他替代品几乎是不可想象的。
尽管如此,英伟达首席执行官黄仁勋表示,他“担心”这家成立 31 年的公司会失去优势。他在去年年底的一次会议上承认,有许多强大的竞争对手正在崛起。
并非只有英伟达的GPU能够运行支撑生成式人工智能的复杂数学运算。如果性能较弱的芯片也能完成同样的工作,黄仁勋的担忧或许是有道理的。
从训练人工智能模型到所谓的推理(或部署模型)的转变,也可能给公司一个取代英伟达GPU的机会,尤其是当它们的购买和运行成本较低时。英伟达的旗舰芯片售价约为30000美元或更高,这给客户足够的动力去寻找替代品。
“英伟达希望能拥有 100% 的市场份额,但客户并不会希望英伟达独享100%的市场份额,”竞争对手D-Matrix的联合创始人Sid Sheth表示。“这个机会太大了。如果任何一家公司全部占有,都会非常不健康。”
D-Matrix成立于2019年,计划在今年晚些时候发布一款用于服务器的半导体卡,旨在降低运行人工智能模型的成本和延迟。该公司去年9月融资1.1亿美元。
除了D-Matrix,从跨国公司到新兴初创公司都在争夺人工智能芯片市场的份额。据市场分析师和AMD称,未来五年,人工智能芯片市场的年销售额可能达到4000亿美元。英伟达在过去四个季度创造了约800亿美元的营收,美国银行估计,该公司去年人工智能芯片销售额为345亿美元。
许多采用英伟达GPU的公司认为,不同的架构或某些折衷方案可以产生更适合特定任务的芯片。设备制造商也在开发可能为人工智能完成大量计算的技术,而这些计算目前是在云端的大型GPU集群中进行的。
3Fourteen Research联合创始人Fernando Vidal表示:“没有人能否认,如今英伟达就是人们想要的训练和运行人工智能模型的硬件。但从开发自有芯片的超大规模企业,到设计自有芯片的小型初创公司,我们在公平竞争方面取得了一些进展。”
AMD 首席执行官苏姿丰希望投资者相信该领域有足够的空间容纳许多成功的公司。
苏姿丰去年12月在公司推出最新款人工智能芯片时表示:“关键是有很多选择。我认为,我们将看到的情况是,解决方案将不止一种,而是多种多样。”
其他大型芯片制造商
AMD制造用于游戏的GPU,并像英伟达一样,将其改造成用于数据中心的人工智能模型。AMD的旗舰芯片是Instinct MI300X。微软已经购买了AMD的处理器,并通过其Azure云提供访问权限。
苏姿丰在发布会上强调了该芯片在推理方面的卓越表现,而不是与英伟达在训练方面的竞争。上周,微软表示正在使用 AMD Instinct GPU 为其 Copilot 模型提供服务。摩根士丹利分析师认为,这一消息表明AMD今年的人工智能芯片销售额可能超过40亿美元,这是该公司的公开目标。
去年营收被英伟达超越的英特尔也试图在人工智能领域占据一席之地。该公司最近发布了第三版人工智能加速器Gaudi 3。英特尔称其产品更具成本效益,在运行推理方面优于英伟达的H100,同时在训练模型方面速度更快。
美国银行分析师最近估计,英特尔今年在人工智能芯片市场的份额将不到1%。英特尔表示,该芯片的积压订单金额达20亿美元。
更广泛采用的主要障碍可能是软件。AMD和英特尔都加入了一个名为UXL基金会的大型行业组织,该组织的成员包括谷歌(GOOGL.US)。该组织正致力于开发可替代英伟达CUDA的免费产品,用于控制人工智能应用的硬件。
英伟达主要客户
英伟达面临的一个潜在挑战是,它正在与一些最大的客户竞争。包括谷歌、微软和亚马逊(AMZN.US)在内的云提供商都在构建内部使用的处理器。这三大科技巨头加上甲骨文(ORCL.US)占英伟达营收的40%以上。
2018年,亚马逊以Inferentia品牌推出了自己的人工智能芯片。目前已推出第二版。2021年,亚马逊AWS推出了针对训练模型的Tranium。客户不能购买这些芯片,但他们可以通过AWS租用系统,AWS在营销中称这些芯片比英伟达的更具成本效益。
谷歌可能是最致力于自有芯片的云提供商。自 2015 年以来,该公司一直在使用所谓的张量处理器(TPU)来训练和部署人工智能模型。今年5月,谷歌发布第六代TPU芯片Trillium,该芯片被用于开发Gemini和Imagen等模型。
谷歌也使用英伟达的芯片,并通过云提供这些芯片。
微软在这方面的进展并不快。该公司去年表示,正在打造自己的人工智能加速器和处理器,分别名为Maia和Cobalt。
Facebook母公司Meta Platforms(META.US)并不是云计算提供商,但该公司需要大量的计算能力来运行其软件和网站,并提供广告服务。虽然Meta正在购买价值数十亿美元的英伟达处理器,但它在4月份表示,其部分自主研发的芯片已经用于数据中心,与GPU相比,它们的“效率更高”。
摩根大通分析师今年5月估计,为大型云提供商打造定制芯片的市场价值可能高达300亿美元,年增长率可能达到20%。
初创企业
风险投资家看到了新兴公司加入这一领域的机会。根据PitchBook的数据,他们在2023年向人工智能半导体公司投资了60亿美元,略高于前一年的57亿美元。
对于初创公司来说,这是一个艰难的领域,因为半导体的设计、开发和制造成本高昂。但也存在差异化的机会。
对于硅谷的人工智能芯片制造商Cerebras Systems来说,重点是人工智能的基本操作和瓶颈,而不是GPU的通用性。据报道,该公司成立于2015年,在最近一次融资中估值为40亿美元。
该公司首席执行官Andrew Feldman表示,名为WSE-2的Cerebras芯片将GPU功能、中央处理功能和额外内存整合到一个设备中,更适合训练大型模型。
Feldman表示:“我们使用一个巨大的芯片,而他们使用很多小芯片。”“他们面临着移动数据的挑战,而我们没有。”
Feldman表示,公司的客户包括梅奥诊所、葛兰素史克和美国军方,他们的超级计算系统正在赢得业务,甚至可以与英伟达竞争。
Feldman表示:“竞争很激烈,我认为这对生态系统是有益的。”
D-Matrix的Sheth表示,他的公司计划在今年晚些时候发布一款带有芯片的卡,这样就可以在内存中进行更多计算,而不是在GPU等芯片上进行计算。D-Matrix 的产品可以与现有的GPU一起插入人工智能服务器,但它可以减轻英伟达芯片的工作量,并有助于降低生成人工智能的成本。
客户“非常乐于接受,也非常有动力将新的解决方案推向市场,”Sheth表示。
苹果和高通
英伟达数据中心业务面临的最大威胁可能是处理地点的变化。
开发人员越来越相信,人工智能工作将从服务器场转移到电脑和手机上。
像OpenAI开发的大型模型需要大量强大的GPU集群来进行推理,但苹果和微软等公司正在开发“小型模型”,这些模型需要的电量和数据更少,可以在电池供电的设备上运行。它们可能不像最新版本的ChatGPT那样成熟,但它们可以执行其他应用程序,例如总结文本或可视化搜索。
苹果和高通(QCOM.US)正在更新芯片以提高人工智能的运行效率,为人工智能模型增加了名为神经处理器的专门部分,这可以在隐私和速度方面具有优势。
高通最近发布了一款个人电脑芯片,可以让笔记本电脑在设备上运行微软的人工智能服务。该公司还投资了多家芯片制造商,这些芯片制造商生产低功耗处理器,用于在智能手机或笔记本电脑之外运行人工智能算法。
苹果一直在推销其最新的笔记本电脑和平板电脑,称其针对人工智能进行了优化。在即将召开的开发者大会上,苹果公司计划展示一系列新的人工智能功能,这些功能很可能会在该公司为iPhone提供支持的芯片上运行。
王丹 06-03 12:50
董萍萍 06-03 13:01
贺翀 06-03 12:52
王丹 06-03 08:15
张洋 06-03 06:51
张洋 06-03 06:51
贺翀 06-02 17:03
王治强 06-02 16:55
最新评论