AI让厂商快无法承受显卡保固了! 研究报告显示NVIDIA产品维修支出暴增1000%

nvidia-h100-sxm-1

AI热潮下大量的显示卡与存储器被投入运算工作,造成市场缺货、价格暴涨,加上卡片不眠不休的高负载使用,连带对保修服务带来沉重负担,维修率的增加、料件成本上扬等,研究机构指出显卡的故障率逼近过去的挖矿潮,支出费用更是暴涨了1000%。

保修调查机构Warranty Week调查AMD和NVIDIA历年的保修维修比例和相关费用,显示两家厂商在2025年的保修支出成本都大幅增加,其中又以NVIDIA最为夸张,从2024年的8100万美元飙升到了8.94亿美元,相差了11倍!

这庞大成本的背后牵涉到市场变化、硬件设计缺陷等因素,其中内存暴涨占最大的因素,由于高阶显卡使用的GDDR7、HBM内存成本不断攀升,使得保修维修、全卡换新的费用不断往上增加,但因为在保修范围内,厂商只能自己吞下。

fig1
保修微修的费用支出

其次,AI运算长时间的高负载运作也让显卡的寿命极速缩短,调查报告中统计了历年的故障率,NVIDIA在2022年因为挖矿热潮的关系,保修出保率一度突破1%的历史高峰,后来2023 – 2024年热潮衰退回归正常。

但从2025年开始,卡片故障率的数量又开始激增,到了2025年已经达到0.9%,与AI大爆发的议题的时间重叠,几乎可以肯定是因为大量显卡在运算AI的过程被操坏。

fig2
保修出保率

同时,NVIDIA在2022年9月RTX 40推出后用上恶名昭涨的12VHPWR电源接头,造成大量烧毁灾情,后续2025年年初的RTX 50替换成改良版的12V-2X6接头,但阻止意外效果并不明显,也被认为是维修率激增的原因之一。

只是这点从维修比例上所呈现的因果关系并不是很明显,因为2023年的出保率出现大幅下跌,2024年全程保持在低点,倘若RTX 40用的12VHPWR真如此不可靠,理当不应该在年度销售额创新高的同时,还保持如此低的维修率。

fig3
显卡销售额

然而,如果把AMD纳入比较,调查显示长久以来AMD的产品在多数时间的稳定率是弱于NVIDIA的,仅在2022年末的挖矿潮以及2025年开始的AI潮胜出,且AMD在挖矿潮下的出保率完全没有变化,唯在AI世代有提升。

由于AMD不要求厂商使用12VHPWR、12V-2X6接头,这是否能够呼应损坏率在两大高负载狂热事件下没有夸张变化,又仅是单纯AMD在挖矿和AI运算上较为弱势,销售量远不如NVIDIA广泛,造成统计的误差所致。

(0)
Owen BouchardOwen Bouchard

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注