wwwabg2025.net
你的位置:wwwabg2025.net > ABG欧博官网 >

算力太紧张!微软等云服务商被曝对中小客户“挑挑拣拣”

  就在AI进步引发全球创业热潮之际,一些小有成就的美国初创公司正面临同样的麻烦:难以从微软等云服务商租到算力。除了价格飞涨、长期排队外,在某些情况下连获得算力销售人员的答复都成为奢望。

  周五的最新消息也显示,与2023年那一轮AI应用萌芽时期的算力紧张不同,当下对AI编程工具和智能体应用的需求剧烈增长,正推动云服务商聚焦应对头部AI开发者(例如Anthropic)的需求,同时收紧对中小客户的GPU容量供应。

  价格飞涨、销售代表“不接电话”

  旧金山初创公司Krea的遭遇就极具代表性。Krea开发AI图像生成应用,成立4年以来已经从a16z、贝恩资本在内的头部VC融资8300万美元。

  Krea的联合创始人兼首席执行官维克托·佩雷斯对媒体表示,6个月前,公司在几家云服务商“激烈争取”下,以每块芯片每小时2.8美元的价格租用了数百块英伟达Blackwell芯片。但在过去一个月里,当公司开始寻求租用更多AI服务器用于训练模型时,一些云服务商的销售代表甚至电话都不接了。

  佩雷斯表示,当公司终于得到回复时,被告知现在的价格已经大幅上升,而且合作的条件包括签订一份至少3年的合约。

  即便在那样的条件下,当公司开始评估一些服务器的报价时,短短几天内就被其他客户抢订一空。

  Krea最终以承诺额外增加数百块Blackwell芯片,且签订1年合约的条件,拿到每小时每块芯片3.7美元的价格——比半年前高出32%。考虑到其他供应商的报价,这个价格仍显得便宜。

  佩雷斯说道:“我们最担心的是拿不到足够的算力资源来运行平台和训练模型。即便算力价格略有上涨,也不会要了我们的命。”

  引爆“算力争夺战”的另一个原因,是许多“ChatGPT时代”的初创公司,此前签订的2年或3年期云服务合同正接近到期。云服务商得以寻求涨价,或者将算力重新分配给Anthropic、OpenAI等对算力几乎拥有无尽需求和掏得起大价钱的“超级大户”。

  云服务商Lightning AI的首席执行官Will Falcon表示,公司在线的GPU约有40,000块,但潜在租赁订单积压的需求高达约400,000块。

  Falcon表示,这导致价格在过去六个月上涨超过25%,从每块芯片每小时约1.60美元涨到现在超过2美元,有些情况下更高。需要说明的是,Lightning AI的芯片主要是英伟达上一代Hopper架构产品。

  微软的“用或失去”(Use ‘Em or Lose ’Em)政策

  对于那些依然能从微软等云服务商租到算力的公司而言,现在也要面临更加严苛的政策。

  据匿名微软员工透露,由于大型客户以及微软内部团队的需求激增,微软云计算部门Azure已开始限制向中小客户出租服务器的数量。该人士表示,一些中小客户目前租用额外GPU时,需要排队等待数月时间,而且还要被“挑挑拣拣”。

  举例而言,微软近几个月开始要求希望租用英伟达Blackwell芯片的客户承诺至少打包1000块芯片、且租期至少为一年,而这样的合约最低也要数千万美元。现在从Azure租用少量上一代英伟达芯片的客户,也得至少等上数周、乃至数月。

  关键点在于,等待的时间取决于客户与微软的“关系”。

  Azure会基于分级制度对客户进行优先排序。获得优先访问权的一级客户大约有1000家,是其最大的收入来源;二级客户开支较小,但仍足以让微软为其指定专门的销售代表来管户;三级客户则是由微软的转售合作伙伴负责维护关系的较小企业。

  如果客户不承诺预订大量GPU,而是选择按需付费(pay-as-you-go)的方式租用芯片,往往需要等待较长时间才能获得算力资源。

  一位微软员工表示,即便微软按这种方式向客户提供GPU容量,仍会持续跟踪其使用情况。服务器哪怕只闲置几个小时,就有可能被收回访问权限。

  微软也在收回部分通过初创企业扶持计划获得GPU使用权限的企业算力资源。该计划原本向初创公司免费提供云服务器额度。但微软已告知相关初创企业,如果未能充分利用这些GPU,就可能失去使用权限。

  怎么办?自己买芯片

  面对难以从云服务商获得算力的状况,一些初创公司开始选择自己购买英伟达芯片。

  油气企业AI智能体初创公司Collide的创始人Collin McLelland表示,由于等待租用大型云服务商的排队时间过长以及使用限制让他感到厌烦,他正考虑花大约50万美元购买英伟达的GPU自主运行。

  Collide正在考虑等GPU到货后,直接向数据中心运营商或云服务提供商租用机房空间进行托管部署。

  McLelland说,虽然短期来看,自购并部署GPU的成本明显高于向云服务商租赁,但为了避免算力租赁的不确定性和等待延迟,这一投入是值得的。从多年周期来看,自购GPU的总成本预计反而低于持续租赁。

  他说道:“如果在需要算力的时候却没有可用资源,对我们来说风险非常大。很多人只是害怕接触硬件而已。我以前买过油井,所以对这些并不陌生。”



热点资讯

推荐资讯



Powered by wwwabg2025.net @2013-2022 RSS地图 HTML地图

Copyright Powered by站群系统 © 2013-2024