Future Tech

[转贴] 500天,阿里云长成大模型“地头王”

Tan KW
Publish date: Wed, 21 Aug 2024, 09:53 AM
Tan KW
0 502,968
Future Tech

智东西(公众号:zhidxcom)
作者 | 三北
编辑 | 心缘

2024年过半,云巨头的大模型技术战、价格战一家比一家打得响,阿里云已率先突围了。

智东西8月20日报道,在刚刚过去的2024年第二季度(对应阿里巴巴2025财年Q1),阿里云营收同比增长6%至265.49亿元,经调整EBITA利润同比增长155%至23.37亿元

500天,阿里云长成大模型“地头王”

就在两年前,阿里云还身处负增长的“泥潭”,面临在国内外市场“被双杀”的风险。但到了2024年,阿里云一举取得近八财季以来最大幅增长,本财季EBITA利润达2023整个财年的近两倍,成为阿里集团最亮眼的增长板块。

500天,阿里云长成大模型“地头王”

背后的动力是什么?重点可以总结为一句话:阿里云公共云业务两位数增长,AI相关产品收入实现三位数增长。

阿里巴巴集团CEO吴泳铭在电话会议上称,当前阿里云一半以上的营收增速都来自于AI产品,而且AI投资回报率相当可观,大部分算力上架之后就会开始满负荷地产生收入。

对比来看,全球云巨头微软、谷歌的业绩受AI拉动仍不明显。在前不久的财报会议上,两者都曝出AI方面的资本投入太大,引起净利润增长率均大幅下降。微软首席财务官Amy Hood甚至称其AI投资回报在15年后。(《AI带不飞云巨头》)

实际上,阿里云的AI投资也大到影响其自由现金流,但其依然实现了利润大涨155%。这是如何实现的?令许多产业人士感到好奇。

自8月15日阿里巴巴财报发布后,其美股股价多次上涨冲高,截至8月19日收盘价为83.91美元/股,相比于8月14日收盘的79.41美元/股,同比上涨约6%,业内分析这离不开阿里云增长带来的积极信号

500天,阿里云长成大模型“地头王”▲阿里巴巴集团近五日美股股价走势(图源:雪球)

“百模大战”500天,阿里云是否已通过AI完成了新一轮转型?它是如何一步步转型的?背后有什么样的产业逻辑和趋势?本文对此进行了深入探讨。

一、阿里云AI突围密码,与微软、AWS不一样

和微软、亚马逊一样,阿里云也试图通过AI拉动公有云增长

但不同于微软与ChatGPT强绑定、亚马逊AWS汇聚三方模型做底层基础设施,阿里云综合两者优势,走出了一条新路:既要自家大模型稳江山,又要赚足大模型产业的基础设施服务费用。

阿里云从一开始就选择了自研大模型AI基础设施服务两手抓。

一方面,阿里云CTO周靖人在2023年10月发布了千亿级参数大模型通义千问2.0,2024年5月推出通义千问2.5,后者已在性能上全面赶超GPT-4 Turbo,最新开源的1100亿参数模型也在多个基准测评中收获最佳成绩。

另一方面,阿里云提出的“模型即服务(MaaS)”理念尤为突出,推动阿里云从底层算力到上层模型的全栈服务发展。GPU算力储备优势并不突出,但阿里云却能做出更高的投资回报率,这是出于和全球第一大云巨头AWS相似的逻辑:云服务底盘足够稳

过去一年多,周靖人带领团队从底层算力到AI平台再到模型服务进行了全面升级

例如,在IaaS层,灵骏智算集群采用HPN 7.0网络架构,支持10万卡级的可扩展规模,满足指数级增长的AI需求;自研集合通信优化调度器Crux,可提升高达14.8%的GPU计算利用率……

在PaaS层,AI平台PAI分布式训练加速比高达96%,可稳定运行千卡任务5周以上,同时全线大数据产品也面向AI场景升级……

在MaaS层,魔搭社区汇集通义千问等超5500个优质开源模型和上千数据集,百炼已集成上百款大模型API,服务客户数已达23万……

相比于国内的其他云服务同行,阿里云更强调整体云计算体系的升级,为其进一步在大模型产业获客奠定了基础。

这是一场速度战。仅是一年之间,多家云厂商已经搭建了AI全栈服务的框架。以“闪电战”著称的字节,目前已推出自研大模型产品豆包及To B服务、AI视频生成工具即梦、“方舟”大模型服务平台2.0等AI全栈布局,显露成为AI云服务霸主的野心。不过,阿里云的速度还是更快

根据全球研究和咨询公司Forrester近日发布的最新全球AI基础设施解决方案研究报告,阿里云获评AI基础设施服务产品力全球第二,仅次于谷歌,超过AWS及微软。

500天,阿里云长成大模型“地头王”

二、四大核心策略,造就国产大模型“地头王”

抛开云技术加速迭代这一特点,阿里云能斩获大量客户,更离不开企业和开发者的“自来水”。

为什么企业和开发者愿意为其买单?笔者总结,原因无外乎开源、降价、开放“模型商店”差异化投资四大较核心的策略。

1、开源+降价,通义千问成许多企业的“第一款模型”

首先,阿里云吸引客户的手段可谓简单且直接:开源+降价。

阿里云是国内唯一坚定明确模型开源开放的云巨头。早在2023年8月,阿里云就开源通义千问70亿参数模型至免费可商用;到2024年6月,阿里云已开源通义千问Qwen2系列模型,其中Qwen2-72B成为当时全球性能最强的开源模型,性能超过美国最强开源模型Llama3-70B,也超过众多中国主流闭源大模型,这满足了很多企业开发专用大模型的需求。

持续开源新模型,使得原本使用阿里云的海量客户主动在云上接入大模型,获得更多的控制权和调优空间,通义千问是很多企业采用的第一款大模型

降价举措也是一波接着一波。2024年2月,阿里云资深副总裁、公共云事业部总裁刘伟光宣布史上最大力度降价,覆盖计算、存储、数据库等领域的100多款产品、500多个产品规格,平均降幅超过20%,最高降幅达55%。2024年5月,通义千问GPT-4级主力模型Qwen-Long的API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%,相当于1块钱可以买5本《新华字典》的文字输入量,降价覆盖之广,达9款商业化及开源系列模型。

迅猛的降价策略,使得大量新场景需求得以释放,拉动阿里云的大模型调用量数倍增长。 根据最新数据,通义千问开源模型下载量已突破2000万次

2、最快速度上架第三方模型,企业吃到第一波热度

其次,阿里云以最快的速度,把最新第三方大模型铺到“大模型商场货架”上,让开发者和企业第一时间吃到热度。

既然不打算停留在“卷模型”,那阿里云的思路,就是要尽量接入最多的大模型在平台之上供用户选择。无论是Meta前段时间开源的Llama 3,还是最近爆火的最强文生图开源模型FLUX,都第一时间在百炼大模型服务平台上开放免费训练、部署、推理。

魔搭社区已经成为“中国版Hugging Face”,正如前文提到,其已汇集通义千问等超5500个优质开源模型和上千数据集;百炼已集成上百款大模型API,服务客户数已达23万

3、大力投资大模型独角兽,云积分投资“秒变”云收入

此外值得一提的是,阿里强劲的大模型投资,也通过云积分形式,拉动阿里云算力服务收入增长

据英国《金融时报》今年5月报道,阿里正以算力支付形式投资多家中国AI大模型创企,比如其投资月之暗面的8亿美元的近一半份额是以云积分形式提供。截至目前,阿里已投资了MiniMax、月之暗面、零一万物、智谱AI以及百川智能5家大模型独角兽,成为中国大模型独角兽的“提款机”。

据透露,与微软对OpenAI的投资类似,阿里对AI创企的投资方式强调算力支持;但不同的是,阿里的资金并未直接转给中国AI创企,而是被存放在一个代管账户中,并可以被计入阿里收入。阿里云方未对这一消息进行回复,如果属实这也将是一笔可观的收入。

四大策略受到阿里云高层的“AI驱动,公共云优先”战略的引领。

吴泳铭在2023年11月首次为阿里云明确了“AI驱动,公共云优先”战略,这是首次将AI放在了阿里云发展中的核心地位,将公有云作为重点。在这一战略的引领下,阿里云加大了AI软硬件领域的技术投资,专注更具竞争力和可复制的公有云产品,加强云产品与AI的协同,对停留在“模型之战”的同行进行了降维打击

这种打法像极了互联网时代的“赢家通吃”:同行你只管卷模型,我把最好的模型低价甚至免费送给大家,做背后算力流量生意。

提早就想明白了“开源模型+云服务”闭环的阿里云,不仅是让开发者采用大模型的门槛更低了,也为其自身公有云的增长提供了新的动力。

三、AI转型突围背后,阿里云面临三大隐忧

事实上,努力进行AI转型的不止阿里云,包括腾讯云、华为云、百度智能云甚至天翼云等运营商云厂商,都在通过AI拉动云业务增长。

背后是受宏观经济影响,2024年众多政企数字化转向的进程放缓,每家云厂商都想摆脱政企市场寒冬阴霾、抓住AI大模型新风口机遇。知名行研机构IDC在去年底调低了未来5年中国数字政府整体市场规模预测,复合增长率下降2.9个百分点。地方财政承压,整体市场预计进入相对低速的增长态势。

据阿里云相关负责人透露,大部分企业,尤其是云端客户,今年在新兴AI方面的预算比去年扩大了不少,所有行业都在利用AI提升产品能力或效率,这是一个全新的行业趋势

而阿里云是率先在风口上飞起来的玩家。如下图所示,将时间线拉长到八个财年的维度,可以更明显地看到AI及公有云对阿里云业务拉动力之强劲。刚刚过去的2024财年(对应自然年2023年Q2-2024年Q1),覆盖了“百模大战”从打响到高潮,阿里云营收增长回暖,经调整EBITA利润超过2023财年的3倍。2025财年Q1(对于自然年2024年Q2)则延续了前一年的业绩回暖趋势。

500天,阿里云长成大模型“地头王”

AI对增长功不可没,阿里云的业绩表现是整个云计算行业向好的一个缩影。正如前文提到的财报数据,阿里云在2025财年Q1(实际年2024财年Q2)收入同比增长6%至265亿元人民币,经调整EBITA同比增长155%至23亿元人民币。阿里相关负责人在财报电话会议上称,收入增长主要是由公共云收入取得双位数同比增长AI相关产品的用量增长所驱动,AI相关产品收入同比取得三位数的增长。

着重来看盈利增长,据悉,经调整EBITA增长主要是由于阿里云专注于公共云和运营效率的提升,从而带来了产品结构改善,以及AI产品和解决方案的需求强劲而持续,当然部分增长被技术和客户的投入增加所抵消了。

诚然,就像微软、谷歌一样,阿里云在今年AI的投资也是巨大的。阿里云本季度自由现金流下降,AI领域的大量投资是一大原因。但AI投资花的钱,阿里云正通过全线降本增效省回来。

除了前文提到的提高公有云运营效率提升、优化产品结构,业内人士告诉智东西,2024年阿里将人员成本降得更低。根据财报,截至2024年6月30日阿里员工总数为198162人,2023年12月31日这个数字是219260人,半年里合计减少了2万多人;同时,省在细节,不少阿里云内容部员工反映其明显感到日常的差旅、团建等福利在压缩,比如有团队年度团建需要每人自费数千元。说盈利是几万阿里云人省吃俭用挤出来的,也不为过。

面向未来,阿里还会继续大力投资“用户”和“AI”。聚焦到阿里云,正如相关负责人所说,当下大模型市场需求仍未达到满足阶段,阿里云会继续延续高投入水平。

但“节流”虽有效,“开源”才是长久之计。如何让新成长起来的AI相关业务规模化落地应用,走向持续商业化的正轨,是阿里云的AI相关业务接下来面临的一大重要议题。

与此同时,全球大模型人才竞赛加剧,阿里云面临人才流失威胁。在美国硅谷,百万美元年薪挖人大战愈演愈烈,比如OpenAI的9名联创成员已离开创业,谷歌前不久以25亿美元估值变相收购了明星大模型创企Character.ai的核心人员;在国内,阿里的大模型元老杨红霞、前阿里副总裁贾扬清、通义实验室通义千问负责人周畅等顶尖人才也都相继传出离职,稳固和壮大人才队伍是一大当务之急。

从全球视野来看,公有云是规模生意,阿里云如何突破规模瓶颈是更长远问题。尽管亚马逊AWS、微软智能云体量都已超过阿里云,但营收增速还维持20%左右的高位,但阿里云即便收入回暖但增长仍低于10%。在主动做减法之后,如何做好新的加法,对阿里云来说至关重要。

500天,阿里云长成大模型“地头王”

结语:500天,阿里云成大模型“地头王”

在近500天的时间里,阿里云快速实现了大象转身,围绕AI进行了深度转型。

在2023年5月阿里巴巴董事会主席蔡崇信与吴泳铭首封联名信中,他们明确了“AI驱动”为核心发展战略,并提出围绕通义千问的AGI探索、投资大模型以发展云计算业务、AI带动阿里消费业务锐变的三大投资目标。时隔一年多,这三项目标都取得了显著成果,使其稳坐中国大模型产业“地头王”宝座。

在中国市场上,阿里云是唯一家同时提供开源模型和AI云服务的厂商,这种优势已经开始凸显。开发者在使用开源模型时,会更倾向于选择阿里云的AI产品,从而带动了公有云业务的增长。与此同时,阿里云依然面临着AI商业化不足、人才流失及规模增长瓶颈等挑战,这些都是其在新的AI竞赛中需要考虑的关键要素。

 

https://zhidx.com/p/438627.html

Discussions
Be the first to like this. Showing 0 of 0 comments

Post a Comment