智东西(公众号:zhidxcom)
作者 | 云鹏
编辑 | 心缘
就在智能手机出货量跌入十年最低谷之际,AI大模型直接给所有人送来了新的机遇。
最近摩根斯坦利的一份深度研究报告指出,边缘AI技术的发展会给智能手机和PC产业注入新的活力,他们预计,智能手机产业会在2024年止跌企稳,并逐渐迎来复苏,出货量将迎来4%的同比增长。
4%,对于销量频频跌至新低的智能手机行业来说,实属来之不易。
▲2011年到2022年全球智能手机年度出货量统计,来源:Counterpoint
正如摩根斯坦利报告所指出的,今天AI大模型带来的AIGC浪潮,正深度洗礼着智能手机产业。最近短短一个月内,小米、vivo、OPPO、三星接连亮出了十个以上的AI大模型,从十亿级、百亿级到1300亿。
值得一提的是,这些大模型几乎都打着“自研”的旗号,似乎并非此前被行业议论多时的“开源版换皮”。
从ChatGPT火爆至今不过一年左右,国内头部手机厂商中除了荣耀均已将AI大模型技术落地在自家手机中,这动作不可谓不快。
毫无疑问,手机AI大模型之战,已经开始了。
▲近期手机厂商AI大模型相关发布梳理
AI大模型对各类智能设备的交互范式、服务提供形式或许都会有颠覆性影响,智能手机行业也将深度卷入这场大模型之战,对于各家厂商来说,这似乎是一场不能输的仗。
面对这样的行业剧变,厂商们都是如何布局大模型技术的,又是如何实现的?厂商们为何选在相近时间点发布,各家大模型又有何异同?智能手机用上AI大模型,真的是一次“智能进化”,还是一个“噱头”?我们将深入各家大模型产品,对话厂商相关负责人,尝试找到答案。
在ChatGPT诞生之初,人们就在想象其在各行各业中应用的样子,因为ChatGPT最初的形式就是与人用自然语言对话,因此将其与智能手机结合,我们不难会想到智能语音助手,当时也有不少关于手机智能语音助手是否会被取代的讨论。
但技术发展之快甚至没有给我们思考的时间,在我们给出答案之前,事实就已经呈现在我们面前了,“智能语音助手”这个词,的确已经成为过去时。
在AI大模型落地手机的今天,智能语音助手们并没有消失,而是从底层完成了一次“质变”,成为了用户接触AI的核心入口之一,它们的名字中也去掉了“语音”两个字。
无独有偶,今天各家手机厂商在发布会上都将其称之为“智能助手”、“智慧助手”或“智能助理”,在AI大模型带来的“多模态”能力之下,我们跟AI的交互不再停留于语音,甚至不再停留于文字,交互的形式变得更加多样,AI输出给我们的信息也变得形式更加丰富。
只不过我们与AI交互的过程总需要一个“界面”或“入口”,各类智能助手就成为了信息输入输出的平台,而背后真正的“大脑”正是AI大模型。
说了这么多,AI大模型加持下,手机体验到底有什么改变?
从华为、小米、vivo、OPPO发布的一系列AI大模型以及其落地手机对应的产品和应用服务来看,最直观的一个改变,就跟我们当初第一次接触ChatGPT十分类似,这个手机上的AI,终于变“聪明”了。
这个聪明,可以简单分为两方面来看,第一是能听懂了,第二就是能做好了。
听懂这块,形象地来说,AI大模型加入前,AI的语言理解能力,让我们不得不把自己想象成一个AI,以AI的口吻去说话或者输入文字,语言需要表达的非常清晰准确,不能有错字或者省略的字。
而AI大模型加入后,我们不但可以像正常人一样直接跟AI对话交流,即使我们输入的信息不完整,甚至有错别字,AI都可以很好地理解我们到底要什么。
手机上的AI真的变聪明了,能跟人一样正常交流了,能够懂我们了。
▲华为小艺通过自然语言对话设置手机天气壁纸
但仅仅是听懂只是第一步,真正能干什么才是核心差异所在。
说到能做什么,这里有一个核心问题就出现了——手机用上AI大模型,跟我们直接在手机上下载ChatGPT App以及各类基于AI大模型的App有什么区别?
这里,我们不妨通过几个例子来直观感受一下两者之间的区别。
对于应用了AI大模型的手机智能助手,我们可以直接让它帮我们设置各种手机功能,比如换个跟今天天气相符合的动态壁纸,比如编排一个专属于我们自己的提醒模式,在特定的时间点以特定方式提醒我们去做某件事,再比如通过一句话就能快速开启方便残障人士使用的各类无障碍模式。
▲华为小艺设置“晨跑场景”
AI大模型可以针对手机使用的场景进行学习优化,让AI了解手机的各类功能,也就是说,小白也可以成为“玩机达人”,而每个手机,不同的品牌,不同的操作系统,功能设置的具体方式可能都有不同,这是ChatGPT所无法完成的。
再进一步,在手机使用场景中,还有很多能力也是ChatGPT不具备的。
比如我们可以让智能助手根据备忘录里的信息写一封明天开会的会议邀请邮件,也可以让助手根据我们口头描述直接找到手机本地相册里一张“下雨天我抱着猫的照片”。
▲vivo小V助手搜图
在一些厂商开发的功能中,AI可以学习用户的外貌特征,直接“创作”出一些照片,即使我们没有去过一些景点,AI还是可以生成我们在这些地方的“旅游照”。
▲小米相册的AI创作图片功能
此外,AI会根据我们日历中对一些重点日期的标注进行主动智能服务的提供,比如在结婚纪念日前几天提前给我们推荐一些购物、餐饮、娱乐服务。
▲华为小艺在关键节日、纪念日提供主动提醒和服务
可以说,这种本地化、个性化、主动的智能服务体验,是AI大模型在手机上落地带给我们最直观的感受,也是手机智能助手们区别于ChatGPT的主要特性之一。
当然,另外一部分直观能力体现就与ChatGPT十分接近了,比如文字创作、文本摘要、图像生成等等,这些能力也是AI大模型的核心优势所在,不过今天我们对这些能力都不陌生了。
▲华为小艺进行文字摘要
在餐馆里帮我们随手写个用餐好评、过年帮我们写个祝福语、针对一份会议纪要写出一份思维导图式的要点梳理、将一张照片转换成不同风格的图像,或者帮我们编写简单的程序,生成一些代码。
▲小米AI大模型进行文字创作
整体来看,用一句话总结就是,ChatGPT能干的它能干,ChatGPT干不了的它也能干。而AI大模型落地智能手机,就相当于给每个人配了一个更聪明更能干的全能助手,跟以往的智能语音助手体验完全不在一个层次。
说了这么多AI大模型在手机上的应用,那是不是每家手机厂商的AI大模型都能实现这些功能和能力呢?各家的AI大模型有何异同?
就目前各家厂商在发布会上的演示和实际落地表现来看,在功能性上各家的大模型差异并不明显,基本上你能做的我也能做,并没看到有明显的“人无我有”的优势能力出现。
现在各家的做法更像是先打好基础,搭建一个舞台,具体AI大模型能有怎样更精彩的表现,一方面要看厂商的后续优化,另一方面也要看三方生态的建设,能否有更多手机App可以应用到这些AI大模型的能力。
值得一提的是,虽然在功能上各家并没有拉开明显差异,但在AI大模型落地手机的具体形式、参数规模、模型数量、自研深度、开源程度等方面确实存在一定差异。
比如从形式上来看,华为这边的载体是自家的小艺助手,在发布会上,华为对于AI大模型能力的展示,基本上都是以小艺能力的形式,从知识获取、逻辑推理、任务规划、记忆扩展、工具调用到创作辅助。
跟华为类似,vivo和OPPO也都是以各自智能助手能力的形式来展示AI大模型落地所带来的变化,比如vivo的蓝心小V以及OPPO的小布助手。
小米这边,虽然小爱同学必然会成为用户接触AI大模型的关键入口之一,但在发布会上,小米重点强调的是AI大模型技术在整个系统层面的应用,尤其是在各类App中的应用。
▲小米在WPS上推出的PPT生成功能
比如文本创作功能被应用在了输入法中,写摘要总结做PPT这样的功能则与WPS进行了结合,像AI搜图、进行图片创作这样的能力则整合进了相册中。
值得一提的是,vivo这边在蓝心小V之外,还发布了一个会以公版App形式上线安卓、iOS手机应用市场的产品,名为蓝心千询,一个自然语言对话机器人。
这就相当于手机厂商基于自己的AI大模型能力,做了另一个“ChatGPT”出来。vivo这种做法在华为、小米和OPPO中并没有看到。
说完了形式,我们来看看规模,首先,并不是每家厂商都在发布会上对自家AI大模型的详细参数量、架构、关键特性都有详细介绍,所以我们仅能从已公开的信息中寻找答案。
从发布的模型数量上来看,vivo这次在发布会上提到的大模型就有六个,是发布数量最多的一家,模型参数量从10亿、70亿、130亿、700亿、1300亿到1750亿,1750亿已经看齐了GPT-3.5的参数量。
在vivo的规划中,10亿、70亿规模的大模型主要用于端侧,像语言理解、文本创作、文本总结这样的能力基本上都可以实现,700亿参数的大模型则主要用于云端,可以进行更复杂的角色扮演、知识问答和自然对话。
值得一提的是,vivo的蓝心大模型-7B是目前手机行业中第一个开源的大模型,vivo也发布了对应的开发套件BlueKit。
华为这边虽然没有在发布新版小艺的同时介绍盘古大模型,但在今年的华为开发者大会上,我们可以看到盘古大模型的更多详细信息,比如最新的盘古大模型已经迭代至3.0版本,华为也是几家头部手机厂商中布局AI大模型最早、产品迭代相对更成熟的一家。
不过华为的盘古大模型并不是一个专门用于智能终端产品中的大模型,而更多的是面向行业应用,华为给它的定位是“行业大模型”,智能手机只是其应用领域之一。
盘古3.0也有100亿、380亿、710亿和1000亿等几个不同参数规模的基础大模型,像知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等常见且必要的能力基本上都有涵盖。
OPPO这边的AI大模型目前已知的有Tiny、Turbo、Titan三个不同的规模,其中用在端侧的Tiny参数量约为70亿,Turbo和Titan主要用在云上。
虽然OPPO没有明确提到其他大模型的参数量,但在AI大模型测试C-Eval的排行榜中,我们能够看到由AndesLM研发的AndesLM-13B,参数为130亿。
与华为、vivo和OPPO相比,小米是几家中对于自研AI大模型的细节信息公布最少的,在C-Eval排行榜中,我们能够看到参数量13亿的小米AI大模型MiLM-1.3B和参数量60亿的MiLM-6B。
值得一提的是,从目前各家厂商发布的模型来看,在手机端侧落地的大模型,参数规模通常在60-70亿左右,最高参数量目前在130亿左右,这与高通、联发科等手机芯片厂商在芯片发布时提到的信息也相吻合。
从各家模型特性上来看,vivo这边给出的描述最为详尽,vivo也提出了他们认为的优秀大模型应该具备的五个特点,包括大而全、算法强、安全性高、自进化以及开源。大主要是数据规模、模型参数大,知识量丰富,全主要指场景覆盖要全,并且支持多模态。
端云结合也是各家AI大模型落地手机的一个典型特征,目前各家基本上都是采取端云协同的方式落地大模型,根据官方说法,这主要是出于成本、算力、效率、安全性等多方面因素考虑。
最后,有一点值得注意的是,华为、小米、vivo都在发布会上明确提到了“自研大模型”的概念,而OPPO这边用词为“自主训练的”,发布会全程并未提及“自研”。
在排行榜上,小米和vivo大模型的研究主体都是小米和vivo,而OPPO的研究主体是AndesLM。
整体看下来,虽然各家大模型目前落地功能并没有差异,但是在参数量、架构、关键特性等方面可能仍然有各自的侧重。
ChatGPT火爆至今不过一年多,各家手机厂商能够在这么短的时间内实现AI大模型在手机上的落地,足见其技术实力。
虽然国内的百模大战、千模大战早已上演,甚至有不少玩家已经退场,但相比这些创业公司或者做出一个个“试用产品”的互联网巨头们来说,华为、小米、vivo、OPPO这些头部智能手机厂商们要面对的是上亿的终端用户,这背后涉及到的技术研发量是不容小觑的。
提到技术研发,人才肯定是第一位的。
目前有比较具体研发团队规模公布的是小米和vivo。小米集团总裁卢伟冰曾在财报电话会上提到,小米是在2023年4月组建的AI实验室大模型团队,目前在AI领域的研发人员有1200人左右。
相比之下,vivo这边已公布的AI专家团队规模同为1000人左右,目前发布AI相关专利有700多个,AI顶会论文70多篇。
当然,各家手机厂商在AI领域的布局要远远早于AI大模型的出现,比如小米是几家头部手机厂商中布局AI技术较早的一个,在2016年就成立了小米探索实验室,开始布局VR和智能机器人等方向的技术,而我们熟悉的小米小爱同学智能语音助手就诞生于次年3月。
vivo从2018年开始也在AI领域有所布局,成立了AI全球研究院、人工智能图谱研究院,至今其掌握的13000T多模态数据、2800T中文文本数据都成为AI大模型研发的重要数据资源。
vivo在发布会上提到,这2800T中文文本数据清洗和压缩后产生的15T高质量训练数据用于蓝心大模型训练,而这15T数据已经相当于2.5个中国国家图书馆藏书量。
当然,作为在AI领域同样布局较早的华为,华为云在2020年就开始了盘古大模型的研发,是几家中布局大模型较早的一个,其在2021年4月发布的盘古系列大模型中,就包括了千亿参数中文语言预训练模型,当时华为还在现场演示了对话机器人产品。
OPPO这边,从公开信息来看,相比独立研发,OPPO可能更侧重于产学研结合,2018年OPPO与浙江大学联合成立了创新中心,当时人工智能就已经成为双方重点聚焦的技术创新领域,包括机器视觉、嵌入式AI、感知计算等等。
2022年OPPO和中国科学技术大学联合成立了智能计算联合实验室,AI大模型就是其重要研究领域之一。
除了人才、数据,算力也是AI大模型研发和落地应用中非常关键的一环。对于当下中国AI芯片市场面对的窘境,vivo相关高管曾在发布会上坦言,目前他们在算力建设和部署上压力很大、缺口也很大,高端芯片买不到了,他们需要用更多的技术创新来应对算力缺口,去提升训练效率。由于芯片方面的限制,vivo建设出的计算集群规模要更大一些,能耗也要高一些。
可以看到,今天手机厂商们的AI大模型纷纷落地,实际上离不开各家厂商提前多年在AI领域的布局,多年来各家手机厂商智能语音助手在实际应用中所积累的数据以及研发经验也成为手机厂商们做AI大模型的优势所在。
目前,AI大模型在手机上的应用还处于初期阶段,很多功能仍然处于测试状态,未能实际落地,而从前文提到的各类功能以及模型规模来看,AI大模型在手机端的应用还有不少需要继续优化迭代的方向。
有头部手机厂商相关技术负责人告诉智东西,目前AI大模型技术本身和它的应用场景都在快速迭代发展中,从底层的AI大模型到上层应用都需要时间进一步探索。
虽然目前各家的功能还没有拉开明显差距,但在他看来,在应用层面其实各家是可以打出差异化的,因为每家的产品、技术和生态侧重都有所不同,比如华为是鸿蒙生态,更主要的是手机+车,小米目前主推“人车家”的概念,生态产品规模最大,OPPO和vivo更多是自家生态内设备的落地应用。
应用场景、主要应用设备不同,AI大模型相对应的调整和技术难点也有所不同。
据业内人士透露,虽然参数量很重要,但未来随着算法的迭代、训练方式的优化,以及更高质量训练数据的应用,实际应用中对于模型参数的依赖会越来越小。
从目前各家AI大模型在手机上的落地应用来看,一个“超级助理”+N多个应用了AI大模型技术的App的模式已经成为主流。
当然,未来技术迭代的空间是很大的,比如AI大模型目前距离真正的“智能”还有不少的差距,能够实现本地运行的AI大模型更是如此,同时随着未来AI大模型能力越来越强,需要处理的任务越来越复杂,其对于芯片算力的要求也会更高。
值得一提的是,虽然国内头部智能手机厂商们都已经积极踊跃地加入到了AI大模型之战中,但身为全球智能手机技术“风向标”的苹果似乎仍在观望,或者说是实实在在的慢了。
虽然此前已有各路关于苹果AI大模型的相关爆料信息,但苹果内部AI团队动荡、人才频频流失也是不争的事实,对于苹果来说,想要快速跟进可能是“心有余而力不足”。
三星这边虽然也在上月发布了自家的自研AI大模型“高斯”,但其最早落地应用于手机中也要等到明年Galaxy S24系列的发布了。
在技术创新方面,至少在AI大模型这一波,国产手机是实打实的领先了。
从国内华米OV到海外的三星,智能手机巨头们正积极涌入AI大模型之战,智能手机也在AI大模型的加持下开始经历新一轮“智能化”洗礼,当年智能语音助手们未曾实现的梦,AI大模型似乎要替它们圆了。
不过纵观AI大模型在手机端的落地,目前功能和应用的发展都还处于早期,尤其是主动智能、个性化方面还有很大很大提升空间,目前各家手机端应用的AIGC功能,大多仍然需要云侧大模型支持,未来本地化大模型运行,仍需时日。
当然,未来苹果的入局也是一大看点,苹果能否后来居上甚至搅动产业,都充满不确定性,但我们可以确定的是,AI大模型时代已经到来,手机大模型之战,好戏才刚刚开始。
https://zhidx.com/p/404272.html
Created by Tan KW | Nov 09, 2024
Created by Tan KW | Nov 09, 2024
Created by Tan KW | Nov 09, 2024
Created by Tan KW | Nov 09, 2024