Future Tech

[转贴] 大模型打开机器人觉醒之门!席卷新工业革命

Tan KW
Publish date: Fri, 16 Aug 2024, 05:29 AM
Tan KW
0 466,970
Future Tech

智东西(公众号:zhidxcom)
作者 |  程茜
编辑 |  漠影

今年初,家用机器人Mobile ALOHA火爆出圈,炒菜、洗碗、扫地、逗猫、叠衣服样样精通,堪称全能管家;时隔半年,原班团队再度推出机器人自主导航基础模型Mobility VLA,机器人在公司转一圈就能听从人类语音指令,快速变身导航员。

像这样逐渐深入我们生活的机器人越来越多,做咖啡、打扫卫生、酒店配送,甚至连按摩、作手术、康复训练等诸多岗位上都出现了机器人的身影。

但即便如此,这些机器人也只是按部就班、听命行事,距离电影中高度智能的机器人形象仍相距甚远。

AI技术革命,并非一蹴而就,横空出世,而是在科技历史长河中持续地发生。2022年底,以生成式人工智能 ChatGPT为起点的大语言模型(LLM),带来人机对话交互变革。2024年,LAM(大型动作模型)正在起势,机器人觉醒新纪元来临。

大模型打开机器人觉醒之门!席卷新工业革命

具身智能已经在实际场景中落地应用,重构了生产关系,对生产力起到了颠覆意义,正在助推着新工业革命。可以说,AI为科幻电影中具有高度智能的机器人走出银幕搭起了阶梯。

作为新质生产力代表的具身智能联想晨星足式机器人GS应运而生,这也是大模型与物理世界交互的最领先成果之一,作用于现实世界,具身智能具有更深远的意义和影响。伴随2024/2025财年Q1财报,联想集团发布第三季硬核知识科普视频的第一集《具身智能:人工智能如何成为人》。

大模型打开机器人觉醒之门!席卷新工业革命

视频中采用了桌面电影形式的融合创新。极具《权力的游戏》风格的开场片头,以串联着机器人领域完整技术发展关系图谱的科技树为线索,带领观众在时间中穿梭,重新探索机器人科技树图谱下三个技术路径的竞技与角逐。在讲述中同时打碎重构桌面元素,让信息在观众、主角IP和桌面中流动传递。

大模型打开机器人觉醒之门!席卷新工业革命

此外,视频中以英国科技历史学家、生物化学家、中科院外籍院士李约瑟为原型打造的智能体,也是一大亮点。立足于2100年的赛博版李约瑟,以未来的第一人称视角首次为观众呈现具身智能完整的技术史观,也在其中展示了新工业革命时代的革命先锋——联想晨星足式机器人GS如何深入工业场景,看到联想集团使AI向实,帮助千行百业真正应用AI,释放生产力还智于业,完成变革,可谓是一支带有十足革命感和大历史观的视频大片。

一、百年技术角逐碰撞,唤醒具身智能机器人

1959年,世界上第一台机器人Unimate被安装在汽车工厂的装配线上,彼时其只能完成辅助汽车生产的简单、重复任务;60余年后,各种类人、足式机器人出现,大型商超、工业园区的巡逻安防、全天候的电力巡检、消防应急救援、做咖啡等诸多场景都出现了机器人的身影。

与机器人形态发展的前提是技术的进阶,随着各项能力被慢慢点亮,机器人科技树逐渐枝繁叶茂。

从联想集团财报视频打造的科技树起点可看到,最先点亮机器人应用能力的是工业,在第一台机械手臂Unimate所在的技术路径上,数控技术、工业机器人、机械手臂等技术被点亮。

大模型打开机器人觉醒之门!席卷新工业革命

在此之上,斯坦福大学研究人员发明的Stanford Arm拥有6个自由度,奠定了工业机器人的标准化基础。20世纪70年代初期,第一台由电动机驱动的工业机器人FAMULUS问世,ABB机器人(原ASEA)推出IRB 6,世界上首台全电动微型处理器控制的机器人发布,使得工业机器人发展飞速,科技树的这一支线也走向成熟。

但机器人的形态就稳固于此了嘛?机器人科技树发展的第二条技术路径给出了答案。在“工业”技术路径发展初期,机器人另一条技术路径也开始萌芽——“移动”。

这条技术路径中最直观的变化就是机器人形态。1970年前后,美国斯坦福国际研究所开发了首台移动机器人Shakey,它可以做到自主感知、环境建模、行动规划并执行任务,不过当时受限于计算机体积以及运算速度,Shakey往往需要耗费数个小时完成任务。

机器人在移动领域的技术节点被点亮,并且实现了与工业机器人技术路径的交叉。这些贯穿着前后数十年历程的技术节点,铸成了机器人“觉醒之门”的钥匙,成为让机器人走出工厂、走进家庭、商场等场景的关键技术支持。

科技树的第三条支线“智能与神经”迎来爆发,这也正是打造出能满足人们对机器人终极幻想的关键条件。

1950年,内置光传感器、触摸传感器、推进及转向电机的电子乌龟诞生,可以摸索着向有光亮的地方前进,并在遇到障碍时改变方向,使得机器人展现出了拥有“生物智慧”的潜力。直到2016年,一场AlphaGo战胜李世石的世纪决战,成为机器人发展的标志性时刻。

在智能与神经与工业、移动三支技术支线相互碰撞的时刻,早在1950年就已经被提出的智能体、具身智能概念,今年终于展现出了成为现实的可能。

大模型打开机器人觉醒之门!席卷新工业革命

二、嵌入大模型与体验,联想具身智能“上岗”三大场景

如今“以机器人之躯,承载AI的灵魂”,已成为当下这一产业的热门议题。

智慧最先只出现在虚拟世界当中。

早年间,DeepMind连发三篇论文,阐释了通过机器学习教导AI自主学习走路;OpenAI基于强化学习让智能体掌握了各种捉迷藏套路,并掌握了多种隐藏策略。后来,麻省理工学院的研究小组基于机器学习技术,让“粘液”机器人具备了改变形状完成复杂任务的潜力,于是大模型和物理世界产生连接。

大模型打开机器人觉醒之门!席卷新工业革命

这就是视频中提到的“离身智能”,视频中呈现的这场1963年的实验,说明了“离身智能”与“具身智能”的关键区别。

实验中笼子里的两只猫,一只可以主动正常行走,另一只只能被动行走,最后的结果是被动行走的猫无法应用对环境深度感知的能力。

大模型打开机器人觉醒之门!席卷新工业革命

因此,实现具身智能最关键的就是自主感知、亲身体验,这也是扩宽机器人在产业场景中应用空间的先决条件。

机器人此前被应用于具体场景时,往往只能依赖于在软件中学习的经验,或者仅完成简单的重复性任务。但对于危险系数高的环境、人不方便进入的狭窄危险区域而言,机器人需要更高的智能属性,才能应对这些场景,并真正辅助人类完成任务。

正如我们在视频中看到,从科技树中具身智能这一节点走进现实的还有联想晨星足式机器人GS,就是当下机器人承载AI灵魂,并能真正满足企业对于新质生产力的急迫需求的集大成者。

大模型打开机器人觉醒之门!席卷新工业革命

联想集团要做的是真正让懂人话、会规划的机器人走出实验室,落地到场景中——还智于业。

联想晨星足式机器人GS已经从单纯的听令行事,演进为可通过理解自然语言执行复杂任务,且能够自主纠错应对特殊情况。

根据面对开放动态环境提出的具身导航框架,机器人可以基于大语言模型理解自然语言指令,将复杂指令分解成不同的动作序列,然后机器人基于状态、任务需求协调动作网络。

在执行任务、规划行走路径时,机器人通过大模型和长短记忆可以推测目标方位,从而结合3D语义地图给出的物体关系对制定目标进行搜寻。

大模型打开机器人觉醒之门!席卷新工业革命

此外,联想集团还利用了生成式AI建立典型场景的随机环境并加入物理引擎,采用强化学习训练机器人行走和探索,优化探索策略。

在形态的设计方面,联想晨星足式机器人GS也始终服务于落地应用这一终极目标。

不同于常见的四足设计,它基于六足实现了三角静态稳定步态,拥有能应对全地形的移动能力,爬楼梯、过斜坡、穿越崎岖路面都不在话下。

另外,运动过程中的稳定,也能保证搭载在其之上的传感器采集到的图像清晰、稳定、一致性强,并能减少磕碰,延长使用寿命。

同时,机器人实际应用场景中为了完整复杂任务往往需要搭载机械臂辅助完成,但受限于稳定性等因素,人形、四足机器人等可搭载的机械臂重量有限,而联想晨星足式机器人GS负载能力达到100公斤级,因此在实际场景中的应用空间更大。

工业巡检操作、应急救援支持、野外勘测任务这三大场景则成为其率先落地应用的任务。

在工业巡检操作中,联想晨星足式机器人GS可以实现自主巡检、定位故障、收集数据,以提供工业设备的运行效率和安全性。应急救援支持时,会遇到一些极端天气,达到IP66防水等级的足式机器人可以在灾难现场快速响应,实现救援搜救、物资运输等任务。面对野外地形勘探任务,它还能实现高效精准的地形测绘、资源勘探、环境监测。

大模型打开机器人觉醒之门!席卷新工业革命

还有,联想投资的清华系机器人创企星动纪元,已经成长为国内人形机器人产业的代表企业,开发了具身智能人形机器人全栈技术架构,推出了全尺寸人形机器人XBOT。在不依赖预先编程和遥控操作的情况下,XBOT能完成全自主任务实现和规划导航。

此外,人形机器人Figure 02也开始“进厂打工”。不仅外形更像人,还能实现与人类语音对话。Figure 02可直接作用于汽车工厂的生产制造环境,已具备执行通常对人类工人具有挑战性的复杂任务的能力,如将钣金件插入特定固定装置这一汽车底盘组装中的关键步骤。

这一刻机器人的技术革命与场景应用的成果已经达到了新的阶段,人形、足式、轮式以及各类仿生形态的机器人落地到工业场景中,打通物理与信息世界边界的标志性时刻到来。

大模型打开机器人觉醒之门!席卷新工业革命

三、联想集团使AI向实,为生产力变革注入强劲动力

联想集团首款晨星机器人到如今的晨星足式机器人GS,在形态、能力变迁中已经变为了一台拥有感知、思考和行动能力的智能体。

可以说,联想晨星足式机器人GS是前沿技术与落地应用,在当下这一发展节点碰撞出的必然成功。

再看视频中的科技树,其技术延展的进程正在从终身智能、情感智能、伦理与公平到仿生手指,让这些人类曾赋予无限想象空间的智能体将成为现实。

大模型打开机器人觉醒之门!席卷新工业革命

或许在未来某个时刻,伴随着机器人科技树枝桠继续延伸,最终的智能体将与人的形象接近重合,从而实现技术狂想与现实世界的交织。

大模型打开机器人觉醒之门!席卷新工业革命

AI领域的技术突破与落地应用的研究一直齐头并进,人工智能革命正在发生,我们亲身感知到的,或许只是其中分支,而具身智能在新工业革命中有着更深远的意义和影响。联想集团董事长兼CEO杨元庆说道,联想集团要做的就是: “让人工智能走下云端,真正落地,走进千家万户千行百业。”

联想集团实现机器人从辅助决策、能力增强到实现产业应用落地的变迁。使AI向实,推动了AI社会的进程,让AI与千行百业紧密连接。

大模型打开机器人觉醒之门!席卷新工业革命

真正的AI时代应该基于以人为本、多元丰富的智能技术理念,将效率优势和创新优势兼收并蓄,释放个体的创造力和生产力,使经济与社会发展的动能倍增,从而构建人本智能的璀璨未来。联想正围绕着“Smarter AI for all” 的愿景,催化助力AI落地应用。

 

https://zhidx.com/p/436353.html

 

Discussions
Be the first to like this. Showing 0 of 0 comments

Post a Comment