大模型加持下,人形机器人从科幻走向现实

大模型加持下,人形机器人从科幻走向现实-创新湾

本文来自微信公众号:甲子光年(ID:jazzyear),作者:八度、七月‍‍,编辑:栗子,原文标题:《AI变革的头号玩家,为什么是机器人?》,头图:文心一格生成

2023年的机器人行业火到什么程度呢?

达闼机器人创始人黄晓庆用“疯狂”二字来形容。中国目前每天成立一个人形机器人公司汽车行业的零部件制造商正全方位地向机器人行业靠拢,把生产能力往机器人方向倾斜,显然瞄准了机器人庞大的蓝海市场,以此开辟第二战场。

当前我国作为世界机器人第一大市场,机器人销量占世界总销量的50%以上。随着新型工业化的加速推进,越来越多的领域对机器人提出了需求:给机器人装上“大脑”,想人类之所想;安上“电子鼻”、“电子皮肤”,感人类之所感。

对于AI与机器人的碰撞,有个形象的比喻:人工智能是魂,机器人是身体,“形魂相容”也被视为未来机器人发展的目标。

随着ChatGPT爆火,AIGC应用走到台前,大模型从C端到B端突破不断。人们在不断寻求大模型的最佳落地点和载体时,通用智能机器人就这样猝不及防闯入人们的视野,成为今年的新热点。

只是在火热的背后,仍不乏一些冷静的思考:机器人大模型目前还只是停留在学术层面的概念,仍需要工业界的力量来推动飞轮向前滚动;对于客户来说,机器人用不用AI不重要,重要的是产品能否如期交付,成本是否划算。

在众人期待的通用智能机器人时代到来前,不妨让子弹再飞一会。

当通用智能机器人成为热点

2023年被视作通用人工智能发展的元年,对于通用智能机器人行业也是如此。

智能机器人将是继个人计算机、智能手机之后的人类第三台‘计算机’”,黄晓庆做出这样的判断,“机器人的问题归根结底其实是一个人工智能的问题。”

过去的机器人没有办法完成很复杂的操作、推理和计算,本质的原因就是没有足够的算力,没有办法同时处理多模态的数据。而现在,蓬勃发展的人工智能,将赋予机器人更多潜力和可能性。

事实上,在机器人领域使用人工智能早已不是新鲜事了。多年以来,视觉和智能学习能力已经逐渐被集成到机器人中。机器人在许多人类难以胜任的任务,如繁重、重复、枯燥、肮脏或危险的任务上都表现出色。

只是在更高算力和更多数据的支撑下,人工智能使得机器人在完成这些任务时更加游刃有余:它们具有更强的学习能力,能够通过经验而非编程学习;能够在动态变化的环境中工作,或与人类一同工作。

谷歌旗下的AI团队DeepMind也放出大招,展示了用于机器人的AI智能体“RoboCat”。

RoboCat是全球第一个可以解决和适应多种任务的机器人AI智能体,“通用性学习能力”是RoboCat的强项。除了“学得多”外,RoboCat还能“学得快”,这些能力将极大减少人类监督训练的需求,这是创造通用机器人非常重要的一环。

当把时间线往回拉,从最早的机械臂、到外骨骼机器人、再到四足机器人、人形机器人,一座难度系数逐级攀升的机器人产业高山,渐次被攻下。

马斯克在社交媒体上发布了特斯拉第二代人形机器人Optimus Gen2的演示视频,视频中显示,Optimus第二代机器人再第二代大模型的加持下,行走更加灵活,能够轻松完成深蹲站立的动作,还能准确地抓取、拿起、放下鸡蛋,物体操控能力提升明显。此外,第二代机器人的平衡感和身体控制能力也都得到显著改善,步行速度也提升了30%。

这意味着在AI的助力下,人形机器人又向前迈进一大步。

此前,在特斯拉股东大会上,马斯克更是大胆预测,未来人形机器人的需求量将远远超过电动车。“如果人形机器人和人的比例是2:1左右,那么未来人们对机器人的需求量可能是100亿乃至200亿个,这是一个令人疯狂的数字”。

一项项叙事让通用智能机器人成为今年热点新话题,也让行业的水温几度沸腾。

中关村发展集团启航投资副总裁郑鸾表示,在今年之前,我们对于机器人行业的投资大都集中于某一类特定的、专业的垂直场景,通用智能机器人是今年一个新的热点话题。‍

AI正在深度变革机器人

当AI遇见机器人,会碰撞出怎样的火花?

高新兴机器人创始人柏林给这个问题下的判断,是“具身智能将重塑巡逻机器人”。重塑,也就意味着将改变原有范式,创造新范式。

所谓具身智能,是指有身体并支持物理交互的智能体,可以让AGI从数字世界走向实体世界,走向机器人、无人机、无人车,从而与环境形成交互感知。

“产业界会认为,只有AI软件是不够的,必须要有能够驱动物理的实体——机器人。所以我们的理解是,大模型在机器人扮演中着推理的决策,实际上这个过程也需要机器人来进行系统重构。”柏林说道。

AI与机器人,在这个维度上显得相辅相成。

如果我们问ChatGPT一个问题:“帮我拿一个面包吃可以吗?”它能够理解你的意思,但显然它并不能真的给你去拿一个面包。而一旦拥有具身智能机器人的协同,就能够让其在理解之后并操作执行,帮助拿到面包。这是大模型与具身智能机器人结合的火花。

事实上,这样的“科幻”画面已经照进现实。

”阿里云工程师通过钉钉对话框向机器人发出指令:“我渴了,找点东西喝吧。”千问大模型立即理解了指令内容,并回答:“好的,我找找有什么喝的。”

随后,千问大模型在后台自动编写了一组代码发给机器人,机器人开始识别周边环境,从附近的桌上找到一瓶水,并自动完成移动、抓取、配送等一系列动作,顺利递送给工程师。

被誉为“AI女神”的华裔美国科学家李飞飞发布了具身智能的最新成果,将大模型接入机器人,无需额外数据和训练,就能把复杂指令转化成具体行动规划。

比如说桌上有一个小抽屉,她下达机器人指令:“打开上面的抽屉,同时小心不要碰到花瓶”。大语言模型+视觉语言模型,就能从3D空间中分析出目标和需要绕过的障碍,帮助机器人做行动规划。

目前普遍的共识是,机器人拥抱AI大模型的过程就是具身智能机器人的实现过程,融合AI大模型的具身智能机器人将是未来机器人的主要发展方向。

柏林表示,具身智能一方面会提升和改善机器人的技能,另一方面可以增强用户体验。“具身智能将让巡检机器人和管理人员更有效地沟通。这个过程解决了怎样更懂人的问题,通过交互感知使机器人学习并了解电力场景,解决更内行的问题。”

在此之前,人工智能对机器人的改变早有端倪。

特行科技战略投融资部总经理焦儒透露,在服务机器人领域,CV(计算机视觉)已经有很多的应用落地了,特别是在人脸识别、预警和巡控机器人等方面;而NLP(自然语言处理)方面,大模型的推动可以加速人和机器人之间的交互,使问答更加顺畅和智能化。

从感知层面来看,多模态模型也有所应用。例如,在自动驾驶领域中,如果之前我们没有训练过某些场景,多模态模型可以帮助机器人展现出更高的精准度和安全性。

毫无疑问,机器人是一个非常系统化的过程。有一个比喻则很好地说明了这个本质:“机器人整个系统就像一个乐团,而AI能提升的是某个乐手的极致表现”。

从商业机器人的角度来看,大模型以及AI的应用,让机器人更加人性化了。

举个例子,如果在一个景区有一些做冰淇淋或奶茶的机器人,人们能感受到机器人的科技性能。倘若机器人还能跟游客聊天、逗小朋友并讲述景区的故事,这将进一步提升游客的体验。在大模型的应用下,机器人可以拥有与人类相似的思考方式和表达能力。

此外,机器人本身具有云-边-端的计算能力。有了这个载体,AI在机器人领域能够创新更多的玩法。

那么,这些玩法是不是受到市场认可了呢?

让“子弹”再飞一会儿

技术研发的真正落地,在此时此刻显得至关重要。

源码资本作为一家创业投资机构,在过去九年多时间里投资了300多家公司,其中有20多家是机器人公司,比如云鲸智能、梅卡曼德、海柔创新、猩猿哲、斯坦德、擎朗、橡鹭科技等。一直以来,源码资本都非常关注机器人行业,也积累了很多投资经验和教训。

身为一线投资从业者,源码资本执行董事陈润泽表示:“客户不关心机器人用不用AI,客户只关心两个问题:第一个是能不能完成节拍精度、通量等性能要求;第二个是成本是否划算,这包括机器人本身的成本以及交付的成本。

能否落到实处,也是投资行业最为关心的一件事。

“我们应该感到审慎。年初时,我们发现机器人在操作能力方面提升得非常快,可以很快地抓取刚性物体,甚至也能操作衣服、塑料袋等可变形物体。但我们在学术社区得到的反馈是,这些技术成熟需要时间,需要工业界的力量来推动数据飞轮向前滚动。机器人大模型,这在今天还是一个概念,我们需要时间和努力来将这个概念变为现实。”陈润泽补充道。

特行科技战略投融资部总经理焦儒也对此表达了相似的观点。人形机器人和具身智能的出现,机构投资者更加关注技术研发的实力以及是否能够实现所宣称的技术能力。

因此,投资者对于机器人行业的关注点已经从单纯的财务指标转向了技术研发实力和市场潜力等方面。

无论是在大模型、技术还是行业中,投资人更关注的是解决方案是否真正解决了客户的实际问题,并为其带来多少收益。他们关心这种收益能否复制到其他公司,以及公司在行业内是否具有深厚的专业知识和理解,成为行业的领先者。

事实上,今年的机器人投资热度不及往年,投资变得更加理性和坚定。

正所谓“AI一日,人间十年”。今年大家对AI的关注度特别高,讨论的热度也非常之高,但真正反映在销量或增速上,远远没有达到人们热议的高度。

相反,当下的投资环境,募投双降、退出难,对于一级市场投资人来说,这是一个“先相信,后看见”的市场:AI遇上机器人,有机会,也有挑战。

机器人能够随着数据的积累和扩大,不断提高自主决策和执行能力,具备高级别的自主决策能力是判断机器人智能化程度的重要标准,而这一点需要时间来验证。

黄庭坚的《登快阁》中有这么一句诗:“落木千山天远大,澄江一道月分明”。郑鸾认为这句诗与当前的机器人投资处境颇为相似:初冬时天气变冷,树木凋零,但也使得山川更加寂寥,天空更加辽阔,江水也更加分明地向远处的朗朗明月流去。

时代变革之中,真正伟大的企业可能正在我们身边孕育。

本内容为作者独立观点,不代表创新湾(ID:EnnoBay)立场。如有异议,请与我们联系。创新湾聚焦新科技、新产业领域,致力于记录中国科创力量,让更多人洞见未来。(报道、转载、进群,联系微信:EnnoBay2020)

大模型加持下,人形机器人从科幻走向现实-创新湾

大模型加持下,人形机器人从科幻走向现实-创新湾

扫码进群

您的浏览器不支持 HTML5 canvas 标签。 下载图片