羊城晚报全媒体记者 李钢
“我最喜欢看人形机器人了,看得我汗毛都竖起来了。”一位参观者在走进进博会展馆后,向羊城晚报记者道出了自己最真实的感受。正在举办的第七届中国国际进口博览会,俨然成为人形机器人厂商的竞技场。跳舞的跳舞,奔跑的奔跑,充电的充电,就连Tesla Bot也来现场“发个呆”。
只是,看完各个流派的展示,你依然会有疑问:要想真正走进家庭,这些仍然“呆笨”的机器人依然不够好。那究竟还差些什么?
众多厂商在人形机器人产品的商业化路径上都差不多:先服务工业场景,再进入商业服务,最后才是走入家庭、服务大众。业界对于实现走进家庭的时间预测也并不相同,唯一相同的是,大家都认为不能在短期内实现。显然,他们也知道,作为民用商品,人形机器人的进化之路仍需时日。
在与南方科技大学机器人研究院院长戴建生的对话中,记者曾经问过这样一个问题:如果让人形机器人抱起一名失能老人,如何保证老人能够获得舒适的体感?这其实是两个问题:一个是“抱”,一个是“舒适”。
对于人类护理者来说,只要有足够的体能,这并不是什么问题,通过手臂、躯体的姿态调整,就可以达到这一目的。而对于机器人而言,这却是一个大大的难题:人体不是物品,不仅个体的体型、体重不同,对于外力的耐受能力也不尽相同。因此,你可以看到,目前人形机器人的各种能力展示都局限在对“物”的操作,因为“物”没有感受。
对此,戴建生认为,除了传感器、算法等软硬件优化之外,更重要的是数据的获取和训练。但这背后有种矛盾。对于大众消费者而言,他们希望人形机器人能像科幻电影中的机器人管家那样,能进行有情感的互动、将家庭事务处理得井井有条,成为无所不知的工作助手。对于业界来说,如果没有真实家庭场景下大规模的数据获取,显然无法让人形机器人达到前述要求。
目前,人形机器人领域的重点依然是从仿真场景中获取数据。此前,有业界人士描述了他们正在建设的大型仿真中心:模拟真实场景,不停训练机器人。而Mobile ALOHA项目则提出了另一种解题思路:利用操控系统来收集数据,并通过监督行为克隆的方式进行训练。有人已经指出,特斯拉Optimus在“派对”上的丝滑表现,同样是基于遥控作业。一旦让它自主,大概率会翻车。
在某具身智能社区中,有人提出了一种基于视觉和音频数据学习的训练方法,颇为动人。这种方法强调视频和音频的反馈,譬如,在一项擦拭任务中,机器人被要求擦掉白板上的图案。挑战之处在于,要让机器人在移动橡皮擦的同时对白板施加合理的接触力。仅凭图像很难推断出橡皮擦是否接触到了白板,而在结合音频反馈后,整体的成功率从40%提高了85%——一个相当不错的成绩。但这还仅仅是让机器人完成了一个人类的简单动作,能否推广仍待考量。距离能够舒适地抱起失能者,更是长途漫漫。
可以说,无论采取何种方式获取数据,都有其局限性。要让人形机器人完成更为复杂的动作,核心问题依然是如何获得高质量数据,并有效利用获取的数据继续训练。而我们所期待的,则是能够出现一些细节技术的突破,让这一逻辑运行得更加“丝滑”。