在2024中国算力大会主论坛上,中国工程院外籍院士张建伟介绍了多模态具身智能面临的机遇与挑战。他表示,未来的人工智能,尤其是在具身智能方面将有巨大发展空间。
张建伟表示:“十年前,我们在实验室里已开始讨论,如果一个机器人把全世界的知识、书籍和文章都读进去后,会出现什么样的场景。今天我们看到,多模态大模型初露端倪,语言大模型走进千家万户,从ChatGPT的诞生到今天多模态智能的出现,使得我们在具身智能方面有了非常好的基础。”在他看来,从典型信息空间的非具身智能,到未来能够掌握时间信息、空间信息、逻辑信息的具身智能,都是数字经济和实体经济融合的重要应用点,也是算力能够真正创造价值的重要课题。从人形机器人到自动驾驶,再到未来医疗、未来制造和个人助理等,具身智能将发挥重要作用。
张建伟介绍,在前30年中,实现具身智能的方法基本上是模块化编程,但在具身智能时代,可以用孩子进化和生物进化的机理进行具身智能的学习。从被动的感知到交互的感知、强化的想象,再到机器人的具身,智能系统不断出现新范式。比如,我们现在研制的会打乒乓球的机器人,每天都在“增长本领”。通过把26个电极融到机器人头部,使其具有共情能力,从而打造能够操作、交互、执行的人形机器人。
张建伟表示,在具身智能空间里,我们更关心多模态的信息处理,如何把语言和视觉、听觉、味觉、触觉等深度融合起来,解决制造、医疗等问题。未来,多模态的信息处理,可以把各种各样的异构数据融合在一起,进行有效的深度学习。
“具身智能的诞生与我们生活生产的实际需求紧密契合,未来我们希望机器人从结构化的工厂走向千家万户,在任务不断变化的情况下也能通过具身智能学到新的本领。”张建伟表示。
张建伟表示,通用具身智能实际上在数据方面给我们提出了巨大的挑战,语言文本的智能其实是“金字塔最下端”,它的处理是最方便、最有效的。但是对于具身智能来说,图像、触觉、机器人的本体感觉等数据的获取和高质量处理至关重要,我们通过整合不断进化的模型和遥操作创造的真实世界的数据,把多模态的信息融合在一起,推进具身智能的应用。
张建伟表示,未来,算法、数据和硬件将会融为一体,我们要把新的具身智能和算力融合在一起,真正解决物理世界的痛点问题,让我们共同关注伦理治理,产学研国际合作,应对全球的重大挑战,跨学科交叉协同,共创和谐社会和美好生活。
编辑:曹倩 于莉莉
智能机器人中国工程院 新浪科技公众号“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)
相关新闻