《科创板日报》7月11日讯(编辑 宋子乔)通过嵌入大语言模型,机器人变得更加智能,将视觉模型也堆上去,机器人会有怎样的提升呢?
(资料图片)
AI科学家李飞飞带领的团队日前发布了具身智能最新成果:大模型接入机器人,把复杂指令转化成具体行动规划,人类可以很随意地用自然语言给机器人下达指令。更重要的是,通过将LLM(大语言模型)+VLM(视觉语言模型)结合在一起,机器人与环境进行交互的能力进一步提升,无需额外数据和训练便可完成任务。
李飞飞团队将该系统命名为VoxPoser,相比传统方法需要进行额外的预训练,这个方法让机器人在零样本的前提下完成了,解决了机器人训练数据稀缺的问题。
李飞飞是华裔女科学家、世界顶尖的AI专家,现为美国斯坦福大学终身教授、斯坦福大学人工智能实验室主任,曾任谷歌副总裁和谷歌云首席科学家。前Open AI研究员、曾担任特斯拉人工智能和自动驾驶视觉总监的Andrej Karpathy便是其得意弟子。
李飞飞研究领域涉及计算机视觉、机器学习、深度学习、认知神经科学等,而近年来其关注的重点聚焦在AI智能体,即具身智能。在她看来,计算机视觉未来的重点方向就是具身智能,她认为,具身AI可能会给我们带来一次重大的转变,从识别图像等机器学习的简单能力,转变到学习如何通过多个步骤执行复杂的类人任务,如制作煎蛋卷。
▌不仅能听懂人话 还不需要额外数据和训练
回到VoxPoser,为什么说它是具身智能领域的一大突破?当然不是因为李飞飞本人的学术地位。
VoxPoser解决了机器人训练的一大难题——数据稀缺。
VoxPoser的研究工作中,通过将LLM(大语言模型)+VLM(视觉语言模型)结合在一起,可实现“人类自然语言输入——代码生成反馈给机器人——机器人收到指令并规划路径——最终完成任务”。
这个流程的意义在于,机器人的交互能力大大提高,通过LLM+VLM拥有了眼睛和理解力,相当于拥有了人类一样学习能力,即从现实环境中收集数据实时学习,而不是依赖于提前录入的数据库“遇题找答案”。
李飞飞团队也表示,这些操作均不需要进行任何训练或使用基本操作,只要掌握了以上基本流程,就可以完成任何给定任务,实现了在真实世界中的零样本机器人操纵。
在数据对机器学习的重要性和数据获得的难度上,李飞飞有着十足的话语权。她在2006主导构建的ImageNet数据集是世界首个用于计算机视觉算法的大规模人工标注照片数据集,它包含了超千万张有标签的图像,可以用来训练复杂的机器学习模型,被誉为改变人工智能历史的数据集。但这些数据的收集、处理工作异常艰巨,来自全球167个国家近5万名工作者以众包的方式花费三年时间才完成。
如何解决训练数据稀缺的难题,将成为具身智能乃至人工智能发展过程中的第一大拦路虎。
在2022年的论文中,李飞飞旗帜鲜明地表示,随着人工智能的成熟,人工智能模型的建立正变得越来越容易,包括亚马逊、谷歌和微软在内的公司都提供自动机器学习(AutoML)产品,允许用户在自己的数据上建立最先进的人工智能模型,而无需编写任何代码。但由于规划和注释的成本,为人工智能创建数据集仍然是一个主要的痛点,创建适当的数据集和数据管道以开发和评估AI模型越来越成为最大的挑战。
VoxPoser目前还存在着一定的局限性,它依赖于外部感知模块,仍需要为嵌入的大模型手动输入提示词,仍需要通用的动力学模型来完成更丰富的动作等。
不过,学术界、业界对此议论纷纷。一位前微软研究员评价,这项研究走在了人工智能系统最重要和最复杂的前沿。另有DeepMind研究员、人形机器人初创公司Figure创始人等为这项研报“点赞”。
VoxPoser项目已开辟官网,相关论文已上线,代码即将推出。当下李飞飞团队只是迈出了第一步。这一框架将有何改进、未来会怎样应用在机器人产品上,我们拭目以待。
标签:
数据稀缺阻碍具身智能进步?顶尖科学家抛出方案:“大模型+机器视觉”实现零样本操...
《科创板日报》7月11日讯(编辑宋子乔)通过嵌入大语言模型,机器人变
曾是天坑专业,如今却成“金饭碗”:就业率100%,殡葬学的爆火与真实
撕下“污名化”标签,殡葬学的“冷热变迁”。作者:朱末来源:快刀财经
张兰败诉!9.8亿元必须得还,女强人又狠狠跌了一跤
近日,新加坡高等法院宣判了张兰的上诉结果:驳回上诉,维持原判。这意
乘用车零售本世纪以来首次逐月环比增长 电动智能结构性增长显著
乘联会数据显示,2023年6月乘用车市场零售达到189 4万辆,同比下降2 6%
本周9只银行股登记分红,建设银行现金分红近1000亿!银行业ETF(512820)冲高回调
A股三大指数今日集体收涨,沪指涨0 22%,深证成指涨0 50%,创业板指涨1
暑期游持续升温旅游酒店集体上涨,Q2业绩现拐点中国中免A+H放量大涨
7月10日,旅游酒店板块高开高走,成交量温和放大。Choice数据显示,旅
中小板运输股票排名(市值排行榜)
中小板运输股票排名(市值排行榜),...
2023年汽车下乡龙头股有一览(2023/7/11)
2023年汽车下乡龙头股有一览(2023...
a股桥梁板利好股有哪些?哪些桥梁板板块个股受利好?
a股桥梁板利好股有哪些?哪些桥梁...
彩盒上市公司有哪些?2023年彩盒概念龙头股一览
彩盒上市公司有哪些?2023年彩盒概...
收藏!灯具概念股盘点(7/11)
收藏!灯具概念股盘点(7 11),灯...
雄安发布政策做好住房租赁合同备案
为进一步做好住房租赁合同备案工作...
广州住建局住房租赁资金监管工作公开征求意见
近日,为加强住房租赁市场管理,规...
福建加快5G网络在旅游景点等深度覆盖
近日,福建省人民政府办公厅印发了...
豫园股份:2023上半年短期闲置资金综合管理实现收益47.42万元
近日,上海豫园旅游商城(集团)股份...
九华旅游:实际控制人拟变更为池州市政府国资委
7月10日晚间,九华旅游发布公告称...
19家景区入选2023年海南“省级文明旅游示范单位”
7月10日,海南省旅游诚信建设指导...
北京动物园大熊猫馆7月17日-19日临时闭馆
据“北京动物园”公众号消息,为满...
2023年硫磺板块股票龙头一览(7月11日)
2023年硫磺板块股票龙头一览(7月1...
包河租赁正式更名为滨纷逸居;深圳迎首家国企企业公寓 | 迈点住房租赁周报
焦点关注01、深圳“共有产权房”管...
赛维时代预计哪天上市?301381上市日期查询
赛维时代预计哪天上市?301381上市...
中国车企出海:在泰国,已经开始抢日本的饭碗了
出海观察 产业观察 立足泰国...
晓鸣股份2023年6月鸡产品销售收入环比下降26.07%
2023年7月10日,晓鸣股份(300967 ...
华嵘控股拟购资产疑云:标的公司亏损,收购尚未完成拟提供借款
《电鳗财经》孙耀琦 文业绩遇困、...
顺丰控股发布中期业绩预告,速运业务超行业增长,扣非后净利润最高或至37.4亿元,...
7月7日晚间,顺丰控股(002352)发...