专栏名称: 腾讯科技

只供应最有营养的科技大餐！

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

XRSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

英伟达的机器人新魔咒：一句指令让双足机器人“自由”行动

腾讯科技 · 公众号 · 科技媒体 · 2024-12-11 12:11

主要观点总结

本文介绍了加州大学研究人员和英伟达共同提出的新型机器人导航模型NaVILA，该模型使机器人能够听懂人类的自然语言指令，并结合实时的视觉图像和激光雷达信息自主导航到指定位置。文中详细阐述了NaVILA模型的核心创新点，如不需要预先的地图，能在更多复杂场景中具备跨越障碍和自适应路径规划的能力。同时介绍了该模型的技术原理，包括高层控制器（视觉-语言-行动（VLA）模型）和低层控制器的作用，以及NaVILA如何帮助机器人变得更通用。此外，文章还讨论了NaVILA在腿式机器人导航方面的新可能性和应用场景，如家庭场景、搜索救援等。

关键观点总结

关键观点1: NaVILA模型的核心创新点

不需要预先的地图，机器人只需“听懂”人类的自然语言指令，结合实时的视觉图像和激光雷达信息，就可以自主导航到指定位置。

关键观点2: NaVILA的技术原理

包括高层控制器（视觉-语言-行动（VLA）模型）和低层控制器的作用，通过这两套机制实现“无图导航”。其中高层控制器通过视觉-语言-行动（VLA）模型解析自然语言指令和摄像头图像，生成路径规划表和高层动作指令。低层控制器则负责控制机器人具体的关节动作。

关键观点3: NaVILA带来的新可能性和应用场景

将导航技术从轮式机器人延展到了腿式机器人，使机器人在更多复杂场景中具备跨越障碍和自适应路径规划的能力。此外，NaVILA还将高层次的路径规划与底层的腿式运动解耦，使得同一套VLA控制逻辑可以适配不同的机器人平台。应用场景包括家庭场景、搜索救援等。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

面包板社区 · 拆解68配列3模机械键盘：矩阵键盘/电路/芯片全解析！

13 小时前

新浪科技 · 【搬运800公斤物品不在话下！库卡搬运机器人亮相】8月8日-12-20250809175726

昨天

36氪 · 这个夏天，打工人的眼泪为小妖怪流

2 天前

新浪科技 · 【#日本公务员将获34年来最大幅度加薪#】日本公务员即将获得34-20250807223000

3 天前

新浪科技 · 【#特斯拉在全球已建设超7万个超充桩#】特斯拉公司副总裁@Gra-20250807211637

3 天前

人间草木-槿 · 江苏网友——小丝轧花：啃老不如自立趁年轻多拼！富足橙子Bn：这种-20241109093406

9 月前

人力资源管理 · 不会给老板汇报工作，做的再多都是瞎忙活！

8 月前

利市 · 业绩大增！预增100%以上的公司出炉，多家公司一季报预增超10倍

3 月前

奇爱博士 · 我看了一圈北京大学生电影节的售票情况，卖的最好的三部：《里斯本丸-20250427184805

3 月前

创意铺子 · 百元入！出口同款儿童版「大疆」，避障、悬停、超安全防护…一年摔坏换新

2 月前