首页 > 阅读笔记 > 阅读笔记 > 谷歌称Gemini AI正在让机器人变得更加智能

谷歌称Gemini AI正在让机器人变得更加智能

发布时间:2024-07-12 22:52:25

7月12日消息,据外电报道,谷歌正在使用 Gemini AI 训练其机器人,以便它们能够更好地导航和完成任务。

DeepMind 机器人团队在一篇新研究论文中解释了如何使用Gemini 1.5 Pro的长上下文窗口(决定 AI 模型可以处理多少信息)让用户更轻松地使用自然语言指令与其RT-2 机器人进行交互。

这项技术的工作原理是拍摄指定区域(例如家庭或办公室空间)的视频,研究人员使用 Gemini 1.5 Pro 让机器人观看视频以了解环境。

然后,机器人可以根据观察到的情况,使用口头和/或图像输出执行命令 - 例如在向用户展示手机并询问「我在哪里可以给它充电?」之后,引导用户到电源插座。

DeepMind 表示,其 Gemini 驱动的机器人在 9,000 多平方英尺的操作区域内对 50 多条用户指令的成功率达到 90%。

研究人员还发现初步证据,表明 Gemini 1.5 Pro 使其机器人能够规划如何执行除导航之外的指令。

例如,当办公桌上有很多可乐罐的用户询问机器人是否有他们最喜欢的饮料时,该团队表示 Gemini知道机器人应该导航到冰箱,检查是否有可乐,然后返回给用户报告结果。

DeepMind 表示计划进一步调查这些结果。

谷歌提供的视频演示令人印象深刻,尽管根据研究报告,机器人确认每个请求后明显的切换掩盖了处理这些指令需要 10-30 秒的时间。我们可能还需要一段时间才能与更先进的环境地图机器人共享我们的家园,但至少这些机器人可能能够找到我们丢失的钥匙或钱包。

阅读笔记更多>>

马斯克SpaceX背后的她:现实版钢铁侠小辣椒 极速120km/h 九号M5 P千万台纪念版电摩今日开售:23999元起 性能真超RTX4060!砺算科技母公司发财报:自研6nm GPU已交付 vivo V70 Elite手机曝光:骁龙8s Gen 3芯片,6500mAh电池 苹果宣布Apple Cash即时提现手续费上调至1.7%,最多25美元封顶 千亿市场的赛博宠物,也逃不过“吃灰”现实? 宝马纯电M3将配备模拟V10发动机声浪,重现历代经典车型引擎轰鸣 当AI遇上残障群体,开始挑战生命的“不可能” 华硕2025年营收预估突破7000亿元新台币创历史新高 小鹏全球总部向公众开放体验:1月12日起可预约参观 高通CEO安蒙2026年致辞:2028年推出6G预商用终端 卢伟冰选出2025小米三个高光瞬间:玄戒O1发布排第一 罗永浩回应播客广告增多:实在讨厌就忍着吧 免费看还想怎样 纯电续航最高210km!比亚迪2026款海豹05、海豹06DM-i加推长续航版:8.98万起 吉利2025年Q3核心净利39.6亿元,同比增长19% 宝马与Momenta共研辅助驾驶系统将首搭BMW iX3车型 三星、现代宣布3,100亿美元韩国本土投资计划 丹诺德集团签约落地上海嘉定 半固态先行,全固态瞄准2030年后大规模商业化​ 奇瑞汽车就天门山挑战测试意外致歉:全力修复并承担赔偿责任 宇树推出首款轮式人形机器人 比亚迪汉L广州车展发布:19.48万起配 “车位到车位” 智驾 新能源与新势力,把市场铺满 第六代全新荣放:当经典给出新时代答案 传采埃孚因安世半导体芯片短缺放缓生产 福耀玻璃开启“曹晖时代”:新老传承,迈向新发展 德国豪华汽车品牌奥迪证实,产品阵容革新计划将包含一款名为Q9的全新旗舰级跨界车 苏州芯检荣获2025盖世汽车金辑奖——最具成长价值奖 宏光MINIEV狂飙!10月销6.15万辆,创造180万传奇 雷克萨斯加速本土化 上海研发中心启用 2027年在华国产电动车