2025-09-28 04:17:10
loading...

DeepMind Gemini Robotics 1.5发布:机器人迈入多步骤规划新时代

摘要
谷歌DeepMind推出Gemini Robotics 1.5及配套模型,实现机器人从单任务执行向自主规划、在线搜索与跨设备技能迁移的跃迁,标志着通用人工智能在物理世界应用的关键突破。
谷歌DeepMind近日发布两款全新AI模型——Gemini Robotics 1.5与Gemini Robotics-ER 1.5,推动机器人从执行简单指令迈向具备自主推理与多步骤规划能力的新阶段。这一进展被视为应对现实世界复杂性的一项基础性突破,也是通用人工智能(AGI)落地的重要里程碑。 传统机器人依赖工程师为每个动作编写代码,难以适应环境变化。而新模型通过引入代理能力,使机器人能够理解任务目标、生成分步计划、调用外部工具如谷歌搜索,并将知识泛化至不同场景。例如,机器人可依据天气预报自动打包行李,或查阅当地垃圾分类政策后正确投放垃圾,展现出前所未有的情境感知与适应能力。 核心技术上,Gemini Robotics-ER 1.5作为视觉语言模型(VLM),负责制定任务计划;而Gemini Robotics 1.5则为视觉-语言-动作(VLA)模型,将自然语言指令转化为精确的物理操作。两者协同工作,形成“大脑+肢体”的智能架构。在一项实验中,机器人成功完成垃圾分类任务,尽管成功率仅20%至40%,但已远超此前无法处理此类复杂任务的水平。 谷歌首席执行官桑达尔·皮查伊表示,这代表公司迈向真正有用的通用机器人的下一大步。相较于特斯拉强调大规模生产与波士顿动力追求极限运动能力,谷歌选择以人工智能为核心,让机器人无需特定编程即可灵活应对未知环境。 目前,Gemini Robotics-ER 1.5已通过Google AI Studio开放给开发者使用,而行动模型Gemini Robotics 1.5则仅限精选合作伙伴部署。该技术背景也呼应了全球对机器人产业的战略关注,美国正推动设立联邦级机器人办公室,中国则已成为全球最大工业机器人应用市场,2023年投入使用机器人数量接近180万台。 此次更新不仅是技术演进,更预示着未来人机协作模式的深刻变革。随着模型持续优化,机器人将在家庭服务、仓储物流、医疗辅助等领域加速渗透,开启智能化实体交互的新篇章。
声明:文章不代表比特之家观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!转载请注明出处!侵权必究!
币圈快讯
查看更多
热门币种
BTC比特币
105,239.09 USDT
¥755,174.66
-%
ETH以太坊
2,517.54 USDT
¥18,065.36
-%
USDT泰达币
1.00000 USDT
¥7.18
-%
XRP瑞波币
2.15 USDT
¥15.44
-%
BNB币安币
646.71 USDT
¥4,640.66
-%
SOLSolana
145.58 USDT
¥1,044.65
-%
USDC
0.99980 USDT
¥7.17
-%
TRX波场
0.27410 USDT
¥1.97
-%
DOGE狗狗币
0.16830 USDT
¥1.21
-%
ADA艾达币
0.59440 USDT
¥4.27
-%
查看更多
回顶部