智谱开源“会操作手机的AI”AutoGLM,人人可打造豆包手机-外盘期货
智谱宣布,正式开源其核心AI Agent模型AutoGLM。该模型被业界视为具备“Phone Use”(手机操作)能力的AI Agent,能够稳定完成外卖点单、机票预订等长达数十步的复杂操作流程。
智谱从 2023 年 4 月开始探索AutoGLM,在最开始的版本里,基于大模型所构建的系统只知道“点”、“滑”等操作,偶尔能完成一个很短的流程,更多时候会迷失在不知所谓的操作中,甚至陷入死循环。为了解决这类问题,智谱花费近一年的时间,建了一整套 Phone Use 能力框架;把点击、滑动、输入、截图、界面理解这些最基础的动作抽象出来;让模型学会把一句自然语言拆解为一系列稳定、可回放的操作步骤;处理掉各种真实世界的“脏信息”:网络波动、弹窗打断、广告遮挡……

奈飞「篡位」好莱坞?
2024 年 10 月 25 日,智谱发布了能够在真机上稳定完成一条完整操作链路的 AutoGLM,并在一个月后发出了由 AI 完成的手机红包;2025 年,智谱又发布了 AutoGLM 2.0,验证了强化学习的规模扩展定律,提出了 MobileRL、ComputerRL 和 AgentRL 算法,让 AutoGLM 在上千个虚拟设备环境里同时强化学习,极大扩展了 Agent 的准确性和泛化能力。
此次开源意味着硬件厂商、手机厂商和开发者均可基于AutoGLM,在自己的设备或系统中复现一个能“看懂”屏幕、并模拟真人进行点击、输入、滑动的AI助手。目前,AutoGLM已支持微信、淘宝、抖音、美团等超过50个高频中文应用的核心场景,其自动化操作能力与此前引发热议的“豆包手机”演示相似。
AutoGLM的开源将大幅降低AI手机的技术门槛,推动AI手机生态从封闭走向开放共创。同时,项目支持本地与云端部署,确保数据与隐私控制权始终掌握在使用者手中。


