AutoGLM:每台手机,都可以成为 AI 手机
Agent
智谱 AutoGLM 的诞生,是 GLM 技术团队在语言模型、多模态模型和工具使用等多方面深耕的成果。作为全球首个手机 Agent,它突破传统 AI 局限,以 “能说更能做” 的核心优势,开创了 Agent + 云手机 / 云电脑的新技术范式,重新定义了人机协同的全新可能。
核心技术
AutoGLM 依托智谱开源 SOTA 技术底座,由 GLM 系列语言模型与 GLM-V 系列视觉推理模型持续赋能。AutoGLM 将基座模型原生能力发挥到极致,并结合在「端到端异步强化学习」方面的多项突破成果,可以完成推理、编码、研究、Agentic 与 GUI 操作等多类任务,并可根据需求灵活调用最合适的「大脑」完成执行。
- ComputerRL:提出 API-GUI 协同范式,提升数据多样性与计算效率;改进 GRPO 并提出 Entropulse 机制,增强探索与策略多样性。
- MobileRL:创新难度自适应强化学习方法(推理自举预热 + 难度自适应 GRPO),显著提升移动端任务的稳定性与收敛效率。
- AgentRL:通过交叉采样与任务优势归一化机制,解决多任务训练中的不稳定与梯度分布不均,增强整体鲁棒性与效率。在 Device Use 基准测试(涵盖手机、电脑和网页操作)中,AutoGLM 表现优于 ChatGPT Agent、UI-TARS-1.5 和 Claude Sonnet 4,展现出更强的鲁棒性与通用性,处于主流 Agent 的 SOTA 水平。
能力范围
AutoGLM 跳出传统 chatbot 框架,首次让大模型具备与现实世界互动的核心能力,真正实现 “从说到做” 的跨越:
- 精准理解与自主规划:凭借屏幕信息解读、自然语言理解与推理能力,快速解析指令并规划任务流程;
- 全场景高效执行:无需搭建复杂 workflow,通过自然语言指令即可在云端完成生活(点外卖、订酒店等)与办公(信息检索、内容创作发布等)多类任务,理论上可覆盖电子设备上的各类操作;
- 智能交互与纠错:任务执行中持续反馈,具备独立判断、自我纠错能力,可灵活调用工具精准响应需求;
- 云端异步运行:配备专属智能体设备,云端自主完成任务,不占用本地设备资源,支持 “自动驾驶手机” 与 “异步代理办公”。
开源赋能
2025 年 12 月 9 日,AutoGLM 正式开源,项目名为 Open-AutoGLM。此次开源提供了完整的技术底座,包括 Apache-2.0 协议授权的完整代码库、模型训练脚本、应用适配接口及 50 + 场景 Demo,同时在 Hugging Face 开放 AutoGLM-Phone-9B 轻量级模型,支持本地与云端部署,确保数据与隐私控制权掌握在使用者手中。截至2026年1月初,项目GitHub仓库已斩获20.9K Star,成为 2025 年增速领先的大模型开源项目之一。
宣传片Promotional Video
- 24.10. v1.0:AI 的「phone use」时刻也来了
- 24.10. v1.0: The Era of AI Phone Usage Is Here
- 25.8. v2.0:全球首个移动端通用Agent上线
- 25.8. v2.0: Launch of the World’s First Mobile Universal Agent
实机案例Real-Device Cases
- 美团-再来一单
- Meituan - Place Another Order
- 快手-查找视频
- Kuaishou - Search for Videos
- 微博-超话打卡
- Weibo - Check in on Super Topic
- 喜马拉雅-播放相声
- Ximalaya - Play Crosstalk
- 汽水音乐-播放音乐
- Soda Music - Play Music
- bilibili-查找直播
- bilibili - Find Live Streams
- 红果短剧-找短剧
- Hongguo Short Drama-Search for Short Dramas
- 爱奇艺-播放电视剧
- iQIYI - Play TV Series
- 贝壳-查找房源
- Beike-Search for Properties
开源案例Open-Source Cases
外卖选购Food Delivery Ordering
帮我在美团点一杯冰豆花
Help me order a cup of iced tofu pudding in Meituan.
商品比价Product Price Comparison
给我对比一下“32K显示器”哪个购物平台便宜,找一个最便宜的下单Help me compare the prices of 32K monitorsacross shopping platforms and place an order for the cheapest one.
播客播放Podcast Playback
帮我看一下小宇宙上,晚点聊这周更新了没,把最新一期帮我放到播放列表,我一会路上要听
Check if the latest episode of Wan Dian Liao is updated on Xiaoyuzhou, add the newest episode to my playlist—I’ll listen to it on my way later.
餐厅预订Restaurant Reservation
给我在美团预订一个今晚上19:30日料餐厅
Help me book a Japanese restaurant on Meituan for 7:30 PM tonight.
差旅场景Business Trip Scenario
我下周一要出差,你现在飞书上帮我给太宰发一条请假消息“我下一周要出差,需要请个假”,然后再去携程上帮我预定一张下周一从北京到广州的高铁票
I have a business trip next Monday. Please send a leave request message to Taizai on Feishu right now: “I need to take a leave next week as I have a business trip.” Then book a high-speed train ticket from Beijing to Guangzhou for next Monday on Ctrip.
制定旅游路线Travel Itinerary Planning
我下周六要去长春玩,帮我总结下当前页面上推荐的景点,到高德地图上收藏一下这几个景点,特别是具体看看博物馆门票价格,再去12306上订一张上午十点从北京去长春的高铁票,把相关信息整理好给我
I’m going to Changchun for a trip next Saturday. Please summarize the recommended attractions on the current page, save these attractions on Amap, check the ticket prices of the museums in particular, then book a high-speed train ticket from Beijing to Changchun departing at 10 AM next Saturday on 12306, and organize all the relevant information for me.