Skip to content
On this page

Open-AutoGLM - 智谱 AI 开源手机 Agent

来源:https://github.com/zai-org/Open-AutoGLM 官方:https://www.open-auto-glm.com/

概述

开源手机 Agent 框架,让 AI 控制 Android/HarmonyOS 设备,通过自然语言完成手机操作。

核心能力

  • 📸 屏幕感知 — 多模态理解屏幕内容
  • 🧠 意图理解 — 理解用户自然语言指令
  • 🛠️ 自动执行 — 自动规划并执行操作序列

支持的模型

模型特点下载
AutoGLM-Phone-9B中文优化Hugging Face / ModelScope
AutoGLM-Phone-9B-Multilingual多语言Hugging Face / ModelScope

支持平台

  • Android — 通过 ADB 控制
  • HarmonyOS — 通过 HDC 控制
  • iOS — 通过 Midscene.js 适配

使用场景

  • "打开小红书搜索美食"
  • "给文件传输助手发消息:部署成功"
  • 点外卖、搜餐厅、订机票

环境要求

  • Python 3.10+
  • ADB(Android Debug Bridge)
  • 开发者模式 + USB 调试开启

特点

  • 🔒 内置敏感操作确认机制
  • 🤝 支持人工接管(验证码场景)
  • 📡 远程 ADB 调试(WiFi 连接)

资源地址


整理 by 文殊