Open-AutoGLM - 智谱开源操作手机的 AI Agent, 类似“豆包手机”

https://github.com/zai-org/Open-AutoGLM

Phone Agent 是一个基于 AutoGLM 构建的手机端智能助理框架,它能够以多模态方式理解手机屏幕内容,并通过自动化操作帮助用户完成任务。

系统通过 ADB(Android Debug Bridge)来控制设备,以视觉语言模型进行屏幕感知,再结合智能规划能力生成并执行操作流程。

用户只需用自然语言描述需求,如“打开小红书搜索美食”,Phone Agent 即可自动解析意图、理解当前界面、规划下一步动作并完成整个流程。

#AI #GitHub #Tool #Android GitHub - zai-org/Open-AutoGLM
 
 
Back to Top
OKHK