V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
is101
V2EX  ›  Android

不懂就问,刚才看到一个很好的 AI 应用场景,想问一下这个是怎么实现的。

  •  
  •   is101 · 19 小时 20 分钟前 · 1281 次点击

    看起来像是 AI 操作手机,手机 UI 界面每个控件被彩色框出来,框上还有数字标记,想问下这个是怎么实现的呀?

    应用场景视频: https://share.cleanshot.com/npxzbc0G

    没搞过安卓开发相关项目 问了下 gpt 回答是 AutoJs ? 不是吧...

    9 条回复    2025-11-20 10:24:16 +08:00
    crysislinux
        1
    crysislinux  
       19 小时 17 分钟前
    Fooooo0
        2
    Fooooo0  
       19 小时 13 分钟前
    搜 mobile-use , UI-TARS
    john6lq
        3
    john6lq  
       19 小时 11 分钟前
    框像是是开发者模式中的“显示布局边界”,或者是配合了 uiautomator 抓取布局自己绘制的?
    leehaoze98
        4
    leehaoze98  
       19 小时 8 分钟前   ❤️ 1
    leehaoze98
        5
    leehaoze98  
       19 小时 4 分钟前
    mqnu00
        6
    mqnu00  
       18 小时 2 分钟前
    android 开发者模式 不是有 ui 标注功能吗?
    iflint
        7
    iflint  
       15 小时 41 分钟前
    但凡是能适用于任意三方进程的就来两种模式,一种是 Droidrun 、Maestro 那种去基于无障碍系统/uiAutomator 去 dump UI 布局信息然后画框的;另一种是走的纯截图然后视觉识别以后画框的。 当前主流的就还是通过拿无障碍信息
    iyaozhen
        8
    iyaozhen  
       15 小时 37 分钟前
    统称 computer-use ,其实很成熟了。可以是纯视觉方案,可以加一些元素辅助
    is101
        9
    is101  
    OP
       3 小时 38 分钟前
    @leehaoze98 #4 看了下感觉确实是这个 👍
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5433 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 06:02 · PVG 14:02 · LAX 22:02 · JFK 01:02
    ♥ Do have faith in what you're doing.