This topic created in 46 days ago, the information mentioned may be changed or developed.
这两天在折腾 Codex 里的 skill 和 MCP ,目标很朴素:别开新浏览器会话,直接用我当前已经打开、已经登录的 Safari 去把事做完。
目前自己试下来的感受是:
- 纯 WebDriver 路线做页面自动化没问题,但继承不了现成登录态
- 如果想直接操作当前 Safari tab ,就得混 AppleScript 、System Events 、Accessibility ,必要时还得上 OCR / 坐标点击
- 能用,但链路有点长,稳定性也比较吃页面和系统弹窗
所以想问下各位:
1. 你们现在有啥好用的 skill / MCP / 工具链,是专门拿来控制 Safari 的?
2. 有没有比较顺手的 existing-tab / logged-in session 方案?
3. 除了 Playwright 之外,有没有更适合“直接操作正在使用的 Safari”的路子?
如果有现成方案、踩坑经验、或者自己搓过类似工具,欢迎分享下。