使用本地模型 Gemma4 来驱动 OpenClaw

4 月 4 日
 Livid

替换下面指令中的 model ID 为你本地 Ollama 里启动的版本。

openclaw onboard --non-interactive \
  --auth-choice custom-api-key \
  --custom-base-url "http://127.0.0.1:11434/v1" \
  --custom-model-id "gemma4:31b-it-q4_K_M" \
  --custom-api-key "ollama" \
  --secret-input-mode plaintext \
  --custom-compatibility openai \
  --accept-risk
6318 次点击
所在节点    OpenClaw
28 条回复
0U0
4 月 4 日
需要什么配置才能跑得动
Livid
4 月 4 日
@0U0 这里有不同版本,应该总有一个是本地能跑起来的:

https://ollama.com/library/gemma4/tags
Visoar
4 月 4 日
Google 搞了个 `Google Al Edge Gallery`,在 iPhone 上直接跑起 e2b/e4b 版本 Gemma4 ...
试了 e2b 速度很好很顺畅,能力也不错.

看起来今年端侧小模型要开始卷了

pkuphy
4 月 4 日
这个模型真的好用
senooo
4 月 4 日
手机上的 e2b 2G PC 端的 e2b 7G
CatCode
4 月 4 日
@Visoar iPhone 13 提示内存不足。iPad 倒是跑起来了,就是 UI 比较蛋疼。
v2gba
4 月 4 日
站长这个得 30+的内存才能跑了吧?
zivn
4 月 4 日
32G M3 Pro 不论用 mlx 还是 ollama 跑 31b 基本没法用。
聊天可以,openclaw 直接卡死。
虽说理论上只要 20G 内存,但 openclaw 上下文太长了,预填充要几分钟甚至十几分钟。
26b 是 MOE 就没试了,感觉还是 Dense 才有前途。
zivn
4 月 4 日
mlx 版本在 huggingface 上,mlx-community/gemma-4-31b-it-nvfp4 ,需要用 mlx-vlm 运行。
huanxianghao
4 月 4 日
很棒。
在 windows 上面跑了,4070s 跑 26b ,感觉思考时间有点长
paranoiagu
4 月 4 日
龙虾的上下文太长了,我 24G 显卡,跑 27B 的 qwen3.5 ,开了 64K 上下文,再大就爆显存了。但是 64K 龙虾不够。
chipipi
4 月 4 日
目前什么设备能跑得动?
dinjufen
4 月 4 日
16G 内存的 mac mini m4 能跑动吗
zoozobib
4 月 4 日
测试 qwen3.5-27b q4 和 gemma4-31b q4 。200K ctx 同样的代码问题,后者一把过,测试用例还是少
zoozobib
4 月 4 日
但前者能跑到 38 /t 后 只能到 33/t
levn
4 月 4 日
27b q4 使用 32G 显存,就可以开 200k 上下文
31b q4 使用 64G 显存,kv q8 量化都开不到 100k 上下文
crocoBaby
4 月 4 日
能用度如何?
learnshare
4 月 4 日
16G M2 Mac mini 勉强能跑起来低配两个版本,但仅能跑起来,没啥可用性
以后得买 64G 版本玩一玩了
sickoo
4 月 4 日
@dinjufen 跑 mlc 吧
zoozobib
4 月 4 日
新测,加了 2b 的 draft , 提升到 45/t ;Draft 接受率 不错,5 成

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1203472

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX