Gemini 3 Flash 用着挺香,但想找个更便宜的替代

3 月 12 日
 wsbqdyhm
最近在折腾 OpenClaw (小龙虾)+ n8n 工作流 做一些自动化任务,现在主要是薅 Google 的 $300 API credit 。

主力模型用的是 Gemini 3 Flash ,整体体验挺好,速度快、工具调用也稳,基本能顶住日常 workflow 。不过 Gemini 3.1 Pro 有调用限额,所以很多任务还是得靠 Flash 。

现在的问题是:
想找一个 性能大致对标 Gemini 3 Flash ,但更有性价比的模型 做备用 / 分流。

另外我本地也有一张 4090 ,所以也在考虑顺便搞个 本地模型做 fallback ,简单任务或者离线的时候用。

在各大主流 ai 问了一圈,投票如下:

云端模型(对标 Gemini 3 Flash )

Kimi K2.5-K2 ( 4 票)

DeepSeek R1 / V3.2 ( 1 票)

本地部署( 4090 )

DeepSeek-R1-Distill-Qwen-32B ( 4bit )( 3 票)

GLM-4.7-Flash ( 30B A3B MoE )( 2 票)

目前的思路大概是:

主力:Gemini 3 Flash

云端备用:Kimi / DeepSeek

本地:跑一个 30B 左右模型兜底

不过我自己还没实际长期跑过这些组合,所以想听听大家的真实使用经验:

Kimi K2.5 和 DeepSeek V3 / R1 实际体验怎么样?

有没有 性价比能接近 Gemini 3 Flash 的模型?

4090 本地模型现在比较稳的是不是还是 32B 这一档?

欢迎拍砖,主要想听听长期在用的经验。
4359 次点击
所在节点    程序员
28 条回复
superkkk
3 月 12 日
千问 3.5 35B A3B 或者千问 coder next ,这俩还行,但是毕竟免费开源的,24g 显存可能不够
Nasdaq
3 月 12 日
比它聪明的没它快,比它快的没它聪明
wsbqdyhm
3 月 12 日
@liu731 2.5flash 体验怎么样? 之前用了一下 2.5 pro 弱智一样。
skyemin
3 月 12 日
$300 API 现在还送吗
Nasdaq
3 月 12 日
@wsbqdyhm 简单任务(<=5K Token )还不错。复杂任务不行
wsbqdyhm
3 月 12 日
@skyemin 送的,但有各种限额。用 3.1p 一不小心就⚠️ API rate limit reached. Please try again later.
chungon
3 月 12 日
这个我也没找到替代,国产的试了一圈都没有它好用
resist
3 月 12 日
模型我认为目前好用的就是 gemini 和 chatgpt ,其他的都差点意思
catning
3 月 12 日
今天试了下本地部署 QWen3.5 35B-A3B 可用度很高,https://pinchbench.com/ 上评分超过了 gemini-3-flash-preview
FengMubai
3 月 12 日
3.1 lite
v2gba
3 月 12 日
3 flash 跑一天大概多少花费?
skyemin
3 月 12 日
@wsbqdyhm 咋操作呀 可以的话我也弄一下
kphiia
3 月 12 日
3.1 lite
xiafengjieying
3 月 12 日
3.1pro 有调用 api 么?
wsbqdyhm
3 月 12 日
@xiafengjieying #14 有 3.1 预览版,250 次一天
wsbqdyhm
3 月 12 日
@skyemin #12 直接卡验证就行,v 卡双币的好像不行,我用的招行万事达可以,
wsbqdyhm
3 月 12 日
@eGlhb2Jhb2Jhbw #9 4090 能跑不
Cusox
3 月 12 日
$300 大概能用多久
zyqbit
3 月 12 日
@Cusox #18 我记得好像是 90 天有效期
NakanoAzure
3 月 12 日
现在还能白嫖 api 吗,是不是多注册几个白嫖就行?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1197732

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX