AI 成本太高怎么办?

2024-10-13 13:20:44 +08:00
 kongkongye

只有 claude3.5sonnet 的能力才能满足,其他模型效果都不行,可是 claude 接口费用真的是贵。

8613 次点击
所在节点    程序员
45 条回复
msg7086
2024-10-13 16:48:44 +08:00
说个思路,Vertex ,具体就不说了。
potatowish
2024-10-13 17:06:05 +08:00
过程拆分,先用低成本 ai 实现一部分
yufeng0681
2024-10-13 19:19:08 +08:00
@kongkongye #11 目前还是在提高软件的可用性。有种子用户进来使用,就能不断的提高软件可用性。定价高了,用户量就会少,软件迭代就慢。 而这个时代,快鱼是要吃掉慢鱼的。
YsHaNg
2024-10-13 22:22:40 +08:00
foolishcrab
2024-10-13 22:25:06 +08:00
现在大平台亏钱抢地盘的时代
个人最好的方向是买断软件在交互上做出花,让用户填 token
hkshawn
2024-10-14 00:09:32 +08:00
aiapi.dog 主打 claude3.5 claude opus 超高并发 超级稳定 不掺水 无逆向 gpt 最低价格不到官方 1/10
TimePPT
2024-10-14 00:20:04 +08:00
比较好奇是啥场景非 claude 不可😂
lee88688
2024-10-14 09:20:03 +08:00
claude 有缓存 API 可以去看看,说不定能降低一些费用。
zihanla
2024-10-14 09:22:33 +08:00
换 deepseek ,去 linuxdo 看看便宜的 claude
beryl
2024-10-14 09:51:44 +08:00
几个思路(假设是对外提供服务,不是自用):
1. 最可行的,如果当前成本不是亏损太多,可以先勉强用着,提前埋伏未来,未来半年或者各家产品估计能够打平现在的 claude3.5 sonnet 水平

2. 通过优化 prompt 或者其他手段,看下其他平台,推荐 deepseek 。 之前做过对比,在只有 claude 能够完成的情况下,deepseek 的 差距最小

3. 分模型收费,结合第二点
Flicker
2024-10-14 09:53:51 +08:00
用第三方的,刚看了下:
claude-3-5-sonnet-20240620
提示:$1.65 / M tokens
补全:$8.25 / M tokens
0.55 元=1 美金
Outer2048
2024-10-14 10:24:34 +08:00
长期用,想稳定,建议放弃白嫖和那些所谓的 1 折、8 折
我长期用的两个平台都是这个规律,看上去省了钱,用的时候总会有一些莫名其妙的问题,最主要的是稳定性
jiayouzl
2024-10-14 10:25:27 +08:00
@Flicker 平台地址发下这个价格便宜。
kongkongye
2024-10-14 10:29:30 +08:00
@beryl 对的,deepseek 的确比较接近 claude 效果
kongkongye
2024-10-14 10:31:29 +08:00
@Outer2048 稳定性的确是问题
vipppppp
2024-10-14 11:10:13 +08:00
单纯从接口收费,任何 AI 接口都亏钱,无论是传统算法还是大模型,大模型的收益甚至可能连电费都抵不了

从其它地方获取利润才是关键 =。=,否则就是做慈善
me1onsoda
2024-10-14 11:12:24 +08:00
没有付费意愿的产品,都没有必要做
gEnv1Er
2024-10-14 12:23:08 +08:00
@Flicker #31 可以分享一下吗
unco020511
2024-10-14 14:25:50 +08:00
尝试用 4o 替代
raphaelsoul
2024-10-14 17:15:08 +08:00
老黄吃肉 大模型服务商喝汤 你在为爱发电。想好商业模式再动手。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1079788

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX