qazwsxkevin

qazwsxkevin

V2EX member #349448, joined on 2018-09-14 00:19:53 +08:00
Today's activity rank 13802
Per qazwsxkevin's settings, the topics list is hidden
Deals info, including closed deals, is not hidden
qazwsxkevin's recent replies
3 days ago
Replied to a topic by YangJiLei DeepSeek deepseek 值得入手吗
现在大家 vibe code 是用什么工具连接 ds API 的?
现在啥 AR 眼镜,适合坐下来当显示器看资料用?
@66beta
挺好的,炼出来的成果,少了很多套接套,件接件的屁事,间接依赖过程造成的性能开销,全要回来了,给到正事业务去了,事能把硬件资源全给正事吃,计算机本来就应该如此啊
@diudiuu 嗯嗯,是的,非常同意,这东西就是得买 4 台才能干活,反正要有那个水平和性能,无论是 DGX 还是 MAC Studio 或者显卡多卡,大 10W 人币(约 10W~14W )目前来讲,是必须掏钱的。
@diudiuu 我也没买,之前在其它主题下也请教过您 DGX 一些问题的。。。 看了好多天。。。
DGX 目前阶段,的确是非常好的东西,但是拿它要做点事情(必须 Q8 以上,Dense,TPS > 40~60/s ,同时还要确保权重能用的 KV 空间可以 256K 上下文)的话,得一下买 2 台(最少)或 4 台集群,6W~13W(*4 还得买交换机和专用线)人币的投入;
有 6~10 来万投入的小工作室或者个人,还真不会买 DGX*2 or *4;
单台 DGX 似乎就是玩具,老王的意思可能就是,要让真用的人,该掏那笔钱还是得掏的;
我看社区里调教,优化 DXG 适配、加速模型,也是呕心沥血的(维护不易,支持较少、反应也慢)。。。
早期我也用过 n2n ,后来 n2n 的项目停了,作者以自己的名义搞了 n3n 的项目,也用过 n3n 一段时间,supernode 用的是 99 元阿里云的折扣服务器(深圳),有些感受想交流:
1.用下来的感受 peer 和 peer 是保证能通,但 n2n/n3n 无法直观的看到 p 和 p 是直通,还是经由 supernode.(看文档,n2n/n3n 是可以协助 p 和 p 直通打洞,在双方都是 NAT4 的状态下,只能经由 supernode.
2.因为我都是在双 NAT4 环境下使用,p 和 p 各在电信和联通,延时有 40 几 ms 以上,我不知道是和 99 元的服务器水管问题,还是 n2n/n3n 设计效率问题.
3.相比第二点提到场景,OpenVPN 的 hub 组网,延时 20ms 左右.
无法判断,n2n/n3n 只作为保留手段.
谢谢,可以增加 Qwen Coder 系列模型吗?
GPT 充值,用虚拟卡充的话,友好吗?
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1488 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 21ms · UTC 16:59 · PVG 00:59 · LAX 09:59 · JFK 12:59
♥ Do have faith in what you're doing.