Groq 的速度真的好快啊

2024-04-22 08:12:50 +08:00
 coinbase

这是什么原理

4841 次点击
所在节点    分享发现
29 条回复
BIND
2024-04-22 08:19:12 +08:00
确实快,感觉这个 AI 它上辈子是个哑巴,这辈子急着说话。我问题刚问完,它就库喳一下子答完了。
a1b2c3T
2024-04-22 08:54:18 +08:00
刚去试了一下,确实好快啊,不像 gpt 一个字一个字往外蹦…蹲一个大佬解释一下
waynevan
2024-04-22 08:57:33 +08:00
用的自研芯片,不是英伟达的
xiaohundun
2024-04-22 08:57:56 +08:00
你不看看他用的什么模型,lama3-8b
cat9life
2024-04-22 09:02:04 +08:00
@xiaohundun #4 所以算力要求很低?
xiaohundun
2024-04-22 09:05:01 +08:00
@cat9life 8b 很低,不过我看他可以切换模型 70b ,也挺快的,这要看他的使用量,像是 ChatGPT 、Claude.ai 使用量大,慢一点不奇怪,当然也可能是他的 LPU 引擎很牛
tianzi123
2024-04-22 09:06:14 +08:00
我去,速度太快了,有点不适应了
yianing
2024-04-22 09:08:28 +08:00
@xiaohundun #4 8b 是 800t/s ,70b 是 280b/s ,都挺离谱的
idragonet
2024-04-22 09:16:09 +08:00
测试下还是快,不过正式库很老。
ThinkStu
2024-04-22 09:16:41 +08:00
感觉速度挺快,质量不如 GPT3.5...
492
2024-04-22 09:17:07 +08:00
准确率怎么样,我随手测了下速度确实快
rambo92
2024-04-22 09:19:03 +08:00
确实快,不过还是没有解决 鲁迅为什么殴打周树人 的问题 哈哈哈
youmilk
2024-04-22 09:37:24 +08:00
@rambo92 模型换 70b
securityCoding
2024-04-22 10:04:01 +08:00
llama3 8b 模型我在 8G 显存开发机上跑,速度快到起飞
WashFreshFresh
2024-04-22 10:07:51 +08:00
为啥 web 登录上去不能发消息...
aduangduang
2024-04-22 10:08:36 +08:00
快是真快,傻也是真傻
pkoukk
2024-04-22 10:16:40 +08:00
你别问我对不对,我就问你快不快吧
lichuyi
2024-04-22 10:29:14 +08:00
@rambo92
鲁迅为什么殴打周树人
鲁迅( 1881-1936 )和周树人( 1885-1957 )是中国现代文学家和作家,两人都是中国文学界的知名人物。关于鲁迅殴打周树人,实际上是鲁迅在 1927 年的一篇文章《周树人》中提到的事件。

根据鲁迅的描述,1925 年,他和周树人在上海的一家咖啡馆中遇见,周树人在喝咖啡时,鲁迅认为他喝的咖啡太多,鲁迅便殴打周树人。鲁迅在文章中解释说,他殴打周树人是因为周树人喝的咖啡太多,鲁迅认为这是对中国文化的污染。

然而,这个事件的真实性和鲁迅的描述是否准确,仍然是一个争议的问题。一些学者认为,这个事件可能是鲁迅的虚构或夸大,旨在攻击周树人和中国文化。周树人本人也没有留下关于这个事件的记载。

总之,鲁迅殴打周树人事件的真实性和原因仍然是一个争议的问题,需要更多的证据和研究来确定事件的真实性。
m6R1SW7tCHvO3mHL
2024-04-22 10:37:22 +08:00
https://www.reddit.com/r/LocalLLaMA/comments/1auxm3q/groq_is_lightning_fast/
有个自称 Groq Engineer 的哥们在解释可以看看
m6R1SW7tCHvO3mHL
2024-04-22 10:38:55 +08:00
@rambo92 准不准是模型的问题啊,Groq 单单只负责推理。
当然他有没有对模型做量化是不知道的,如果做的那确实会影响部分结果

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1034466

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX