我们也曾为 GPU 算力发愁,所以创造了云主机

44 天前
 nexmoe

作为一支专注于 AI 的小团队,我们和许多开发者一样,在模型训练的道路上饱受算力短缺的困扰。

昂贵的显卡、主流云平台漫长的排队、复杂的环境配置,以及因闲置而不断燃烧的经费,都曾是我们的日常。我们把大量时间浪费在了等待和运维上,而不是真正投入到算法和产品创新中。

我们受够了这种低效。为了彻底解决自己的问题,我们决定打造一个我们心中理想的 GPU 云平台。它必须足够简单、高效、且便宜。

我们如何解决共同的痛点?

我们把所有踩过的坑,都变成了「共绩算力」的核心特性:

  1. 告别排队,即开即用:我们投入重金储备了千卡级的 RTX 4090/5090 现货。你不再需要为资源排队等待,在浏览器里就能直接进入熟悉的 Jupyter Lab 、VS Code 或 Bash 终端,随时开始工作。

  2. 只为有效算力付费:我们坚信,一分钱都不该为闲置浪费。因此,我们实现了精确实在的「按秒计费」,关机即停费,开关机过程零费用。RTX 4090 每小时仅需 1.68 元,真正做到用多少、付多少。

  3. 三分钟上手,专注开发:我们预装了涵盖 PyTorch 、TensorFlow 、ComfyUI 、Stable Diffusion 等在内的主流镜像。你无需再为繁琐的环境配置分心,所有工具开箱即用。

  4. 数据无忧:我们提供了共享存储卷和 S3 挂载加速功能,让你的数据集、代码和模型权重安全、高效地在不同任务间流转。

我们追求极致的性价比

我们将自己作为第一个用户,围绕开发中最耗费心神的几个环节,做了针对性的优化。我们的目标是在同等价格下,提供最稳定、流畅的体验。

维度 共绩算力 解决了什么问题
可用性 RTX 4090/5090 千卡现货 无需排队,即刻开始。
价格 4090: 1.68 元/时,5090: 2.5 元/时 成本比主流云厂商降低 30-60%。
计费 按秒计费,关机实例不收费 资金不再为闲置浪费。
启动速度 3 分钟内进入开发环境 告别漫长等待。
环境 预装常用镜像,内置清华 pip 源 免除环境配置的烦恼。
协作 教师/主管一键分发镜像 团队协作、教学培训效率倍增。

在真实场景中的表现

我们也在用「共绩算力」进行着模型微调、原型开发等工作。以下是一些真实场景的成本与效率参考:

快速上手

我们把上手流程设计得非常简单,三分钟就能跑起你的第一个任务:

  1. 前往「共绩算力」控制台,进入云主机界面。
  2. 挑选你需要的 GPU 型号和数量。
  3. 为你即将创建的实例命名,并选择一个预装好的基础镜像。
  4. 如果需要,可以挂载一个共享存储卷用于数据持久化。
  5. 点击「创建实例」,完成。

现在,你可以全身心投入到 AI 开发的乐趣中了。

我们为你准备了 10 元的算力体验券,点击下方链接注册即可领取。希望「共绩算力」也能成为你手中那把趁手的“炼丹”工具。

链接:点我立即获得 10 元无门槛代金券

4809 次点击
所在节点    分享创造
46 条回复
mscb
44 天前
4090 本身对多 GPU 训练也不算支持的太好,其实单卡比友商便宜一点,对于训练来说也差不了几块钱,训模型优先还是会用 A100 这种。你们可以在推理上多发发力,我们公司遇到的最大的痛点是模型部署问题。像我们小公司,模型多,请求不大,又不值得单独租 GPU 机器(成本太高)。用阿里的 serverless 能解决按量付费的问题,可是冷启动又太慢(毕竟他们是通用的架构),差不多要 1 ~ 2 分钟整个模型对外的 API 才可用。国外的平台,延迟高,充钱也不方便,所以也没试过。不知道你们平台有没有办法解决这个问题。
llej
44 天前
@monkeyWie 估计是流量太贵了,而且客户端网速太影响时间了
nexmoe
44 天前
@monkeyWie C2C 是另一个业务线~适合做异步数据处理
nexmoe
44 天前
@mscb 巧了,我们刚好在做 Serverless ,马上就会上线自动弹性扩缩容了
https://www.gongjiyun.com/product/serverless/
xiaowoli
44 天前
哥们 为啥你们页面这么卡啊,点个页面要等 3 ,4 秒
nexmoe
44 天前
@xiaowoli 是不是开代理了,我们目前在开代理的情况会遇到这种情况
nexmoe
44 天前
@woctordho 10T 数据集,具体是什么场景,什么需求呢
woctordho
44 天前
@nexmoe 我在考虑训练一个开源的音乐生成模型,类似于 Chroma

Chroma 是基本由一个人训练出来的图像生成模型,他花了大概半年,数据量是 10T 的数量级

目前我觉得算力相对比较好找,但是把 10T 的音乐数据搬来搬去比较麻烦,所以我需要先把这方面考虑清楚再开始训练
baiyi
44 天前


web 终端体验有点不好啊
mscb
44 天前
@nexmoe #24 我看了下你们的文档,目前是要自己调用 API 扩缩容。而且看起来侧重于从 1 到 N 的扩容。到时候会实现从 0 到 1 的自动扩容吗?
nicoljiang
44 天前
这个是不是挺早的,记得之前见过。但你们控制台的响应是真的不咋快。
zhengfan2016
44 天前
这个 ui 是不是 shadcn 改的
nexmoe
44 天前
@baiyi 我们也发现了,最近在优化
nexmoe
44 天前
@zhengfan2016 是的
nexmoe
44 天前
@nicoljiang 今年就会优化了
xgq89757
43 天前
后面会有 NPU ,DCU 吗?
a56143575
43 天前
共绩科技 2023 年成立于"清华",专注于构建融合算力与电力的智能调度网络
kebamt
43 天前
校招去了解过你们,感觉不太靠谱,再看看吧,目前在用其他平台
bt7vip
43 天前
搭建成本上,推理卡是不是比计算卡要便宜,我在想如果给用户卡,让用户跑自己的模型,这个有没有市场。终端用户可以根据自己的需求跑各种不同模型,满足在一个平台上使用多个模型的需求,自建还不会遇到因为使用过多出现被降智问题,提供商按推理使用时常收费,用户只关心我用的什么卡和那个模型,你们只负责卡稳定运行。这是面对推理场景,我看网站页面感觉像是面对开发者的计算场景。
nexmoe
43 天前
@mscb #30 马上就可以支持自动扩缩容了,0-1 我们正在做技术调研中,有计划去推进

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1150570

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX