谈一下个人对上云的感想

2019-11-08 19:51:18 +08:00
 tinybaby365
首先现在云厂商都是在做亏本买卖,不要看他们标的公价,要看折扣后的价格。等大家都上云后,蛋糕分得差不多的时候,就应该是一分钱一分货的时候了。现在为什么鼓励大家 all in cloud,因为他们需要小白鼠。

基于成本的考虑(不赚钱嘛),云厂商的物理服务器一般情况下都会比你自己采购质量要差,这一点我们 hadoop 集群上云前后对比比较明显。这背后带来的是 VM,DB 等的可靠性无法保证。

上云后消费者看得见的成本是降低了,但却带来了隐形成本。隐形成本的根源是云厂商的 SLA 无法保障,要么是给你的业务造成了直接损失,要么是你为了提高可用性带来了其他成本。

云厂商的 SLA 就是个广告,他们是基于理论给出来的,但实际上他们的程序有 bug,他们是完全做不到的。在网上大家看到印象比较深的案例有:云盘数据丢失(冗余存储都丢失)。我们也遇到过多次云厂商的 bug,有的时候他们还不承认,扯不清。

拿 MySQL 举例,你觉得云厂商的主从版不会丢数据(不考虑故障时主从延迟丢数据的情况),而实际上有的用户,会跨 zone 再自己同步一份,外加定时备份到第三方云。从这个角度看上云成本完全没看到降低。

个人其实是不倾向于用云厂商的 MySQL,Redis,MQ 的,因为用 K8S 我们也可以让这些组件存储和计算分类,并且自己保障存储冗余,做到故障自动恢复。此外云厂商的这些服务,有些是他们的魔改版,特性和你了解的开源版本有差异。

此外用 K8S 还有个好处,这是对云厂商差异的隔离,方便切换云厂商。

怎么选择云厂商?我觉得主要看售前团队的实力(这个词太综合了)。说个比较夸张的对比:aws 的 BD 很熟悉他们家的产品特性,甚至知道一些常人不知的细节,可以给你做简单的方案;而另一家的 BD 只会装傻卖萌。这不是广告,我们没用 aws,因为他们的价格贵。此外这个团队的牵头能力很重要。
7675 次点击
所在节点    云计算
44 条回复
Mush
2019-11-08 19:55:27 +08:00
我们用了 AWS, 体验很好
snappyone
2019-11-08 20:02:13 +08:00
云厂商的物理服务器一般情况下都会比你自己采购质量要差,这个你是怎么得出结论的
tinybaby365
2019-11-08 20:03:55 +08:00
@Mush aws 产品很成熟,细节做得不错(用其他云遇到问题时就会感慨),个人也认同他的定价理念。
tinybaby365
2019-11-08 20:06:36 +08:00
@snappyone 从硬盘掉盘和机器宕机的次数。云厂商的服务器是"定制的"。
hst001
2019-11-08 20:07:28 +08:00
你用 k8s 之类的去搭建数据库等基础服务性能应该没原生的好,毕竟隔了层 vm,基础服务云厂商应该不会跑 VM 上,毕竟会降低性能变相提升成本
ivmm
2019-11-08 20:07:35 +08:00
@snappyone 赞同

云厂商的物理服务器一般情况下都会比你自己采购质量要差,这个你是怎么得出结论的 +1。

至于 SLA 和 BUG, 自己运行服务器自己承诺自己 SLA,自己修 BUG,以及设置不知道哪里有 BUG。

还有就是云安全的模式,比如说 18 年初的 熔断和幽灵,17 年的永恒之蓝。 云厂商都会第一时间通告用户,并修复宿主机,以热修复的模式,不影响 SLA。 但是自己托管,安全情报都是个很大的问题。
Mush
2019-11-08 20:08:29 +08:00
@tinybaby365 #3 aws 用量大了之后可能会比标价便宜很多, 例如可以买 RI, 可以签 CDN 合同. CDN 承诺 500T/月用量的价格几乎是标价的十分之一
id7368
2019-11-08 20:09:59 +08:00
SLA 确实是个笑话,所谓百倍赔偿,挂了个小时最后按几个小时乘以 100 然后延长几天服务器到期时间,但半个小时损失那么大。
sampeng
2019-11-08 20:10:06 +08:00
用 k8s 跑 mysql ? orcale ?怕是你想离职…
snappyone
2019-11-08 20:12:15 +08:00
@tinybaby365 机器宕机我懂,掉盘是什么鬼,你是不是开了个便宜的实例拿去跑 hadoop 然后得出不行的结论?
tinybaby365
2019-11-08 20:14:51 +08:00
@sampeng 看情况吧,可用 k8s 跑。重要的用物理机,走传统模式。
tinybaby365
2019-11-08 20:16:42 +08:00
@snappyone 不是,是物理机,提前预约采购的。
snappyone
2019-11-08 20:19:57 +08:00
@tinybaby365 那你这个跟机房托管一样的啊,如果服务器老掉盘那可能考虑下是不是价格压太狠或者中间有人吃了油水,毕竟同样的容量,服务器硬盘比民用盘贵好几倍。 反正我是不信阿里、腾讯这些大公司采购服务器质量会有问题
tinybaby365
2019-11-08 20:21:40 +08:00
@ivmm 这里说的 bug 是云厂商基础设施的 bug,例如:网络(极端条件下)。基础设施不是 bug free 的,也是走版本发布,新版本会灰度部分用户的。
tinybaby365
2019-11-08 20:24:57 +08:00
@snappyone 呵呵,就是其中一家,还让我们用 uuid mount,免得掉盘重启后 mount 的顺序乱了。
westoy
2019-11-08 20:31:04 +08:00
亏本, 你想多了吧。。。
举个例子
某云前身是国内最大的 IDC
他家代理呢, 大部分是地方网建, 收入主要就三块, 外包程序、主机域名邮箱以及维护、各种搜索引擎推广 /SEO
然后呢
为了抢单呢, 程序可能报低一点, 钱呢, 在后两块赚
主机这块呢, 会尽量的忽悠企业用户上独服, 再赚个运维钱
然后呢, 大部分小企业呢, 一个月可能也没几个流量
所以, 本质是三输啊,IDC 机位被空占, 客户多出钱, 代理呢, 一台机器一年也就赚个几百, 也没多赚
现在呢, 问题解决了
一台主机塞个几十个这种用户一点问题都没有, 云方可以塞更多用户, 单位的运维成本也低了, 客户出的也少了, 代理也没少赚
靠网上这些散单, 饿都饿死了
tinybaby365
2019-11-08 20:31:13 +08:00
@hst001 K8S 的 node 可用是物理机。对于有性能要求的 DB,如果走物理机的 K8S 也会走动和云厂商类似的路上。
sampeng
2019-11-08 20:34:09 +08:00
@tinybaby365 个人觉得不行。io 密集型的在 docker 里稳定性差的不要不要的
sampeng
2019-11-08 20:35:54 +08:00
@tinybaby365 另外…aws 真的稳如狗
sampeng
2019-11-08 20:45:12 +08:00
@tinybaby365 不要闭门造车。阿里云的技术实在是烂到家。想当然 k8s 拯救世界。到现在我们也只敢里面放无状态的。有无状态的依然用传统的部署方式。不能光想着省钱,业务可靠性也是很重要的。mysql 扔过,没扛到上线,来回死。es 就不用说了,需要关闭 swap 等内核参数调整。redis 可以是可以。对不起,网络模型还是 iptable 方案。当然有其他的…但也没稳定到哪去。

redis 其实我觉得也够呛…跑跑无状态的服务还是蛮 ok 的。k8s 将就整体服务一致性的稳定性。单个 pod 就是要随时可能没有。你试试上线 mq,redis,db 出一丢丢问题?

从用 aws 得 rds 后。真的 sla 很高…就没出过问题。从来没管过。自己升级自己备份。自己玩得挺嗨的。

不要拿国内这些以市场运营为主的云厂商拍死全部的云厂商。其实最近试试微软云,感觉好像也不错…就是操作有点迷…

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/617736

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX