我是如何把网站图片 cdn 流量成本压到全网最低(之一)的

2022-09-05 09:32:44 +08:00
 star7th

缘起

我经营的一些网站和产品的访问量越来越高,付出的 cdn 流量成本(主要是图片资源)也越来越大。抱着节省成本的想法,我尝试在网络上找下有没有便宜的 cdn 商家。 像阿里云、腾讯云、七牛云,这些公有云 cdn 的价格都大同小异,我感觉即使从这一家换到另一家,也节省不了多少成本,同时还增加了迁移的麻烦。因此我把目光投向传统机房,预感可能越接近机器底层,能优化的空间越大。

经过几天的考察,发现很多非热门地区的机房都或多或少都有一些闲置的优惠产品,甚至其中也不乏优质带宽机器。特别是三四线机房,线路测试其实还不错。很明显这些闲置资源没有得到充分利用。一个点子在我脑海中酝酿了。

使用开源 or 自己原创?

假如我把各地的闲置机器组织起来,把它们当成一个个节点,组建起一个分布式网络,自动容灾切换,岂不就是一个廉价的自建 cdn 方案了? 顺着这个思路,我去找一下开源的 cdn 软件 ,看看有没有现成的解决方案。

然而事情没有我想的那么简单。开源 cdn 并没有很好的容灾切换机制,无法实时避障。 它核心原理里,用域名 cname 的方式指向某个节点 ip ,当节点挂了的时候,由于域名 cname 解析变更有 10 分钟以上的缓存,所以必定会导致用户有一段时间的访问故障。 我现在探索的是把各地机房集成到一起,其中机器节点的可靠性是参差不齐的。如果想做成一套 cdn ,那么就必须要假设节点是不可靠的,随时可能故障的,然后为此设计一套完善的容灾解决方案。

既然找不到现成的开源解决方案,那就自己动手写代码实现吧。

基本逻辑

我边啃着玉米,边用笔在纸上画着逻辑交互图。 经过一阵子的反复斟酌,基本逻辑已经成型。

1 ,这套程序主要有两个角色,调度服务器和节点服务器。调度服务器架设在阿里云 k8s 上,保障高可用。而节点服务器则是分布在各地机房,做好可能会故障、随时容灾切换的准备。

2 ,调度服务器的作用是导流和容灾,将用户流量以重定向的方式导向可用的节点,同时避开故障节点,做到实时无缝切换。

3 ,节点服务器的主要作用是拉取源文件到本地缓存,从而被用户访问。

4 ,节点服务器跟调度服务器之间要用某 tcp 协议实时连接监控,监控粒度细分到每个文件,方便调度服务器实时避开故障节点,这样才能保证故障时候,用户访问的每个链接都可以正常切换访问。这里实时性是非常重要的,也是容灾方案的核心。

小试牛刀

于是我花了一个多月的时间去写代码来实现这个逻辑。核心代码其实写得很快,但是为了保障稳定性,增加了非常多的异常容灾措施,要花时间不断测试不断重写。 初期只放三个异地机房节点,把流量切进来看看。 为了保险起见,先从小的做起。我一开始切日均 10G 流量过去,让它跑几天。 几天后,没问题。 试试日均 50G 流量? 50G 跑了几天,ok 。日均 300G ? 依然正常运行 。

开放商用

现在,已经完美运行了一个月,每天承受超过 1000G 流量,暂时没发现有故障现象。我以及一些朋友的很多产品都在用。我刻意关掉其中一个节点,调度服务器马上切流量到其他节点。我刻意关闭全部节点,流量也马上转到源站。整个过程中,只要调度服务器正常运作,那么,无论节点故障与否,用户都将继续无感知地正常访问图片。 而调度服务器直接运行在阿里云 k8s 上,可靠性是非常高的。因此整套架构的可靠性很高。

有了这个架构,如果需要承受更大流量,我只需要增加节点数即可。而全国范围内的机房机器多的是 ,我可以随时租机器来新增节点。当我意识到有规模化运作大流量的可能性后, 我决定把 cdn 能力包装出去 ,商业化运作。于是注册并备案了大风云网, 访问地址是 www.dfyun.com.cn

结语

大风云 www.dfyun.com.cn 严格来讲不是传统 cdn ,它是另一种内容分发机制,基于传统 cdn 以及传统机房机器, 用软件技术实现资源整合,是应用层面的一种微创新,在图片访问,文件下载等这些场景下可以成倍地降低流量成本 ,成本低于 0.05G/元 , 降低到公有云 cdn 价格的四分之一以下(只对比平时价格,不考虑搞活动的临时特价),几乎是全网 cdn 流量成本最低之一了。

26222 次点击
所在节点    分享创造
190 条回复
xiaoz
2022-09-05 12:50:16 +08:00
其实腾讯、阿里的代理商他们也能拿到 0.05/G 的价格。另外网址首页好像没有 title ?
xx3122
2022-09-05 13:05:29 +08:00
我有个需求,基于 nginx 的防火墙,屏蔽一些 ip 和 ua 之类的,想通过 cdn 或其他更加方便的方式给其他人使用,op 有更好的方案不?谢谢
star7th
2022-09-05 13:09:38 +08:00
@joesonw 所以自定义域名很麻烦,要同步证书什么的,不一定会提供。至于你说客户端缓存,是的,url 变了,缓存肯定失效
star7th
2022-09-05 13:10:11 +08:00
star7th
2022-09-05 13:12:52 +08:00
@xiaoz 我了解过了,腾讯云阿里云,只有非常大单的客户,才有可能拿到 0.07 左右的价格。要达到 0.05 的价格需要的规模更大大,中小网站就别想了。而我这个起步就是 0.05 的价格,还是有优势的。首页 titlel 的问题,后面再加
yuzo555
2022-09-05 13:13:29 +08:00
如果流量够大,从大厂商那边拿到价格也可以低于 0.05 元 / GB 。
westoy
2022-09-05 13:16:46 +08:00
成本不只是流量本身啊

审核、 硬防、 管理、容灾冗余、客户管理

CDN 外卖的都是摊进去算的, 你一旦提供商业方案, 这些也会成为你的成本的
star7th
2022-09-05 13:19:15 +08:00
@xx3122 我看不懂你的需求和使用场景,没有想好的解决方案。
star7th
2022-09-05 13:20:20 +08:00
@yuzo555 中小网站都不可能有这个流量规模,所以这块市场还是空白的
star7th
2022-09-05 13:25:34 +08:00
@westoy 规模没有足够大的时候,有些成本可以省掉。规模大了的时候,就自然有足够的经济支撑去解决这些问题了
mingsi
2022-09-05 13:31:47 +08:00
楼主强大,我曾经考虑过用家宽搞,自己用用,但没实际行动。
SakuraPGH
2022-09-05 13:52:27 +08:00
我这边访问官网 cdn 图片访问 demo 时,图 1 和图 4 挂了
hankai17
2022-09-05 13:57:09 +08:00
2 ,调度服务器的作用是导流和容灾,将用户流量以重定向的方式导向可用的节点,同时避开故障节点,做到实时无缝切换。

3 ,节点服务器的主要作用是拉取源文件到本地缓存,从而被用户访问。

调度服务器跟节点之间维护一个文件白名单是吗? 白名单怎么同步?
star7th
2022-09-05 14:01:47 +08:00
@SakuraPGH 图 1 和图 4 我检查了下,它被调度到一个不常用端口。我这边访问正常,但据我所知,有些公司的网络会禁止员工的电脑访问非常用端口,可能导致无法限制。这个更多是公司网络防火墙限制。我晚点改一下节点端口为常用端口。
star7th
2022-09-05 14:02:48 +08:00
@hankai17 更细的技术细节就不透露了哈哈,毕竟要商业混饭吃,还是留一点技术门槛吧
ScepterZ
2022-09-05 14:11:27 +08:00
@joesonw 尽量少切换的话,应该大部分时候 uri 不会变,只有增减机器了的时候会变
whileFalse
2022-09-05 15:42:23 +08:00
怎么解决用户侧网络不通 你服务器端网络通畅的问题?
pkwenda
2022-09-05 15:48:51 +08:00
@whileFalse 用户侧网络不通,用正儿八经的 CDN 也无法解决吧?
airqj
2022-09-05 16:09:53 +08:00
@yuzo555 我觉得满足你这个流量够大条件的公司 根本不会点开这个帖子 🐶
star7th
2022-09-05 16:20:57 +08:00
@whileFalse 用户自身的网络问题,服务端层面无法帮用户解决

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/877718

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX