大厂的对象存储都是基于什么实现的呢?

2021-09-01 15:18:27 +08:00
 acbot
腾讯云 COS,阿里云 OSS,HW OBS 这些对象存储服务是独立自主实现的,还是基于什么开源项目(比如 :MinIO )实现的呢?
7942 次点击
所在节点    云计算
34 条回复
acbot
2021-09-02 08:33:24 +08:00
@ospider 是什么原因造成 ceph 不能支撑大的场景呢?如果自用只是存储量比较大的情况 ceph 能胜任不呢?
swulling
2021-09-02 09:57:18 +08:00
说底层用 ceph 的可能对数据量缺乏想象力
dynastysea
2021-09-02 10:30:19 +08:00
@moult 如果你是个存储行业的,你就知道 HW 的存储实力有多强了(软硬层面全栈都有自研,腾讯现在还停留在软件层面,阿里也在涉及存储硬件开发),互联网公司在华为面前就是跟玩似的,特别是腾讯,虽然是自研但基本也是跟着开源的节奏来(华为在国外都有专门的研究所,比如俄罗斯有专门的存储算法研究团队,存储部门内的博士更是一大堆,阿里也有美国研发团队,博士也不少。腾讯投入小很多,基本都是国内招本科生、研究生,存储行业好的博士基本不会选择腾讯,多数都是选择华为、阿里,很多在华为的挖都挖不动,对于那些深研技术的,目前国内差不多只有华为、阿里有更高的平台可以让他们接触到最前沿的存储技术)。华为存储做的很早,腾讯、阿里存储组里面很多华为跳槽过来的。
zmxnv123
2021-09-02 12:19:14 +08:00
hdfs+hbase 目前对象数大概几十万亿。
armyHcz
2021-09-02 16:06:46 +08:00
@moult 七牛用的是阿里云包了一层
hemingway
2021-09-02 19:07:20 +08:00
除了 ceph 和 minio 还有其他选择么?对于小厂来说,不自研的话
henvm
2021-09-02 22:08:53 +08:00
@dynastysea 这点比较赞同,我记得我公司之前一个客户买了一台华为的存储设备 15 万吧,他们用起来很舒服,
kerro1990
2021-09-03 09:01:27 +08:00
用 AWS S3
yuyuko
2021-09-05 05:20:48 +08:00
对象存储是存储中难度最小的了吧。。。协议层召点人怼一下,元数据层用开源方案,存储层随便搞搞就行,反正不要 iops,不要时延,吞吐大力出奇迹
yuyuko
2021-09-05 05:25:09 +08:00
@dynastysea 哈哈,国内不还有 emc 嘛,我们这边好多 emc 出来的人😂
my3157
2021-10-08 23:34:36 +08:00
恰好做过对象存储, 对象存储确实看起来是 块 /文件 /对象 三个存储里面实现难度最小的, 前提是实现个玩具, 如果要做一个真正严肃意义上生产可用, 甚至提供公有云服务的商业产品, 工程细节上需要下大力气, 而且在中大规模场景下(100PB 以上), 会有一个量变到质变的过程, 有很大难度的, 反而在三个存储里面, 块存储相对来说是复杂度比较可控的
my3157
2021-10-08 23:40:39 +08:00
至于性能, 谁不想性能好一点呢? 为了压榨性能, 存储内部走 RDMA , 绕过本地文件系统, 直接管理裸设备已经是基本操作了, 各种 offload 优化商业产品都前几年就开始做了, 总体来说, 开源产品技术上不差, 但是动力上稍微欠缺, 需要自身有维护能力
Sunmxt
2021-10-09 01:49:39 +08:00
没有一个开源项目撑得住公有云的数据规模
acbot
2021-10-09 08:32:49 +08:00
@Sunmxt 据我观察公有云也是不同域部署多个对象存储 不是一个对象存储服务全域

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/799276

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX