对于类互联网后端服务而言,监控系统的重要性不言而喻。一般大厂都会有专门的团队结合自身业务打造一套专属的监控系统(或者说可观测系统)——集成数据埋点、上报、指标计算、可视化展示、告警、归因等一系列功能。
但是对于中小厂而言,专门养一个这样的团队,ROI 可能不高,因此可能会使用一些开源方案、或者云厂商提供的服务,想了解一下,有此类经验的同学,是否在使用这些系统、服务时有什么痛点问题。
1
Hieast 52 天前
专门招人来做 SRE 最好,不然永远有做不完的需求和技术债
|
![]() |
2
SethShi 52 天前
可以看看阿里云的 ARMS, 支持上百种标准协议接入, 囊括硬件层, 网关层, 应用层,
数据收集用的 opentelemetry 协议收集 => 存储到 SLS => 指标计算使用 ARMS, 可以看到 p99, 超时错误等等 ==> 价格太高的话把保存天数设置为 7 天就行 |
![]() |
3
SethShi 52 天前
|
4
guanyujia5444 52 天前
ARMS 很好用,该花钱花钱
|
![]() |
5
zfyp 52 天前
小公司最主要是不重视,没钱做或者不想花钱
|
6
salmon5 52 天前
ARMS ,养一个这样的团队?弄一地鸡毛?
|
7
kiraskyler 52 天前
做深入的性能观测的门槛很高,只是基础的话开源工具就可用,比如普罗米修斯这种。
|
8
nickyadance23 52 天前
@salmon5 #6 我经历过的 500 人小厂,增长期招大厂 infra 进来一顿折腾包括监控、框架和中间件等,上市无望后全部裁掉真正的一地鸡毛。最经典的是接口返回码得从 0 改成 200 ,说是对齐 http~~
|
![]() |
9
pc10201 52 天前
有很多公司在用夜莺监控系统了,不过夜莺公司也没有赚到很多钱
|
![]() |
10
mengdodo 51 天前
小公司建议还是多把心思花在业务上,整天研究自己的员工算哪门子事
|
12
dawee2y 51 天前
直接用开源的,比如 skywalking 这种
|
15
salmon5 51 天前
|
![]() |
16
Desdemor 51 天前
需求没那么大, 普罗米修斯+阿里云的 log 已经满足大部分场景了
|
17
julyclyde 50 天前
小厂的好处就是没那么多多余的人去创造新项目
尽量跟随主流/标准就行了 |
![]() |
18
abcbuzhiming 50 天前
小厂最大的问题就是没钱没人,监控这东西做的够好是要投入钱和人的,小厂要做这个,就只能做个样子货
|
![]() |
19
tianshiyeben 49 天前
看看 www.wgstart.com 监控 工单 日志都有了
|