V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
qm
V2EX  ›  程序员

类互联网中小厂在监控系统方面有什么痛点吗?

  •  
  •   qm · 52 天前 · 2707 次点击
    这是一个创建于 52 天前的主题,其中的信息可能已经有所发展或是发生改变。

    对于类互联网后端服务而言,监控系统的重要性不言而喻。一般大厂都会有专门的团队结合自身业务打造一套专属的监控系统(或者说可观测系统)——集成数据埋点、上报、指标计算、可视化展示、告警、归因等一系列功能。

    但是对于中小厂而言,专门养一个这样的团队,ROI 可能不高,因此可能会使用一些开源方案、或者云厂商提供的服务,想了解一下,有此类经验的同学,是否在使用这些系统、服务时有什么痛点问题。

    19 条回复    2025-08-10 14:49:53 +08:00
    Hieast
        1
    Hieast  
       52 天前
    专门招人来做 SRE 最好,不然永远有做不完的需求和技术债
    SethShi
        2
    SethShi  
       52 天前
    可以看看阿里云的 ARMS, 支持上百种标准协议接入, 囊括硬件层, 网关层, 应用层,
    数据收集用的 opentelemetry 协议收集 =>
    存储到 SLS =>
    指标计算使用 ARMS, 可以看到 p99, 超时错误等等 ==>
    价格太高的话把保存天数设置为 7 天就行
    SethShi
        3
    SethShi  
       52 天前
    报警的话有自带的 AlertManager,
    比如监控某个时间段内 P99 超过 250ms,
    或者 500 错误大于 20 开始报警


    补一张图, 竞品的话有一个叫做听云的, 它们家主做"探针"无代码侵入, 不过价格有点小贵
    guanyujia5444
        4
    guanyujia5444  
       52 天前
    ARMS 很好用,该花钱花钱
    zfyp
        5
    zfyp  
       52 天前
    小公司最主要是不重视,没钱做或者不想花钱
    salmon5
        6
    salmon5  
       52 天前
    ARMS ,养一个这样的团队?弄一地鸡毛?
    kiraskyler
        7
    kiraskyler  
       52 天前
    做深入的性能观测的门槛很高,只是基础的话开源工具就可用,比如普罗米修斯这种。
    nickyadance23
        8
    nickyadance23  
       52 天前
    @salmon5 #6 我经历过的 500 人小厂,增长期招大厂 infra 进来一顿折腾包括监控、框架和中间件等,上市无望后全部裁掉真正的一地鸡毛。最经典的是接口返回码得从 0 改成 200 ,说是对齐 http~~
    pc10201
        9
    pc10201  
       52 天前
    有很多公司在用夜莺监控系统了,不过夜莺公司也没有赚到很多钱
    mengdodo
        10
    mengdodo  
       51 天前
    小公司建议还是多把心思花在业务上,整天研究自己的员工算哪门子事
    gravelbit
        11
    gravelbit  
       51 天前
    @mengdodo #10 别人说是业务监控..
    dawee2y
        12
    dawee2y  
       51 天前
    直接用开源的,比如 skywalking 这种
    DUNAI
        13
    DUNAI  
       51 天前
    @salmon5 笑死我了
    DUNAI
        14
    DUNAI  
       51 天前
    @mengdodo 为什么美国时间比中国慢,是因为美国人懒吗
    salmon5
        15
    salmon5  
       51 天前
    @DUNAI #13
    @nickyadance23 #8
    亲身经历,因为 APM 不是最终用户的需求,是内部需求,是内部技术上藏污纳垢的地方,很容易乱搞。最终绝对一地鸡毛。
    Desdemor
        16
    Desdemor  
       51 天前
    需求没那么大, 普罗米修斯+阿里云的 log 已经满足大部分场景了
    julyclyde
        17
    julyclyde  
       50 天前
    小厂的好处就是没那么多多余的人去创造新项目
    尽量跟随主流/标准就行了
    abcbuzhiming
        18
    abcbuzhiming  
       50 天前
    小厂最大的问题就是没钱没人,监控这东西做的够好是要投入钱和人的,小厂要做这个,就只能做个样子货
    tianshiyeben
        19
    tianshiyeben  
       49 天前
    看看 www.wgstart.com 监控 工单 日志都有了
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5206 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 08:58 · PVG 16:58 · LAX 01:58 · JFK 04:58
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.