如何集中管理 200 台云服务器

300 天前
 Gtristan

搜罗的帖子说用 k8s 目前还没搭建 k8s ,有其它的铁子说说,你们都是怎么管理多台云服务器( Centos+Ubuntu )的吗 主要实现基本功能如下

  1. 能看服务器在线状态(尽量多显示 cpu 内存等信息那更好)
  2. 服务器离线提醒
  3. 其它系统信息

有这样的开源平台吗

2055 次点击
所在节点    问与答
21 条回复
cuixiao603
300 天前
Prometheus
Aliencn
300 天前
这个需求只需要一个监控就能实现吧。zabbix 或 prometheus
GeorgeWai
300 天前
先拿出一台机器,然后把公钥丢给下面 200 台机器。然后基于 ssh 可以愉快的玩了,想看啥,就发命令,坐等返回,返回结果里会告诉你哪些机器超时了,5 分钟跑一次即可。
ropon
300 天前
jumpserver 统一管理
prometheus 监控
ropon
300 天前
@ropon prometheus+node_exporter 监控
b7cn
300 天前
有个 iis7 的服务器管理工具
Gtristan
300 天前
CaCo6
300 天前
随便整个探针不就行了?
graetdk
300 天前
哈哈,我想起我当年管理一堆服务器的艰难经历了。不过,如今的技术真是越来越发达了,管理云服务器也变得更加容易。建议可以考虑采用一些云平台的管理工具,或者使用自动化部署等技术,来轻松应对这个数量级的服务器管理工作。祝你好运!
bytesfold
300 天前
说随便整整的一定没有大批量机器😅;

机器规模一旦起来了管理非常困难,不过基础的开源工具无论如何都是要用的,例如:Ansible 、Prometheus 、ELK
vast0906
300 天前
Ansible / SaltStack (批量执行工具) + Prometheus (监控) + Grafana (展示)
flexbug
300 天前
监控用 prometheus ,grafana ,alertmanager 管理的话 saltstack ,puppet ,ansible ,jump server 也行
deorth
300 天前
招个好点的运维
LCD
300 天前
jumpserver 简单够用,但不知道为什么批量执行脚本的图标转很久。。。,不知道是否 bug
LCD
300 天前
另外 fabric 也是不错,几行就可以跑起来,只是开始接触的时候坑太多了
Illusionary
300 天前
你都说云服务器了,还需要你搞这些这么基础的监控? 云厂商本来就有,你只要稍微配置一下告警指标和告警渠道就好了
me1onsoda
300 天前
就这么简单的需求,云厂商的控制台不就能满足
wuzhewuyou
300 天前
蹲个结果,暂时想到写一个 mqtt ,各服务器向总服务台发送状态信息,很容易做到离线提醒,支持一些远程指令等
nomytwins
300 天前
我们用的 appnode
Subfire
297 天前
Proxmox VE

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/956737

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX