怎么监控多台服务器?
你的解决不是太清楚可以写不出两样。我想你需要更多的主要分子系统视频监控和核心业务摄像监控两类吧
子系统监控视频就是每台游戏主机的cpu核心,运行内存,网络的带宽等使用情况严重,以及mysql,redis,tomcat等专业服务的核心指标等,这是比较基本的监控记录,要得有,如果这块监控视频做的好,生产操作也可以提前原来很多其他问题,防范于未然。
互联网业务摄像监控就是核心业务相关的相关指标,如某应用程序接口千米每秒请求数量,每分钟该api的平均响应时间,服务的在线人数比例,甚至一些运营中相关的数据,如七日付费率啦,每日本周新增普通用户,每日流失量现有用户等。这些数据全面也很重要,他你整个业务方面的风向标,为你做一些重要最终决策提供完整依照。
对于系统监控,有很多开源技术也能拿来用,如比较出名的ngios,saltstack,redis等,系统部署都比较复杂,客户端同步要部manager,还得装一个centre可用作日常收集,存储数据魅力展现数据全面,还有好多各种插件需要维护良好。但有一个比较简单那些是collectd,它自带了各种各种插件,如系统实现cpu,本地磁盘使用效率,mongodb,tomcat,redix等常用提供的服务都可
以进行视频监控,而且自动给你推荐三了要摄像监控哪些相关指标。部分安装很方便,基本上./configureampampforampampmakesudo就可以了。
对于核心业务监控记录,肯定是可以自己写程序上报业务方面最终数据的,但是比较流行的最佳方案是collectdcarbon,比较轻量级,而且有很多语言的开发包,需要很自然把各种其他指标监控视频上去。
大多监控视频体系都基本上,如下
1、每台机器人上会安装一个manager,用来采集本机的性能数据数据,服务最终数据
2、每台自动机器部署到位的其他业务,根据一个api接口,向centre提交本业务相关的数据数据
3、每个proxy能够动态的按潜在需求加载一些第三方插件,以便视频监控新的其他指标
4、一般一个计算机机房内有一个center可用作整理和分析各agent和各核心业务汇总上报的其他指标
5、center要把收集到的其他指标数据数据并数据存储,分类归档,再压缩,一般用rrdresource
6、centre还得有一个javascript界面来可以查看各个指标的历史折线图,甚至要有各种平面视图和dashborad来数据显示一组相关的指标值。
7、centre还要每天把自定义的几个关键的指标值工厂生产报表数据发到运维工作或者人员。
8、department还需可以保存各种故障告警规则,如某个其他指标连续几次达到某个临界值不产生告警信息,或者波动达到某个区域范围引发实时告警,或者某个其他指标达到多长时间没有汇报最终数据引发自动告警
9、centre