zabbix入门
第一章 监控知识基本概述
1.1 为什么要使用监控
1.对系统不间断实时监控
2.实时反馈系统当前状态
3.保证服务可靠性安全性
4.保证业务持续稳定运行
1.2 如何进行监控,比如我们需要监控磁盘的使用率
1.如何查看磁盘使用率 df -h
2.监控磁盘的那些指标 block、 inode
3.如何获取具体的信息 df -h|awk ‘//(NF-1)’
4.获取的数值到达多少报警 80%
1.3 流行的监控工具
1.Zabbix
2.Lepus(天兔)数据库监控系统
3.Open-Falcon 小米开源监控系统
4.Prometheus(普罗米修斯, Docker、 K8s)
1.4 如果去到一家新公司,如何入手监控
1.硬件监控 路由器、交换机、防火墙
2.系统监控 CPU、内存、磁盘、网络、进程、 TCP
3.服务监控 nginx、 php、 tomcat、 redis、 memcache、 mysql
4.WEB监控 请求时间、响应时间、加载时间
5.日志监控 ELk(收集、存储、分析、展示) 日志易
6.安全监控 Firewalld、 WAF(Nginx+lua)、安全宝、牛盾云、安全狗
7.网络监控 smokeping 多机房
8.业务监控 活动引入多少流量、产生多少注册量、带来多大价值
第二章 单机时代如何监控
2.1 传统监控相关命令
CPU 监控命令: w、 top、 htop、 glances
1
|
%Cpu(s): 0.3 us, 0.3 sy, 0.0 ni, 99.3 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
|
内存监控命令: free
1
|
[root@m01 ~]
|
磁盘监控命令: df、 iotop
1
|
Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn
|
网络监控命令: ifconfig、 route、 glances、 iftop、 nethogs、 netstat
1
|
单位换算
|
2.2 传统监控痛点
随着时间的推移,用户不断的增多,服务随时可能扛不住会被 oom(out of memory),当系统内存不足的时候,就会触发 oom
1.当系统内存不足的时候就会大量使用 swap
2.当系统大量使用 swap 的时候,系统会特别卡
注意: 有时可能内存还有剩余 300Mb-500Mb,但会发现 swap 依然被使用
1
|
[root@ZabbixServer ~]# dd if=/dev/zero of=/dev/null bs=800M
|
2.3 使用Shell脚本监控
那单机时代,如何使用 shell 脚本来实现服务器的监控
需求: 每隔 1 分钟监控一次内存,当你的可用内存低于 100m,发邮件报警,要求显示剩余内存
1.怎么获取内存可用的值 free -m|awk ‘/^Mem/{print $NF}’
2.获取到内存可用的值如何和设定的阈值进行比较
3.比较如果大于 100m 则不处理,如果小于 100 则报警
4.如何每隔 1 分钟执行一次
1
|
[root@ZabbixServer ~]# cat free.sh
|
第三章 zabbix 监控快速安装
2.1 安装mariadb
2.1.1 安装官方最新版mariadb
由于官网的MariaDB版本要比阿里云的版本要高,所以我们应该优先使用官方的版本
1
|
1.首先在RHEL/CentOS和Fedora操作系统中添加MariaDB的yum配置文件MariaDB.repo文件。
|
2.1.2 使用阿里云源安装Mariadb
1
|
# 如果官方的下载网速太慢,我们就使用阿里云低版本的mariadb数据库
|
2.1.3 安装好了之后,使用systemctl进行mariadb服务管理
1
|
systemctl start mariadb #启动MariaDB
|
2.1.4 初始化mariadb
1
|
mysql_secure_installation
|
2.1.5 优先解决中文无法正常显示的问题
1
|
1.停掉mariadb服务
|
2.2 配置zabbix仓库
1
|
[root@m01 ~]
|
2.3 安装 Zabbix 程序包,以及 MySQL、前端、代理
1
|
[
|
注意:nginx软件包在官方存储库中不可用。可以在epel资料库中找到。
1
|
yum -y install epel-release
|
2.4 创建 Zabbix 数据库以及用户
1
|
[
|
2.5 导入 Zabbix 数据至数据库中
1
|
[
|
2.6 配置Zabbix服务器数据库
编辑/etc/zabbix/zabbix_server.conf 文件,修改数据库配置
1
|
[root@m01 ~]# cat /etc/zabbix/zabbix_server.conf
|
2.7 为zabbix前端配置PHP
编辑文件/etc/nginx/conf.d/zabbix.conf,取消注释并设置’listen’和’server_name’指令。
1
|
listen 80;
|
编辑文件/etc/php-fpm.d/zabbix.conf,取消注释并设置正确的时区。
1
|
php_value[date.timezone] = Asia/Shanghai
|
2.8 启动 Zabbix 服务进程,并加入开机自启动
1
|
[
|
第四章 WEB安装步骤
4.1浏览器打开地址:http://10.0.0.9/setup.php
4.2 检查依赖项是否存在异常
4.3 配置zabbix连接数据库
4.4 配置 ZabbixServer 服务器的信息
4.5 最终确认检查
4.6 安装成功
提示已成功地安装了 Zabbix 前端。配置文件/etc/zabbix/web/zabbix.conf.php 被创建。
4.7 登陆zabbix
默认登陆 ZabbixWeb 的用户名 Admin,密码 zabbix
4.8 调整字符集为中文
查看仪表盘
4.9 修复中文乱码
打开图形之后会发现语言为乱码,原因是缺少字体
解决方法:安装字体并替换现有字体
1
|
[
|
再次刷新发现已经变成中文了
第五章 Zabbix 监控基础架构
zabbix-agent(数据采集)—>zabbix-server(数据分析|报警)—> 数据库(数据存储)—>zabbix web(数据展示)
第六章 zabbix 快速监控主机
6.1安装zabbix-agent
1
|
[root@web01 ~]
|
6.2配置zabbix-agent
1
|
[root@web01 ~]# cat /etc/zabbix/zabbix_agentd.conf
|
6.3 启动zabbix-agent并检查
1
|
[root@web01 ~]# systemctl start zabbix-agent.service
|
6.4 zabbix-web界面,添加主机
点击创建主机, 填写以下主机信息
再点击并选择模板
第七章 自定义监控主机小试身手
7.1 监控需求
监控TCP11种状态集
7.2 命令行实现
1
|
[
|
7.3 编写zabbix监控文件(传参形式)
1
|
[root@web01 ~]# cat /etc/zabbix/zabbix_agentd.d/tcp_status.conf
|
7.4 server端进行测试
1
|
[
|
7.5 web端添加
添加tcp_state监控项
点击图形查看状态
用同样的方式再添加一个TIME_WAIT监控项
查看TIME_WAIT状态
7.6 克隆监控项
由于TCP有多种状态,需要添加多个监控项,我们可以使用克隆快速达到创建的效果
但前提是配置文件里面除了监控名称,其他都一样,例:
1
|
[root@web01 ~]# cat /etc/zabbix/zabbix_agentd.d/userparameter_mysql.conf
|
添加好配置文件后,注意需要重启zabbix-agent端
其他的状态依次添加即可
7.7 创建图形
7.8 查看图形
7.9 设置触发器
点击创建触发器
第八章 邮件报警
8.1 定义发件人
编辑Email报警配置
8.2 定义收件人
8.3 自定义报警内容
定制报警内容:
https://www.zabbix.com/documentation/4.0/zh/manual/appendix/macros/supported_by_location
参考博客
1
|
https://www.cnblogs.com/bixiaoyu/p/7302541.html
|
发送警告
1
|
报警邮件标题可以使用默认信息,亦可使用如下中文报警内容
|
恢复警告
1
|
恢复标题:恢复{TRIGGER.STATUS}, 服务器:{HOSTNAME1}: {TRIGGER.NAME}已恢复!
|
第九章 微信报警
9.1 查看配置文件里的脚本目录路径
1
|
[root@m01 ~]# grep "^AlertScriptsPath" /etc/zabbix/zabbix_server.conf
|
9.2 将weixin.py放在zabbix特定目录
1
|
[root@m01 /usr/lib/zabbix/alertscripts]# ll
|
9.3 配置发信人
添加微信报警,配置脚本参数
1
|
{ALERT.SENDTO} # 动作
|
9.4 配置收信人
9.5 登陆企业微信公众号添加账户
https://work.weixin.qq.com/wework_admin/loginpage_wx
1.登陆后在企业号上新建应用
2.上传logo,填写应用名称 ,应用介绍等
3.查看启动应用
同时会生成应用的AgentId以及Secret,这个在后面步骤会有用
4.接口调用测试
http://work.weixin.qq.com/api/devtools/devtool.php
这里的corpid为公司ID
Corpsecret就是刚才创建应用生成的Secrt,确认没问题填写进去然后下一步
如果没问题会显示200状态码
9.6 添加成员
9.7 关注公众号
9.8 查看自己的账号
9.9 修改脚本里的信息
1
|
[
|
9.10 发信测试
1
|
[
|
例:
1
|
python weixin.py 13530930319 '发信测试' ‘微信测试消息’
|
9.11 微信号上查看
9.12 配置文件权限(非常重要)
在脚本里面有写日志的功能,所以zabbix用户要有日志文件的所有权限
1
|
chmod 755 /tmp/log
|
9.13 发送到整个微信组
虽然我们实现了发送到单个用户的功能,但是如果我们的用户比较多,这样还是麻烦的,不过我们可以发送到整个组,其实脚本里已经预留好了配置,只不过默认注释了。
将脚本修改为以下内容,注释掉用户,打开组设置
1
|
|
9.14 发送到所有用户脚本
1
|
|
9.15 随机发送到指定用户脚本
1
|
|
第十章 自定义模版(新版本不支持)
10.1 监控TCP11种状态
编写zabbix配置文件, 添加以下内容
1
|
[
|
10.2 重启zabbix-agent
1
|
[
|
10.3 测试监控项
使用zabbix-get命令测试
1
|
[root@m01 ~]# yum install zabbix-get.x86_64 -y
|
10.4 导入模版文件
10.5 主机关联模版文件
10.6 查看最新数据
10.7 查看图形
jianshu
第十一章 自定义模版监控nginx状态
11.1 开启监控页面并访问测试
1
|
[
|
11.2 准备nginx监控状态脚本
1
|
[root@web01 /etc/zabbix/zabbix_agentd.d]# cat nginx_monitor.sh
|
11.3 编写zabbix监控配置文件
1
|
[root@web01 ~]# cat /etc/zabbix/zabbix_agentd.d/nginx_status.conf
|
11.4 使用zabbix_get取值
1
|
[root@m01 ~]# zabbix_get -s 10.0.1.7 -k nginx_status[accepts]
|
11.5 导入模版
11.6 链接模版
11.7 查看数据
第十二章 自定义模版监控php状态
12.1 开启监控页面
1
|
[
|
12.2 访问测试
1
|
[root@web01 ~]
|
12.3 准备访问脚本
1
|
[root@web01 ~]# cat /etc/zabbix/zabbix_agentd.d/fpm.sh
|
12.4 准备zabbix配置文件
1
|
[root@web01 ~]# cat /etc/zabbix/zabbix_agentd.d/fpm.conf
|
12.5 使用zabbix_get取值
1
|
[root@m01 ~]# zabbix_get -s 10.0.1.7 -k php-fpm["total processes",http://127.0.0.1/php_status]
|
12.6 导入模版
导入之后需要修改一下模版里的宏配置
第十三章 WEB监控
需求,监控页面状态码
添加Web场景
配置步骤:
第十四章 故障记录
故障1
故障现象:
提示zabbix-server is not running
报错日志:
1
|
34983:20190807:202215.171 database is down: reconnecting in 10 seconds
|
故障原因:
zabbix-server的配置文件里配有配置数据库密码
故障解决:
添加正确的数据库账号密码信息
1
|
[root@m01 ~]
|
故障2
故障现象:微信报警失败
报错日志:
1
|
[root@m01 ~]# tail -f /var/log/zabbix/zabbix_server.log
|
问题原因:
缺少模块 requests
问题解决:
安装缺失的依赖包
1
|
[
|
故障3
故障现象:
在server端使用zabbix_get命令测试键值命令时提示警告
1
|
[root@m01 ~]# zabbix_get -s 10.0.1.7 -k ESTABLISHED
|
问题原因:
zabbix_agent是以普通用户zabbix运行的,而普通用户执行netstat -antp时会有警告,网上查找发现只要不是用p参数就可以以普通用户运行
解决方案:
监控脚本里的命令修改为netstat -ant
转自虎哥:https://www.lxh1.com/2019/12/09/linux/zabbix%E7%9B%91%E6%8E%A7%E6%9C%8D%E5%8A%A1/
原文地址:https://www.cnblogs.com/wpnr/p/12055624.html
- spark三种连接join
- 用firebug给firefox添加信任链接
- Elasticsearch索引别名、Filtered索引别名、Template
- 追本溯源:Oracle 只读表空间的探索实践
- firefox查看微信公众平台的数据分析时就出现不信任链接怎么办?
- spark-streaming集成Kafka处理实时数据
- 使用spark与MySQL进行数据交互的方法
- python分布式环境下的限流器
- commons-pool与commons-pool2连接池(Hadoop连接池)
- Glusterfs 文件系统
- 时过境迁:Oracle跨平台迁移之XTTS方案与实践
- Kazoo Python Zookeeper 选主
- Linux Redis集群搭建与集群客户端实现
- python使用上下文管理器实现sqlite3事务机制
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法