安装配置
下载安装包
| 1 | # 下载 Prometheus 服务端程序 | 
安装 Prometheus
- 解压压缩包
| 1 | tar zxvf prometheus-2.18.1.linux-amd64.tar.gz | 
- 配置服务文件 /etc/systemd/system/prometheus.service
| 1 | [Unit] | 
- 加载服务并启动 Prometheus 服务
| 1 | systemctl daemon-reload | 
- 查看端口
| 1 | [root@prometheus local]# netstat -anptl |grep 9090 | 
- 浏览器访问地址 172.16.68.23:9090
安装 Alertmanager
- 解压压缩包
| 1 | tar zxvf alertmanager-0.20.0.linux-amd64.tar.gz | 
- 配置服务文件 /etc/systemd/system/alertmanager.service
| 1 | [Unit] | 
- 加载服务并启动 alertmanager 服务
| 1 | systemctl daemon-reload | 
- 查看端口
| 1 | netstat -anplt |grep 9093 | 
安装 Grafana
- 解压文件
| 1 | tar zxvf grafana-6.7.3.linux-amd64.tar.gz -C /usr/local | 
- 配置服务文件 /etc/systemd/system/grafana.service
| 1 | [Unit] | 
- 重新加载服务并启动 grafana 服务
| 1 | systemctl daemon-reload | 
- 查看端口
| 1 | netstat -anptl |grep 3000 | 
- grafana 初始账号密码为 admin/admin, 第一次登陆会提示修改密码。
安装 exporter
- 解压文件
| 1 | tar zxvf node_exporter-0.18.1.linux-amd64.tar.gz | 
- 配置服务文件 /etc/systemd/system/node_exporter.service
| 1 | [Unit] | 
- 重新加载服务并启动 node_exporter 服务
| 1 | systemctl daemon-reload | 
- 查看端口
| 1 | netstat -anptl |grep 9100 | 
配置 Prometheus 监控 node 节点
- 编辑 Prometheus 配置文件 prometheus.yml,添加监控对象以及监控任务
| 1 | scrape_configs: | 
- 添加 configs/host.yml 文件
| 1 | - labels: | 
- 重启服务
| 1 | systemctl restart prometheus | 
配置 Prometheus Alertmanager
修改 prometheus.yml 配置文件的如下内容
| 1 | # Alertmanager configuration | 
创建 rules 文件
| 1 | mkdir rules && cd rules | 
- host_status.yml 内容如下
| 1 | groups: | 
- memory_usage.yml
| 1 | groups: | 
修改 Alertmanager 配置文件 alertmanager.yml
| 1 | global: | 
创建告警模板文件
- email.tmpl
| 1 | {{ define "email.html" }} | 
- wechat.tmpl
| 1 | {{ define "wechat.html" }} | 
重启服务
| 1 | systemctl restart prometheus | 
测试告警
停掉一台服务器的 node_exporter,然后访问 http://172.16.68.23:9090/alerts, 查看告警相关的规则
 
		