安装配置
下载安装包
1 | # 下载 Prometheus 服务端程序 |
安装 Prometheus
- 解压压缩包
1 | tar zxvf prometheus-2.18.1.linux-amd64.tar.gz |
- 配置服务文件 /etc/systemd/system/prometheus.service
1 | [Unit] |
- 加载服务并启动 Prometheus 服务
1 | systemctl daemon-reload |
- 查看端口
1 | [root@prometheus local]# netstat -anptl |grep 9090 |
- 浏览器访问地址 172.16.68.23:9090
安装 Alertmanager
- 解压压缩包
1 | tar zxvf alertmanager-0.20.0.linux-amd64.tar.gz |
- 配置服务文件 /etc/systemd/system/alertmanager.service
1 | [Unit] |
- 加载服务并启动 alertmanager 服务
1 | systemctl daemon-reload |
- 查看端口
1 | netstat -anplt |grep 9093 |
安装 Grafana
- 解压文件
1 | tar zxvf grafana-6.7.3.linux-amd64.tar.gz -C /usr/local |
- 配置服务文件 /etc/systemd/system/grafana.service
1 | [Unit] |
- 重新加载服务并启动 grafana 服务
1 | systemctl daemon-reload |
- 查看端口
1 | netstat -anptl |grep 3000 |
- grafana 初始账号密码为 admin/admin, 第一次登陆会提示修改密码。
安装 exporter
- 解压文件
1 | tar zxvf node_exporter-0.18.1.linux-amd64.tar.gz |
- 配置服务文件 /etc/systemd/system/node_exporter.service
1 | [Unit] |
- 重新加载服务并启动 node_exporter 服务
1 | systemctl daemon-reload |
- 查看端口
1 | netstat -anptl |grep 9100 |
配置 Prometheus 监控 node 节点
- 编辑 Prometheus 配置文件 prometheus.yml,添加监控对象以及监控任务
1 | scrape_configs: |
- 添加 configs/host.yml 文件
1 | - labels: |
- 重启服务
1 | systemctl restart prometheus |
配置 Prometheus Alertmanager
修改 prometheus.yml 配置文件的如下内容
1 | # Alertmanager configuration |
创建 rules 文件
1 | mkdir rules && cd rules |
- host_status.yml 内容如下
1 | groups: |
- memory_usage.yml
1 | groups: |
修改 Alertmanager 配置文件 alertmanager.yml
1 | global: |
创建告警模板文件
- email.tmpl
1 | {{ define "email.html" }} |
- wechat.tmpl
1 | {{ define "wechat.html" }} |
重启服务
1 | systemctl restart prometheus |
测试告警
停掉一台服务器的 node_exporter,然后访问 http://172.16.68.23:9090/alerts
, 查看告警相关的规则