官方文档: Alerting Rules
Prometheus 中文文档: Prometheus 中文文档
Prometheus 告警处理
告警能力在Prometheus的架构中被划分为两个部分:
more >>生如蝼蚁当立鸿鹄之志, 命如薄纸应有不屈之心!
官方文档: Alerting Rules
Prometheus 中文文档: Prometheus 中文文档
告警能力在Prometheus的架构中被划分为两个部分:
more >>官方文档: CONFIGURATION
模板配置: simple.yml
可视化路由编辑器: Routing tree editor
首先来看一个简单的 Alertmanager 的配置示例
more >>Operator 是由 CoreOS 公司开发的用来扩展 Kubernetes API 的特定应用程序控制器,用来创建,配置和管理复杂的有状态应用,例如数据库,缓存和监控系统。Prometheus Operator 就是基于 Operator 框架开发的管理 Prometheus 集群的控制器。
目前,CoreOS 官方提供了几种 Operator 的代码实现,其中就包括 Prometheus Operator。如下图所示,是 Prometheus Operator 官方提供的架构图
more >>Blackbox_Exporter 项目地址: blackbox_exporter
blackbox_exporter 允许通过 HTTP、HTTPS、DNS、TCP 和 ICMP 对端点进行黑盒探测。新版的 Prometheus Stack 已经默认安装了 Blackbox Exporter,可以通过以下命令查看
1 | # kubectl get po -n monitoring -l app.kubernetes.io/name=blackbox-exporter |
公司的 k8s 集群使用的是 kube-prometheus
监控的,除了 kube-prometheus
外,公司还有一些其他主机也需要使用 Prometheus 监控起来。Prometheus 可以添加额外的配置文件,详细的可以查看 Additional Scrape Configuration
具体的步骤如下:
参考文档:
SNMP: SNMP 是(Simple Network Management Protocol)简单网络管理协议的缩写。SNMP 用于通过设置某些属性的值来管理网络设备(通常称为托管对象),并通过从设备轮训必要的指标来监控网络设备。
SNMP 包括简单的客户端-服务器架构。在你的网络管理解决方案上运行的 SNMP 客户端将负责轮询数据或设置数据。运行在你实际设备上的 SNMP 服务器将响应 SNMP 客户端的调用。默认情况下,在网络设备中不会打开 SNMP 代理。如果需要,网络管理员必须启用 SNMP。
more >>Kubernetes 是 Google 基于 Borg 开源的容器编排调度引擎。作为 CNCF 最重要的项目,Kubernetes 的目标不止是成为一个编排系统,更是提供一种规范,该规范可以让我们描述集群的架构并定义服务的最终状态,让系统自动达到和维持这种状态。
对于 Kubernetes 这样庞大的系统来说,监控告警自然是不可或缺的。对于 Kubernetes 集群,我们一般需要考虑监控以下几个方面:
more >>当前稳定的 HTTP API 可在 Prometheus 服务器上的 /api/v1 下访问。任何不间断的添加都将添加到该端点下。
API 响应格式为 JSON。每个成功的 API 请求都会返回一个 2xx 状态代码。
tag:
缺失模块。
1、请确保node版本大于6.2
2、在博客根目录(注意不是yilia-plus根目录)执行以下命令:
npm i hexo-generator-json-content --save
3、在根目录_config.yml里添加配置:
jsonContent: meta: false pages: false posts: title: true date: true path: true text: false raw: false content: false slug: false updated: false comments: false link: false permalink: false excerpt: false categories: false tags: true