Grafana 警报路由指南

Lucas Simon

2024年4月16日星期二上午11:57:44

在 Grafana 中配置双电子邮件警报
在 Grafana 中管理警报配置通常需要微调，特别是当不同的情况需要向单独的联系点发送通知时。目前，警报系统设置为通过通知单个联络点来统一处理所有情况，而不管具体的警报条件如何。
现在的挑战是根据警报触发器的性质（错误与匹配条件）将警报定向到两个不同的电子邮件地址，从而增强此设置。这一调整将有助于有针对性的沟通，并确保正确的团队有效地解决具体问题。

命令描述

require('nodemailer') 加载用于从 Node.js 发送电子邮件的 Nodemailer 模块。

require('express') 加载 Express 框架以处理 Node.js 中的 Web 服务器功能。

express.json() Express 中的中间件用于解析传入的 JSON 有效负载。

createTransport() 使用默认 SMTP 传输创建可重用传输程序对象。

sendMail() 使用传输器对象发送电子邮件。

app.post() 定义一个路由，并将其绑定到特定函数，以便在路由被 POST 请求触发时执行。

app.listen() 开始接受指定端口上的连接。

fetch() 用于发出 Web 请求和处理响应的本机浏览器功能。

setInterval() 安排按设定的时间间隔重复执行某个函数。

命令	描述
require('nodemailer')	加载用于从 Node.js 发送电子邮件的 Nodemailer 模块。
require('express')	加载 Express 框架以处理 Node.js 中的 Web 服务器功能。
express.json()	Express 中的中间件用于解析传入的 JSON 有效负载。
createTransport()	使用默认 SMTP 传输创建可重用传输程序对象。
sendMail()	使用传输器对象发送电子邮件。
app.post()	定义一个路由，并将其绑定到特定函数，以便在路由被 POST 请求触发时执行。
app.listen()	开始接受指定端口上的连接。
fetch()	用于发出 Web 请求和处理响应的本机浏览器功能。
setInterval()	安排按设定的时间间隔重复执行某个函数。

解释 Grafana 警报脚本

提供的脚本用作后端和前端解决方案，用于根据警报条件管理具有不同接触点的 Grafana 警报。后端脚本使用 Node.js 以及 Express 框架和 Nodemailer 模块。此设置允许创建一个 Web 服务器来侦听指定端口上的 POST 请求。当 Grafana 中触发警报时，它会将数据发送到该服务器。然后，服务器分析警报的性质（无论是由于错误还是匹配条件），并使用 Nodemailer 将电子邮件路由到适当的联系点。

前端脚本旨在使用纯 HTML 和 JavaScript 在网页上动态显示警报状态。它定期从后端获取警报状态并相应地更新网页。这对于不同团队可能需要快速了解特定类型警报的环境中的实时监控特别有用。使用“fetch()”发出 Web 请求并使用“setInterval()”设置刷新率可确保仪表板保持最新状态，而无需手动干预。

Grafana 警报中的动态电子邮件路由

Node.js 与 Nodemailer 和 Grafana Webhook

const nodemailer = require('nodemailer');
const express = require('express');
const app = express();
const port = 3000;
app.use(express.json());
const transporter = nodemailer.createTransport({
  service: 'gmail',
  auth: {
    user: 'your-email@gmail.com',
    pass: 'your-password'
  }
});
app.post('/alert', (req, res) => {
  const { alertState, ruleId } = req.body;
  let mailOptions = {
    from: 'your-email@gmail.com',
    to: '',
    subject: 'Grafana Alert Notification',
    text: `Alert Details: ${JSON.stringify(req.body)}`
  };
  if (alertState === 'error') {
    mailOptions.to = 'contact-point1@example.com';
  } else if (alertState === 'ok') {
    mailOptions.to = 'contact-point2@example.com';
  }
  transporter.sendMail(mailOptions, (error, info) => {
    if (error) {
      console.log('Error sending email', error);
      res.status(500).send('Email send failed');
    } else {
      console.log('Email sent:', info.response);
      res.send('Email sent successfully');
    }
  });
});
app.listen(port, () => console.log(`Server running on port ${port}`));

Grafana 警报状态的前端可视化

JavaScript 与 HTML

<html>
<head>
<title>Grafana Alert Dashboard</title>
</head>
<body>
<div id="alertStatus"></div>
<script>
const fetchData = async () => {
  const response = await fetch('/alert/status');
  const data = await response.json();
  document.getElementById('alertStatus').innerHTML = `Current Alert Status: ${data.status}`;
};
fetchData();
setInterval(fetchData, 10000); // Update every 10 seconds
</script>
</body>
</html>

Grafana 中的高级警报管理

在高级 Grafana 配置中，根据多种条件管理警报并向不同端点发送通知可以显着提高运营效率。通过利用 Grafana 灵活的警报框架，用户可以设置复杂的规则，根据特定的数据模式或系统状态做出不同的反应。这种灵活性对于需要不同级别响应严重性的系统或需要特定信息的部门至关重要。 Grafana 允许创建多个通知渠道，这些渠道可以定向到各种电子邮件地址或其他通知系统，例如 Slack、PagerDuty 或 SMS。

设置此类配置涉及在 Grafana 中定义警报条件并使用外部脚本或 Grafana API 来增强功能。例如，通过将 Grafana 与 Node.js 等脚本解决方案集成（如所示），用户可以编写自定义逻辑来处理不同的警报状态。此方法提供了一种更细致的警报管理方法，确保正确的人员在正确的时间（可能在问题升级之前）获得正确的信息。

如何在 Grafana 中创建警报？
您可以直接从 Grafana 仪表板创建警报，方法是选择您想要发出警报的面板，然后单击“警报”选项卡并设置触发警报的条件。
Grafana 可以向多个收件人发送警报吗？
是的，Grafana 可以通过配置多个通知渠道并将其与您的警报规则关联来向多个收件人发送警报。
是否可以根据严重性自定义 Grafana 警报？
是的，您可以根据严重性自定义警报，方法是在警报规则中使用不同的条件并将其路由到适当的渠道。
我可以将外部 API 与 Grafana 集成以实现更复杂的警报吗？
是的，Grafana 支持与外部 API 集成，从而允许更复杂的警报机制和自定义通知逻辑。
如何确保即使在服务器停机期间也始终发送 Grafana 警报？
为了确保在服务器停机期间发送警报，您应该考虑将 Grafana 实例及其数据库托管在高可用性服务器上，或使用提供强大正常运行时间保证的 Grafana Cloud。

根据警报条件在 Grafana 中向不同收件人定制警报通知的能力为系统监控和事件响应提供了显着的优势。通过使用 Node.js 中的脚本并集成 Grafana 灵活的警报功能，管理员可以确保将关键信息及时转发给适当的利益相关者，从而提高运营效率和响应能力。