開發與維運

SLS告警內置通知渠道最佳實踐

概述

為了實現全方位、多層次的告警通知,SLS告警內置了多種通知渠道,從觸達強度、通知內容豐富程度等方面進行了全方位的覆蓋。大體上來說,這些通知渠道分為以下三大類:

  • 用戶相關:短信、語音、郵件
  • Webhook相關:釘釘、企業微信、飛書、Slack以及其它通用Webhook
  • 其它:阿里雲消息中心

本文會詳細介紹各個渠道的一些特點以及限制,並給出一般場景下的最佳實踐。

渠道介紹

SLS告警內置通知渠道的一些比較如下表所示:

分類

通知渠道

觸達強度

內容豐富程度

限制及建議

用戶相關

短信

較強

簡單

  • 有字數限制,通常在200字以內
  • 建議只發送簡短、必要的信息
  • 避免在短信中加入超鏈接等內容,不然容易導致內容過長被截斷

語音

簡單

  • 有字數限制,通常在200字以內
  • 建議只發送簡短、必要的信息
  • 建議用來發送嚴重的告警通知,對於低級別的告警避免語音打擾
  • 由於語音的特殊性,因此儘可能避免各種特殊字符或無意義的英文單詞

郵件

較弱

豐富

  • 可以發送較長信息,適合發送告警詳情
  • 內容中支持基礎的 HTML 標籤

Webhook相關

釘釘

較強

豐富

  • 內容支持較長信息,適合發送告警詳情
  • 釘釘還支持@某個人或者@所有人
  • 支持Markdown內容,可以添加各種超鏈接,方便進一步查看和操作

企業微信

較強

豐富

飛書

較強

豐富

Slack

較強

豐富

通用Webhook

未知

豐富

  • 通常用來對接企業內部 IM 系統或者內部運維管理平臺
  • 具體行為取決於自建服務的業務邏輯

其它

消息中心

一般

  • 觸達性較弱,一般用的不多

最佳實踐

根據上面的表格,我們可以發現,一般來說,不同的渠道適合不同的發送內容,因此根據實際需求,選取合適的通知渠道,或者使用多種通知渠道相結合,是非常有必要的。

通常來說,會多種渠道結合使用,並且會在行動策略中針對每種渠道配置單獨的接收人(用戶、用戶組或者值班組)、接收時段(不限制、工作日、工作時間等),從而形成多層次的通知,不僅可以快速感知到告警,而且可以根據需要查看詳細的內容。

例如:

  • 嚴重的告警需要直接打電話,並且不管是否是工作時間——強觸達,通知內容簡單
  • 所有告警都可以直接通過釘釘和短信通知——觸達比語音弱一些,但是可以查看詳細內容
  • 在有需要的場景下,可以使用值班組來進行負責人的輪換

1.png

進一步參考

更多相關信息,可以參考:

對我們工作感興趣的,可以通過如下方式瞭解更多,謝謝關注!

2.png

Leave a Reply

Your email address will not be published. Required fields are marked *