使用Netdata监控树莓派温度,设置阈值发出警告
2022年11月30日...大约 2 分钟
注意
阅读本篇文章,默认你的树莓派已经安装了 netdata
,如果没有安装,参考官方教程安装,我是使用的docker安装,其它安装方式官方也有。
1.编写配置文件
官方有快速入门的文档,按照文档,先在 /etc/netdata/health.d/
文件夹下新建文件,文件名为 cpu_temperature.conf
,然后使用命令编辑该文件:
cd /etc/netdata/
./edit-config health.d/cpu_temperature.conf
填写如下内容:
alarm: cpu_temperature
on: sensors.cpu_thermal-virtual-0_temperature
units: Celsius
lookup: average -10s
every: 10s
warn: $this > 50
crit: $this > 60
info: cpu core temperature
每一行的含义:
alarm
:警报的名字on
:监听的图表名,确定图表名方法 --> alarm-line-onunits
:单位lookup
:警报监测哪些指标,监测的时间长度,计算得到的值保存到$this
average
:计算收集到的所有指标的平均值-10s
:使用从10秒前到现在的指标来计算这个平均值。
every
:多长时间进行一次lookup
计算,以决定是否触发该警报。warn
/crit
:Netdata触发警告或严重警报的值。info
:警报的描述,将出现在仪表板和通知中
一句话概括上面的配置文件就是:
名为cpu_temperature的警报监听sensors.cpu_thermal-virtual-0_temperature图表,它计算最后10秒钟内的指标(也就是温度)的平均值,它每10秒计算一次,如果计算的值超过50(也就是超过50℃),将触发警告警报,如果超过60,将触发严重警告。
2.重新加载配置
保存好上面的配置文件后,需要重新加载才能生效,执行下面的命令在不重启Netdata的情况下重新加载:
netdatacli reload-health
3.检查是否生效
有两种方式检查配置是否生效
1.本地web服务
浏览器访问Netdata监控面板,访问如下界面
在列表中就能找到刚才创建的警报,如果有就表明已生效
2.Netdata Cloud
如果使用了Netdata Cloud,并且关闭了本地web服务,打开Netdata Cloud的面板,按照如下步骤能找到刚才创建的警报,点进去就能查看详情
使用了Netdata Cloud,在触发阈值时还能给你发送通知邮件。
Powered by Waline v3.3.2