百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

基于Zabbix主动发现机制实现Nacos服务动态监控

haoteby 2025-03-13 15:35 17 浏览

一、 快速部署Zabbix7.0

使用Docker-compose快速搭建Zabbix7.0监控平台,请参考文档: Zabbix7.0 Docker-compose部署指南

二. Nacos注册中心简介

Nacos(Dynamic Naming and Configuration Service)是阿里巴巴开源的服务注册与配置中心,主要提供两大核心功能:

  • 服务发现与管理:实现微服务的注册、发现和健康监测
  • 动态配置管理:支持配置信息的集中管理和动态更新
  • 服务元数据管理:存储包括服务版本、健康状态等关键信息

作为微服务架构的核心组件,Nacos能有效解决服务拓扑动态变化带来的管理难题。

三、 从Nacos获取服务列表

3.1 服务查询接口

GET http://{nacos_url}/nacos/v1/ns/catalog/services

参数说明:

  • namespaceId:命名空间标识
  • pageNo:当前页码(支持分页)
  • pageSize:每页记录数

3.2 服务发现脚本

创建
nacos_service_discovery.py
实现双模式查询:

#!/usr/bin/python3
import requests
import json
import sys

nacos_url = "http://srebro.cn:8848"
namespace = "base-uat"
page_size = 1000

services_cache = []  # 全局缓存提升性能

def get_all_services():
    global services_cache
    if services_cache:
        return services_cache
        
    services = []
    page_no = 1
    while True:
        url = f"{nacos_url}/nacos/v1/ns/catalog/services?namespaceId={namespace}&pageNo={page_no}&pageSize={page_size}"
        try:
            resp = requests.get(url, timeout=10)
            resp.raise_for_status()
            data = resp.json()
            services.extend(data['serviceList'])
            if len(services) >= data.get('count', 0):
                break
            page_no += 1
        except Exception as e:
            print(f"Error: {e}")
            break
    services_cache = services
    return services

def main():
    if len(sys.argv) > 1:
        service_name = sys.argv[1]
        for service in get_all_services():
            if service["name"] == service_name:
                print(service.get("healthyInstanceCount", 0))
                return
        print(0)
        return
    
    discovery = {"data": []}
    for service in get_all_services():
        discovery["data"].append({
            "{#SERVICE_NAME}": service["name"],
            "{#HEALTHY_COUNT}": service.get("healthyInstanceCount", 0)
        })
    print(json.dumps(discovery))

if __name__ == "__main__":
    main()

3.3 脚本执行模式

  • 自动发现模式(无参数)
$ python3 nacos_service_discovery.py

{
    "data":[
        {
            "{#SERVICE_NAME}":"srebro-app-alarm",
            "{#HEALTHY_COUNT}":1
        },
        {
            "{#SERVICE_NAME}":"srebro-oss",
            "{#HEALTHY_COUNT}":1
        },
        {
            "{#SERVICE_NAME}":"srebro-sys",
            "{#HEALTHY_COUNT}":1
        },
        {
            "{#SERVICE_NAME}":"srebro-meta",
            "{#HEALTHY_COUNT}":1
        },
        {
            "{#SERVICE_NAME}":"srebro-message",
            "{#HEALTHY_COUNT}":2
        },
        {
            "{#SERVICE_NAME}":"srebro-uc",
            "{#HEALTHY_COUNT}":1
        },
        {
            "{#SERVICE_NAME}":"srebro-org",
            "{#HEALTHY_COUNT}":1
        },
        {
            "{#SERVICE_NAME}":"srebro-workflow",
            "{#HEALTHY_COUNT}":1
        },
        {
            "{#SERVICE_NAME}":"srebro-platform-iot-master",
            "{#HEALTHY_COUNT}":1
        },
        {
            "{#SERVICE_NAME}":"srebro-app-risk",
            "{#HEALTHY_COUNT}":1
        },
        {
            "{#SERVICE_NAME}":"srebro-job",
            "{#HEALTHY_COUNT}":1
        },
        {
            "{#SERVICE_NAME}":"srebro-export",
            "{#HEALTHY_COUNT}":1
        },
        {
            "{#SERVICE_NAME}":"srebro-gateway",
            "{#HEALTHY_COUNT}":1
        }
    ]
}
  • 健康实例查询(带服务名参数):
$ python3 nacos_service_discovery.py srebro-app-alarm
1

四、 Zabbix-agent 客户端配置

zabbix_agentd.conf中添加自定义监控项:【允许自定义KEY ,千万不能忘记 UnsafeUserParameters=1】

# 服务自动发现
UserParameter=nacos.enhanced.discovery,/usr/local/zabbix/bin/nacos_service_discovery.py

# 健康实例数查询
UserParameter=nacos.health.current[*],/usr/local/zabbix/bin/nacos_service_discovery.py "$1"

重启zabbix-agent服务

systemctl restart zabbix-agent

测试使用zabbix-get获取数据

[root@localhost bin]# /usr/local/zabbix/bin/zabbix_get -s 172.22.33.201 -k "nacos.health.current[srebro-message]"
2


五、 Zabbix模板配置

5.1 创建模板

属性

模板名称

Nacos Services Health Monitor

模板组

Templates

5.2 配置自动发现规则

参数

配置值

名称

Discover Services with Healthy Count

类型

Zabbix客户端主动式

键值

nacos.enhanced.discovery

更新间隔

1h

5.3 创建监控项原型

监控项原型配置项:

参数

配置值

名称

Health instances of {#SERVICE_NAME}

类型

Zabbix客户端主动式

键值

nacos.health.current["{#SERVICE_NAME}"]

信息类型

数字(无正负)

更新间隔

1m

5.4 创建触发器原型

触发器配置参数:

参数

配置值

名称

服务 {#SERVICE_NAME} 实例数 < 1

表达式

last(/Nacos Services Health Monitor/nacos.health.current["{#SERVICE_NAME}"])<1

严重性

灾难

描述

服务 {#SERVICE_NAME} 健康实例数降为0,可能导致服务不可用

六. 监控数据验证

通过监测 → 最新数据查看监控数据:

七、扩展建议

  1. 报警升级:配置连续报警机制,防止偶发误报
  2. 数据可视化:创建聚合仪表盘展示核心服务健康状态
  3. 日志追踪:结合ELK日志平台的异常日志关联分析

相关推荐

Chrome OS 41 用 Freon 取代 X11_chrome os atom

在刚发布的ChromeOS41里,除了常规的Wi-Fi稳定性提升(几乎所有系统的changelog里都会包含这一项)、访客模式壁纸等之外,还存在底层改变。这一更新中Google移除...

苹果iPad Pro再曝光 有望今年六月发布

自进入2015年以后,有关大屏iPad的消息便一直不绝于耳,之前就有不少媒体猜想这款全新的平板电脑将会在三月发布,不过可惜的是我么只在那次发布会上看到了MacBookPro。近日@Ubuntu团队便...

雷卯针对香橙派Orange Pi 5 Max开发板防雷防静电方案

一、应用场景高端平板、边缘计算、人工智能、云计算、AR/VR、智能安防、智能家居、Linux桌面计算机、Linux网络服务器、Android平板、Android游戏机...

Ubuntu Server无法更新问题解决_ubuntu server not found

上周老家的一台运行UbuntuServer的盒子无法连接上了,中秋这两天回来打开,顺手更新一下发现更新报错。提示`E:Releasefileforhttps://mirrors.aliyun...

虚幻引擎5正式版发布:古墓丽影&amp;巫师新作采用、新一代实时渲染

机器之心报道编辑:杜伟、陈萍虚幻引擎5的目标是「助力各种规模的团队在视觉领域和互动领域挑战极限,施展无限潜能」。...

AMD Milan-X双路霄龙7773X平台基准测试曝光 CPU缓存总量超1.5GB

OpenBenchmarking基准测试数据库刚刚曝光了AMDMilan-X双路霄龙7773X平台的跑分成绩,虽然很快就被撤下,但我们还是知晓了高达1.6GB的总CPU缓存。早些时...

ROS机器人建模_ros机器人硬件搭建

...

全网最新的Dify(1.7.2)私有化离线部署教程(ARM架构)

Hello,大家好!近期工作中有涉及到Dify私有化离线部署,特别是针对于一些国产设备。因此特别整理了该教程,实测有效!有需要的小伙伴可以参考下!本文主要针对Dify1.7.2最新版本+国产操作系...

在ubuntu下新建asp.net core项目_创建ubuntu

本文一步步讲述在ubuntu下用visualstudiocode创建asp.netcore项目的过程。step1:环境操作系统:virtualbox下安装的lubuntu。请不要开启“硬件...

在晶晨A311D2处理器上进行Linux硬件视频编码
在晶晨A311D2处理器上进行Linux硬件视频编码

在KhadasVIM4AmogicA311D2SBC上,我更多的时间是在使用Ubuntu22.04。它的总体性能还不错,只不过缺少3D图形加速和硬件视...

2025-08-26 17:22 haoteby

Nacos3.0重磅来袭!全面拥抱AI,单机及集群模式安装详细教程!

之前和大家分享过JDK17的多版本管理及详细安装过程,然后在项目升级完jdk17后又发现之前的注册和配置中心nacos又用不了,原因是之前的nacos1.3版本的,版本太老了,已经无法适配当前新的JD...

电影质量级渲染来了!虚幻引擎5.3正式发布:已开放下载

快科技9月8日消息,日前,Unrealengine正式发布了虚幻引擎5.3,带来了大量全方位的改进。...

2025如何选购办公电脑?极摩客mini主机英特尔系列选购指南

当下,迷你主机的性能越来越强,品类也越来越多。但是CPU是不变的,基本都是AMD和英特尔的。有一个小伙伴在评论区提问,我应该如何在众多机器中选购一台符合自己的迷你主机呢?那今天我们优先把我们的系列,分...

ubuntu 20.04+RTX4060 Ti+CUDA 11.7+cudnn

ububtu添加国内源sudocp/etc/apt/sources.list/etc/apt/sources.list.backupsudovim/etc/apt/sources.lis...

Linux Mint 18将重新基于Ubuntu 16.04 带来更好硬件支持

项目负责人ClementLefebvre在本月6日披露了关于LinuxMint18“Sarah”操作系统的大量信息,包括带来全新扁平化体验的Mint-Y主题。而现在,这款将于年底之前上线的操作...