1、Zabbix的功能概述
1.1 zabbix是什么
Alexei Vladishev創建了Zabbix項目,當前處于活躍的開發狀態,Zabbix SIA提供支持。
Zabbix是一個企業級的、開源的、分布式的監控套件。
Zabbix可以對網絡和服務進行監控。 Zabbix利用靈活的告警機制,可實現微信、短信和郵件的自動報警。Zabbix利用存儲的監控數據提供監控報告及實現圖形化顯示。
Zabbix支持polling和trapping兩種方式。所有的Zabbix報告都可以通過配置參數在WEB界面進行訪問。你可以通過Web界面實時查看網絡和服務的監控狀況。 不管你是小型組織還是大規模的公司,Zabbix都可以通過不通的配置來扮演監控你的IT基礎框架的角色。
Zabbix是零成本的,因為Zabbix編寫和發布基于GPL V2協議. 意味著源代碼是免費發布的。
同時,Zabbix公司也提供商業化的技術支持。
1.2 zabbix特性
Zabbix是一個高度集成的網絡監控套件,通過一個軟件包即可提供如下特性
可用性及性能檢測
支持SNMP(trapping及polling)、IPMI、JMX監控
自定義檢測
自定義間隔收集收據
server/proxy/agents實現分布監控環境
允許靈活地自定義故障閥值,Zabbix中稱為觸發器(trigger), 存儲在后端數據庫中
可以自定義告警升級(escalation)、接收者及告警方式
告警信息可以配置并允許使用宏(macro)變量
通過遠程命令實行自動化動作(action)
通過內置的繪圖引擎實現監控數據實時繪圖
允許自定義創建多監控項視圖
網絡拓撲(network maps)
自定義的面板(screen)和slide shows,并允許在dashboard頁面顯示
報告
高等級(商業)監控資源
數據存儲在數據庫中
歷史數據可配置
內置數據清理機制
主機通過添加監控設備方式添加
一次配置,終生監控(除非調整或刪除)
監控設備允許使用模板
模板中可以添加組監控
模板允許繼承
自動發現網絡設備
agent自動注冊
自動發現文件系統、網卡設備、SNMP OID等
web前端采用php編寫
訪問無障礙
你想怎么做就能做么做
審計日志
Zabbix API提供程序級別的訪問接口,第三方程序可以很快接入
安全的權限認證
用戶可以限制允許維護的列表
在監控目標上部署
支持Linux及Windows
C開發,高性能,低內存消耗
易移植
通過Zabbix proxy可以非常容易的創建遠程監控
1.3 Zabbix功能
監控拓撲圖說明:
(1)可以通過微信、短信、郵件實現自動報警機制
(2)可以通過Web頁面進行配置,監控狀態查看
(3)可以通過SNMP協議實現對打印機、路由器、交換機的設備的監控
通過在植入agent的方式對服務器主機進行監控
通過ping或者是port檢查的方式實現IP和PORT的監控
可實現大多數系統的監控,包括windows、Linux、unix、Solaris、Mac等等,如圖:
對主機可監控項包括:
CPU:CPU負載,CPU使用率
Memory:內存使用率,可交換內存/虛擬內存使用率
Network:網絡傳輸、網絡故障、丟包
Disk:磁盤使用率,磁盤I/O
Service:進程監控、界面服務、TCP端口連接,響應時間、DNS監控、NTP監控
Log:日志監控,文本日志,事件日志
File:文件監控
Other:性能計數器(僅限于Windows系統)
自定義報警機制:
如圖所示,
如果故障在10分鐘沒有被解決,可以短信或郵件通知系統管理員
如果故障在15分鐘沒有被解決,可以短信或郵件通知運維人員
如果故障在30分鐘沒有被解決,可以短信或郵件通知經理
可以通過proxy代理服務器,代理Zabbix server搜集被監控的監控數據,并統一發送到Server端
2、zabbix程序架構
架構圖如下:
Zabbix各組件的說明:
Zabbix Server為核心組件,用來獲取agent存活狀況及監控數據。所有的配置、統計、操作數據均通過Server進行存取到database
所有的Zabbix數據均存儲在數據庫中
為了更簡單的無障礙的訪問Zabbix, 所以提供了web接口。該接口作為Zabbix Server的一部分,通常和server運行在同一臺主機上
注意:如果采用SQLite作為數據庫,web接口和Zabbix Server必須運行在同一臺主機上
Zabbix Proxy能夠代替Zabbix Server進行性能及可用性數據采集。Proxy是Zabbix部署的可選組件。 如果想分擔單一Zabbix Server負載,推薦使用proxy。
Zabbix agents 部署在目標監控機上并監控本地資源和應用,將收集數據匯報給Zabbix Server
通過zabbix監控數據流,并采取相應的措施。
首先要創建一個host,再創建一個item來搜集數據
通過item來創建觸發器(trigger)
通過觸發器(trigger)來創建一個動作(action)
例如:如果你想監控一個服務器的CPU負載狀況,你首先為該服務器創建一個主機條目,其次是創建一個item來監控服務器的CPU狀況,并創建相應的觸發機制,當cpu負載達到某個閥值,觸發操作,該操作包括執行設定的動作和發送郵件報警。
可以將這些操作設置成一個模板,要監控某臺主機的時候,直接套用模板即可。
Zabbix各組件結構圖:
Zabbix相關術語:
相關名詞解釋:
主機(host)
一個你想監控的網絡設備(需要知道IP/DNS)
主機組(host group)
一個邏輯的主機組,它包含主機和模板。主機和模板在同一個主機內的話模板不能被link到其他上。主機組通常用于給不同的用戶組創建訪問權限
監控項(item)
你想從主機中收集到的數據
觸發器(trigger)
一個邏輯表達式,用來表達從監控項獲取的數據達到了預設的故障閥值
當接收到的監控值達到了預設的閥值,則觸發器狀態由’OK’變更為’Problem’,當收到的監控值低于閥值,則狀態保持/變更為’OK’
事件(event)
一個事情發生如觸發器狀態變更或一個自動發現(discovery)/agent自動注冊等
動作(action)
當一個事件發生時預設的處理過程
一個動作(action)包括操作(operations,如發送告警)和條件(當指定的操作完成)
告警升級(escalation)
在動作中一個自定的操作執行過程,一個發送告警/執行遠程命令的隊列
媒介(media)
發送告警的渠道
告警(notification)
通過媒介(media)渠道發送事件的消息
遠程命令(remote command)
當監控主機達到某些條件(condition)后預設的自動執行的命令
模板(template)
一組包含監控項、觸發器、繪圖、面板(screen)、應用、低級別自動發現規則等并且能被其他主機應用的實體
模板能夠提升主機部署監控任務的速度,同時也非常容易對監控任務做批量(mass)更新。模板被主機鏈接(link).
應用(application)
監控項邏輯組
web方案(scenario)
對一個web站點可用性進行檢查的一個或多個http請求
前端(frontend)
Zabbix提供的web接口
Zabbix API
Zabbix API允許通過JSON RPC協議去創建、更新、獲得Zabbix對象(如主機、監控項、繪圖等等)以及完成自定義任務
Zabbix server
Zabbix軟件中心進程,用于連通Zabbix proxy及agent完成監控、評估觸發器、發送告警以及中心數據存儲
Zabbix agent
部署在監控主機上的進程,用于監控本地資源和應用
Zabbix proxy
替代Zabbix server完成數據收集的進程,通常用于降低中心Zabbix Server的負載
節點(node)
一套完整的Zabbix server配置,通常位于分布式系統中,用于負責本區域的監控
Zabbix工作流程圖:
Server
Zabbix server是Zabbix軟件的核心進程。
Server通過polling和trapping采集數據來判斷是否達到閥值,從而使用觸發器發送報警給用戶。Server也可以通過簡單服務檢查(simple service check)來完成遠程網絡服務檢測。
Server既是保存所有配置、統計和操作數據的數據庫,也是故障報警服務。
Zabbix server根據不同功能可劃分為三個部分:Zabbix server、Web GUI及Database。
由于Zabbix的所有的配置信息保存在數據庫中,server和web GUI可以直接進行操作。比如,通過Web界面(或者API)創建一個新的監控項時,它將創建的數據插入數據庫。一分鐘左右Zabbix server會查詢監控項數據表,并將查詢的監控項列表保存在自己的緩存(cache)中。這也是為什么通過Zabbix前端進行的變更將在兩分鐘左右生效的原因。
Zabbix server以守護(daemon)進程方式運行。
Zabbix server默認要求運行在非root賬戶下。
如果Zabbix server和agent運行在同一臺主機上,建議分別運行在不同的用戶下,因為一旦運行的同一個用戶下,agent將可以訪問server的配置文件,并且能夠輕松取得Zabbix Admin級別用戶,例如,數據庫密碼。
Zabbix server在以下平臺進行過測試:
Linux
Solaris
AIX
HP-UX
Mac OS X
FreeBSD
OpenBSD
NetBSD
SCO Open Server
Tru64/OSF1
Agent:
Zabbix agent部署在被監控主機上用來監控本地資源和應用(如硬盤、內存、處理器等)。
Zabbix agent收集本地主機運行信息并將數據發送給Zabbix server進行處理. 一旦出現異常(如硬盤滿或服務進程中斷), Zabbix server會自動響應并進行報警操作。
Zabbix agent利用本地系統調用完成統計信息收集,因此它非常的高效。
被動(passive)和主動(active)檢查
Zabbix agent提供被動和主動檢查方式。
在 被動檢查 模式中agent應答數據請求,Zabbix server或者proxy詢問agent數據,如CPU load,然后Zabbix agent回送結果給server.
主動檢查 處理過程將相對復雜,agent必須先進行一次請求Zabbix server索取監控項列表,然后發送對應的值給server.
選擇是被動還是主動檢查,需要在 監控項類型 中選擇’Zabbix agent’或者’Zabbix agent (active)’。
Zabbix agent運行在被監控主機上,可以通過守護進行的方式運行。
Zabbix agent一般要求運行在非root賬戶下。
如果你在’root’賬戶下啟動Zabbix agent,它將自動選擇在操作系統中建立的’zabbix’用戶,除非你修改agent配置文件中’AllowRoot’參數。
Zabbix agent支持以下平臺:
Linux
IBM AIX
FreeBSD
NetBSD
OpenBSD
HP-UX
Mac OS X
Solaris
Windows: 2000, Server 2003, XP, Vista, Server 2008, 7
代理proxy
Zabbix代理(proxy)通常用于替代server收集監控信息并將數據發送給Zabbix server。所收集數據會先存儲在代理主機的緩存中然后傳送給Zabbix server。
代理是可選的,不過使用它可以有效的降低分布式環境中單一的Zabbix server負載。通過代理去收集監控數據,server可以有效降低CPU和磁盤I/O消耗。
Zabbix代理可以出色的完成遠程區域、分支機構、無本地管理員的網絡的集中監控。
Zabbix代理使用獨立的數據庫。
注意:Zabbix proxy數據庫可以使用SQLite, MySQL, PostgreSQL. 如果Oracle或IBM DB2在低等級自動發現規則時存在限制和風險。
Zabbix proxy作為守護進程運行。
Zabbix proxy一般要求運行在非root賬戶下。
如果在’root’賬戶運行,它將自動選擇之前已經在操作系統建立的’zabbix’用戶,但是無法在編譯時或在配置文件中進行配置。
Java gateway
zabbix2.0之后引入的一個功能。Java網關,類似agentd,但是只用于監控運行在Java虛擬機上的Java應用。它只能主動去獲取數據,而不能被動獲取數據。它的數據最終會給到server或者proxy。
Zabbix 2.0通過Zabbix Java gateway的守護進程對JMX應用進行監控。Zabbix Java gateway是采用Java編寫的一個守護進程,Zabbix Java gateway利用 JMX API 去請求遠程的有關應用。
Java gateway接受來自Zabbix server或者proxy的連接。在Zabbix server或proxy的配置文件中指定JAVA gateway的IP和端口,因此在每一個Zabbix server或proxy中只能配置一個Java gateway。
當在Java gateway上的一個監控項值更新了,Zabbix server或代理將連接Java gateway請求該值。同樣的,Java gateway不會緩存任何值。
Zabbix server或代理可以通過 StartJavaPollers 控制連接Java gateway的進程。Java gateway在內部通過 START_POLLERS 控制選項使用多線程啟動。 在Zabbix Server端,如果一個連接請求超過了 Timeout 設定的秒數,連接將會終止,但Java gateway也許此時依然忙于從JMX計數器中檢索該值。
建議 StartJavaPollers 小于或等于 START_POLLERS ,否則可能導致當連接Java gateway時而Java gateway沒有多余的線程進行處理。
當Java gateway已經運行,需要在 server配置文件 中指定JavaGateway的IP和端口,如果JMX應用采用Zabbix代理進行監控的話,你需要在 代理配置文件 中指定對應的連接參數。
Sender
Zabbix sender命令行工具常用于發送性能數據給Zabbix server。
該工具常用于在長時間運行的用戶自定義腳本中以便不斷發送可用性及性能數據。
Get
Zabbix get用于連接Zabbix agent并從agent上檢索需要的信息。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。