以前,企業網絡工程師不得不為各種連接的服務器、應用程序和終端設備提供網絡接入和足夠的帶寬。從OSI模型角度看,這些工具主要關注于1-4層網絡。由于通過一個網絡的所有流量和數據流都共享全部的帶寬和隊列資源,更高的OSI層次多少被忽略了。
慢慢地,網絡設備變得越來越復雜,現在網絡中不同的數據流都可以被識別出來并區別對待。各種服務質量(QoS)和應用層流程成型技術也可用于實 現這個目 標。此外,隨著對于關鍵業務應用程序依賴程度越來越高,網絡工程師也迫切需要了解OSI模型的更高層次,這樣他們才能發現網絡、服務器操作系統、虛擬化軟 件和應用程序本身所存在的性能問題或其他問題。但是,要想解決這些問題,他們需要借助于一些工具。
在許多場景中,網絡性能監控工具已經從較為傳統和簡單的網絡監控軟件向前進化。這些監控工具通常使用ICMP的ping和簡單網絡監控協議 (SNMP)的 polling/traps去檢查網絡狀態。更現代的補充功能包括監控、基線化和智能分析應用程序本身的所有狀態。最先進的網絡監控工具則還能夠執行以下 5種功能:
1. 網絡與應用程序監控
2. 網絡問題分析
3. 應用數據與流攔截分析
4. 虛擬化與操作系統問題檢測
5. 問題根源分析
不同的網絡性能監控供應商在執行這些任務的粒度各不相同。而且,越精確的任務在實現和管理時會越復雜。因此,一定要準確理解自身組織的需求,之后再恰當地平衡粒度和復雜度。那么,我們接下來繼續分析現代網絡性能監控工具所具備的5個常用功能。
網絡與應用程序監控
正如前面所提到的,現代網絡監控工具已經從使用ICMP ping和SNMP協議的網絡監控進化為更復雜的工具了。來自網絡監控服務器的常規ping命令會發送到各種不同的網絡、服務器及其他需要監控的終端設備 上。如果所監控的設備沒有響應ping請求,那么監控工具可能會將該設備標記為“宕機”,然后向支持人員發出警報。
SNMP會收集和組織來自支持這種協議的網絡與服務器組件的各種不同類型的數據。
對于網絡設備而言,這通常意味著要不斷地監控特定的設備接口狀態和數據吞吐量。此外,它還會監控硬件狀態,其中包括電源、風扇和內存使用率等。
有一些網絡性能監控工具還能夠收集和響應各不同的系統日志(Syslog)消息。系統日志是一種面向基礎架構設備日志消息的通用標準。這些消息會被發送和 存儲到一個集中的網絡監控工具中,經過分析后會在出現系統故障時用于通知支持工程師。
網絡監控工具具有全面的監控能力,它不僅能夠監控可用性和性能統計數據,甚至能夠監控整個應用層。這種監控通常依賴于所配置的軟件插件或操作系統設置,將監控數據發送回中央監控服務器。
虛擬化和操作系統問題檢測
網絡與應用程序之間也一定會出現一些問題。這其中包括虛擬化、服務器操作系統及應用程序所依賴的各種中間件。虛擬機管理程序需要單獨監控可能造 成應用層性 能下降的問題。負責管理分布式系統之間通信的主操作系統和中間件也有一樣的問題。網絡性能監控供應商會使用不同的方法去監控這些問題,其中一些還支持更多 的虛擬機管理程序、操作系統和中間件軟件。
網絡問題分析
除了提供簡單的在線/斷線狀態和使用率信息,網絡性能監控產品還能執行更復雜的自動化網絡故障修復任務。這其中包括路由協議監控和計劃外路由變 化警報。此外,有一些產品還能使用智能技術去理解各種WAN技術、虛擬堆疊和QoS特性的工作方式。此外,它們還能設置成在出現問題時自動發送警報,甚至 還能夠執行 自動修復問題的操作。
應用數據與流的捕捉分析
現代網絡性能監控工具的最重要任務就是解析和分析數據與流。在網絡中,不同區域可以用不同的方法去捕捉數據包,然后執行自動和/或人工分析。最常見的方法 有:
1. 在所有關鍵的網絡位置上部署分布式數據采集代理。
2. 使用特定路由器/交換機硬件所具有的數據包捕捉功能。
分析數據包并執行更精細的應用分析,這是許多企業組織越來越重視的需求。通過使用深度數據包檢測技術,網絡管理員就能夠分辨出與應用程序關系更密切的通信問題,否則這些問題很難檢測到。
網絡流采集會整理出數據進出網卡的IP網絡統計信息。一旦將這些數據發送到一個集中的服務器并通過網絡性能監控流分析工具的分析,網絡支持管理 員就能夠分 辨流量的源信息和目標信息,以及流量在通過網絡時會遇到的詳細QoS策略。最終,這些數據會被用于識別網絡設備之間的配置問題或各個網絡路徑的擁塞問題。
問題根源分析
在一個網絡性能監控工具上整合各種事件數據并進行分析,能夠形成一種自動化問題根源分析功能。如果網絡中出現一個問題,然后它觸發多個組件的事 件,那么許 多網絡性能監控工具都會使用人工智能技術分析這些事件的關聯性,最終確定這個問題的根源。這是其中一個需要配置的復雜功能,因為它要求正確配置所有的設備 和監控系統。例如,如果設備時間沒有通過網絡時間協議(Network Time Protocol)進行同步,那么事件發現的時間就會出錯。這會給問題根源分析引擎的精確度造成負面影響。但是,一旦創建好并采取正確的維護措施,自動化 問題根源分析工具就能夠在故障修復方面節省大量的時間。
北京金恒智能系統工程技術有限責任公司 版權所有 Copyright 2007-2020 by Create-china.com.cn Inc. All rights reserved.
法律聲明:未經許可,任何模仿本站模板、轉載本站內容等行為者,本站保留追究其法律責任的權利!
電話:86+10-62104277/2248/4249 傳真:86+10-62104193-819 京ICP備10010038號-2網站XML
智慧機房
在線體驗