不能否認,監控您的服務器極度主要。它不僅可以協助您每日辦理疑問,還可以協助您完工擴展和容量安排等任務。但無論您的監控有多進亨利 百家樂步,它老是從簡樸的服務器康健指示開始。實際上,或許簡樸在這里并不是最好的詞。服務器康健通常會給你一個康健/不康健的指示。但這并不意味著底層邏輯也很簡樸。在這篇文章中,您將了解查抄服務器運行狀況的實際操縱。
什麼是服務器運行狀況?
聽起來可能很簡樸,但確認服務器運行狀況實際上并不那麼容易。為了確認服務器運行狀況,您需要考慮多個指標。對于初學者來說,康健不僅僅意味著服務器正在運行。服務器可能已啟動并正在運行,但它可能存在多個疑問。CPU 採用率可以恒定為 100%,磁盤可能(幾乎)已滿,或者網絡吞吐量可能極度低。
這些疑問相對容易發明。但也有一些場合可能看起來一切正常,但偶然會出現疑問。在磁盤和網絡方面尤其如此。隨機磁盤和/或網絡疑問很難發明,但它們肯定會產生一些疑問。因此,服務器康健監控并不像資本消耗和正常運行時間那麼簡樸。那麼,優良的服務器運行狀況指示實際上應該包含有哪些內容?讓我們深入了解它。
根基
正確評估服務器的康健狀況肯定需要的不僅僅是根本指標。可是,這并不意味著您應該跳過這些根基知識。事實上,在大多數場合下,它們會為您提供服務器康健狀況的優良指示。
那麼這些根基是什麼呢?
服務器狀態和正常運行時間
讓我們從(理論上)最直接表明服務器康健狀況的東西開始——服務器狀態。假如服務器已啟動并正在運行,則表示它是康健的。假如服務器關閉或沒有響應,則它不康健。但真的是這樣嗎?
想想看。大多數公司已經轉移到云環境,這讓事情變得有點復雜。云的優勢之一是敏捷性和自動擴展。您在云中的根基架構可能百家樂 投注大師 程式會依據當百家樂在線賺錢前需求自動啟動和截止服務器。因此,假如服務器宕機,并不意味著有疑問。這可能意味著自動縮放器截止了它,由於此時不需要它。出于同樣的理由,服務器正常運行時間或重啟次數也不再是服務器康健狀況的指標。
資本採用
嗯,不一定。
您可能以為服務器採用 10% 或 90% 的 CPU 并不主要。假如它採用任何數目的 CPU,那麼這意味著它已經啟動并正在運行。所以它應該是康健的,對吧?
依據具體場合,極度高或極度低的資本消耗可能表明存在疑問。這一切都取決于高下文和模式。假設您的服務器在過去一年中採用率不亂在 40% 到 60%,然后突兀飆升至 100%。這通知你可能有疑問。
想象一下,您有服務器在公司中蒙受沉重的工作。它們的代表採用率相近 100%。(例如,他們可能會批量處理大批數據或 GPU 驅動的圖形渲染。)假如此中一臺服務器突兀下降到相近 0% 的採用率,那麼肯定有疑問。所以有什麼疑問?或許進行主要處理的軟件垮掉了。
夢想場合下,您應該在服務器康健指標中涵蓋資本消耗——但條件是您能夠將其與基線進行對照,并且僅適用于具有不亂、可預計的採用模式的服務器。
你還應該考慮什麼?
如本文劈頭所述,服務器可能已啟動并正在運行,但這可能并不意味著它是康健的。我們包含了根基知識,但縱然是這些指標也可能并不總能通知您全部本相。以下是評估服務器運行狀況時需要考慮的一些額外事項。
網絡和存儲
網絡和存儲對于評估服務器運行狀況都極度主要。可是,它并不像 CPU 或內存採用那麼簡樸。在這里,我們對簡樸的採用數字并不感嗜好。相反,察看一些可以直接表明康健疑問的具體指標是有意義的。
對于網絡,您應該(例如)察看耽擱和丟包計數,而不是察看吞吐量或網絡飽和度。當然,一天中的耽擱也會有所差異,具體取決于整體網絡流量。但假如它真的關閉了,那麼你就知道出了點疑問。
以秒而不是毫秒為單位算計的耽擱是需要研究的。有時它可能只是一個軟件疑問,但極度高的耽擱也可能表明服務器上存在一般網絡疑問。
實際上,將耽擱與丟包計數結合起來可以協助您確認這是硬件疑問還是軟件疑問。假如您看到極度高的耽擱和大批的數據包丟失,那麼將服務器標誌為不康健是有意義的。
在存儲方面,我們也有雷同的場合。磁盤吞吐量對于服務器的運行狀況并不那麼主要,盡管寫入或讀取速度極度慢可能表明存在磁審問題。
更有趣的是 I/O 等候時間。假如您常常看到高 I/O 等候時間,那麼我會以為這樣的服務器不康健。這實際上并不一定意味著磁盤有疑問。同樣,與網絡一樣,它可能表示磁盤無法處理負載。但這也可能意味著實際硬件存在一些疑問。
如何將這些知識付諸實踐?讓我們來了解一下。
康健查抄
目前您已經大致了解了如何評估服務器運行狀況,目前是商量如何實際執運作行狀況查抄的時候了。有幾種想法可以做到這一點——重要取決于您選擇的監控工具。但總體思路對所有人來說都是一樣的。
一種選擇是基于監控系統評估服務器運行狀況,而監控系統又基于某些指標。例如,您可以建立一些復雜的邏輯來考慮我們上面提到的所有指標。基于此,您可以在監控工具中建立康健/不康健條目。
另一種選擇是暫時執行遠程運行狀況查抄。這意味著您向服務器發送某種調用并等候響應。依據響應,您可以評估服務器運行狀況。
此調用可以有多種格式,從簡樸的 ping (ICMP) 或 TCP 數據包到高等 HTTP 調用,直接調用服務器上運行的軟件。簡樸的調用只會通知您服務器是否啟動。更高等的、基于 HTTP 的調用不僅可以通知您服務器是否正在運行,百家樂 勝率還可以通知您它是否在做它應該做的工作。
結算并尋找進步的監控辦理方案
如您所見,完全了解服務器運行狀況并不像知道服務器是否已啟動和運行那麼簡樸。可是,很多公司仍然這樣對待服務器康健。像這樣一個極度百家樂預測軟件簡樸的指標通常可以在服務器實際上存在一些疑問時表明它是康健的。
假如您不想成為這些公司中的一員,請察看可以協助您構建更好的服務器康健評估的高等監控辦理方案。服務器控制軟件便是這樣一種工具。無論您在服務器上運行什麼操縱系統,都可以協助您避免被無用的警報轟炸。更好的是,它可認為您提供有關服務器康健狀況的有用見解。銷售團隊將很甘心向您呈現一個演示和一個有用的、可搜索的博客。