雖然現在有無人值守資料, 有軟體定義資料中心, 各種智慧化的資料中心, 但實質上這些資料中心都是離不開人的, 若沒有人的參與和指導, 這些設備都還可能處於無序的工作狀態。 就像前段時間, 有人討論機器人和人的關係, 未來究竟是誰能代替誰的問題。 對於資料中心來說, 人在資料中心的運行週期裡依然起著最為關鍵的作用, 資料中心離不開人。 資料中心也不是放在那裡運轉起來就不用管了, 還是需要人去監控和管理。 所以無論一個資料中心的自動化水準多高, 技術多先進, 都需要監控,
關於資料中心監控方面的技術和工具數不勝數, 從最開始的SNMP MIB網管, 到現在的雲計算工具, 視覺化、圖形化、自動化的工具可真是不少, 而且不少還是開源的免費使用。 比如:MRTG(Multi Route Traffic Grapher)、Ganglia、OpenTSDB、Zabbix都是免費的, 當然用起來都有不少問題需要自己修改, 還有一些專業的定制化軟體, 這些則需要支付費用, 針對特定的資料中心設計一些專用的監控軟體。 不管是哪個軟體,
那麼, 資料中心的監控都監控哪些方面呢?資料中心的確是一個非常複雜龐大的系統, 監控不可能面面俱到, 一定要監控對資料中心最重要的地方。 一般來講, 資料中心的所有設備硬體狀態都要監控, 電子設備出現硬體故障在所難免, 一個擁有十幾萬台伺服器的資料中心幾乎每天都會有伺服器故障, 所以對這些伺服器的硬體情況一定要監控,
監控是資料中心的天眼,對資料中心的重要性不言而喻,就好像人走路不能離開雙眼一樣,每個資料中心在整個運行週期過程中都在不斷完善和建設自己的監控系統。監控的目的是要及時發現資料中心出現的問題,並且能及時定位問題、解決問題,當然事後還要總結。如果監控不能做到這些,那麼就不是一個好的監控系統。監控系統就好比是資料中心的體檢醫生,要能看病還能治病,資料中心不舒服了,立馬在監控系統上就有體現,這樣監控才能起到應有的作用。有了監控系統,人的作用的確不大了,只要人去做決策就好了,監控會將資料中心的運行狀態記錄下來並及時給出告警,以便人們進行處理,好的監控系統就是只將YES或NO的選擇留給人們去做,所有的資訊資料監控系統已經分析好了。
很多時候採集的資料不正確或者關鍵資料沒有採集到,導致問題並不是由監控系統反映出來,而是由業務層面回饋出來的,這時對業務已經造成了影響,監控系統沒有起到應有的作用。監控系統要全面,但也要注重採集和分析資料的準確性。監控是資料中心的天眼,對資料中心的重要性不言而喻,就好像人走路不能離開雙眼一樣,每個資料中心在整個運行週期過程中都在不斷完善和建設自己的監控系統。監控的目的是要及時發現資料中心出現的問題,並且能及時定位問題、解決問題,當然事後還要總結。如果監控不能做到這些,那麼就不是一個好的監控系統。監控系統就好比是資料中心的體檢醫生,要能看病還能治病,資料中心不舒服了,立馬在監控系統上就有體現,這樣監控才能起到應有的作用。有了監控系統,人的作用的確不大了,只要人去做決策就好了,監控會將資料中心的運行狀態記錄下來並及時給出告警,以便人們進行處理,好的監控系統就是只將YES或NO的選擇留給人們去做,所有的資訊資料監控系統已經分析好了。