Web運維要求理解架構中的各個組成部分,在理解計算系統(tǒng)的來龍去脈時,扎實的計算背景對你會有莫大的幫助。處理器體系結構、內存系統(tǒng)、存儲系統(tǒng)、網(wǎng)絡交換與路由、為何第二層協(xié)議那樣工作、HTTP、數(shù)據(jù)庫概念…這個清單可以列好幾頁。具有扎實的基礎,對于理解為什么及如何架構解決方案,以及識別出問題所在,是非常重要的,畢竟,計算是架構我們的智能系統(tǒng)的基礎。此外,工程師的思維方式和對物理定律的基本理解也是一個很大的優(yōu)勢。
一天,在喝酒聊天的時候,我的一位朋友,也是Web運維領域的同行, Jesse Robbins,講了一個排查衛(wèi)星電話線路故障的故事。一套衛(wèi)星電話設施安裝好了,而線路有超過一秒的非預期”延遲。這是很久以前的事了,這套衛(wèi)星電話設施已經(jīng)花了一大筆錢,所以,客戶對于服務質量感到非常沮喪。經(jīng)過好幾個小時的排查和連續(xù)的調優(yōu)之后,技術人員問道:“先要搞清楚,這一秒的延遲是算到預期的延遲時間里的,對不對?”一陣長時間的沉默之后,客戶問:“什么是預期延遲?”技術人員首先向請來的所有人為浪費他們的時間而道歉,然后嚴厲地斥責客戶,說他浪費了所有人的時問。所謂預期延遲就是將信號送到外層空間的衛(wèi)星再返回所需要的時間,我們就是再怎么努力,也沒有辦法增加光的速度啊。盡管這個故事看起來很愚鑫,我卻經(jīng)常遇到這種隨意的、不切實際的期望??赡茏钇胀ǖ木褪强缰尥綇椭频钠髨D了,就是公然藐視我們目前所知的物理定律嘛。我們還是努力成為一個維護好站點可靠性的工程師吧,盡量將計算機科學和物理學的基本原理付諸實踐。要在理論限度內做好工作,你必須知道這些限度是什么以及在哪里,這就是為什么計算機科學、物理學、電氣工程,以及應用數(shù)學的理論知識真正不可缺少的原因。
運維,就是理解理論和實踐在哪里發(fā)生沖突,并發(fā)明適當?shù)姆椒?,以便在發(fā)生事故時減少損失。
嫻熟的決斷力
雖然優(yōu)柔寡斷在任何領域都不算是一個優(yōu)點,但在Web運維中卻幾乎不能容忍。像急救中心和急診室的醫(yī)生一樣,你會經(jīng)常常面臨這樣的境地,此日時單有良好的判斷力是不夠的這一點你可要明白。決策的遲延就會導致宕機的持續(xù),所以必須訓練你的大腦持續(xù)不斷地對接收到的輸入做出反應,因為那種“收集、審查、建議”的方式將會導致局面不可收拾。
在計算機科學中,算法有兩種類型:離線和在線。離線算法是指在確定輸出之前,整個輸入集都已獲得的解決方案。與此相反,在線算法是指邊獲取輸入邊產(chǎn)生輸出。當然,由于算法在產(chǎn)生輸出(或解決方案)時,并沒有獲得整個輸入集,也就沒有辦法保證產(chǎn)生最優(yōu)化的輸出。與離線算法不同的是,在線算法保證你手上總是有答案。
運維決策必須是在線算法的結果,而非離線算法。這并不是說離線算法在Web運維中就沒有地位了,恰恰相反,其中一個非常關鍵的過程就是離線的,那就是根本原因分析(RCA)。對于盡可能地形式化RCA過程,我可是有巨大熱情的。
對失敗及其癥狀表現(xiàn)以及“即時”決策的復審進行徹底的離線(事后)分析,是改進在線算法(你和你的團隊用于關鍵運維決策)的可能的最好途徑。
沉穩(wěn)的性格
一個沉穩(wěn)與可控的思維過程是非常關鍵的,沒有它,就會出現(xiàn)吉斯通警察綜合征,使糟糕的局面變得更加不可收拾。在瘋狂的動作片中,一個人崩潰了,另一個人就抓住他使勁搖晃,告訴他要鎮(zhèn)定下來一一在這種情形下,你要確定你是處在清醒的一方的。在清醒的一方,你就會有一個快樂、健康的職業(yè),否則,你得到的將是一份沉重的工作,弄不好,將會不堪重負。
因為沒有正式的教育途徑,Web運維行業(yè),就其目前的狀況而言,是一種非正式的師徒模型?;ヂ?lián)網(wǎng)的廣泛應用,已使商務和社會交往發(fā)生了范式轉移,而且信息已經(jīng)在某種程度上唾手可及,從而一種虛擬的師徒模型便成為可能。不幸的是,正如你能夠料想到的,在不同的群組之間,這種師徒模型的質量也是千差萬別的。
在網(wǎng)站建設Web運維領域,目標很簡單,使所有事情在所有時間正常運轉:一個簡單的定義,但卻是一個不可能的期望。或許在這個領域成為一名工程師的更大挑戰(zhàn)是組織內的同事對你的不切實際的期望。
本文地址:http://m.hbbqcd.cn//article/3302.html