|
文章來源:名易軟件箴言 用激勵人心。?。说?德魯克(PeterF.Drucker)用對待老鼠的辦法對待知識財富,肯定無法使人的長處得以發(fā)揮。--弗雷德里克.赫茨伯格(FredrickHerzberg)將合適的人請上車,不合適的人請下車。--管理學(xué)者詹姆斯.柯林斯(JamesC.Collins)把我們頂尖的20個人才挖走,那么我告訴你,微軟會變成一家無足輕重的公司。--微軟總裁比爾.蓋茨(BillGates)決策是管理的心臟,管理是由一系列決策組成的,管理就是決策。--美國著名管理學(xué)家赫伯特.西蒙(HerbertA.Simon)從某種意義上說,融智比融資更重要,財富的生產(chǎn)力比財富本身更重要。--海爾CEO張瑞敏一方面,選用優(yōu)良的軟硬件設(shè)備;另一方面,用嚴密的規(guī)章制度保障系統(tǒng)正常運轉(zhuǎn)。大到系統(tǒng)擴容,小到服務(wù)器的日常管理工作,網(wǎng)通網(wǎng)管中心都有相應(yīng)的章程加以規(guī)范。中國網(wǎng)絡(luò)通信集團公司(以下簡稱網(wǎng)通)在原中國電信集團公司及其所屬北方10?。▍^(qū)、市)電信公司、中國網(wǎng)絡(luò)通信(控股)有限公司、吉通通信有限責(zé)任公司基礎(chǔ)上組建而成。如今,網(wǎng)通不僅是北京2008年奧運會固定通信服務(wù)合作伙伴,而且成為國內(nèi)外知名的電信運營商,直接隸屬于集團公司的網(wǎng)管中心,承擔(dān)了全網(wǎng)的運維管理工作。精耕細作的網(wǎng)管中心與網(wǎng)通主營業(yè)務(wù)相對應(yīng)(包括固定電話、小靈通、ADSL、大客戶專線等通信業(yè)務(wù)),網(wǎng)管中心作為一個技術(shù)部門,要承擔(dān)傳輸網(wǎng)、語音網(wǎng)、數(shù)據(jù)網(wǎng)等網(wǎng)絡(luò)的運營維護。其職責(zé)涵蓋了網(wǎng)絡(luò)的監(jiān)控、設(shè)備配置與管理、故障管理等。復(fù)雜的網(wǎng)絡(luò)分類,決定了復(fù)雜的運維服務(wù)工作。網(wǎng)通網(wǎng)管中心組建了13個部門,針對不同專業(yè)的網(wǎng)絡(luò)進行分門別類的管理。而黃??邓诘膭恿S護與系統(tǒng)支撐部,主要是對整個集團公司的網(wǎng)管系統(tǒng)做好運維支撐服務(wù)。據(jù)黃??到榻B,網(wǎng)管系統(tǒng)由各種硬件、軟件、服務(wù)器以及不同的操作平臺組成,這些都是系統(tǒng)支撐部的管理范圍。雖然在購置軟硬件時,廠商會提供一定時期的服務(wù),但是,電信運營的復(fù)雜性決定了一個廠商不可能做所有系統(tǒng)。網(wǎng)通的網(wǎng)管系統(tǒng)至今仍是分散的,細分為IP性能分析系統(tǒng)、語音網(wǎng)管理系統(tǒng)、傳輸網(wǎng)管理系統(tǒng)等。因此,管理這些網(wǎng)管系統(tǒng)本身就是一件復(fù)雜的工作。對于黃??岛屯聛碚f,最重要的工作是對海量存儲系統(tǒng)、投影系統(tǒng)以及服務(wù)器主機系統(tǒng)的運營維護和管理。海量存儲系統(tǒng)是所有網(wǎng)絡(luò)運維部門共享的一個系統(tǒng),而不屬于某一個部門,語音網(wǎng)可以用,傳輸網(wǎng)也可以用。之所以稱為“海量”,是因為它有幾個TB的容量,并且運轉(zhuǎn)在光接口上。系統(tǒng)支撐部根據(jù)每個部門的要求,分配海量存儲系統(tǒng)的空間,并對模塊系統(tǒng)進行管理,保證系統(tǒng)的正常運轉(zhuǎn)。投影系統(tǒng)是網(wǎng)管中心指揮調(diào)度的一個輔助系統(tǒng),它顯示各種流量和數(shù)據(jù),便于相互協(xié)調(diào)。這也需要系統(tǒng)支撐部的分配。服務(wù)器主機有web服務(wù)器、DNS、郵件服務(wù)器等,對網(wǎng)絡(luò)提供不同的服務(wù),它們更是需要長期的維護。對網(wǎng)管系統(tǒng)的日常監(jiān)控、配置和管理成為系統(tǒng)支撐部最重要的日常工作,保障網(wǎng)管系統(tǒng)的正常運轉(zhuǎn),不出故障,也是系統(tǒng)支撐部最大的理想。因為,一旦系統(tǒng)宕機,數(shù)據(jù)可能丟失,對業(yè)務(wù)影響非常大,甚至造成無法挽回的損失。每天的“作業(yè)”與每月的“功課”嚴密的規(guī)章制度是網(wǎng)通運維管理中的一項重要內(nèi)容。大到系統(tǒng)擴容,小到一個U盤的發(fā)放工作,都有相應(yīng)的章程加以規(guī)范。“一方面,我們選用優(yōu)良的軟硬件設(shè)備;另一方面,我們用嚴密的規(guī)章制度保障系統(tǒng)正常運轉(zhuǎn)?!秉S??到榻B說。網(wǎng)管大廳、機房設(shè)備等運維管理,網(wǎng)管人員都有章可循,有規(guī)可依。就拿服務(wù)器主機的維護來說,說簡單也很簡單,網(wǎng)管人員“少操作甚至不操作”也能運轉(zhuǎn),因為很多故障都是人為操作造成的。但是,要真正管好,網(wǎng)管人員卻有很多的“功課”要做。網(wǎng)通就對服務(wù)器主機的運維管理制定了“維護作業(yè)規(guī)程”。“維護作業(yè)規(guī)程”規(guī)定了網(wǎng)管人員每天要做的作業(yè)和每月必修的功課。記錄CPU使用率、刪除無用文件以釋放磁盤空間、檢查當(dāng)前運行的服務(wù)進程、病毒碼是否最新、系統(tǒng)補丁是否更新、機器指示燈是否完好、網(wǎng)絡(luò)是否連通等,都是網(wǎng)管人員每天必須要做的。每月要做的事情有檢查電源、電纜是否牢固,標(biāo)簽是否完好,數(shù)據(jù)備份等。雖然這些事看起來小,卻必不可少。比如設(shè)備標(biāo)簽,它包含很多信息量,有序列號、所屬部門、購置時間、責(zé)任人、用途、配置以及IP地址等。標(biāo)簽有無與新舊,不僅影響財務(wù)部門的資產(chǎn)審計,而且影響其他網(wǎng)管人員對該機器的維護。系統(tǒng)支撐部承擔(dān)了相關(guān)規(guī)章的制定工作。服務(wù)器分布在各個專業(yè)部門,系統(tǒng)支撐部就要下發(fā)服務(wù)器的維護作業(yè)規(guī)程,并督促各部門落到實處。如果沒有一天一天的積累,等大的問題發(fā)現(xiàn)時,可能補救都來不及了。擴容長期而細致的維護工作中,網(wǎng)管員可能會發(fā)現(xiàn)某臺服務(wù)器響應(yīng)速度越來越慢,或者磁盤空間越來越小等狀況?這是網(wǎng)管中心系統(tǒng)支撐部在日常維護管理工作中遇到的另一個問題?現(xiàn)有設(shè)備或系統(tǒng)不能滿足業(yè)務(wù)的需求。在這種情況下,系統(tǒng)有兩種選擇:擴容和替換?;诔杀镜目紤],網(wǎng)管中心首先會選擇擴容。費用較高的大型設(shè)備的擴容,一般由設(shè)計院來研究決定;小型設(shè)備如服務(wù)器等則由網(wǎng)管中心申請、測試和實施,如服務(wù)器的擴容。黃??稻徒?jīng)歷過一臺服務(wù)器的擴容。那是一臺提供認證服務(wù)的服務(wù)器,在用戶撥號上網(wǎng)時,輸入賬號和密碼,經(jīng)服務(wù)器驗證后給用戶授權(quán)。但是服務(wù)器使用年限一長,性能明顯落后,直接影響接通效率。服務(wù)器對用戶請求應(yīng)接不暇,發(fā)展到后來只有少量用戶能夠連上。網(wǎng)管中心首先想到了給這臺服務(wù)器擴容:從單個CPU增加到雙個CPU,內(nèi)存從512兆增加到1G。他們選擇了凌晨3點左右(此時流量少,影響也最?。嵤?,拆開服務(wù)器,插入一個模塊,然后重啟,看服務(wù)器能否識別新硬件,功能是否正常。如果不識別,則分析原因,比如是否軟件也要升級才能識別硬件。當(dāng)然網(wǎng)管人員做好了功能不正常的準(zhǔn)備,在計劃的時間沒有辦法解決故障,他們就會拆掉新加的模塊,恢復(fù)原狀,然后再試。事實上,他們只用了一個小時就成功實施了服務(wù)器的擴容。切換經(jīng)過擴容的認證服務(wù)器在使用半年之后,又產(chǎn)生了同樣的問題?它仍然滿足不了業(yè)務(wù)增長的需求。但是服務(wù)器滿配就是2個CPU,已經(jīng)不能再擴容。此時,網(wǎng)管中心需要用一個全新的機器來代替它。用一個新機器來代替在線使用的設(shè)備,即新舊設(shè)備的切換,這需要測試。網(wǎng)管中心安裝新系統(tǒng)之前要做好測試工作,或者人工模擬用戶使用狀況,或者采用測試系統(tǒng)。網(wǎng)通新系統(tǒng)的測試一般都有計劃書,按照計劃一步一步去測。比如一個步驟要測試5遍,每一遍的測試數(shù)據(jù)都要記錄下來,包括出現(xiàn)的故障,以及解決方法等。同時,要根據(jù)系統(tǒng)的復(fù)雜程度決定切換時間,短的半天,長的一周,甚至半年。但電信企業(yè)要求不長于3小時。系統(tǒng)或設(shè)備切換必然涉及到服務(wù)中斷,因此也要選擇恰當(dāng)?shù)臅r機。在服務(wù)器斷電后,將其移出機柜,新的機器接通電纜,然后檢查新機器以及相關(guān)設(shè)備是否運轉(zhuǎn)正常,只有恢復(fù)到割接之前的狀態(tài)才算正常。但是,擴容還是切換新系統(tǒng),并不是短視行為,而要長期規(guī)劃。它不僅取決于硬件系統(tǒng)的性能,更重要的是與業(yè)務(wù)部門的需求相匹配。如果系統(tǒng)所提供的服務(wù),是增長快、市場潛力大的業(yè)務(wù),則會考慮未來需求進行擴容或更換新系統(tǒng)。相反,如果系統(tǒng)所服務(wù)的業(yè)務(wù),增長量已經(jīng)達到高峰,或者呈下降的趨勢,則不會考慮擴容。網(wǎng)管部門和市場部門分別提出建議,領(lǐng)導(dǎo)根據(jù)雙方的情況決定是否擴容。鏈接數(shù)據(jù)通信維護規(guī)程(部分)數(shù)據(jù)通信網(wǎng)絡(luò)業(yè)務(wù)數(shù)據(jù)和軟件的維護管理1.維護項目及維護周期(1)定期檢查和清理網(wǎng)絡(luò)業(yè)務(wù)數(shù)據(jù)(每月);(2)網(wǎng)絡(luò)局數(shù)據(jù)的增、刪、改(實時);(3)用戶數(shù)據(jù)的增、刪、改(實時);(4)軟件備份(必要時);(5)軟件升級(必要時)。2.維護要求(1)網(wǎng)絡(luò)業(yè)務(wù)數(shù)據(jù)應(yīng)根據(jù)需要定期按時備份,并注意保存?zhèn)浞萁Y(jié)果;(2)新版本業(yè)務(wù)數(shù)據(jù)產(chǎn)生后應(yīng)先進行測試,再避開忙時加載使用,并作記錄;(3)所有設(shè)備在作配置修改前后應(yīng)及時備份。備份結(jié)果保留到下一次;(4)軟件維護要做到①軟件維護須由專人負責(zé),并嚴格做好日常維護工作;②必須嚴格執(zhí)行各類軟件維護制度,并制定軟件維護工作計劃;③軟件版本更新(升級)、軟件的修改必須遵守先審批后執(zhí)行的原則;④不得進行正常軟件維護工作以外的操作。數(shù)據(jù)通信系統(tǒng)網(wǎng)管設(shè)備的維護1.日常維護項目和要求觀察網(wǎng)管系統(tǒng)各部分的運行狀態(tài),包括:(1)CPU負荷(2)磁盤狀態(tài)(3)文件系統(tǒng)(4)存儲空間(5)打印機(6)通信接口(7)控制臺終端2.年檢維護項目和要求利用系統(tǒng)提供的診斷測試程序,每年進行一次全面的系統(tǒng)診斷測試,項目包括:(1)CPU(2)內(nèi)存儲器(3)磁盤(4)光盤機(5)磁帶機(6)打印機(7)通信接口(8)顯示器(9)路由器(10)局域網(wǎng)接口
信息發(fā)布:廣州名易軟件有限公司 http://www.jetlc.com
|