當前位置:工程項目OA系統(tǒng) > 泛普服務體系 > 泛普博客
廢墟上的IT故事 CIO談災備規(guī)則與演練
企業(yè)對于災備的認識究竟有多少?看法各不相同:災備這種事情,就像買保險,絕大多數都是買個心理安慰,發(fā)生意外的概率太小了;對于數據災備,還是有必要的,但對于系統(tǒng)災備,那簡直就是浪費成本;IT這東西,更新換代太快了,要做災備得充分考慮投資回報……
不難看出企業(yè)真正認識到災備意義的少之又少,絕大多數企業(yè)認為災備的投資是一個浪費,再加上災備的成本較高,很多企業(yè)還是停留在數據災備層次上。沒有充分衡量災備的價值,了解災備對于企業(yè)生產經營的意義。但經過“5.12”地震后,身處災區(qū)的企業(yè)卻對災備有了更加深刻的認識。
地震后僅用了15天,東方汽輪機廠就恢復了生產,這不得不稱得上是一個奇跡。在這奇跡背后,支撐東方汽輪機廠迅速投入生產的是IT災備系統(tǒng)。原來,早在“十五”期間,東汽就意識到災備的重要性,從那時起就開始了災備工作。據東方汽輪機廠計算機處處長夏開渝介紹,在災備工作開始前期大家并沒有認識到災備的重要性,很不理解這樣的工作。很多人都不認同企業(yè)做災備,認為投入大、周期長,還不如用這些錢來投入到生產,獲得更大的收益。把這些錢花到災備上,卻什么收益也看不到。整個災備方案論證了很長時間。但是在夏開渝的努力下,災備工作得以進行。東汽首先從數據災備開始,逐步過渡到系統(tǒng)災備,直到2007年底東汽完成了異地數據災備、系統(tǒng)災備。
東汽的主信息中心在漢旺,而另一個用來備份的信息中心在德陽,兩地相距幾十公里。兩個信息中心的數據相互備份,但是數據的備份并非實時,而是每天夜里零點自動做增量備份,每周做全備份。對于重要的ERP數據,每天備份,同時做增量備份,一周做一次全備份,數據保留時間為一年。對于非關鍵數據3天做一次增量備份,兩周做一次全備份。
而德陽機房中心的備份僅局限于數據備份,東汽只在漢旺機房內對關鍵核心服務器做了雙機熱備。夏開渝對企業(yè)級服務器以及PC及服務器分別用不同的軟件做了系統(tǒng)備份。就在地震過去整整一個星期后,東汽進入了抗震救災的第二階段,將工作重點從救人轉向清理廢墟、搶救設備和生產恢復。
據夏開渝回憶:“我們漢旺中心的系統(tǒng)都損壞了,當時中心ERP服務器的機柜倒掉了,核心兩臺服務器也遭受了一定程度的破壞,但經過修復發(fā)現仍然可用。這對于我們來說是一個天大的好消息?!币驗?,不僅這4臺企業(yè)級服務器價格昂貴,更重要的是他們只是在漢旺進行了備份,并沒有在德陽備份。如果這4臺服務器出了問題,要恢復原來的信息系統(tǒng),就必須重新采購新機器、安裝軟件,程序繁瑣,時間周期會很長。
5月18日,夏開渝帶領自己的手下就把機房中心的設備全部搶救出來,并在19日將這些救出來的設備運抵東汽德陽信息中心。此時,夏開渝對短期內迅速將信息系統(tǒng)恢復到震前水平已有了一定的把握。夏開渝還清晰地記得,首先自己從硬件恢復工作開始,此期間IBM給予他們很大的幫助,第一時間內無償提供了急需的硬件。僅用了3天就把磁盤陣列等硬件設施恢復好,之后又用了兩天的時間恢復系統(tǒng)和數據,最后一天對所有的系統(tǒng)進行了全面測試。就這樣,東汽僅用了約一個星期的時間就把系統(tǒng)恢復到了生產前的狀況。
截至5月25日,東汽erp系統(tǒng)、PLM、CAPP、質量管理平臺、人力資源系統(tǒng)以及財務系統(tǒng)等全面恢復應用。
同樣面對突然而來的地震,華西證券的后臺交易系統(tǒng)卻能正常運行,除了現場交易系統(tǒng)的損壞。華西證券早在2005年7月就開始建立災備系統(tǒng),并在2006年7月份對原有災備中心進行了擴建。
目前,華西證券在深圳擁有一個異地災備中心,而在成都總部擁有同城異地災備中心,一主一備。在此次地震前,華西證券也經常采取一些應急演練,來應對各種突發(fā)事件。據華西證券技術部總經理李均介紹:“為了確保業(yè)務的連續(xù)性,我們經常會過一段時間就把所有系統(tǒng)全部關閉,然后自動切換到異地備用系統(tǒng)進行演練。經過多次演練,整個切換過程需要10〜15分鐘時間,業(yè)務仍舊順利運轉?!?/P>
在地震后的十幾分鐘內,通訊線路還未中斷,李均迅速徹查了手機炒股、電話委托等非現場交易,在確保非現場交易一切正常后,李均又開始向公司領導匯報情況。為了確保業(yè)務的連續(xù)性,華西證券每個營業(yè)部至少都有3套通訊線路與總部聯通。這其中有聯通線路、電信線路以及衛(wèi)星線路。正是由于這樣的準備工作,使得華西證券即使現場交易因為地震受阻,人們也能通過網上交易以及手機交易來實現。從而確保華西證券從地震發(fā)生至今,整個交易持續(xù)運轉。
地震后的東方汽輪機廠能夠在短短15天內就恢復生產,系統(tǒng)很快運轉,與其良好的災備系統(tǒng)有著直接的關系。但是經過此次地震后,夏開渝以及公司的領導也發(fā)現了東汽災備的不足之處,同時對于災備也有了新的認識。
過去東汽的應用系統(tǒng)數據庫的服務器分散度較大,所有服務器都是單應用運行,經過這次地震后,夏開渝認為要把多個數據庫服務器做成一個集群。夏經理這樣解釋道:“這樣做的好處不僅在平日災備的時候可以有效提高速度,另一方面使得災備的準確性大大提高。地震前的備份,經常會出現一些地方備份不到,給我們?yōu)暮蠡謴凸ぷ鲙砹艘欢ǖ睦щy?!边^去東汽的災備有很多人為的因素,需要人工確定哪些地方需要做災備,哪些地方不需要。經過此次事件,東汽要把所有服務器共享一個磁盤陣列,由過去的10T擴大到30T。
之前東汽在漢旺的總廠區(qū)已經無法投入生產,未來東汽會在德陽重新建立一個新廠區(qū),并且在德陽做一個同城異地的系統(tǒng)備份。夏開渝介紹道:“德陽新廠區(qū)和原來德陽的舊廠區(qū)距離僅有20公里,我們會把現有廠區(qū)的信息中心作為新廠區(qū)的災備中心。不僅備份數據,更加強調系統(tǒng)的備份。”
東汽未來IT工作的重點是完善整個災備系統(tǒng)。對于德陽同城異地的災備方案,夏開渝也表示了擔心:“兩個廠區(qū)相距僅20多公里,對于普通的火災、斷電問題可以很好解決,倘若再次面臨這樣嚴重的地震,這種災備是遠遠不夠的?!睂Υ耍瑬|汽首先會在德陽建立災備中心,其次會考慮在異地構建一個大型的系統(tǒng)級災備中心。
夏開渝反復強調:“災備對于一個企業(yè)來說至關重要,雖然說系統(tǒng)壞了可以重建,數據沒有了就是致命的損失。但是經過此次地震,讓我更明白系統(tǒng)災備的重要性。”系統(tǒng)災備對于東汽震后快速恢復生產至關重要,雖然企業(yè)有了數據,但是如果沒有系統(tǒng)備份,要想短時間內恢復生產,根本不可能?!皩τ谖覀冎圃煨偷钠髽I(yè)來說,ERP的數據至關重要,但是ERP的系統(tǒng)備份更不可少,因為ERP的使用從最初到現在會不斷升級,這期間有一個周期。”夏開渝感慨萬分地談道??磥?,數據備份只是第一步,企業(yè)要想快速恢復“元氣”更需要系統(tǒng)備份。
此外,企業(yè)的災備還應考慮到異構系統(tǒng)災備問題。例如,企業(yè)平日使用的服務器很可能與災備中心的服務器不同,尤其是異地災備中心。那么,當企業(yè)的系統(tǒng)切換到災備中心時,經常會發(fā)現系統(tǒng)一時間運轉不了。這時,企業(yè)一定要統(tǒng)一平臺,做好災備規(guī)劃。
過去,雖然每家證券公司都會做一個災備中心,但是經過地震后,監(jiān)管機關更明確要求所有證券公司必須有兩個災備中心,一個同城災備中心,一個異地災備中心。作為一個高度依賴IT的行業(yè),經過地震對災備更有了深刻的認識。談到這一點,李均說:“過去我們的災備中心只具有主信息中心70%的能力,在性能上會與主信息中心有一定差距,未來我們會加大對基礎設施的投入,提高同城災備與異地災備的成本。更加注重災備的高可用性?!?/P>
同樣在管理上,對于異地災備,CIO要面臨管理的挑戰(zhàn)。李均談到:“CIO需要面臨管理半徑多長的問題,同時外包又會有信心安全的風險,這是一個不小的挑戰(zhàn)。”因為異地災備,CIO并不能隨時掌控所有信息,及時處理各種問題。同時CIO還需要確保災備系統(tǒng)能夠在第一時間啟用。對于平日的演練、設備保養(yǎng)、系統(tǒng)運行管理等工作如何來做,需要CIO在工作上費一番功夫。(cioinsight)
- 1新年流程不僅要“立”也要“破”
- 2金融行業(yè)是OA采用率最高的行業(yè)之一,在全球大都如此
- 3企業(yè)家要以禮治企
- 4OA的核心是面向服務、模塊化、可復制化
- 5如何讓企業(yè)文化充滿活力?
- 6企業(yè)發(fā)展:要比別人做得更好
- 7三元VS三鹿結合之5大猜想
- 8青島將擴建社情民意調查中心 億元項目同步監(jiān)測
- 9網絡管理員和網絡工程師的區(qū)別在哪里
- 10OA辦公系統(tǒng)的本職工作就是依靠先進的OA技術平臺
- 11從價值鏈著手研究競爭對手
- 12解析OA系統(tǒng)與ERP系統(tǒng)交互關系在企業(yè)中的影響
- 13戰(zhàn)略落地生根是企業(yè)過冬必要條件
- 14網絡管理安全策略 2011年安全威脅五大趨勢
- 15避免企業(yè)陷入選型的誤區(qū),泛普OA辦公系統(tǒng)為大家提個醒
- 16泛普OA能在組織信息化建設中具體發(fā)揮以下作用:
- 17成都市僑聯黨組書記、主席陳雄接受組織調查
- 18OA的作用可以簡單地理解為應用的整合
- 19綜合以上三點分析:企業(yè)在選購OA軟件(www.theonlineadagency.com)時莫要過于看重服務
- 20服裝行業(yè)關店風潮對零售軟件行業(yè)的影響
- 21做辦公OA軟件,對潛在“商機”太專一,失戀后經受不住打擊
- 22客戶溝通管理之道
- 23網絡管理員如何整合網絡安全?
- 24數據準確方能體現CRM系統(tǒng)價值
- 25中國服裝企業(yè)品牌授權概況分析
- 26妨礙財務信息化管理效果兩大因素
- 27十招教你輕松搞定中考語文背誦
- 28湖南副縣級官員強奸下屬續(xù):紀委已介入調查
- 29EKP:讓企業(yè)真正從制造到智造
- 30 最帥快遞小哥爆紅網絡 酷似臺灣偶像邱澤