您的位置:首頁>科技>正文

眾所周知I2017年度國內外十大宕機事件盤點

防範未然讓世界早有準備

下面, 我們甄選了十大國內外IT宕機事件——防範未然, 讓世界早有準備!

事件1:今日頭條伺服器宕機

影響評級:★★

時間:2017.1.6

原因:伺服器故障。

持續時間:此後長達30分鐘時間內仍未解決。

影響範圍:不少使用者發現今日頭條出現宕機情況, 頁面刷新不顯示, 頭條號的編輯後臺亦無法進入。

警示:做好伺服器系統的業務連續性建設。

http://money.163.com/17/0106/18/CA47UE85002580S6.html

事件2:Gitlab誤刪資料庫

影響評級:★★★★

時間:2017.1.31

原因:Gitlab 遭受DDoS 攻擊, 導致資料庫寫入鎖定, 網站出現不穩定和宕機, 在阻止了惡意郵件發送者之後, 運維人員開始修復資料庫不同步的問題, 在修復過程中, 錯誤的在生產環境上執行了資料庫目錄刪除命令, 導致300GB資料被刪除, Gitlab 被迫下線。

持續時間:18小時的服務中斷

影響範圍:丟失使用者近6小時的資料

警示:加強IT審計, 備份和恢復測試

http://www.tmtpost.com/2565002.html

事件3:Instapaper宕機

影響評級:★★

時間:2017.2.9

原因:資料故障是由2014年4月之前創建的RDS實例的2TB檔大小限制造成的,

而2014年4月以後創建的實例由ext4檔案系統支援, 並受6TB檔大小限制。 失敗的關鍵系統是我們的MySQL資料庫, 該資料庫作為託管解決方案在Amazon的關聯式資料庫服務(RDS)上運行。

持續時間:2月14日服務才全面恢復

影響範圍:使用者無法正常訪問頁面

警示:每月測試MySQL備份, 強化應急中斷工程團隊建設

http://www.sohu.com/a/154636981_115128

事件4:百度搜索移動端故障

影響評級:★★

時間:2017.2.28

原因:未給出原因。

持續時間:20:50- 21:25。

影響範圍:使用者用百度移動端APP無法搜索內容。

警示:需要強化快速恢復服務的能力。

http://tech.sina.com.cn/i/2017-03-02/doc-ifyazwha3499407.shtml

事件5:微軟Azure雲服務全球大面積故障

影響評級:★★★

時間:2017.3.16

原因:Storage存儲問題, 一個微軟工程團隊確認原因為斷電導致的存儲集群不可用。

持續時間:3月16日6:42-15:37。

影響範圍:微軟分佈在全球各地的28個資料中心裡,

26個出現了存儲故障。 部分地區使用 Storage服務的使用者在執行服務管理運營操作(比如創建、更新、刪除)時, 可能會收到報錯提醒。 其他使用Storage的服務可能也會受到影響。

警示:加強防止大規模資料中心故障發生的制度性工作。

http://36kr.com/p/5067104.html

事件6:Digital Ocean刪庫宕機

影響評級:★★★

時間:2017.4.5

原因:主要資料庫被刪除了。

持續時間:4小時56分鐘。

影響範圍:這次故障導致其控制台和API失靈, 因而害得客戶無法創建新的虛擬伺服器(即所謂的“Droplet”)。

警示:除了對主要資料庫的訪問進行新的限制外, 還對網路進行了升級, 加快資料庫伺服器連接的速度。

http://www.sohu.com/a/133370872_465914

事件7:全球多地爆發“WannaCry”系列勒索病毒

影響評級:★★★★★

時間:2017.5.13

原因:WannaCry利用Windows作業系統445埠存在的漏洞進行傳播,

並具有自我複製、主動傳播的特性。

持續時間:影響一周時間, 並有變種病毒。

影響範圍:英國、中國、俄羅斯等99個國家在醫療、教育、企業、電信等機構受到影響嚴重, 受感染伺服器的關鍵資料丟失, 業務中斷。

警示:及時修訂系統漏洞, 做好關鍵資料的CDP持續保護。

http://tech.qq.com/a/20170513/005824.htm

事件8:英國航空航班大面積延誤

影響評級:★★★★

時間:2017.5.27

原因:可能是由於將網路系統外包給印度公司造成。

持續時間:超過2天時間。

影響範圍:英航在全世界的值機系統和飛行系統都受到影響, 呼叫中心和官方網站也無法正常運行, 導致航班無法起飛, 大量乘客滯留機場, 很多人的行李也無法拿到。

警示:機場等重要交通場所需要建立可靠、可控的備份系統, 並及時啟用備用系統。

http://www.jiemian.com/article/1357415.html

事件9:荷蘭海牙雲主機商verelox前員工刪庫

影響評級:★★★★★

時間:2017.6.10

原因:一名前任管理員刪光了該公司所有客戶的資料, 並且擦除了大多數伺服器上面的內容, 客戶資料恢復希望渺茫。

持續時間:一周內恢復正常。

影響範圍:暫時將verelox網路下線。 verelox一直在努力恢復資料, 但是這個方法可能恢復不了已丟失的所有資料。

警示:建議更改所有伺服器密碼, 建立資料防刪機制。

https://www.idcps.com/news/20170610/95173.html

影響評級:★★★

時間:2017.10.8

持續時間:當天下午2點。

警示:備份更多的伺服器以應對高併發海量訪問需求。

https://www.ithome.com/html/it/329034.htm

『總結』

IT系統宕機, 已經從2015年的責任追究, 到2016年的全民認知提升, 到今年勒索病毒導致資料丟失的眾所周知, 全行業對資訊系統的安全性的關切提升到新的高度。

與此同時, 我們也欣喜看到,除了個別事件由於遭受惡意刪庫無法恢復,與“2016年國內外宕機事件盤點”相比,2017年的系統宕機事件的恢復時間都有了很大的提升,表明事件故障機構對系統恢復的能力有顯著的提高。

防範未然,讓世界早有準備!所有資訊化浪潮下的組織機構,建立專業、可靠的資料災備和業務連續性體系不僅僅是規範企業自身的IT建設需求,更是使用者在產品品質信得過以外,企業服務信得過方面的又一重要訴求。

為此,我們依舊建議:

建設專業的災備系統,不要有僥倖心理

資訊系統屬於企業重要的資訊基礎設施,其安全問題涉及到核心資料資產,關乎企業生存與發展,涉及個人生存與生活,甚至觸及國家和社會的穩定。中華人民共和國國民經濟和社會發展第十三個五年規劃綱要》中明確指出要:強化資訊安全保障,包括強化重要資訊系統和資料資源保護,加強資料資源在採集、存儲、應用和開放等環節的安全保護,加強各類公共資料資源在公開共用等環節的安全評估與保護等。而對於資訊安全、資料安全,災備是最基礎的技術需求,幾乎所有的資訊資產都需要災備保護,以確保在任何意外故障情況下,資訊系統的正常運轉。

2017年6月1日,《中華人民共和國網路安全法》正式實施。該法從保障網路產品和服務安全,保障網路運行安全,保障網路資料安全,保障網路資訊安全等方面進行了具體的制度設計。該法第二十一條、三十四條明確規定關鍵資訊基礎設施的運營者應當履行對重要系統和資料庫進行容災備份的保護義務,並在其他條文中規定了相應的處罰細則。

業務連續性管理應該是“老闆工程”

資訊系統環境中的風險點和威脅點往往不是單一的,也不是靜態的,簡單的安全產品堆砌已被證明不是有效的解決途徑。資訊系統安全是涉及到技術、人員、組織、環境、法律及管理等多方面因素的系統性問題,應該採用資訊保障的原理、技術和方法,以全域的、動態的眼光來研究、設計、實施與維護資訊系統安全工作。這需要企業機構的負責人高度的重視,以第一責任人的安全意識規劃統籌業務連續性管理的工作。

推薦閱讀:

醫院HIS系統災備實戰演練,全科室無感知切換接管

這是屬於大家的《中國災備技術和行業白皮書2018》

我們也欣喜看到,除了個別事件由於遭受惡意刪庫無法恢復,與“2016年國內外宕機事件盤點”相比,2017年的系統宕機事件的恢復時間都有了很大的提升,表明事件故障機構對系統恢復的能力有顯著的提高。

防範未然,讓世界早有準備!所有資訊化浪潮下的組織機構,建立專業、可靠的資料災備和業務連續性體系不僅僅是規範企業自身的IT建設需求,更是使用者在產品品質信得過以外,企業服務信得過方面的又一重要訴求。

為此,我們依舊建議:

建設專業的災備系統,不要有僥倖心理

資訊系統屬於企業重要的資訊基礎設施,其安全問題涉及到核心資料資產,關乎企業生存與發展,涉及個人生存與生活,甚至觸及國家和社會的穩定。中華人民共和國國民經濟和社會發展第十三個五年規劃綱要》中明確指出要:強化資訊安全保障,包括強化重要資訊系統和資料資源保護,加強資料資源在採集、存儲、應用和開放等環節的安全保護,加強各類公共資料資源在公開共用等環節的安全評估與保護等。而對於資訊安全、資料安全,災備是最基礎的技術需求,幾乎所有的資訊資產都需要災備保護,以確保在任何意外故障情況下,資訊系統的正常運轉。

2017年6月1日,《中華人民共和國網路安全法》正式實施。該法從保障網路產品和服務安全,保障網路運行安全,保障網路資料安全,保障網路資訊安全等方面進行了具體的制度設計。該法第二十一條、三十四條明確規定關鍵資訊基礎設施的運營者應當履行對重要系統和資料庫進行容災備份的保護義務,並在其他條文中規定了相應的處罰細則。

業務連續性管理應該是“老闆工程”

資訊系統環境中的風險點和威脅點往往不是單一的,也不是靜態的,簡單的安全產品堆砌已被證明不是有效的解決途徑。資訊系統安全是涉及到技術、人員、組織、環境、法律及管理等多方面因素的系統性問題,應該採用資訊保障的原理、技術和方法,以全域的、動態的眼光來研究、設計、實施與維護資訊系統安全工作。這需要企業機構的負責人高度的重視,以第一責任人的安全意識規劃統籌業務連續性管理的工作。

推薦閱讀:

醫院HIS系統災備實戰演練,全科室無感知切換接管

這是屬於大家的《中國災備技術和行業白皮書2018》

Next Article
喜欢就按个赞吧!!!
点击关闭提示