雙十一購物狂歡節從2009年開始至今, 每年巨大成交量的背後有數十萬台伺服器進行複雜的運算, 處理著數億次的交易。 作為阿裡巴巴集團的基礎設施, 資料中心, 伺服器, 網路承擔了大量的資訊處理任務。 阿裡工程師一直從事著底層技術的研發, 來提升資料處理的能力, 資訊的可靠性。 承載著如此大資料處理能力的資料中心以及伺服器持續優化達到性能最優。
為了降低資料中心PUE, 節省能耗, 提高伺服器供電效率, 阿裡巴巴在伺服器內部嵌入鋰電池BBU(Battery Backup Unit), 並在阿裡資料中心進行部署, 來支持雙十一的業務運行。
該方案落地後, 阿裡巴巴將成為國內首家伺服器級備電的互聯網企業, 並和Google、微軟同樣擁有該備電技術的企業。
(圖中左側為阿裡伺服器內置鋰電池BBU)
在電力方面,
絕大多數資料中心備用電源系統都是集中式UPS再加上鉛酸電池,
但這種集中式UPS供電方式在面對快節奏的互聯網行業時,
暴露出的問題越來越多,
導致巨型互聯網公司開始轉向分散式鋰電池BBU,
尤以Google、阿裡巴巴、微軟為代表。
集中式UPS主要有以下四大硬傷:
一:單台UPS設備故障會導致後端數十甚至數千個伺服器機架斷電, 故障影響範圍廣。
二:UPS電能轉換次數多, 供電效率低。
三:UPS投資運營成本高, 系統通常需要按照最大負載配置銅排、配電櫃、斷路器開關等配電設備, 而大部分情況下伺服器負載較低, 造成基礎設施配電線路浪費。
四:運維不方便, 鉛酸電池具有記憶特性, 因此每年要人工對UPS做數次充放電測試檢查電池老化程度, 佔用太多時間和人力成本。
按照阿裡巴巴的設計, 外部供電一旦斷電, 安裝在伺服器內部的12V鋰電池可以立即工作, 為伺服器提供12V電源支援, 效率高達99%, 接近理論最優值。 對比傳統UPS或者240V高壓直流還需要做二次電壓轉換, 效率提升8%以上, 進而有效降低PUE達10%-15%。 所以對於海量計算的資料中心這個省電容量是巨大的。
和UPS集中式部署不同的是, 鋰電池BBU最大一個好處是可以和伺服器一起按需採購和建設, 避免了傳統UPS空置和利用率低, 減少資金成本, 能夠提升15%資料中心整體交付時間。
在投資運營方面, 以10KW級的資料中心為例,
阿裡如何破解電池管理這道世界難題?
在汽車領域, 特斯拉電動汽車的電池管理系統被多家汽車評測機構暴力拆解, 最終得出的結論是, 特斯拉電池管理系統是當前電動汽車行業中最好的。
回到資料中心, 如何對數以萬計的電池進行統一管理, 是運營中的最大難題之一。
劉水旺表示, “電動汽車釋放的電能相對穩定並連續性, 資料中心鋰電池需要在很短的時間內提供特別大的電能, 然後等待其它備電系統啟動。 從高可靠、高安全、長壽命, 以及對數以萬計的電池進行故障定位等指標看,
對於電能輸出, 阿裡採用的是直接可以為伺服器供電的12V電池, 斷電瞬間可立即為伺服器供電。 針對電池故障定位問題, 阿裡複用了PSU介面協定, 鋰電池BBU採用了與伺服器PSU同樣的介面協定, 所以數以萬計的BBU可以平滑的沿用伺服器PSU的管理系統, 當BBU出現故障時, 可以通過伺服器運營平臺進行故障定位, 進而直接進行BBU的更換, 這個過程快速準確。
從2011年發起天蠍計畫, 推動整機櫃伺服器在資料中心快速普及, 到2017年推出互聯網行業全球首個浸沒液冷伺服器集群, 阿裡巴巴一直在對資料中心的產品技術進行升級改革, 作為發動機承載阿裡巴巴電商、金融、製造、雲計算、人工智慧等業務及新技術發展。 此次於業界率先推出的鋰電池BBU伺服器,或許會再次引領互聯網資料中心以及電池行業的新一輪變革,開啟一個新的資料中心供電時代。
此次於業界率先推出的鋰電池BBU伺服器,或許會再次引領互聯網資料中心以及電池行業的新一輪變革,開啟一個新的資料中心供電時代。