4G時代來臨,企業數據面臨爆炸式增長,動則上TB;與此同時,人為因素、軟件缺陷、不可控的自然災害等帶來的安全問題也頻繁發生,如何讓企業數據安全可靠、且低成本高效率的長期保存下來,已經成為任何一家企業亟需考慮的問題。所幸的是,云時代伴隨4G時代一起出現,云計算的核心優勢:高性價比、資源按需分配、基礎設施的柔性擴展、業務的平滑切換、帶寬和存儲無限擴容等特性。
多備份的云備份、云恢復、云歸檔等特性可以充分利用這些優質的云基礎設施實現企業的數據管理服務;多備份是國內首家專注于企業數據云端備份、恢復、歸檔、存儲和遷移的互聯網公司,經過10個月的持續迭代,圍繞著企業數據安全管理的服務已經陸續上線,得到了超過4萬的中小企業客戶認可,同時也引入了國際知名的資本投資。這次我們聯系到了多備份的聯合創始人兼CTO 陳元強,讓我們來看看多備份是如何解決數據在云端可靠存儲備份。以下為采訪實錄:
CSDN:數據存儲備份領域實際已經有很多強勁的大腕,多備份是如何考慮要去做存儲備份的?
陳元強:非常好的問題!大家都知道,最近繼續出現了多起大型故障,這里面不乏有錢的主包括銀行和云巨頭等。我們都知道一些關鍵系統的容災備份方案實際上是相當的貴,方案動則上億,每年的維護費也是高得嚇人,前段時間在網上討論提到的寧夏銀行就是因為費用太高,而放棄了一些維保計劃,最后導致出現災難故障。所以問題的根源還是費用問題。而恰恰超低的投入就可以解決問題,這就是多備份的核心優勢之一。除此之外,傳統的方案在使用上極其復雜,一般需要極強的專業能力才能上手,而極簡設計也是多備份變革傳統存儲備份的關鍵,用戶只需要3步就可以完成備份。
CSDN:目前包括亞馬遜,阿里云,EMC,微軟云,電信,移動等巨頭都有自己的存儲備份方案,多備份與這些云存儲備份服務比起來,有哪些特點?
陳元強:首先,我們和這些云平臺或者存儲巨頭是合作關系,我們是架構在這些平臺上的一個SaaS應用,我們既是他們的客戶,又是他們平臺眾多應用的核心應用。只有足夠多的應用衍生在這些平臺上,才有利于巨頭構建云生態鏈產業,所以多備份是云生態鏈的一個核心環節。
從一開始我們的方向就放在了在這些巨型平臺上做好服務,并不自己研發最底層的存儲,真正通過多備份的整合式計算、存儲、備份等服務,讓這些平臺的潛力發揮出來。用戶可以根據自己的需要選擇合適的或我們推薦的底層云計算和存儲平臺,其中一個關鍵技術就是Cloud 5,也就是對數據進行分塊,并分散冗余存儲在不同的云平臺上,避免單云故障引起數據丟失。
EMC是一家非常厲害的數據管理服務公司,在大數據管理方面的經驗是我們必須學習的;同時,EMC在云計算領域很早就布局了,在超大規模存儲備份方案方面一直是他的強項。多備份更多是在學習EMC的大數據管理實踐經驗,并很好得和我們的創新方向融合在一起。
CSDN:多備份定位非常清晰:整合平臺,形成強大聚合能力,變成一個可以根據用戶需要,按需自由調度的全球性云計算平臺。
陳元強:是的:-),的確是這樣。對于創業企業來說,做自己擅長的事,與廣泛的平臺形成強有力的合作關系,是最容易出效果的路!
CSDN:整合這些云平臺,多備份用了多長時間,投入資源情況如何?
陳元強:網站從去年10月上線,目前歷時10個月,在研發上投入13人,我們的技術團隊都是資深的人員,在系統,網絡,存儲,安全等平均都有7+年的經驗,主要來自騰訊,盛大,迅雷等國內一線互聯網企業。產品每天迭代統上線,用戶發現的問題或缺陷,基本是當天立即修改;每周會有大的特性或優化上線;累計下來差不上萬次的小細節修改,上百處大的優化和新功能開發。目前產品已經成熟,無論是大到上TB的企業核心應用數據,還是小到幾MB的小網站的數據存儲備份,用多備份都很easy的完成備份任務。
CSDN:一般的存儲備份企業在研發上投入的資源相當大,多備份投入13人10個月的資源,具體的思路上有一些可以分享的么?
陳元強:的確,現有的一些傳統的設備或軟件投入資源相當大,動則數百人。實際上,我們的想法很簡單,絕大部分產品要么是功能的羅列,要么就是過度設計。就拿現在的CDP(持續數據保護)產品來說,一般都宣稱是實時,0恢復窗口,但最近有一種觀點是說,實際絕大部分企業是在15分鐘內的能恢復數據就可以滿足要求了。有些時候,為了減少1分鐘,你可能投入的資源和時間會是現有的數倍,所以把資源投入到最必須的特性上,這樣其實可以解決99%的場景。這也是互聯網作產品服務的“少即是多“思想的一個應用。所以,多備份的想法很簡單,就是聚焦在企業核心數據,如各類業務(網站,OA,郵件系統,文件共享系統等)服務器(Linux,Windows,Aix)上的文件系統備份存儲,以及常見的數據庫(如:Mysql,Oracle,MSSQL等)數據的備份存儲,具體應用上可以支持不同數據量級的場景。
CSDN:能否分享一些多備份實現多個云存儲平臺數據整合存儲備份的一些具體思路?
陳元強:這個問題分成幾個點來回答
1. 現有云計算平臺的發展情況
國外公有云基本上形成了AWS稱雄,Google,微軟一線云服務并存的局面;同時包括Rackspace,HP,IBM,EMC等傳統IT廠商,混合云平臺并存的態勢。國內的阿里云,電信,騰訊云,UCLOUD、七牛、華云以及各大老牌IDC廠家如西部數據,新網,萬網,美橙等推出的云平臺,非常多。所以來說,國外和國內云平臺的數量都相當多,國內更多;云計算目前在國內時間還只有3-4年時間,各方面都在不斷進步,性能、穩定性、服務等參差不齊。
2. 企業到底需要什么樣的云平臺能力
隨著信息化技術深入到每個角落,企業從高利潤中心,變成了薄利多銷的模型,絕大部分企業需要的是容易解決業務需求,容易與外部進行溝通的成本低的方案。云計算平臺的出現剛好符合這一趨勢。同時也對云平臺提出了更高的要求:高的性價比,穩定且易擴展,業務適應靈活,數據可靠安全。企業可以專注于自身業務,整合利用優質IT資源為業務服務。
3. 多備份是如何整合這些平臺,并提供這些能力的
基本上來說這些云平臺都有各自的特點,多備份最直接的情況就是結合各自特點,整合其優勢,提供簡單直接的數據存儲備份使用入口。
就國外來說:AWS是最早的公有云平臺,業務范圍覆蓋除了中國以外的其他地區,平臺成熟度很高。但其實如果國內的朋友直接去用,實際會遇到不少的習慣問題,包括計費,存儲和主機的使用。 Google主要是個人和GAE,企業級IAAS平臺最近一段時間才開始發力,和微軟的平臺相對比較新一點,包括個人和企業,穩定性相對沒有AWS穩定,另外一些限制也是各有特色。RackeSpace這類二線的云計算企業,在基礎的產品體驗上相對比較更困難一點。國外相對比較好的優勢是基礎配置比較好,特別是網絡帶寬這塊。
就國內來說:產品成熟度,特別是可靠性和穩定性方面低于國外的幾個主流云平臺,相對比較優勢的地方在于產品使用習慣更符合國人的習慣,最大的優勢在于服務,遇到問題,可以找到人。國外的產品最大的問題在于溝通困難,除了LINODE/DIGITALOCEAN這類專注云主機服務的企業,響應快外,其他幾個巨頭的產品設置都找不到服務入口。國內的IAAS企業也逐步走向海外,香港是連接東南亞市場的第1站。但國內相對國外,在帶寬計費方面是最大的區別,國外的累計流量消耗計費方式,更適合多備份的業務特點。
就整體容錯和均衡能力來說,這些平臺都沒有實現平臺物理區之間完全互聯,各個服務中心之間都相對割裂。國外產品相對有一些跨地區的容災能力,加上由于基礎網絡好,因為割裂而帶來的影響相對沒有國內大。
所以,其實云平臺很多,但在產品設計,計費思路,基礎設施,以及主打方向策略上都各有特點。對于企業來說,在拋棄傳統的方案同時,希望放在云上的業務和重要數據就如存在銀行的錢一樣,可以非常放心,而不是因為用上了云,而再花精力來考慮業務之外的兼容性,可用性,可靠性和安全性等問題。
對于多備份,我們最關心云平臺的三件事情:一是有沒有高性能的主機服務,我們需要對備份的企業數據進行加工,屬于I/O運算密集型業務;二是存儲的可靠性,這是我們的命根子;三是主機和存儲、用戶和主機的距離,直接影響用戶使用服務的速度體驗。
因此我們主要還是聚焦在存儲備份的整合,通過整合,提供簡單易用界面,6個9(99.9999%)的數據安全可靠性(比如我們研發的Cloud 5技術),以及提供比單一云以及傳統異地數據備份的更高的性價比,真正用很少的費用實現數據永不丟失。
CSDN:多備份目前覆蓋的區域大體包括哪些國家地區?
陳元強: 多備份目前可以支持北美,國內,東南亞,西歐部分地區,其他地區目前更多是靠這些有云節點區域來覆蓋,涉及到AWS、微軟Azure、Linode、Rackspace、阿里云、Ucloud、移動云、電信云、Dropbox、微軟One Drive、Google drive、百度云等。多備份目前全球區域覆蓋分布示意圖。
CSDN:前面我們有聊到,多備份既有支持國內,也有支持國外的云平臺。目前這些平臺是怎么樣無縫的整合在多備份平臺中,特別是考慮到國際出口的帶寬其實非常擁擠。
陳元強:對于國際國內的平臺的整合,一開始我們并沒有考慮這么多,更多的是把業務模型做出來,所以前期遇到不少問題,跨國際線路控制命令傳輸丟失,國內國外的數據相互繞著傳遞,調度也沒有考慮任務區域的分配情況,加上各類云平臺其實穩定性都存在這樣或那樣的問題,所以一開始挑戰很大,任務時常卡,或存儲失敗率比較高。互聯網在架構設計上有個說法是,架構從來不是設計出來的,是不斷結合運營優化出來的;經過近10個月的不斷優化迭代,產品體驗上了一個大的臺階,在用戶界面上突出啟發式引導,功能聚焦在備份與恢復這兩個的核心體驗上,基礎資源方面做了大量的體系化的優化和區域路由平衡,對于任務進行分級分區調度,速度更快,任務執行更穩定。
CSDN:有1個安全方面的話題,我們前幾期對其他云服務的采訪,都提到過云平臺的安全問題,企業也是非常關心這個話題。這塊多備份有一些具體的措施么?
陳元強:的確,安全是多備份運轉的基礎,但安全永遠是1個沒有完結的話題,多備份在安全方面一直非常重視,體現在如下幾個基礎事情方面:
盡管如此,我們還是希望整個行業有更多的正能量疊加,真正的把團隊的精力用在不斷推動行業效率提升和應對自然災害、軟件缺陷或人為誤操作引起的故障應對的方向上來。
CSDN:我們之前聊到一些數據規模的問題,多備份可以在全球范圍內,流暢支持從幾MB,到數TB的數據存儲備份,這塊能否介紹一下?
陳元強:先說一下多備份的高效智能化的備份網絡架構模型,整體借鑒Linux內核的設計模型,是一個分層大異步與小同步驅動設計的模型,每一層都為上一層提供核心的能力協議。
為了實現TB/MB各種量級的數據能在備份網絡中混合快速備份,具體來說從幾個環節入手:
數據接入層
數據接入層的設計目的很簡單,就是用最容易,最通用的接入數據的技術,讓各類場景的數據,很輕松接入到備份系統中,同時保持每次盡可能少的數據傳輸。所以,除了常規的分塊,壓縮,去重等常規技術外,還結合互聯網的帶寬小的特點,支持多級緩存加速技術,用最快速的差異分析技術,使得每一次備份都保持最小的數據量流入到數據傳輸層。
第1次:藍色區塊表示對數據最小化起主要作用的功能塊,圖中示意從10GB 變成1-5GB,最后輸出的數據還同數據本身的特征相關。
第2次以后:在第1次的基礎上,本地緩存相關加速比對和差異分析開始運轉,實際變化的數據可能會非常小,圖中示意雖然新增了1GB,但實際變化的數據只有0.1GB不到。
目前具體部署形態上,我們支持插件,托管,以及客戶端代理模式,插件主要針對中小型(1GB以下的)網站,托管支持規模稍大一點的1-30GB,而客戶端模式支持30GB以上的數據備份。
目前我們在Linux(32,64位),Windows(32,64),以及Aix上都已經完整支持。數據庫目前我們支持主流的MySQL,Oracle,MSSQL,PostgreSQL。在具體的應用場景上,我們有一套對應的場景識別能力,同時可以結合API,把控制面板嵌入到云平臺,虛擬主機廠家,以及在線SAAS服務等。
數據傳輸層
目前備份網絡工作策略:基本是采用傳輸和控制分離的方式來設計整體傳輸網絡,類似目前SDN的思想:通過對目標類型識別,服務器進行分區編碼,資源狀態以及網絡狀態動態分析,支持全球范圍的智能化的調度能力,對于不同規模,不同區域的對象,我們會自動調度到最合適的節點和線路,確保最優化配置網絡節點和帶寬資源,優化備份恢復體驗。
具體分為幾個要點來考慮:
節點:直接采用優化過的OS底層協議棧,快速啟動傳輸窗口,加快數據傳輸速度。
網絡:在具體的網絡部署上,通過采用優質的節點,建立核心傳輸通道;同時對根據數據特點,設定節點優先級分區,隔離大、小數據和VIP通道;同時啟動就近接入和鏈路聚合策略,提高節點之間的帶寬利用率;對于一些要求比較高的場景,比如超大規模的數據,我們同時會啟動區域加速策略完成分段數據快速傳輸。
數據存儲層
目前多備份支持企業級和個人云盤存儲接入;并支持完全冗余分組組合和Cloud 5分塊跨云冗余模式。數據原則上就進存儲,對于啟用組合合Cloud 5模式的會進入區域加速模式傳輸。
提高數據存儲效率。另外,在云存儲這里,我們已經與幾家平臺有深入的合作,比一般接入商開放的API能力會更加強大。
存儲為多級索引設計,支持跨地區分布,支持多云存儲,同時存儲對象分為區塊和文件對象組合的方式,提供高速的存儲,下載,搜索等能力。
優化永遠沒有結束,目前我們正在與國內的頂級加速廠商以及更多的云計算與云存儲企業合作,在不久后,就會全面啟動全球范圍內的的數據傳輸通道加速,預計在目前備份網絡目前的基礎上會提升3-5倍的傳輸能力,對于超過TB級的數據的備份和恢復、遷移等動作響應時間會大大縮短。
CSDN:最近幾年,云計算相關的平臺和服務發展非常快,據說多備份已經有超過4萬家企業在使用,祝福多備份在此浪潮中順勢建立起口碑,不斷推出云上驚喜的數據管理功能,為上云的企業提供更多親民的數據安全保障服務,讓數據永生!
陳元強:感謝,這也是我們確定的目標,必須努力!
(責編/魏偉)