日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時間:8:30-17:00
你可能遇到了下面的問題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
如何基于公有云打造TB級文件備份保護系統(tǒng)

如何基于公有云打造TB級文件備份保護系統(tǒng)

作者:陳元強 2015-11-25 11:16:45
云計算
云安全 企業(yè)業(yè)務(wù)稍微上點規(guī)模的,IT系統(tǒng)產(chǎn)生的數(shù)據(jù)很容易就超過TB級,并且資料文檔等很容易超過億級別的規(guī)模,如果用手動復(fù)制的方案來備份,基本是非常困難的;這種情況下,即使購買一些專業(yè)系統(tǒng),隨著數(shù)據(jù)量日益增大,跑起來也非常吃力。本文重點討論如何基于云平臺,來實現(xiàn)對應(yīng)的解決方案。

站在用戶的角度思考問題,與客戶深入溝通,找到察哈爾右翼后網(wǎng)站設(shè)計與察哈爾右翼后網(wǎng)站推廣的解決方案,憑借多年的經(jīng)驗,讓設(shè)計與互聯(lián)網(wǎng)技術(shù)結(jié)合,創(chuàng)造個性化、用戶體驗好的作品,建站類型包括:成都網(wǎng)站制作、成都做網(wǎng)站、外貿(mào)營銷網(wǎng)站建設(shè)、企業(yè)官網(wǎng)、英文網(wǎng)站、手機端網(wǎng)站、網(wǎng)站推廣、域名申請、網(wǎng)絡(luò)空間、企業(yè)郵箱。業(yè)務(wù)覆蓋察哈爾右翼后地區(qū)。

企業(yè)業(yè)務(wù)稍微上點規(guī)模的,IT系統(tǒng)產(chǎn)生的數(shù)據(jù)很容易就超過TB級,并且資料文檔等很容易超過億級別的規(guī)模,如果用手動復(fù)制的方案來備份,基本是非常困難的;這種情況下,即使購買一些專業(yè)系統(tǒng),隨著數(shù)據(jù)量日益增大,跑起來也非常吃力。本文重點討論如何基于云平臺,來實現(xiàn)對應(yīng)的解決方案。

TB級海量文件場景特點

  • 文件規(guī)模大,動作上千萬級規(guī)模
  • 文件目錄結(jié)構(gòu)多,層次多
  • 文件大小從KB 到MB,GB,甚至百GB級別分布
  • 文件變化快,或者有批量增加的場景
  • 無用的,有用的,混在一起
  • 時間分布久,跨度大
  • 文件類型文本,視頻,圖片,壓縮等都有
  • 單個節(jié)點的數(shù)據(jù)量上TB級
  • 總量上TB級,但分布在多個節(jié)點

面對如此特點,如果按照目前的設(shè)備+軟件方案,在以下幾點有非常大的缺陷:

1.升級擴展復(fù)雜,預(yù)先估計容量,后續(xù)擴展起來相當麻煩,必須的改變存儲策略,或重新離線做數(shù)據(jù)遷移分布。如果初始購買的存儲擴展有限,后期還不能很好的升級擴展。

2.3-5年左右的生命周期,也就是說,數(shù)據(jù)經(jīng)過幾年后,改造升級,購買新的方案是必須的,這樣當數(shù)據(jù)上到百TB級別,整個工程實施也是相當復(fù)雜了。

3. 一次投入特別的貴,如果對原始TB級數(shù)據(jù)做專業(yè)備份保護,投入得數(shù)十萬,具體到不同的行業(yè),性能和保護窗口參數(shù)稍微提升,投入立即上升到百萬級。

隨著數(shù)據(jù)量的增長,超過一個量級,比如10TB級別,其實這類方案已經(jīng)難于勝任了。

破解思路

基本上來說,要破解海量數(shù)量,以及TB級增長的難題,基于云的方案是目前最有前途的思路,云有4個核心好處:

1.存儲和計算能力按需擴展

2.可靠,云的計算和存儲分布特點,使得系統(tǒng)在計算和存儲都具備傳統(tǒng)結(jié)構(gòu)不具備的數(shù)倍的可靠性

3.安全,基礎(chǔ)云服務(wù)商自身在安全方面不計成本,比起自己構(gòu)建IT設(shè)施,來得更加專業(yè)

4.擴展,開放性更好,使得構(gòu)建的服務(wù),更容易外部系統(tǒng)對接

目前在國內(nèi)以及全球其他地區(qū),都有成熟的云平臺可以作為構(gòu)建基礎(chǔ)。當然,除了明顯的優(yōu)點外,也有1個缺點是,云畢竟在異地,速度方面沒有本地來得快,所以在設(shè)計系統(tǒng)的時候,要充分考慮到此處特點。以此為基礎(chǔ),考慮構(gòu)思如下備份系統(tǒng)的設(shè)計目標:

最高性價比的TB級海量小文件備份服務(wù)

支持分布式,多節(jié)點集中管理監(jiān)控

備份容易且快速恢復(fù)

結(jié)合云平臺的優(yōu)缺點,基本的設(shè)計思路大體如下:

  • 規(guī)模上量:單點TB突破,分布式上量
  • 最小空間占用:最大化變小數(shù)據(jù)
  • 平衡性能開銷:IO掃描和效益平衡
  • 不做無用功:特征類型自適應(yīng)處理
  • 最近最快,最遠最可靠:多級模式結(jié)合,平衡速度和可靠性

以下將圍繞以上5個點展開,看一個專業(yè)級別的備份保護系統(tǒng)如何打造。

TB級突破

實現(xiàn)TB級突破,重點思路在于如何解決備份和恢復(fù)的速度,以及海量規(guī)模的數(shù)據(jù)塊存儲。而解決數(shù)據(jù)備份和恢復(fù)速度的關(guān)鍵在于組織好數(shù)據(jù)索引;我們?nèi)粘?吹降木W(wǎng)盤備份是簡單的同步模型,很難勝任連續(xù)的數(shù)據(jù)塊版本影射關(guān)系。而一個專業(yè)的備份系統(tǒng),此處是必須要解決好。

架構(gòu)上要突破純云的方案,本地和云結(jié)合

純云的方案,用了云的幾個優(yōu)勢點,但也同時受云天生異地的特點影響,在傳輸效率方面是必定落后本地的方案,在強調(diào)速度的備份和恢復(fù)場景下,只有壓縮數(shù)據(jù),加大帶寬。因此,更好的專業(yè)級方案是兼顧云和本地的優(yōu)勢進行設(shè)計。

以下黃色部分,就是加的一層本地存儲;本地客戶端將以分塊的形式把數(shù)據(jù)寫入本地客戶端,同時啟動同步邏輯,把數(shù)據(jù)從本地同步到云存儲。

#p#

TB級數(shù)據(jù)重點在索引管理上要下功夫,索引分為本地和云端兩級

本地索引采用分段分布設(shè)計,突破傳統(tǒng)RDB單庫數(shù)量過大,查詢過慢的瓶頸。本地索引模型讀寫相對簡單,可以采用自己研發(fā)或開源的本地數(shù)據(jù)存儲方案,Sparkey, levelDB,BDB,甚至MongoDB等都可以,實現(xiàn)索引庫理論支持TB級以上的的索引大小,具體到文件為每條索引可做到100字節(jié)以內(nèi)

索引容量: TB/0.1KB > 100億條索引

按照簡單的順序存取模型,海量的目錄,文件索引,這種分級模型的索引框架,可以輕松解決TB級數(shù)據(jù)與海量小文件場景的管理。

當然,如果離開了異地配合,這種方案還是不完整的。因此在云上,要支持更大規(guī)模的索引容器。幸運的是,在云上,我們可以選擇的方案還比較多??梢曰贛ongoDB,LevelDB等優(yōu)秀的列模型數(shù)據(jù)庫,也可以基于云平臺本身的分布式KV數(shù)據(jù)庫來保存索引。

設(shè)備通過調(diào)度中心定位到云索引中心 ; 單個云索引中心采用NO-SQL DB分布式設(shè)計,具體按照任務(wù)ID進行分布。關(guān)于具體的索引容器,可以選擇云平臺提供的KV數(shù)據(jù)庫,如果要更多靈活的控制,也可以自己選用專業(yè)的KV 數(shù)據(jù)庫來構(gòu)建。理論上云端可以管理索引的數(shù)量無限。

數(shù)據(jù)按系列段分塊存儲,提升混合云模型的速度參數(shù)

普通的量級數(shù)據(jù)讀寫,無所謂要不要分塊了,但一旦規(guī)模上到TB級別,特別在文件量變化快的場景,要盡可能縮短備份窗口,必要的數(shù)據(jù)存儲組織就顯得非常的關(guān)鍵。其數(shù)據(jù)存儲分為兩部分,本地和云。

本地數(shù)據(jù)存儲設(shè)計,可采用N *KB – N *MB 相對固定系列段的分塊設(shè)計,兼顧讀寫效率與空間平衡分塊采用期望分塊方案,盡可能讓分塊分布在1個區(qū)間,保證去重效果的同時,減低分塊對索引記錄數(shù)占用的數(shù)量。本文按照64KB 到 4MB的經(jīng)驗值方案來計算.

總可索引數(shù)據(jù)量區(qū)間:理論最小管理數(shù)據(jù) 100億* 64KB = 600+TB , 理論最大管理數(shù)據(jù) 100億* 4MB = 40+ PB 這么大的規(guī)模,理論上已經(jīng)遠遠滿足數(shù)據(jù)存儲管理需要。

對于數(shù)據(jù)上云,初始化系統(tǒng)這里可以把設(shè)備定位到不同的云數(shù)據(jù)中心,與索引位于同1個中心內(nèi);上傳的數(shù)據(jù)異步化存儲到云存儲,或可同時異步到特定的塊存儲設(shè)備;對于塊存儲,提供合并機制,將小塊進行合并存儲,提高存儲讀寫效率。所以,理論上云端冗余管理的數(shù)據(jù)量受限于云存儲空間提供商的。

本地和云的數(shù)據(jù)存儲組織方案,在本地通過相對分塊序列的方案,在云采用云存儲的方案,從KB-MB級的小數(shù)據(jù)塊文件都可以輕松管理起來。

上圖是基于索引和塊存儲結(jié)合的增量應(yīng)用。任何一個數(shù)據(jù)塊的變化都會第一時間,通過本地的索引塊簽名快速判斷是否需要上傳備份 ; 如果本地的索引無法啟動,將從云端獲取簽名進行比對。任何一個需要備份的數(shù)據(jù)塊,可以快速通過分塊序列存儲方案,保存在對應(yīng)的數(shù)據(jù)塊文件中。

通過并行冗余通道,提升上下云的速度、穩(wěn)定和可靠性

互聯(lián)網(wǎng)絡(luò)本身是一個質(zhì)量無法端到端保證的的一個網(wǎng)絡(luò),傳輸?shù)姆€(wěn)定性會又多個環(huán)節(jié)影響。包括運營商網(wǎng)絡(luò),平臺的網(wǎng)絡(luò),以及用戶接入的網(wǎng)絡(luò)等。對于一個專業(yè)級的備份系統(tǒng),必須要考慮網(wǎng)絡(luò)通道的連續(xù)、穩(wěn)定運行。

以上,在任何一次客戶端注冊期間,一旦認證通過后,可以根據(jù)系統(tǒng)資源情況,分配合適的數(shù)據(jù)節(jié)點給客戶端。 客戶端可以根據(jù)情況,正常情況下,多通道并行傳送 ; 一旦檢測到通道出現(xiàn)問題,自動摘除 ;各個節(jié)點會上報數(shù)據(jù)到調(diào)度中心; 同時當鏈路恢復(fù)的時候,自動接入到系統(tǒng)中。下圖就是示意多通道在同步到云,以及從云恢復(fù)或下載數(shù)據(jù)。

采用端到端加密數(shù)據(jù)塊設(shè)計,結(jié)合數(shù)據(jù)塊垮云分布機制,可靠保存?zhèn)浞莸奖镜睾驮频臄?shù)據(jù)

在備份體系中,數(shù)據(jù)保密性設(shè)計不依賴于人,從機制上保證數(shù)據(jù)備份到云是機密的。最常用的一種方案就是采用對稱加密,具體可以采用AES,3DES 等算法。目前比較常用AES256位,而key的產(chǎn)生可以在客戶端產(chǎn)生。Key一旦丟失,數(shù)據(jù)將無法恢復(fù)和使用。因此key的妥善保護,也是非常重要。

在基于塊的加密設(shè)計中,結(jié)合云分布特征,數(shù)據(jù)被打散在不同的存儲位置,因此在數(shù)據(jù)安全方面進一步增加了強度。基于目前的公有云平臺的情況,在國內(nèi)和國外都有幾大主流的云存儲平臺,分布在全球。理論上,數(shù)據(jù)可以分步在任何一個地方。唯一考慮的是數(shù)據(jù)如何跨地區(qū)進行同步和分布; 當然這里可以先寫入本地云中心,冗余塊通過高速通道,再同步其他云中心,這里可以是同構(gòu)的云,也可以是異構(gòu)的云。

引入自動適應(yīng)方案,提升海量文件和應(yīng)用場景的適應(yīng)能力

在海量文件情況下,由幾種系統(tǒng)因素影響備份的效率和資源開銷。備份系統(tǒng)如果全速開進,會消耗過多的計算和IO資源,如果是生產(chǎn)系統(tǒng),勢必也會帶來沖突。以下是幾種典型的需要規(guī)避的:

  • 壓縮比例和CPU消耗的沖突
  • 磁盤IO和小文件隨機分布的沖突
  • 強加密和CPU需求的沖突
  • 實時檢測和系統(tǒng)資源的沖突
  • 文件類型和壓縮效果的沖突
  • 備份帶寬消耗

通過對帶寬,壓縮算法,文件類型定義等預(yù)定義策略,可以快速平衡好系統(tǒng)資源。這種適合在確定判斷系統(tǒng)場景的情況啟用。

對于無法預(yù)知的情況,啟動自動監(jiān)測機制,包括壓縮比,是否硬件加密加速,是否需要啟動實時或批量掃描等。

總結(jié)與展望:

隨著云平臺的成熟和發(fā)展,網(wǎng)絡(luò)基礎(chǔ)設(shè)施日益完善,用云構(gòu)建的數(shù)據(jù)備份系統(tǒng),可以充分利用天然的地區(qū)分布,運維簡單,靈活擴展特點,以及彈性按需投入的優(yōu)勢,企業(yè)數(shù)據(jù)走向云端簡單更加簡單可行。

作者簡介:陳元強,多備份創(chuàng)始人。15年經(jīng)歷,包括一線技術(shù)公關(guān)、項目與團隊管理等,涉及云服務(wù)架構(gòu),系統(tǒng)底層、網(wǎng)絡(luò)、存儲、安全、大數(shù)據(jù)計算分析、移動應(yīng)用等業(yè)務(wù)和技術(shù)領(lǐng)域。


網(wǎng)站名稱:如何基于公有云打造TB級文件備份保護系統(tǒng)
當前網(wǎng)址:http://m.5511xx.com/article/copcchd.html