如何利用基于云的歸檔解決備份難題
這種解決方案的問題在于,它們給用戶造成了一種貌似安全的假象,導致用戶將大筆投資放在看似精密的解決方案和基礎架構(gòu)上。這個問題的根源是,有 大量的數(shù)據(jù)根本不需要進行備份。根據(jù)最新的數(shù)據(jù)研究顯示,大多數(shù)數(shù)據(jù)中心的主存儲設備都保存著未來6個月到1年之內(nèi)不會被訪問的靜態(tài)數(shù)據(jù)。在 很多數(shù)據(jù)中心中,這種靜態(tài)數(shù)據(jù)所占比例甚至高達80%。
靜態(tài)數(shù)據(jù)問題的影響
大多數(shù)數(shù)據(jù)中心每周或者每個月對整個環(huán)境進行一次完全備份。這意味著每次完全備份完成之后,網(wǎng)絡中遷移和在備份目標中保存的數(shù)據(jù)中有80%在過 去一年都是沒有任何變化的。這個事實使得重復數(shù)據(jù)刪除設備在市場中脫穎而出,這種設備使用塊層級的認證來刪除冗余信息。
然而有一個挑戰(zhàn)是,這些重復數(shù)據(jù)刪除設備并不能解決仍然要在網(wǎng)絡中遷移所有數(shù)據(jù)的問題。因此,實際上這些設備只能對備份存儲起到幫助作用。盡管 它們是基于磁盤的,但只能大幅度縮短備份所需的時間。除此之外仍然需要在網(wǎng)絡基礎架構(gòu)方面的投資,而這可能是很復雜且高成本的。
盡管人們在網(wǎng)絡基礎架構(gòu)方面有投資的預算和意向,但是仍然存在著為備份準備所有文件的問題。在備份過程中,應用需要對每份文件進行檢查,看它自 最近一次備份以來是否發(fā)生過變更。這個過程是非常耗費時間的,尤其是那些保存了大量文件的服務器。
另外還有保留方面的問題。在大多數(shù)備份系統(tǒng)中,“重要”數(shù)據(jù)中往往混合著真正“關(guān)鍵”的數(shù)據(jù),而真正“關(guān)鍵”的數(shù)據(jù)中又混合著法規(guī)遵從所需的數(shù) 據(jù)。在大多數(shù)環(huán)境中,不同形式的數(shù)據(jù)往往具有不同的價值。有時候我們保存這些數(shù)據(jù)是為了法規(guī)遵從,有時候是為了企業(yè)內(nèi)部監(jiān)管。當所有這些數(shù)據(jù)與備份數(shù)據(jù)集混合在一起的時候,我們就很難制訂專 門的保留規(guī)劃。因此,大多數(shù)企業(yè)機構(gòu)決定將所有數(shù)據(jù)保存超過必須保存的時間期限,而這進一步加重了負擔。這使得數(shù)據(jù)恢復就像是大海撈針。
最后是找回問題,這也是實時備份的最主要原因。所有靜態(tài)數(shù)據(jù)與動態(tài)數(shù)據(jù)都是混合在一起的,因此這就會延長恢復數(shù)據(jù)所需的時間。例如,將一臺服務 器恢復在初始狀態(tài)可能需要恢復1TB的數(shù)據(jù),而實際上真正需要的數(shù)據(jù)也許只有200GB。不管使用什么技術(shù),恢復200GB數(shù)據(jù)總要比恢復1TB數(shù)據(jù)快 吧。如果除去這些靜態(tài)數(shù)據(jù)的話,那么以前需要幾天時間的恢復現(xiàn)在可能只要幾小時就可以完成了。
利用歸檔解決靜態(tài)數(shù)據(jù)難題
解決靜態(tài)數(shù)據(jù)難題的最簡單方法就是去掉靜態(tài)數(shù)據(jù),也就是將靜態(tài)數(shù)據(jù)從主存儲中遷移出來。假設一個環(huán)境中的所有靜態(tài)數(shù)據(jù)被刪除,那么將會釋放大約 80%的空間。即使不會完全停止存儲采購,這種方法也可以大幅加快備份和恢復流程。對于上面那個1TB數(shù)據(jù)的例子來說,對200GB數(shù)據(jù)進行掃描、遷移和 保存要比1TB數(shù)據(jù)容易得多了。
當然對于大多數(shù)企業(yè)機構(gòu)來說,刪除80%的數(shù)據(jù)不僅是不切實際的,還有可能是非法的。這里我們需要其他的方法:歸檔存儲。通過創(chuàng)建一個歸檔存儲 層,IT經(jīng)理可以將靜態(tài)數(shù)據(jù)集從主存儲和備份流程中排除掉。因為是單獨保存這些數(shù)據(jù)的,所以可以制訂單獨的保存策略。備份流程不再需要檢查那么多的文件來 決定他們的備份需求。這樣,不僅備份和恢復流程進一步完善了,在備份硬件和網(wǎng)絡基礎架構(gòu)方面的投資也大幅度減少了。
歸檔并不是一個新理念。自從第一臺大型主機問世以來,歸檔就一直是卸載主存儲、減少備份流程負載的一種方法。開放存儲和Windows平臺很少 使用這種技術(shù)。最主要的挑戰(zhàn)是,大多數(shù)歸檔都是基于磁帶的。這種歸檔需要有復雜且定制的軟件以及客戶代理。而且,從歸檔中恢復數(shù)據(jù)以及在基于磁盤的歸檔中 分類數(shù)據(jù)也都是非常具有挑戰(zhàn)性的。
在最近幾年中,廠商們開發(fā)出來基于磁盤的歸檔技術(shù)來克服這種局限性。這種歸檔存儲便于訪問(通常通過NFS或者CFS加載點)、易于索引并提供了磁帶系統(tǒng)無法做到的快速恢復。此外這種歸檔存儲還通過提供更高的可 擴展性和可靠性解決了使用廉價磁盤陣列的局限性。
磁盤歸檔的挑戰(zhàn)
基于磁盤的歸檔也有自身的缺點。一些磁盤歸檔提供了“類似于磁帶”的可擴展性,通過使用1U服務器或 者互連存儲組成的集群架構(gòu)實現(xiàn)了這種可擴展性。典型的存儲集群在添加節(jié)點數(shù)量方面是有限制的,所有這些都需要電力、空間和冷卻資源的支持,而這會進一步增 加成本。
另外,在很多情況下這些系統(tǒng)需要從一個相對大規(guī)模的節(jié)點部署起步。通常初始容量要求在25TB或者更高,而這對于小型和中型企業(yè)來說往往是不切實際的。
最后,在歸檔存儲中,磁盤或者磁帶仍然需要管理。我們需要創(chuàng)建、分配和監(jiān)控存儲來確保一切正常,不需要維護或者升級。考慮到目前IT人員的縮 減,盡管磁盤歸檔可以帶來諸多好處,但是企業(yè)機構(gòu)可能沒有足夠的人員來執(zhí)行這些任務。
利用云存儲作為歸檔
有一個可行的選擇,那就是云存儲。使用云存儲作為歸檔可以為用戶帶來很多好處。要想把云存儲作為歸檔的話,大多數(shù)企業(yè)機構(gòu)應該尋找這樣的解決方案:即使用了本地設備將最近歸檔數(shù)據(jù)緩存在本地磁盤以便快速恢復、然后將數(shù)據(jù) 遷移到云存儲中作為長期保存。因為大多數(shù)云歸檔解決方案都是付費即用型的,所以這對于規(guī)模最小的企業(yè)也是一個可行的選擇。
此外,一些云歸檔系統(tǒng)可以直接從API集中寫入。例如,有些存儲廠商與獨立軟件供應商合作,允許云歸檔直接與他們的應用進行集成。這是推動將數(shù) 據(jù)保存到歸檔存儲中的一個理想點。對于用戶來說,信息仍然保持最新,提供了關(guān)于歸檔數(shù)據(jù)集的智能性,同時應用也可以起到幫助作用。
云歸檔還解決了其他歸檔形式可能給IT員工帶來的操作問題。因為所有物理存儲都是外包的,因此數(shù)據(jù)集管理所需時間為零。此外,這也不需要消耗企 業(yè)機構(gòu)的能源、空間或者冷卻資源。單是這一點就證明了對云歸檔的投資是合理的,而其他歸檔解決方案則無法提供這項保證。
發(fā)布者:博子
評論