雲計算

如何輕鬆搞定SAP HANA數據庫備份?

作者:涼軒
1.jpg

2010年SAP發佈了一款產品,其全稱是SAP High Performance Analytic Application,這款產品就是我們所熟知的SAP HANA。經過多年的發展,SAP HANA已經從一個“應用”演變為一個內置計算、數據庫、分析和預測等各種引擎的高性能應用平臺,現在越來越多的模塊逐漸往這個平臺靠攏或者說集成。

為保證自身的最佳性能,SAP HANA把數據存儲在內存中,同時,使用持久化的存儲系統來進行故障的恢復。在數據庫正常操作時,數據和undo日誌在保存點過程中會自動的持久化到硬盤中,數據的變化被記錄在redo日誌中。雖然保存點(Savepoint)和寫日誌操作可以防止斷電、硬件故障等突發因素對數據庫的影響,但當持久化存儲設備發生故障後或者誤操作時,二者就無能為力了。為了防止上述情況導致的數據丟失,SAP HANA數據庫的備份是必要切必須的。

一、SAP HANA備份特點:

SAP HANA備份可以分成日誌備份和數據備份兩個部分,具體特點包括:

1)兩個部分的備份過程是相互獨立的,SAP HANA進行第一次數據備份以前,日誌備份是不會進行的;
2)備份和恢復都是應用於整個數據庫的,不可以備份和恢復數據庫中某一個對象;
3)SAP HANA備份至少需要 BACKUP ADMIN 和 CATALOG READ權限;

二、阿里雲混合雲備份(HBR)的技術實現

阿里雲混合雲備份(HBR)在一年前即推出了SAP HANA BACKINT集成方案,成為亞洲首家通過SAP HANA BACKINT認證的雲廠商,此外,HBR還可以為阿里雲ECS,NAS,OSS以及自建機房內的文件,VMware,SQL Server等提供安全,高效的備份和容災保護。

傳統的備份方案如下圖所示,需要依賴於SAP HANA Studio 或者 cockpit等工具將需要備份的數據dump到本地磁盤或者NAS上,再上傳到OSS當中,可以看出在備份方案中,配置非常繁瑣,還需要搭配各種腳本進行生命週期的管理。

2.jpg

為了簡化這個流程,HBR通過集成SAP HANA BACKINT接口跟SAP HANA進行三方集成,SAP HANA在啟動備份的過程會啟動HBR部署好的插件,將數據備份到HBR的備份庫當中,HBR將所有需要腳本參與的步驟進行全自動化的管理。
此外, HBR HANA插件遵循SAP HANA Backint接口規範,由SAP HANA數據庫向HBR HANA插件中存入流式數據,還原時由SAP HANA發起,再由HBR插件對備份時的數據流進行回放操作。

3.jpg

通過以上兩種技術手段,大大提升了SAP HANA的備份效率,同時,為了實現數據更快速的恢復, SAP HANA通常採用全備份+日誌備份的方式,這就導致了怎麼樣去縮減全備份的存儲空間佔用,為了解決這個問題, HBR在流式協議之後採用了變長重刪的算法,變長重刪算法能較好的將數據變化影響限定在一個切片或相鄰的兩個切片之間,這樣的算法實現了30:1的重刪比,能夠有效的縮減SAP HANA全備份的存儲容量,有效的降低用戶的存儲成本。

三、HBR備份SAP HANA的三種方式

針對SAP HANA的部署方式,目前分為三種:
1、SAP HANA 單節點部署

4.jpg

-HBR控制檯將控制命令直接發送給SAP HANA節點上的HBR agent (hybridbackup)
-Hybridbackup根據控制命令生成相應的SQL語句發送給SAP HANA數據庫。
-SAP HANA數據庫收到相應的SQL語句之後啟動備份任務並調用BACKINT讀取備份數據。
-BACKINT將數據流重定向到IDS當中進行重刪壓縮處理,最終保存在HBR的備份庫當中。

2、SAP HANA 雙機HA部署 - 分為主節點和備節點,如果主節點發生故障則由主節點切換為備節點

5.jpg

-HBR需在兩臺SAP HANA節點部署HBR Agent,但同一時間工作的數據面程序(BACKINT與IDS)只有一臺和SAP HANA主節點保持一致。
-控制命令由HBR控制檯任意選擇一臺在線的hybridbackup發送控制命令。
-hybridbackup生成SQL命令將命令發送到高可用虛擬IP地址,高可用虛擬IP地址會將請求路由到當前的active節點上執行

3、SAP HANA Scale-out部署 - 通常為數據量較大的數據庫部署方式HBR 備份 SAP HANA scale-out

6.jpg

-SAP HANA Scale-out 部署採用Master-worker結構,有一臺主節點,所有的備份恢復命令都需要發送到主節點進行執行
-SAP HANA worker也通用分佈了部分數據,所以在備份執行時,相應的master 和 worker都會有數據流產生。
-控制命令依然由HBR控制檯任意選擇在線的hybridbackup節點進行發送。

四、HBR備份SAP HANA的優勢

相比於在本地備份SAP HANA 數據庫,在阿里雲上備份SAP HANA 數據庫的優勢包括:
1、 高可靠:備端採用多副本方式存儲,進而實現99.999999999%的數據可靠性;
2、 更安全:多用戶資源隔離機制,支持異地容災機制,提供多種鑑權和授權機制及白名單、防盜鏈、主子賬號功能等;
3、 更經濟:備份庫採用重刪存儲,支持按量付費,資源包等多種付費形式,降低整體擁有成本;
4、 更簡單:操作簡單易用,通過HBR控制檯界面即可輕鬆實現SAP HANA數據庫的週期性備份、日誌備份的相關配置。

Leave a Reply

Your email address will not be published. Required fields are marked *