雲計算

OceanBase吳東昕:多形態技術佈局,滿足客戶的“極致追求”

2020年12月17日至18日, “ Distributed Cloud | 2020 全球分佈式雲大會”在深圳正式拉開帷幕。本次大會就“雲原生”“分佈式雲”“分佈式數據”“分佈式存儲”等幾個熱門概念進行討論。在12月17日上午的“分佈式雲主論壇”上,螞蟻集團 OceanBase 解決方案部資深解決方案架構師吳東昕為現場觀眾帶來了《原生分佈式數據庫帶來數據管理革命》的演講。

01隨時代步伐 積累經驗厚積薄發

隨著數字化轉型,雲計算、邊緣計算,以及各種互聯網業務的興起,大量的業務都需要使用數據庫,這便對數據庫的處理能力提出了巨大的挑戰。傳統 IOE 架構數據庫依賴高端硬件,系統難於擴展,價格昂貴。雖然,基於中間件的分庫分表方案解決了擴展性的問題,但是跨庫事務、全局一致性、負載均衡、複雜 SQL 仍然成為亟待解決的問題。

C41E8389-8426-415f-91AC-E45208CAE753.png

OceanBase 資深解決方案架構師 吳東昕

分佈式數據庫的出現,解決了數據庫處理能力橫向線性擴展的問題。分佈式數據庫基於普通服務器,降低系統成本,並支持原生分佈式查詢。對應用提供透明的支持分佈式事務,確保全局一致性,具有靈活的部署方式和負載均衡能力。

在分佈式數據庫迅速發展的趨勢下,螞蟻集團加快發展步伐。自2010年正式立項,淘寶收藏夾成為了 OceanBase 的第一個用戶,後續全面在螞蟻集團的核心繫統大規模應用,在 2019 年創造了 TPC-C 6100萬 tpmC 的記錄。今年6月,OceanBase 正式成立獨立公司:北京奧星貝斯科技有限公司,進行獨立商業化運作。吳東昕表示:“螞蟻希望原生的分佈式數據庫能力可以惠及更多客戶的更多場景,所以開始了OceanBase分佈式數據庫商業化服務外部客戶的征程。如今,我們能做到全分佈式、多站點的擴展。”

對 OceanBase 來講,從第一天在內部使用,到支撐雙十一大量跟金錢交易的場景,逐漸從解決擴展能力,解決容災能力,最終到解決大規模運維效率。這便是與其它同類產品的不同之處, OceanBase 孵化於支付寶,在內部經歷了大規模極致場景的打磨,產品逐步成熟後再對外部全面開放使用。

02多形態技術佈局 做到市場技術雙驅動

發展到2020年,OceanBase 更加重視市場驅動,針對國內中大型金融機構、國計民生相關的政府與公共事業等有著相關需求的客戶,OceanBase 能夠解決客戶對高可用性、強一致性的訴求,同時能夠實現對上層應用透明,減少應用的侵入性,還能做到擴展自動分片,在線擴容/縮容等功能。吳東昕表示,“在原生分佈式數據庫的技術發展方面,我們希望做到雲原生,將來我們也會做到存儲計算分離。”

OceanBase 是一款100%完全自研的數據庫軟件。吳東昕介紹,從整個存儲引擎到透明的分佈式多地多中心多活的部署架構到系統引擎全部都是自研的。雖然有 Oracle 兼容和 MySQL 兼容兩種應用模式,但通過原生分佈式架構,OceanBase 橫向擴展做到了 TPC-C 7.07億 tpmC的世界紀錄。

OceanBase 數據庫架構有著多副本、對等節點、無需存儲設備共享、分區級高可用性、強一致性等諸多特點。在實現多副本架構時,所有的節點都對等,協同服務做到全部可讀寫,也不需要專用的設備和專用存儲網絡,可以實現多站點多活的方式。吳東昕表示,OceanBase 雖然是分佈式數據庫,用戶會發現在使用方式上與傳統的單機數據庫一模一樣,不需要應用做特殊修改和專門的適配,做到了將困難交給數據庫處理,把方便留給應用。

OceanBase 在可用性上,遠遠超過傳統的架構,對於少數副本或者 ZONE 發生故障,寫事務達到超過半數副本成功時就能成功不影響業務,若主副本異常,則剩餘多數的從副本依據 Paxos 協議協商出新的主副本。吳東昕表示,“通過多地多活的模式,無論是發生一個機房的故障,還是多站點的故障,只要超過半數副本存活,就能夠確保零數據的丟失。即便整個機房宕機,光纖和網絡的中斷也可以在30秒實現 RPO=0。”

在這上面我們提供了非常豐富的多活的解決方案,包括如果只有一個機房,我們提供的是一個機房高可用,到兩地三中心傳統的部署架構,到異地多活,包括其他的客戶不能提供多個機房,我們同樣也提供同城雙機房的主備庫架構,提供各種各樣的容災和業務連續性保護。

OceanBase 有幾種典型的部署方式,例如在一個城市部署3個機房,OceanBase 能做到跨機房,在同城多個核心機房延遲一般在0.5 ~ 2ms之間完全透明的負載均衡和容災保護。而兩地三中心部署,正常情況下和同城三中心部署的延遲一致。兩地三中心五副本部署,能在單 ZONE 故障情況下不影響業務響應延遲。而 OceanBase 將三地五中心分佈式多活架構作為對“數據不丟失,業務不停機”的極致追求。“在今年增加了主備庫的方案,為客戶在相對低成本的方式下提供可用的容災解決方案。”吳東昕說。

演講最後,吳東昕總結道:“OceanBase 作為一個獨創的原生的分佈式數據庫,我們最大的希望是,讓大家享受分佈式數據庫好處的同時,在應用的開發和原來使用單機的數據庫一樣保持透明,不需要做大量的應用適配。我們利用創新性分區級別的多活,保證所有的資源不會有隻提供讀服務的模式,保證所有的硬件資源充分利用,在多站點多活我們提供完全透明的特性。”

總而言之,對原生分佈式數據庫未來的數據管理革命,吳東昕表示,OceanBase 基於分區的數據保護方式真正讓分佈式數據庫按需調整,讓在線擴容縮容成為現實。未來,OceanBase 也希望能夠與更多有願景、有能力的行業夥伴一起共建生態。

Leave a Reply

Your email address will not be published. Required fields are marked *