馮諾依曼架構的 IO 鴻溝,誰能來填補?
隨著AI技術、數據分析等領域興起,數據變得越來越重要了,數據處理往往需要用到大量的內存,數據量爆發式增長讓各種內存密集型應用層出不窮,如Redis數據庫、SAP HANA企業核心系統。在CSDN 2019、2020年度的開發者調查數據中,有四成的開發者在數據收集和消息處理中採用Redis,並且比例在逐年上升。 不過現階段的困境是,底層基礎設施的發展卻未能完全匹配數據爆炸的需求。 隨著5G和網絡性能的提升,計算存儲網絡三部分中的存儲短板問題變得更加突出,內存的容量密度及速度與處理器的核數增長之間的差距越來越大,內存成為了短板。為了讓機器得以處理更多的數據,部分企業只能擴大內存,而內存與CPU的配比有限,這又會造成CPU算力的浪費,昂貴的內存也會讓企業面臨更高的成本壓力。 長久以來,雖然分級存儲機制已經最大化平衡了各類存儲介質的性能與成本要求,但業界對於新存儲介質的探索一直未停歇。而在去年,阿里雲推出了持久內存實例(簡稱re6p),更像是向馮諾依曼計算機體系中的終極夢幻存儲方案邁進了一步。CSDN近日採訪了阿里雲ECS彈性計算產品團隊負責人王志坤與阿里雲持久內存型實例產品經理唐湘華,揭祕阿里雲對持久內存實例的設計理念與對存儲未來方向的理解。 馮諾依曼架構的難題:“內存牆” 過去近一個世紀,馮諾依曼架構構成了計算機科學的基礎。在馮諾伊曼架構中,中央處理器(CPU)通過指令從內存中讀取數據,並完成計算,再將數據返回內存保存。馮諾依曼理論模型的一個很重要的假設,就是計算與存儲的速度相當。但是一旦出現不匹配,慢的一方會成為瓶頸。 如今,雖然數據量在猛增,但底層技術未能均衡發展。內存的容量密度及速度與處理器的核數增長之間的差距越來越大,內存發展速度跟不上計算核數的增長,內存成為的短板,這就是“內存牆”。 為此,不少企業用提升內存的方式對應對該問題。阿里雲彈性計算為了滿足客戶需求也推出了大內存實例,比如阿里雲最近推出了6TB 大內存的實例。然而,如前所述,這又會造成CPU算力的浪費,昂貴的內存也會讓企業面臨更高的成本壓力。這並非長久之計,也難以規模化,需要從底層技術角度解決“內存牆”這個行業難題。 王志坤回憶,自己跟存儲頗有淵源,自己在讀博士的時候剛好就研究這一領域。“IO在整個計算機也好,服務器也好,一直是比較慢速的設備……馮諾依曼架構為什麼有一層緩存系統?就是為了解決我們計算、內存和存儲之間的性能鴻溝。”其實早在十幾年前,學術界就在致力於研究存儲領域的介質,來填補這個鴻溝。學術界和工業界都在尋找一種新型的存儲介質,能夠同時具備內存級別的性能,和硬盤對數據存儲的持久性。 可惜,不少嘗試都侷限在實驗室階段,缺乏大規模商業化的可能性。 打破“內存牆”困境 直到這幾年,阿里雲發現了成熟的、可商用的產品——英特爾傲騰持久內存。該產品重新定義了傳統的兩級存儲架構,性能和形態已經接近內存,而且同時也具備了存儲的持久特性。傲騰持久內存與內存的IO性能幾乎在相同數量級,但成本大大降低,幾乎是為打破內存困境而生。 不過,要發揮這款產品的真正威力,需要非常高的技術能力,僅有少數技術領先的大型企業可以運用得當。阿里巴巴就是其中一家。阿里雲啟動了研發,希望能將這種能力產品化,讓更多的企業低門檻地享受到技術紅利。 最終,阿里雲基於英特爾傲騰持久內存,賦予了其可為客戶提供直接IaaS級雲服務的能力,將內存非易失性這種顛覆性的存儲架構特性帶到了雲上。阿里雲持久內存實例產品經理唐湘華介紹,阿里雲研發推出的持久內存實例提高了單條內存的容量密度,擴大了單顆CPU對應的內存容量,提高了CPU的利用率。持久內存實例應用會幫助用戶打破“內存牆”藩籬,獲得更高性能的同時,有效降低整體IT基礎設施擁有成本(TCO)。 不過,任何IT新的技術從推出到企業級市場落地,企業用戶只會用腳投票,拷問新技術與新產品的性價比。所以持久內存在初始期,必定是用來解決IT存儲中的短板、最痛的那個問題。 關於持久內存實例的應用場景,阿里雲從Redis緩存型數據庫、SAP HANA這類典型的內存密集型應用入手,因為這些應用能夠最直接地體現介質升級所帶來的性能紅利。不過唐湘華表示,阿里雲團隊正在更深入分析持久內存實例,例如在消息隊列MQ的應用場景,可以大幅度地降低消息的長尾延時和業務抖動。除了作為內存的低成本替代品之外,傲騰持久內存也可以作為SSD來使用,在遊戲前端、直播前端這些高負載、高併發的IO密集型應用中,持久內存實例想象空間將更加巨大,這也會是阿里雲彈性計算的重點發力方向。 […]