服務(wù)熱線:
13342898875
“最好的網(wǎng)絡(luò)就像神一樣,無處不在,又感知不到她的存在 …… 大繁至簡,這是我們努力的方向。” – 阿里云網(wǎng)絡(luò)高級技術(shù)專家 孫成浩
2018杭州·云棲大會的主會場上,阿里云產(chǎn)品總監(jiān)何云飛介紹了阿里云自主研發(fā)的云操作系統(tǒng)飛天的全面升級版飛天2.0。作為飛天2.0核心組成部分之一,洛神首次向外界揭開了她神秘的面紗。在隨后的未來網(wǎng)絡(luò)技術(shù)專場上,阿里云網(wǎng)絡(luò)高級技術(shù)專家孫成浩對飛天洛神進(jìn)行了更為詳細(xì)的闡述。本文是首次對飛天洛神的概念、演進(jìn)、架構(gòu)、特點(diǎn)等方面進(jìn)行系統(tǒng)化的解讀,下面隨圖騰機(jī)柜的小編一起來看詳細(xì)內(nèi)容。
什么是飛天洛神
從物理網(wǎng)絡(luò)到用戶感知到的網(wǎng)絡(luò)之間存在一個(gè)虛擬網(wǎng)絡(luò)層。在阿里云,我們給這套虛擬網(wǎng)絡(luò)系統(tǒng)起了個(gè)名字,叫做洛神。洛神是阿里云飛天中負(fù)責(zé)虛擬網(wǎng)絡(luò)的系統(tǒng),她為阿里云客戶提供了豐富的網(wǎng)絡(luò)產(chǎn)品,如VPC、SLB等。同時(shí),她也是ECS,RDS,OSS,NAS等100多個(gè)云產(chǎn)品的網(wǎng)絡(luò)基礎(chǔ)設(shè)施。她還支撐了阿里巴巴集團(tuán)和螞蟻金服集團(tuán)眾多業(yè)務(wù),如電商、支付、物流等。在全球范圍內(nèi),洛神服務(wù)著百行百業(yè)超過百萬的用戶。在雙十一、世界杯、春運(yùn)等互聯(lián)網(wǎng)流量的尖峰時(shí)刻,為每一個(gè)消費(fèi)者的流暢網(wǎng)絡(luò)體驗(yàn)而默默保駕護(hù)航。
很多人都知道阿里云有一個(gè)飛天(Apsara)系統(tǒng),系統(tǒng)中各組件是用各種神的名字命名的,包括盤古,伏羲,女媧,神農(nóng)等,其中盤古是分布式文件系統(tǒng),伏羲是分布式調(diào)度系統(tǒng)。為什么叫虛擬網(wǎng)絡(luò)系統(tǒng)叫洛神呢?在古代,河運(yùn)是非常重要的交通手段,就好比今天的網(wǎng)絡(luò)一樣。因此,在給虛擬網(wǎng)絡(luò)系統(tǒng)起名的時(shí)候,我們就起了一個(gè)河神的名字,叫洛神。
飛天洛神的架構(gòu)
洛神是阿里云的分布式操作系統(tǒng)飛天的一部分。在飛天的基礎(chǔ)架構(gòu)里面,最上層是各種云產(chǎn)品,包括大家熟悉的云產(chǎn)品RDS,ECS,VPC,SLB等等,支撐這些是飛天的3個(gè)基礎(chǔ)組件,包括存儲系統(tǒng)盤古,資源管理伏羲和網(wǎng)絡(luò)管理洛神。也就是說,洛神除了支撐了阿里云的網(wǎng)絡(luò)云產(chǎn)品之外,另外一個(gè)重要的角色就是支撐了其他云產(chǎn)品的網(wǎng)絡(luò)基礎(chǔ)設(shè)施。
講到洛神的技術(shù)架構(gòu),洛神系統(tǒng)由3大模塊組成 – 數(shù)據(jù)平面,控制平面和管理平面。
數(shù)據(jù)平面負(fù)責(zé)云網(wǎng)絡(luò)中數(shù)據(jù)包的處理,它就如同物理世界中的網(wǎng)線和路由交換設(shè)備,把數(shù)據(jù)包高效率低延遲的從發(fā)送端送到目的地。類似的,洛神數(shù)據(jù)平面也包含各種不同角色的組件,包括支持各種不同類型計(jì)算形態(tài)的虛擬交換機(jī),用于數(shù)據(jù)中心互連的DCN網(wǎng)關(guān),用于云網(wǎng)絡(luò)連接公網(wǎng)的internet網(wǎng)關(guān),用于云上云下互連的混合云網(wǎng)關(guān),提供負(fù)載均衡能力的負(fù)載均衡網(wǎng)關(guān)和提供端接入能力的智能接入網(wǎng)關(guān)。為了提高這些組件的轉(zhuǎn)發(fā)性能,洛神不僅使用了軟轉(zhuǎn)發(fā)的技術(shù),而且也對軟硬件結(jié)合甚至純硬件的技術(shù)進(jìn)行了廣泛應(yīng)用。
控制平面則控制如何處理數(shù)據(jù)包,他是洛神的業(yè)務(wù)大腦。從技術(shù)上看,洛神的控制平面是一個(gè)層次性的分布式控制系統(tǒng),最底層的設(shè)備控制器主要負(fù)責(zé)控制和管理數(shù)據(jù)平面的各種組件,同時(shí)在每個(gè)區(qū)域存在一個(gè)虛擬網(wǎng)絡(luò)控制器,在全局存在一個(gè)全球路由控制器。區(qū)域的虛擬網(wǎng)絡(luò)控制器則負(fù)責(zé)本區(qū)域的云網(wǎng)絡(luò)的管理與調(diào)度, 全局路由控制器則負(fù)責(zé)協(xié)調(diào)調(diào)度各個(gè)區(qū)域的資源形成一張全球的云網(wǎng)絡(luò)。基于虛擬網(wǎng)絡(luò)控制器和全局路由控制器之上的則是NFV控制器,完成虛擬網(wǎng)絡(luò)高級功能例如VPN等產(chǎn)品的編排和抽象。
洛神的管理平面是網(wǎng)絡(luò)運(yùn)維和運(yùn)營的中樞,它管理著海量的網(wǎng)元以及用戶,這里的海量指的是千萬級虛擬機(jī)和百萬級網(wǎng)元。為了能做到這一點(diǎn),洛神的管理平臺是基于大數(shù)據(jù)以及機(jī)器學(xué)習(xí)技術(shù)實(shí)現(xiàn)的,它對網(wǎng)絡(luò)運(yùn)行當(dāng)中產(chǎn)生的海量數(shù)據(jù)進(jìn)行實(shí)時(shí)/離線計(jì)算,數(shù)據(jù)建模,來驅(qū)動網(wǎng)絡(luò)資源的提前規(guī)劃,網(wǎng)絡(luò)系統(tǒng)的日常維護(hù)以及網(wǎng)絡(luò)產(chǎn)品的智能運(yùn)營。整個(gè)管理平面包括了一套高性能,分布式的數(shù)據(jù)分析系統(tǒng),由它分析出來的數(shù)據(jù)提供給智能運(yùn)維和智能運(yùn)營系統(tǒng),完成資源規(guī)劃,網(wǎng)絡(luò)建設(shè),系統(tǒng)變更,實(shí)時(shí)監(jiān)控,故障逃逸,產(chǎn)品運(yùn)營等整個(gè)網(wǎng)絡(luò)產(chǎn)品生命周期的工作。最終達(dá)到排無人值守的網(wǎng)絡(luò)變更,先于用戶的問題發(fā)現(xiàn),高效簡單的故障逃逸以及豐富全面的產(chǎn)品及用戶運(yùn)營的效果。
飛天洛神的技術(shù)演進(jìn)之路
洛神能夠成為飛天的四大支柱之一,不是一天煉成的。洛神的演進(jìn)經(jīng)歷了四個(gè)階段。
首先是經(jīng)典網(wǎng)絡(luò)階段,在這個(gè)階段,網(wǎng)絡(luò)只有一個(gè)概念,就是公網(wǎng)帶寬。經(jīng)典網(wǎng)絡(luò)階段的問題是用戶無法自定義網(wǎng)絡(luò)拓?fù)洌@樣使得用戶無法完成云上云下的混合云聯(lián)通。為了解決這個(gè)問題,阿里云洛神進(jìn)入了VPC階段,VPC階段里,洛神在每個(gè)地域虛擬了數(shù)百萬張網(wǎng)絡(luò),并且用戶可以完全自定義這張網(wǎng)絡(luò)。隨著網(wǎng)絡(luò)規(guī)模越來越大,洛神也從區(qū)域網(wǎng)絡(luò)進(jìn)入到全球網(wǎng)絡(luò)的階段,在這個(gè)階段,洛神主要解決如何更好的管理超大規(guī)模網(wǎng)絡(luò)的問題,云企業(yè)網(wǎng)和云連接網(wǎng)構(gòu)成了第三代洛神的兩個(gè)主要特性。
滿足了主要的客戶的需求之后,我們開始思考如何進(jìn)一步提升用戶體驗(yàn)。用戶對網(wǎng)絡(luò)的核心訴求是什么?其實(shí),客戶的最大訴求是網(wǎng)絡(luò)足夠強(qiáng)健可靠,不要發(fā)生問題。就像使用水和電一樣,用戶是不需要了解發(fā)電站和泵站在哪里的。因此,洛神希望網(wǎng)絡(luò)對用戶是無感知的,又是無處不在的。洛神的發(fā)展,是一個(gè)從0到1,到100,再回到0的演進(jìn)過程,大繁至簡,這是我們在研發(fā)下一代洛神中努力的方向,這也是我們首先在業(yè)界提出Networkless理念背后的思考。
飛天洛神的特點(diǎn)
洛神的關(guān)鍵特點(diǎn),包含安全,彈性和可靠,這3個(gè)特性也是洛神達(dá)到最終Networkless狀態(tài)的關(guān)鍵特征。
安全是基本盤,因?yàn)閛verlay技術(shù)把網(wǎng)絡(luò)邏輯的隔離掉,用戶的網(wǎng)絡(luò)之前完全不會互通。并且洛神中還包含了各種加密服務(wù)可以給到用戶,打造更深層次的的安全。彈性有兩個(gè)數(shù)字,一個(gè)是秒級的轉(zhuǎn)發(fā)性能的彈性,洛神支持從1MB到1TB在一秒內(nèi)完成彈性,另一個(gè)是規(guī)模的彈性,洛神的單網(wǎng)絡(luò)支持10w臺計(jì)算節(jié)點(diǎn)的規(guī)模。這樣,洛神既可以支持小到虛擬web主機(jī)這樣的服務(wù),也可以支持打到雙11零點(diǎn)這樣的海量峰值流量。談到可靠性,我們參考年平均故障時(shí)間這個(gè)參數(shù),洛神引發(fā)的單實(shí)例故障時(shí)間只有50ms,這個(gè)故障時(shí)間是極其短的。
13342898875