北京2024年11月14日 /美通社/ -- 分布式算力被中國信通院列入"2024政企數(shù)智化轉(zhuǎn)型十大關(guān)鍵詞"。中國信通院指出,隨著新一代通信規(guī)模建設(shè)和邊緣計算應(yīng)用的持續(xù)部署,越來越多的應(yīng)用運(yùn)行和數(shù)據(jù)生產(chǎn)處理在邊端側(cè)開展,這對于傳統(tǒng)算力基礎(chǔ)設(shè)施的部署、調(diào)度提出了新要求,分布式算力通過不同范圍部署不同規(guī)模算力,為政企數(shù)智化轉(zhuǎn)型各場景隨需獲取算力提供新思路。
作為全球最大的通信基礎(chǔ)設(shè)施服務(wù)商,成立十年的中國鐵塔擁有擁有210萬站址資源、能源設(shè)施和近百萬處機(jī)房,升級22萬現(xiàn)有"通信塔"為"數(shù)字塔"……依托自有超大規(guī)模分布式算力資源,中國鐵塔在2024年啟動了分布式算力池建設(shè),打造超大規(guī)模分布式資源池,該項目是國內(nèi)通信行業(yè)首個集云計算、云原生、大數(shù)據(jù)、AI、邊緣計算等多元算力于一體,覆蓋范圍最廣、開放兼容性最好、一云多芯的自有資源分布式節(jié)點項目。
中國鐵塔信息技術(shù)研究院院長葉臻強(qiáng)調(diào),中國鐵塔分布式資源池項目取得的成績,說明整個行業(yè)都處于從集中大型云到邊端小型云的發(fā)展過程中。當(dāng)前,算力正從集中式向"云邊端"分布式范式轉(zhuǎn)變。隨著大型語言模型、工業(yè)大模型等智能化應(yīng)用熱度不斷高漲,邊緣算力作為產(chǎn)業(yè)智能化發(fā)展的數(shù)字化底座將迎來戰(zhàn)略機(jī)遇期。而中國鐵塔分布式資源池項目,實踐了超大規(guī)模分布式節(jié)點建設(shè),對推動邊緣算力發(fā)展和技術(shù)落地,有著重大技術(shù)價值和產(chǎn)業(yè)意義。
發(fā)展數(shù)字經(jīng)濟(jì),向邊緣算力要業(yè)務(wù)創(chuàng)新力
2014年7月,中國鐵塔成立,負(fù)責(zé)統(tǒng)籌建設(shè)通信鐵塔設(shè)施,提高基礎(chǔ)設(shè)施共建共享水平。2019年,中國鐵塔正式開啟了"一體兩翼"業(yè)務(wù)布局,即以面向通信行業(yè)的業(yè)務(wù)為"一體",以依托獨特資源優(yōu)勢面向社會的智聯(lián)業(yè)務(wù)和能源業(yè)務(wù)為"兩翼"。十年來,中國鐵塔在發(fā)展"兩翼"業(yè)務(wù)過程中推進(jìn)"一塔多用",將"通信塔"升級為"數(shù)字塔",即在鐵塔上掛載環(huán)境監(jiān)測儀、氣象監(jiān)測儀、基站CDN、傳感器等多種信息化設(shè)備,可以滿足行業(yè)企業(yè)視覺感知、數(shù)據(jù)采集、圖像分析、信息處理等數(shù)字化需求。此外,中國鐵塔還推進(jìn)從"通信機(jī)房"變"數(shù)據(jù)機(jī)房",布局邊緣算力網(wǎng)絡(luò)。
目前,中國鐵塔已經(jīng)形成了"前端視頻采集+邊緣AI計算+云端AI計算"的"端邊云"技術(shù)架構(gòu)體系,自主研發(fā)了分布式視頻監(jiān)測平臺、自主定制邊緣網(wǎng)關(guān)、自研AI算法等,實現(xiàn)多個領(lǐng)域的技術(shù)創(chuàng)新。在"端邊云"技術(shù)架構(gòu)和遍布全國的邊緣算力資源支持下,中國鐵塔已經(jīng)為40多個行業(yè)數(shù)字化轉(zhuǎn)型賦智賦能。
啟動分布式資源池建設(shè),深入推進(jìn)數(shù)字中國
隨著"一體兩翼"戰(zhàn)略的深入實施,中國鐵塔啟動了分布式資源池建設(shè)項目,目標(biāo)是將遍布數(shù)百萬平方公里的海量數(shù)字基礎(chǔ)設(shè)施組建成一張"數(shù)字天網(wǎng)",通過新一代信息通信技術(shù)賦能千行百業(yè)實現(xiàn)數(shù)字化轉(zhuǎn)型,服務(wù)"數(shù)字中國"戰(zhàn)略藍(lán)圖實現(xiàn)。
由于中國鐵塔兩百多萬座鐵塔分布在全國,從數(shù)據(jù)采集的壓力來看,集中資源池的模式面臨很大挑戰(zhàn)。中國鐵塔從2020年開始嘗試?yán)梅植荚谌珖淖杂行⌒蜋C(jī)房,建設(shè)分布式節(jié)點,并且與浪潮云海合作,將云平臺的分布建設(shè)、邏輯集中的管理模式,應(yīng)用到實際數(shù)字化底座的建設(shè)中。
實際上,隨著數(shù)字塔業(yè)務(wù)的發(fā)展,中國鐵塔每數(shù)據(jù)中心每日新增數(shù)據(jù)量數(shù)十T,預(yù)計2025年每數(shù)據(jù)中心接入約二十萬站,未來數(shù)據(jù)規(guī)模將達(dá)數(shù)十PB級別,且存在大量的視頻、圖像等非結(jié)構(gòu)化數(shù)據(jù)。此外,中國鐵塔的設(shè)備數(shù)量極多,所有設(shè)施都需要接入平臺中實現(xiàn)統(tǒng)一納管。由于基礎(chǔ)設(shè)施分布地域跨度極大,同時要求在算力下沉的同時,實現(xiàn)多數(shù)據(jù)中心的統(tǒng)一運(yùn)維管理和"云邊端"協(xié)同。
葉臻院長強(qiáng)調(diào),中國鐵塔啟動自有資源分布式算力池建設(shè)主要基于三個方面的考慮。
第一是基于業(yè)務(wù)特點考慮,基礎(chǔ)設(shè)施資源分散在全國各地,而且也面臨地方數(shù)據(jù)不出省的需求,因此既要解決客戶需求又要實現(xiàn)統(tǒng)一管理。而分布式算力的業(yè)務(wù)邏輯和管理邏輯的相對分離,恰好滿足這兩個需求,可以將用戶側(cè)的管理結(jié)果留在省內(nèi),資源側(cè)的管理則集中到總部,實現(xiàn)IT建設(shè)隨業(yè)務(wù)發(fā)展而行。
第二,從經(jīng)濟(jì)性考慮。由于中國鐵塔在各地的都是小型機(jī)房,大多數(shù)位于中國鐵塔屬地分公司購置的綜合樓內(nèi),不需要專門征用大型土地以及增加管理難度。而將綜合樓用于機(jī)房建設(shè),也節(jié)約了成本,從經(jīng)濟(jì)性角度來看,加強(qiáng)了對自身資產(chǎn)的有效使用。
第三,從業(yè)務(wù)前瞻性考慮。在發(fā)展數(shù)字經(jīng)濟(jì)當(dāng)中,中國鐵塔依托豐富的分布式資源,可能成為數(shù)據(jù)采集方面最有優(yōu)勢的企業(yè),將來在數(shù)據(jù)的采集、存儲和通過邊緣網(wǎng)絡(luò)傳送到其他數(shù)字資源進(jìn)行處理時,分布式中間節(jié)點將對企業(yè)未來的發(fā)展帶來很大便利。
中國鐵塔分布式資源池建成后,將帶來顯著的經(jīng)濟(jì)和社會價值。中國鐵塔基站分布在全國各地,對基站的數(shù)據(jù)源采集后可用于社會治理的方方面面,例如可以采集道路、農(nóng)田等各行各業(yè)的數(shù)據(jù),用于耕地保護(hù)、治安、森林防火、河流監(jiān)控、大氣污染防控、地震強(qiáng)度預(yù)警預(yù)報等,對數(shù)字經(jīng)濟(jì)的發(fā)展提供強(qiáng)有力支撐。目前鐵塔的智聯(lián)業(yè)務(wù)按行業(yè)開展,一旦實現(xiàn)數(shù)據(jù)共享,產(chǎn)生的經(jīng)濟(jì)和社會價值就可能翻倍。
戰(zhàn)略再升級,分布式節(jié)點支撐邊緣算力大發(fā)展
作為目前國內(nèi)超大規(guī)模的分布式資源池,中國鐵塔分布式資源池項目的建設(shè)難點在于地域跨度極大、設(shè)備數(shù)量極多、數(shù)據(jù)類型復(fù)雜,需要解決單數(shù)據(jù)中心跨類別多元異構(gòu)資源統(tǒng)一管理、多數(shù)據(jù)中心高效調(diào)度運(yùn)維以及可持續(xù)建設(shè)等嚴(yán)峻挑戰(zhàn)。這一項目由浪潮云海負(fù)責(zé)實施,浪潮云海以可演進(jìn)的私有云理念,打造面向未來的"云數(shù)智、云網(wǎng)安一體化"云底座,確保中國鐵塔技術(shù)架構(gòu)的升級迭代以及全國數(shù)據(jù)中心的持續(xù)建設(shè)。
中國鐵塔分布式算力池建設(shè)項目的目標(biāo)為實現(xiàn)"全國一朵云、兩級多中心",在各省建立滿足虛擬化、云原生、AI識別等場景智算中心,實現(xiàn)算力的就近調(diào)度、就近服務(wù)。配合中國鐵塔"十四五"規(guī)劃,中國鐵塔分布式算力池項目啟動了首期山東、遼寧、湖南等6個省的骨干節(jié)點建設(shè),后續(xù)將推進(jìn)到更多省份。
浪潮云海基于中國鐵塔的項目建設(shè)需求,明確了軟硬解耦、存算分離、IaaS異構(gòu)兼容、PaaS生態(tài)融合等建設(shè)原則。InCloud OS通過分層解耦、開放標(biāo)準(zhǔn)和一云多芯的創(chuàng)新架構(gòu)設(shè)計,實現(xiàn)以云為核心的數(shù)字化基礎(chǔ)設(shè)施的模塊化、組件化封裝,幫助客戶構(gòu)建持續(xù)演進(jìn)的下一代私有云數(shù)據(jù)中心,為企業(yè)業(yè)務(wù)創(chuàng)新提供多元融合和高效便捷的私有云平臺,云海OS的最新特色包括精細(xì)化基礎(chǔ)設(shè)施管理、云原生PaaS、智算融合、一云多芯等。
浪潮云海方案為中國鐵塔提供了四大方案價值:
第一,提升信息化服務(wù)水平、提升資源方法效率、實現(xiàn)數(shù)智化運(yùn)維,通過分布式數(shù)據(jù)中心,信息化支撐響應(yīng)效率由數(shù)天縮短至2小時,資源管理效率大幅提升,采用"末端視頻采集+云端AI計算+邊緣AI計算"等手段,基本實現(xiàn)了自動巡檢、自主派單、智能資管等功能,做到了遠(yuǎn)程管理、不上站管理,支撐了遍布全國的鐵塔站址的智能化、數(shù)字化運(yùn)維。
第二,降本增效、經(jīng)濟(jì)效益增加,自有資源分布式節(jié)點數(shù)據(jù)中心的持續(xù)建設(shè)助力節(jié)約信息化投入。
第三,多元融合、推動數(shù)據(jù)中心持續(xù)演進(jìn)、支撐鐵塔未來戰(zhàn)略,浪潮云海云平臺的可演進(jìn)理念,未來將伴隨中國鐵塔圍繞新基建、空間數(shù)智化治理、人工智能、邊緣算力網(wǎng)絡(luò)、低空經(jīng)濟(jì)等多個方面,加速推進(jìn)戰(zhàn)略性新興產(chǎn)業(yè)和未來產(chǎn)業(yè)發(fā)展,加快形成新質(zhì)生產(chǎn)力。
第四,助力數(shù)字中國建設(shè)、提升社會安全性,建設(shè)云網(wǎng)融合、智能敏捷、綠色低碳、安全可靠的智能化綜合性數(shù)字信息基礎(chǔ)設(shè)施,有力支撐網(wǎng)絡(luò)強(qiáng)國。
超大規(guī)模分布式云,打造邊緣算力新樣板
浪潮云海首席科學(xué)家張東介紹,從分布式算力的角度來看,中國鐵塔分布式算力資源在中國甚至在全球都算超大規(guī)模,這為實踐超大規(guī)模分布式節(jié)點、發(fā)展邊緣算力和邊緣計算技術(shù),提供了難得的機(jī)會。
中國鐵塔分布式算力池浪潮云海方案的整體技術(shù)特色包括:以IaaS、PaaS分層解耦的原則建設(shè)云平臺,融合云上安全生態(tài),面向未來構(gòu)建云數(shù)智、云網(wǎng)安一體化的數(shù)字化底座;邊緣計算能力增強(qiáng),進(jìn)一步完善多協(xié)議端設(shè)備的生命周期管理功能,增強(qiáng)異構(gòu)邊緣資源的統(tǒng)一管理及多地域邊緣應(yīng)用按需編排能力;構(gòu)建面向分布式、大規(guī)模場景的智能化運(yùn)維能力,實現(xiàn)巡檢工具化、管理自動化、運(yùn)維智能化,提升數(shù)據(jù)中心自治能力;在存儲先進(jìn)性方面,按照中國鐵塔業(yè)務(wù)需求實現(xiàn)塊存儲、文件存儲、對象存儲分級建設(shè),面向高速IO場景構(gòu)建全閃資源池,滿足及時響應(yīng)需求,面向海量存儲場景構(gòu)建混閃資源池。采用領(lǐng)先的RDMA技術(shù)提升分布式存儲性能,實現(xiàn)NVMe-OF、ISCSI、FC等多協(xié)議類型全兼容。
由于中國鐵塔算力資源的超大規(guī)模特性,浪潮云海在提供方案時,雙方也進(jìn)行了聯(lián)合技術(shù)攻關(guān)。浪潮云海云計算方案總監(jiān)劉健介紹,中國鐵塔自有分布式資源具有環(huán)境復(fù)雜、跨度大、規(guī)模大等特點,對于解決方案提出了特殊的挑戰(zhàn)。雙方在項目推進(jìn)過程中組成了聯(lián)合項目組,共同解決技術(shù)挑戰(zhàn)、落實技術(shù)方案。
中國鐵塔信息技術(shù)研究院維護(hù)室經(jīng)理王焱介紹,中國鐵塔分布式算力資源池首期項目推進(jìn)過程遇到了很多挑戰(zhàn):首先是異構(gòu),不同節(jié)點具有不同廠商、不同類型的設(shè)備,需要考慮異構(gòu)設(shè)備的兼容性;其次是可靠性問題,特別是系統(tǒng)連續(xù)性的要求,對自建分布式資源平臺提出了較大挑戰(zhàn),最終雙方合作解決了挑戰(zhàn),包括在架構(gòu)設(shè)計初期對容錯方面進(jìn)行了較大的投入;第三是網(wǎng)絡(luò)可靠性,因為分布式算力節(jié)點分布在不同的地理位置上,網(wǎng)絡(luò)比較復(fù)雜,還有I/O性能的挑戰(zhàn),浪潮云海通過專題優(yōu)化,結(jié)合硬件的I/O能力和網(wǎng)絡(luò)SDN的能力,最終解決了大規(guī)模并發(fā)場景的問題;最后是網(wǎng)絡(luò)安全,因為云平臺上承載的是企業(yè)敏感數(shù)據(jù),如何保證不被未授權(quán)的人訪問、抵御外部攻擊和內(nèi)部泄露,中國鐵塔與包括浪潮云海在內(nèi)的業(yè)界網(wǎng)絡(luò)安全企業(yè)合作。
葉臻院長介紹,與浪潮云海雙方合作的分布式資源池建設(shè)項目,既提高了工作效率,也加強(qiáng)了資源管理能力。同時,浪潮云海在網(wǎng)絡(luò)安全支撐方面也給予了全面支持。
【展望未來】中國鐵塔分布式資源池將成為中國乃至全球超大規(guī)模分布式節(jié)點和邊緣算力的樣板工程,為探索和發(fā)展分布式云、邊緣算力與邊緣計算和分布式AI等提供了廣闊的空間和機(jī)會。中國鐵塔分布式資源池在推動通信業(yè)數(shù)字化轉(zhuǎn)型的同時,也將為深入推進(jìn)數(shù)實融合、發(fā)展數(shù)字經(jīng)濟(jì)、提速數(shù)字中國,提供源源不斷的動力和動能。正如葉臻院長強(qiáng)調(diào),中國鐵塔和浪潮云海雙方強(qiáng)強(qiáng)聯(lián)合,不僅有過去的成果,還有更加輝煌的未來!