亚洲欧美成人中文字幕在线_徐直軍：以開(kāi)創(chuàng )的超節點(diǎn)互聯(lián)技術(shù)，引領(lǐng)AI基礎設施新范式

2025年9月18日，華為全聯(lián)接大會(huì )在上海召開(kāi)，華為徐直軍發(fā)表主題演講，圍繞 AI 基礎設施發(fā)展，從行業(yè)沖擊應對、技術(shù)規劃、產(chǎn)品發(fā)布等多方面展開(kāi)，系統闡述華為以超節點(diǎn)互聯(lián)技術(shù)引領(lǐng) AI 基礎設施新范式的戰略與實(shí)踐。

以下為徐直軍演講實(shí)錄——

女士們、先生們，各位老朋友、新朋友，大家上午好！歡迎來(lái)參加2025年華為全聯(lián)接大會(huì )，時(shí)隔一年，很高興再次與大家相聚在上海。我想大家都能感受到，過(guò)去的一年對所有AI從業(yè)者、關(guān)注者來(lái)講是記憶深刻的一年，DeepSeek橫空出世，讓全國人民過(guò)了一個(gè)快樂(lè )的AI年，也讓所有大模型訓練者開(kāi)啟了不知多少個(gè)不眠之夜，調整訓練方式，復現DeepSeek結果，當然也給我們帶來(lái)了巨大沖擊。從春節開(kāi)始，到今年4月30日，經(jīng)過(guò)多團隊的協(xié)同作戰，終于使Ascend 910B/910C的推理能力達成了客戶(hù)的基本需求。

在進(jìn)入今天的具體分享之前，請允許我回顧一下去年的HC，我講到了如下幾點(diǎn)：

第一、智能化的可持續，首先是算力的可持續；

第二、中國半導體制造工藝將在相當長(cháng)時(shí)間處于落后狀態(tài)；

第三、可持續的算力只能基于實(shí)際可獲得的芯片制造工藝；

第四、人工智能成為主導性算力需求，促使計算系統正在發(fā)生結構性變化；

第五、開(kāi)創(chuàng )計算架構，打造“超節點(diǎn)+集群”算力解決方案持續滿(mǎn)足算力需求。

但第五點(diǎn)沒(méi)有展開(kāi)講，本來(lái)想講，但我的團隊不同意。今天，我想利用此機會(huì )，來(lái)把我去年HC沒(méi)有完成的任務(wù)完成，也算是答卷。我今天分享的主題是：“以開(kāi)創(chuàng )的超節點(diǎn)互聯(lián)技術(shù)，引領(lǐng)AI基礎設施新范式”，也是回答去年HC提到的第五點(diǎn)：如何開(kāi)創(chuàng )計算架構，打造 “超節點(diǎn)+集群”算力解決方案來(lái)持續滿(mǎn)足算力需求。

在展開(kāi)今天主題前，回到DeepSeek對產(chǎn)業(yè)界、對華為的沖擊，DeepSeek開(kāi)源后，我們的客戶(hù)對華為的昇騰發(fā)展指出了很多問(wèn)題，也充滿(mǎn)了期待，并一直在給我們不斷地提建議。為此，經(jīng)過(guò)內部的充分討論并達成共識，我們于2025年8月5日在北京專(zhuān)門(mén)舉辦了昇騰產(chǎn)業(yè)峰會(huì )，我代表華為給出了回應，在座的有的參加了，有的可能沒(méi)有參加。今天，我也利用此機會(huì )就主要的決定給大家匯報一下。主要有四點(diǎn)：

一、華為堅持昇騰硬件變現；

二、CANN 編譯器和虛擬指令集接口開(kāi)放，其它軟件全開(kāi)源，CANN基于A(yíng)scend 910B/C的開(kāi)源開(kāi)放將于2025年12月31日前完成，未來(lái)開(kāi)源開(kāi)放與產(chǎn)品上市同步；

三、Mind系列應用使能套件及工具鏈全面開(kāi)源，并于2025年12月31日前完成；

四、openPangu基礎大模型全面開(kāi)源。

接下來(lái)回到今天的主題。盡管DeepSeek開(kāi)創(chuàng )的模式可以大幅減少算力需求，但要走向AGI、要走向物理AI，我們認為，算力，過(guò)去是，未來(lái)也將繼續是人工智能的關(guān)鍵，更是中國人工智能的關(guān)鍵。

算力的基礎是芯片，昇騰芯片是華為AI算力戰略的基礎。自2018年發(fā)布Ascend 310芯片，2019年發(fā)布Ascend 910芯片，到2025年，Ascend 910C芯片隨著(zhù)Atlas 900超節點(diǎn)規模部署，為大家所熟悉。在過(guò)去幾年，客戶(hù)和伙伴們對昇騰芯片有很多訴求，對昇騰芯片也有很多期待。面向未來(lái)，華為的芯片路標是如何規劃的？想必是大家普遍關(guān)心的話(huà)題，可能也是最關(guān)心的內容。

因此，今天，我就直入主題來(lái)介紹昇騰芯片及其路標。我很確定地告訴大家，昇騰芯片將持續演進(jìn)，為中國乃至世界的AI算力構筑堅固根基。

未來(lái)3年，至2028年，我們在開(kāi)發(fā)和規劃了三個(gè)系列，分別是Ascend 950系列，包括兩顆芯片：Ascend 950PR和Ascend 950DT，以及Ascend 960、Ascend 970系列，更多具體芯片還在規劃中。下面我分別介紹快要推出的和已規劃的4顆昇騰芯片。

我們正在開(kāi)發(fā)、且即將推出的芯片叫Ascend 950系列。我首先介紹一下Ascend 950系列的芯片架構，Ascend 950 PR和Ascend 950 DT共用了Ascend 950 Die。與前一代昇騰芯片相比，Ascend 950 在以下幾個(gè)方面實(shí)現了根本性提升。

第一，新增支持業(yè)界標準FP8/MXFP8/MXFP4等低數值精度數據格式，算力分別達到1P和2P，提升訓練效率和推理吞吐。并特別支持華為自研的HiF8，在保持FP8的高效的同時(shí)，精度非常接近FP16。

第二，大幅度提升了向量算力。這主要通過(guò)三個(gè)方面實(shí)現：其一，提升向量算力占比；其二，采用創(chuàng )新的新同構設計，即支持 SIMD/SIMT 雙編程模型，SIMD能夠像流水線(xiàn)一樣處理“大塊”向量，而SIMT便于靈活處理“碎片化”數據；其三，把內存訪(fǎng)問(wèn)顆粒度從512字節減少到128字節，內存訪(fǎng)問(wèn)更精細，從而更好地支持了離散且不連續的內存訪(fǎng)問(wèn)。

第三，互聯(lián)帶寬相比Ascend 910C提升了2.5倍，達到2TB/s。

第四，結合推理不同階段對于算力、內存、訪(fǎng)存帶寬及推薦、訓練的需求不同，我們自研了兩種HBM，分別是：HiBL 1.0和HiZQ 2.0。不同的自研HBM與Ascend 950 Die合封，分別構成芯片Ascend 950PR：面向Prefill和推薦場(chǎng)景，以及Ascend 950DT：面向Decode和訓練場(chǎng)景。下面分別介紹。

首先是我們的第一顆芯片，Ascend 950PR，主要面向推理Prefill階段和推薦業(yè)務(wù)場(chǎng)景。首先，我們發(fā)現，隨著(zhù)Agent的快速發(fā)展，輸入上下文越來(lái)越長(cháng)，首Token輸出階段占用計算資源越來(lái)越多。其次是在電子商務(wù)、內容平臺、社交媒體等業(yè)務(wù)應用中，要求推薦算法具有更高的準確度和更低的時(shí)延，對計算能力的需求也越來(lái)越大。推理Prefill階段和推薦算法都是計算密集型，對計算并行的能力要求高，但對內存訪(fǎng)問(wèn)帶寬的需求相對低。通過(guò)分級內存解決方案，推理Prefill階段和推薦算法對本地內存容量的需求相對也不高。Ascend?950PR 采用了華為自研的低成本HBM，HiBL 1.0，相比高性能、高價(jià)格的HBM3e/4e，能夠大大降低推理Prefill階段和推薦業(yè)務(wù)的投資。

這顆芯片將在2026年一季度推出，首先支持的產(chǎn)品形態(tài)是標卡和超節點(diǎn)服務(wù)器。

接下來(lái)這一顆是Ascend 950DT，相比Ascend 950PR，它更注重推理Decode階段和訓練場(chǎng)景。由于推理Decode階段和訓練對互聯(lián)帶寬和訪(fǎng)存帶寬要求高，我們開(kāi)發(fā)了HiZQ 2.0，使內存容量達到144GB，內存訪(fǎng)問(wèn)帶寬達到4TB/s。同時(shí)把互聯(lián)帶寬提升到了2TB/s。其次，支持了FP8/MXFP8/MXFP4/HiF8數據格式。

Ascend 950DT 將在2026年Q4推出。

第三顆是在規劃中的芯片Ascend 960。它在算力、內存訪(fǎng)問(wèn)帶寬、內存容量、互聯(lián)端口數等各種規格上相比Ascend 950翻倍，大幅度提升訓練、推理等場(chǎng)景的性能；同時(shí)還支持華為自研的HiF4數據格式。它是目前業(yè)界最優(yōu)的4bit精度實(shí)現，能進(jìn)一步提升推理吞吐，并且比業(yè)界FP4方案的推理精度更優(yōu)。

Ascend 960將在2027年四季度推出。

最后一顆是在規劃中的Ascend 970，這顆芯片的一些規格還在討論中?？傮w方向是，在各項指標上大幅度升級，全面升級訓練和推理性能。目前的初步考慮是，相比Ascend 960，Ascend 970的FP4算力、FP8算力、互聯(lián)帶寬要全面翻倍，內存訪(fǎng)問(wèn)帶寬至少增加1.5倍。Ascend 970計劃在2028年四季度推出。大家屆時(shí)可以期待它的驚人表現。

這是剛才介紹的昇騰芯片的主要具體規格和路標，總體上，我們將以幾乎一年一代算力翻倍的速度，同時(shí)圍繞更易用，更多數據格式、更高帶寬等方向持續演進(jìn)，持續滿(mǎn)足AI算力不斷增長(cháng)的需求?？梢钥吹?，相比Ascend 910B/910C，從Ascend 950開(kāi)始的主要變化包括：

引入SIMD/SIMT新同構，提升編程易用性；

支持更加豐富的數據格式，包括FP32 /HF32 /FP16/BF16/FP8/MXFP8/HiF8/MXFP4/HiF4等；

支持更大的互聯(lián)帶寬，其中950系列為2TB/s，970系列提升到4TB/s；

支持更大的算力，FP8算力從950系列的1 PFLOPS提升到960的2 PFLOPS、970的4 PFLOPS；FP4算力從950的2 PFLOPS提升到960的4 PFLOPS、970的8 PFLOPS；

內存容量逐漸加倍，而內存訪(fǎng)問(wèn)帶寬將翻兩番。

有了昇騰芯片為基礎，我們就能夠打造滿(mǎn)足客戶(hù)需求的算力解決方案。從大型AI算力基礎設施建設的技術(shù)方向看，超節點(diǎn)已經(jīng)成為主導性產(chǎn)品形態(tài)，并正在成為AI基礎設施建設的新常態(tài)。超節點(diǎn)事實(shí)上就是一臺能學(xué)習、思考、推理的計算機，物理上由多臺機器組成，但邏輯上以一臺機器學(xué)習、思考、推理。隨著(zhù)算力需求的持續增長(cháng)，超節點(diǎn)的規模也在持續、快速增大。

今年3月份，華為正式推出了Atlas 900超節點(diǎn)，滿(mǎn)配支持384卡。因為是超節點(diǎn)，這384顆Ascend 910C芯片，能夠像一臺計算機一樣工作，最大算力可達300 PFLOPS。到目前為止，Atlas 900依然是全球算力最大的超節點(diǎn)。大家經(jīng)常聽(tīng)到的CloudMatrix384超節點(diǎn)，是華為云基于A(yíng)tlas 900超節點(diǎn)構建的云服務(wù)實(shí)例。Atlas 900超節點(diǎn)自上市以來(lái)，已經(jīng)累計部署超過(guò)300套，服務(wù)20多個(gè)客戶(hù)，涵蓋互聯(lián)網(wǎng)、電信、制造等多個(gè)行業(yè)?？梢哉f(shuō)，Atlas 900于2025年，開(kāi)啟了華為AI超節點(diǎn)的征程。

今天，結合我們已經(jīng)推出或正在研發(fā)中的昇騰芯片，我將為大家帶來(lái)更多超節點(diǎn)和集群產(chǎn)品?，F在進(jìn)入今天最激動(dòng)人心的時(shí)刻，就是新產(chǎn)品發(fā)布環(huán)節。

今天我要發(fā)布的第一款產(chǎn)品，Atlas 950超節點(diǎn)，基于A(yíng)scend 950DT打造。

Atlas 950超節點(diǎn)支持8192張基于A(yíng)scend 950DT的昇騰卡，是Atlas 900超節點(diǎn)的20多倍，我們習慣稱(chēng)呼的昇騰卡，每張卡對應一顆Ascend 950DT芯片，8192張昇騰卡等同于8192顆Ascend 950DT芯片。

Atlas 950超節點(diǎn)滿(mǎn)配包括由128個(gè)計算柜、32個(gè)互聯(lián)柜，共計160個(gè)機柜組成，占地面積1000平方米左右，柜間采用全光互聯(lián)?？偹懔Υ蠓忍嵘?，其中，FP8算力達到8E FLOPS，FP4算力達到16E FLOPS?；ヂ?lián)帶寬達到16PB/s，這個(gè)數字意味著(zhù)，Atlas 950一個(gè)產(chǎn)品的總互聯(lián)帶寬，已經(jīng)超過(guò)今天全球互聯(lián)網(wǎng)峰值帶寬的10倍有余。

Atlas 950超節點(diǎn)的上市時(shí)間是：2026年四季度。

我們很自豪的看到，Atlas 950超節點(diǎn)，至少在未來(lái)多年都將保持是全球最強算力的超節點(diǎn)，并且在各項主要能力上都遠超業(yè)界主要產(chǎn)品。其中，相比英偉達同樣將在明年下半年上市的NVL144，Atlas 950超節點(diǎn)卡的規模是其56.8倍，總算力是其6.7倍，內存容量是其15倍，達到1152TB；互聯(lián)帶寬是其62倍，達到16.3PB/s。即使是與英偉達計劃2027年上市的 NVL576相比，Atlas 950超節點(diǎn)在各方面依然是領(lǐng)先的。

算力、內存容量、內存訪(fǎng)問(wèn)速度、互聯(lián)帶寬等能力的大幅度增強，為大模型訓練性能和推理吞吐帶來(lái)顯著(zhù)提升。相比華為已經(jīng)推出的Atlas 900超節點(diǎn)，Atlas 950超節點(diǎn)的訓練性能提升17倍，達到4.91M TPS。通過(guò)支持FP4數據格式，Atlas 950超節點(diǎn)的推理性能提升達26.5倍，達到19.6M TPS。

8192卡超節點(diǎn)并不是我們的終點(diǎn)，我們還在繼續努力。我今天發(fā)布的第二款超節點(diǎn)產(chǎn)品，Atlas 960超節點(diǎn)?；贏(yíng)scend 960，Atlas 960超節點(diǎn)最大可支持15488卡。Atlas 960超節點(diǎn) 由176個(gè)計算柜，44個(gè)互聯(lián)柜，共220個(gè)機柜，占地面積約2200平方米。

Atlas 960超節點(diǎn)的上市時(shí)間是：2027年四季度。

伴隨卡的規模的再次升級，Atlas 960超節點(diǎn)讓我們在A(yíng)I超節點(diǎn)的優(yōu)勢再度增強?；贏(yíng)scend 960，其總算力、內存容量、互聯(lián)帶寬在A(yíng)tlas 950基礎上再翻倍。其中，FP8總算力將達到30E FLOPS，而FP4總算力將達到60 EFLOPS；內存容量達到4460TB，互聯(lián)帶寬達到34PB/s。大模型訓練和推理的性能相比Atlas 950超節點(diǎn)，將分別提升3倍和4倍以上，達到15.9M TPS 和80.5M TPS。通過(guò)Atlas 950和Atlas 960，我們對于為人工智能的長(cháng)期快速發(fā)展提供可持續且充裕算力，充滿(mǎn)信心。

超節點(diǎn)已經(jīng)重新定義AI基礎設施的范式，但不僅僅局限于A(yíng)I。在通用計算領(lǐng)域，我們同樣認為，超節點(diǎn)技術(shù)能夠帶來(lái)很大的價(jià)值。從需求角度考慮，金融核心業(yè)務(wù)等目前仍然有部分承載在大型機和小型機之上，相比普通服務(wù)器集群，它們對服務(wù)器的性能和可靠性有更高的訴求，通用計算超節點(diǎn)在這兩點(diǎn)上正好切合需求。從技術(shù)角度考慮，超節點(diǎn)同樣可以為通算領(lǐng)域注入全新活力。

因此，鯤鵬處理器主要圍繞支持超節點(diǎn)，更多核、更高性能等方向持續演進(jìn)。同時(shí)，通過(guò)自研的雙線(xiàn)程靈犀核，使鯤鵬處理器能方便支持更多線(xiàn)程。

2026年Q1，我們將推出Kunpeng 950處理器，包括兩個(gè)版本，分別是：96核/192線(xiàn)程和192核/384線(xiàn)程；支持通用計算超節點(diǎn)；安全方面新增四層隔離，成為鯤鵬首顆實(shí)現機密計算的數據中心處理器。

2028年Q1，鯤鵬處理器將在芯片微架構、先進(jìn)封裝技術(shù)等領(lǐng)域持續突破關(guān)鍵技術(shù)，將再次推出兩個(gè)版本，分別是高性能版本，96核/192線(xiàn)程，單核性能提升50%+，主要面向AI host、數據庫等場(chǎng)景。以及高密版本，不少于256核/512線(xiàn)程，主要面向虛擬化、容器、大數據、數倉等場(chǎng)景。

接下來(lái)是今天我發(fā)布的第三款產(chǎn)品：TaiShan 950超節點(diǎn)，基于Kunpeng 950打造，全球首個(gè)通用計算超節點(diǎn)，其最大支持16節點(diǎn)，32個(gè)處理器，最大內存48TB，同時(shí)支持內存、SSD、DPU池化。

這款產(chǎn)品不只是通用計算領(lǐng)域的一次技術(shù)升級，除了大幅提升通用計算場(chǎng)景下的業(yè)務(wù)性能，還能幫助金融系統破解核心難題。當前大型機、小型機替換的核心挑戰是數據庫分布式改造，而基于TaiShan 950超節點(diǎn)打造的 GaussDB多寫(xiě)架構，無(wú)需改造，但性能提升2.9 倍，最終可平滑替代大型機、小型機上的傳統數據庫。TaiShan 950加上分布式GaussDB將成為各類(lèi)大型機、小型機的終結者，徹底取代各種應用場(chǎng)景的大型機和小型機以及Oracle的Exadata數據庫服務(wù)器。

除了核心數據庫場(chǎng)景，TaiShan 950超節點(diǎn)在更廣泛的場(chǎng)景里，表現也很亮眼：比如虛擬化環(huán)境的內存利用率提升20%，在Spark大數據場(chǎng)景，實(shí)時(shí)數據處理時(shí)間縮短30%。

TaiShan 950超節點(diǎn)上市時(shí)間是：2026年一季度，敬請期待。

超節點(diǎn)的價(jià)值，不僅僅體現在智算和通算傳統業(yè)務(wù)領(lǐng)域?；ヂ?lián)網(wǎng)產(chǎn)業(yè)廣泛應用的推薦系統，正在從傳統推薦算法向生成式推薦系統演進(jìn)。我們可以基于TaiShan 950和Atlas 950打造成混合超節點(diǎn)，為下一代生成式推薦系統打開(kāi)全新架構方向。

一方面，通過(guò)超大帶寬、超低時(shí)延互聯(lián)以及超大內存，混合超節點(diǎn)構成超大共享內存池，支持PB級推薦系統嵌入表，從而支撐超高維度用戶(hù)特征；另一方面，混合超節點(diǎn)的超大AI算力，能夠支持超低時(shí)延推理和特征檢索。因此，混合超節點(diǎn)是面向下一代生成式推薦系統的解決方案的全新選擇。

大規模超節點(diǎn)把智算和通算的能力都推向新的高度，同時(shí)也對互聯(lián)技術(shù)提出了重大挑戰。華為作為聯(lián)接領(lǐng)域的領(lǐng)導者，當然不懼挑戰。在定義和設計Atlas 950、Atlas 960兩個(gè)超節點(diǎn)的技術(shù)規格時(shí)，我們遭遇到了互聯(lián)技術(shù)的巨大挑戰，主要在兩個(gè)方面：

第一是如何做到長(cháng)距離而且高可靠。大規模超節點(diǎn)機柜多，柜間聯(lián)接距離長(cháng)，當前電互聯(lián)和光互聯(lián)技術(shù)都不能滿(mǎn)足需求。其中，當前的電互聯(lián)技術(shù)在高速時(shí)聯(lián)接距離短，最多只能支持兩柜互聯(lián)，而當前的光互聯(lián)技術(shù)雖然可以把長(cháng)距離的多機柜聯(lián)接在一起，但無(wú)法滿(mǎn)足可靠性需求。

第二是如何做到大帶寬而且低時(shí)延。當前跨柜卡間互聯(lián)帶寬低，和超節點(diǎn)的需求差距達5倍；跨柜的卡間時(shí)延大，當前互聯(lián)技術(shù)最好只能做到3微秒左右，和Atlas 950/960設計需求仍然有24%的差距，當時(shí)延已經(jīng)低至2~3個(gè)微秒時(shí)，已經(jīng)逼近物理極限，哪怕0.1微秒的提升，挑戰都很大。

華為基于三十多年構筑的技術(shù)能力，通過(guò)系統性創(chuàng )新，徹底解決了當前技術(shù)存在的問(wèn)題，超標達成Atlas 950/960超節點(diǎn)的設計需求，使萬(wàn)卡超節點(diǎn)成為可能。

首先，為了解決長(cháng)距離且高可靠問(wèn)題，我們在互聯(lián)協(xié)議的物理層、數據鏈路層、網(wǎng)絡(luò )層、傳輸層等每一層都引入了高可靠機制；同時(shí)在光路引入了百納秒級故障檢測和保護切換，當出現光模塊閃斷或故障時(shí)，讓?xiě)脽o(wú)感；并且，我們重新定義和設計了光器件、光模塊和互聯(lián)芯片。這些創(chuàng )新和設計讓光互聯(lián)的可靠性提升100倍，且互聯(lián)距離超過(guò)200米，實(shí)現了電的可靠和光的距離。

其次，為了解決大帶寬且低時(shí)延問(wèn)題，我們突破了多端口聚合與高密封裝技術(shù)，以及平等架構和統一協(xié)議，實(shí)現了TB級的超大帶寬，2.1微秒的超低時(shí)延。正是因為一系列系統性、原創(chuàng )性的技術(shù)創(chuàng )新，我們才攻克了超節點(diǎn)互聯(lián)技術(shù)，滿(mǎn)足了高可靠、全光互聯(lián)、高帶寬、低時(shí)延的互聯(lián)要求，讓大規模超節點(diǎn)成為了可能。

為了達成Atlas 950/960超節點(diǎn)對互聯(lián)的技術(shù)要求，為了實(shí)現萬(wàn)卡超節點(diǎn)還能是一臺計算機，華為開(kāi)創(chuàng )了超節點(diǎn)架構并開(kāi)創(chuàng )了新型的互聯(lián)協(xié)議，能夠支撐萬(wàn)卡級超節點(diǎn)架構?；谶@個(gè)互聯(lián)協(xié)議的超節點(diǎn)架構的核心價(jià)值主張是：萬(wàn)卡超節點(diǎn)，一臺計算機，也就是說(shuō)，通過(guò)該互聯(lián)協(xié)議，把數萬(wàn)規模的計算卡，聯(lián)接成一個(gè)超節點(diǎn)，能夠像一臺計算機一樣工作、學(xué)習、思考、推理。

在技術(shù)上，我們總結認為，萬(wàn)卡級超節點(diǎn)架構應該具備6大特征，分別是總線(xiàn)級互聯(lián)、平等協(xié)同、全量池化、協(xié)議歸一、大規模組網(wǎng)、高可用性。我們?yōu)檫@個(gè)面向超節點(diǎn)的新型互聯(lián)協(xié)議取名“靈衢”，英文名稱(chēng)：UB，UnifiedBus。

今天，我們正式發(fā)布靈衢、UnifiedBus，一個(gè)面向超節點(diǎn)的互聯(lián)協(xié)議。

同時(shí)，我宣布，華為將開(kāi)放靈衢2.0技術(shù)規范。為什么從靈衢2.0開(kāi)始開(kāi)放？事實(shí)上，靈衢的研究是從2019年開(kāi)始的，因為眾所周知的原因，先進(jìn)工藝不可獲得，我們需要從多芯片上突破，希望把更多的計算資源聯(lián)接在一起。我們取了一個(gè)名字叫UnifiedBus，簡(jiǎn)稱(chēng)UB，中文名字“靈衢”，意味著(zhù)類(lèi)似九省通衢，實(shí)現大規模算力的聯(lián)通?；陟`衢?1.0 的Atlas 900超節點(diǎn)自2025年3月開(kāi)始交付，至今已商用部署300多套，靈衢1.0技術(shù)得到充分驗證。在靈衢1.0的基礎上，我們繼續豐富功能，優(yōu)化性能，提升規模，進(jìn)一步完善了協(xié)議，形成了靈衢2.0，前面發(fā)布的Atlas 950超節點(diǎn)就是基于靈衢2.0。

我們認為靈衢2.0具備了開(kāi)放的條件，為了更廣泛地促進(jìn)互聯(lián)技術(shù)發(fā)展和產(chǎn)業(yè)進(jìn)步，今天華為決定開(kāi)放靈衢2.0技術(shù)規范，歡迎產(chǎn)業(yè)界伙伴基于靈衢研發(fā)相關(guān)產(chǎn)品和部件，共建靈衢開(kāi)放生態(tài)。

我在去年HC會(huì )上強調過(guò)，基于中國可獲得的芯片制造工藝，我們努力打造“超節點(diǎn)+集群”算力解決方案，來(lái)持續滿(mǎn)足算力需求。今天已經(jīng)介紹了三個(gè)超節點(diǎn)產(chǎn)品。靈衢既為超節點(diǎn)而生，是面向超節點(diǎn)的互聯(lián)協(xié)議，也是構建算力集群產(chǎn)品最優(yōu)的互聯(lián)技術(shù)。

接下來(lái)為大家帶來(lái)兩個(gè)集群產(chǎn)品：首先是，Atlas 950 SuperCluster 50萬(wàn)卡集群！

Atlas 950 SuperCluster集群由64個(gè)Atlas 950超節點(diǎn)互聯(lián)組成，把1萬(wàn)多機柜中的52萬(wàn)多片昇騰950DT組成為一個(gè)整體，FP8總算力可達524 EFLOPS。上市時(shí)間與Atlas 950超節點(diǎn)同步，即2026年Q4。

在集群組網(wǎng)上，我們同時(shí)支持UBoE與RoCE兩種協(xié)議，UBoE是把UB協(xié)議承載在以太網(wǎng)上，讓客戶(hù)能夠利用現有以太交換機。相比傳統RoCE，UBoE組網(wǎng)的靜態(tài)時(shí)延更低、可靠性更高，交換機和光模塊數量都更節省，所以，我們推薦UBoE。

這就是我們的Atlas 950 SuperCluster集群。相比當前世界上最大的集群 xAI Colossus，規模是其2.5倍，算力是其1.3倍，是當之無(wú)愧的全世界最強算力集群！無(wú)論是當下主流的千億稠密、稀疏大模型訓練任務(wù)，還是未來(lái)的萬(wàn)億、十萬(wàn)億大模型訓練，超節點(diǎn)集群都可以成為性能強悍的算力底座，高效穩定地支持人工智能持續創(chuàng )新。

相應的，在2027年Q4，我們還將基于A(yíng)tlas 960超節點(diǎn)，同步推出Atlas 960 SuperCluster，集群規模進(jìn)一步提升到百萬(wàn)卡級，FP8總算力達到2 ZFLOPS！FP4總算力達到4 ZFLOPS。并且，它同樣也支持UBoE與RoCE兩種協(xié)議，在UBoE協(xié)議加持下，性能與可靠性同樣更優(yōu)，并且，靜態(tài)時(shí)延和網(wǎng)絡(luò )無(wú)故障時(shí)間優(yōu)勢進(jìn)一步擴大，因此繼續推薦UBoE組網(wǎng)。通過(guò)Atlas 960 SuperCluster，我們將持續加速客戶(hù)應用創(chuàng )新，探索智能水平新高。

很高興今天給大家帶來(lái)一系列新產(chǎn)品，我們希望和產(chǎn)業(yè)界一起，以開(kāi)創(chuàng )的靈衢超節點(diǎn)互聯(lián)技術(shù)，引領(lǐng)AI基礎設施新范式；以基于靈衢的超節點(diǎn)和集群持續滿(mǎn)足算力快速增長(cháng)的需求，推動(dòng)人工智能持續發(fā)展，創(chuàng )造更大的價(jià)值，謝謝！

（責任編輯：王惠綿）

人人爽人人爽人人片AV亚洲,亚洲小说区图片区另类春色奇幻,亚州精品久久久久久久久,国产综合色产在线精品,亚洲日本一区二区三

徐直軍：以開(kāi)創(chuàng )的超節點(diǎn)互聯(lián)技術(shù)，引領(lǐng)AI基礎設施新范式

徐直軍：以開(kāi)創(chuàng )的超節點(diǎn)互聯(lián)技術(shù)，引領(lǐng)AI基礎設施新范式

徐直軍：以開(kāi)創(chuàng )的超節點(diǎn)互聯(lián)技術(shù)，引領(lǐng)AI基礎設施新范式

徐直軍：以開(kāi)創(chuàng )的超節點(diǎn)互聯(lián)技術(shù)，引領(lǐng)AI基礎設施新范式