AI-RAN 正在成為電信行業讨论度最高的技術主題之一。有些人把它看作無線網絡演進的下一階段,也有人認為在商業模式、成本結構和技術架構得到充分驗證之前,它可能存在被過度宣傳的风險。要真正理解 AI-RAN,就不能只停留在營销概念上,而需要觀察無線接入網、AI 計算、芯片架構、邊缘計算和 6G 戰略正在如何融合。
AI-RAN 是 Artificial Intelligence Radio Access Network,即人工智慧無線接取網。簡單来說,它指的是將 AI 技術應用到無線接入網,或建設一種能够以更融合的方式同時處理通信負載和 AI 負載的無線接入網絡。它并不只是把 AI 軟件放進基站,更深層的概念是把基站從單一通信節点轉變為智能邊缘計算節点。
本文從方案和工程視角解釋 AI-RAN,内容包括從傳統 RAN 到 Open RAN 的演進,CPU、GPU、FPGA 和 ASIC 芯片的角色,AI for RAN、AI and RAN、AI on RAN 的含義,NVIDIA、SoftBank、Nokia、Ericsson、Huawei、ZTE 等企業推動的行業進展,以及運營商必须考慮的主要部署挑戰。
先理解 RAN,再理解 AI-RAN
RAN 是 Radio Access Network,即無線接入網。在移動通信網絡中,通常可以分為核心網、傳輸網和無線接入網三大部分。RAN 是連接智能手機、工業終端、傳感器、车辆和 IoT 設备等用戶設备與運營商網絡的第一層網絡。
在 4G 時代,基站通常由天線、被稱為 RRU 的远端射頻單元、被稱為 BBU 的基带單元,以及它们之間的連接鏈路組成。天線和射頻單元負責無線信號的發送和接收,BBU 則負責調制、解調、编码、解码、信道估計和資源調度等基带處理任務。
到了 5G 時代,架構發生變化。天線和 RRU 更深度地集成,并演進為 AAU,即有源天線單元。同時,BBU 功能被拆分為 CU 和 DU。CU,即集中單元,主要負責非實時功能;DU,即分布單元,主要負責實時基带處理。这種拆分提高了網絡灵活性,但也让架構更加複雜。
為什么 RAN 很難開放和虚擬化
核心網更容易虚擬化,因為它的许多任務與路由、交換、会話控制和業務管理有关。这推動了 NFV,即網絡功能虚擬化的發展。RAN 則困難得多,因為基带處理对時延、計算密度、定時精度和實時性能都有嚴格要求。
傳統基站通常是由電信設备廠商構建的封閉系統,使用定制 ASIC 芯片和專有軟件。这種“黑盒”模式效率很高,因為 ASIC 芯片專門為固定負載設計。对于 RAN 基带處理来說,ASIC 能够提供较高的計算密度、较低的功耗和穩定的時延。
后来,運營商推動行業向更開放的白盒架構發展,目標是軟硬體解耦、接口標準化,并允许通用服務器和芯片承載電信工作負載。这一方向催生了 C-RAN、O-RAN、vRAN、xRAN 和 Open RAN。
從 C-RAN 到 Open RAN
在 4G 時代,中國移動推動了 C-RAN,即集中式 RAN。其思路是將多個分散部署的 BBU 轉移到集中機房,構建基带池。该基带池集中處理基带負載,并通過光纤鏈路把信號分發到远端射頻單元。
Open RAN 進一步向前發展。它的核心思想是模塊化架構和標準化接口。如果接口兼容,RU、DU 和 CU 可以来自不同廠商。基带軟件也可以從專用芯片中剥離出来,運行在 x86 或 ARM 等通用平台上。
然而,Open RAN 也暴露出一個重要工程問題。通用 CPU 平台虽然灵活,但與基于專用 ASIC 的系統相比,可能功耗更高、效率更低、時延穩定性更弱。这也是许多 Open RAN 部署在大規模商用中遇到困難的原因。RAN 不只是軟件問題,也是實時計算和能效問題。
為什么 GPU 進入 RAN 讨论
AI-RAN 的邏輯始于芯片架構。在電信和計算系統中,主要邏輯計算芯片包括 CPU、GPU、FPGA 和 ASIC。CPU 代表通用計算,常與 Open RAN 式架構相关;ASIC 代表專用電信設备;FPGA 具备灵活性,常用于原型驗證或小規模專用部署;GPU 則是推動 AI-RAN 的关键新力量。
NVIDIA 的 AI-RAN 戰略建立在把 GPU 計算引入基站系統之上。其目標不仅是用 GPU 進行基带處理,還包括在網絡邊缘附近運行 AI 模型。如果基站能够同時處理 RAN 負載和 AI 負載,它就可能成為一種新的邊缘 AI 基礎設施。
这一点很重要,因為電信設备采购是一個非常大的市場,全球電信設备年支出超過 1000 亿美元。如果 GPU 成為基站架構的一部分,電信網絡就可能成為一個新的大型計算市場。
AI-RAN 不只是 GPU 基站
AI-RAN 最重要的想法并不是簡單地“在基站里安装 GPU”。更具戰略意義的想法是把基站變成一個具有 5G 和未来 6G 連接能力的低時延 AI 邊缘服務器。在这種模式下,基站同時做两件事:處理無線信號,并為附近用戶、設备、车辆、摄像機、機器人和工業系統運行 AI 推理。
AI 也可以改善 RAN 本身。借助 AI 算法和 GPU 加速,網絡可以實現更智能的信道状態預測、動態多用戶干扰识别、毫米波波束優化、流量預測、節能控制和無線資源調度。这些能力可能提升網絡性能,并降低運維複雜度。
從邊缘計算角度看,AI-RAN 位于云和終端之間。云數據中心計算能力最強,但距離用戶远,可能带来较高時延;智能手機和 IoT 終端距離用戶近,但計算能力有限;基站位于中間,比云更近,又比多數終端更強,因此天然适合承担低時延邊缘 AI。
AI-RAN 的三大技術方向
AI-RAN Alliance 將 AI-RAN 研究划分為三大方向:AI for RAN、AI and RAN 和 AI on RAN。这三個方向不同,但彼此关联。
AI for RAN
AI for RAN 指用 AI 改善無線接入網。目標是让網絡更高效、更智能、更易運維。典型用例包括流量預測、智能調度、節能優化、故障檢測、干扰管理和波束成形優化。
这是最直接、最現實的方向,因為它改善的是電信網絡本身。運營商关注它,是因為它可能提升網絡性能并降低運營成本。
AI and RAN
AI and RAN 指在同一套基礎設施上運行通信功能和 AI 功能。在这種模式下,RAN 負載和 AI 負載共享計算資源。技術挑戰在于如何隔離、調度、優先級排序和平衡两類負載,同時不影響實時通信性能。
这一方向很重要,因為它决定 AI-RAN 能否成為具有成本效益的平台。如果同一硬體可以同時支持網絡通信和 AI 服務,運營商就可能获得更高的資源利用率。
AI on RAN
AI on RAN 指利用 RAN 基礎設施支持外部 AI 應用。这是想象空間最大的方向。基站不再只是通信節点,而變成可编程的邊缘智能節点,可支持視頻分析、工業定位、自動驾驶系統、智慧城市應用、车联網、AR/VR 和低時延 AI 服務。
这也是 AI-RAN 與 6G 联系最緊密的地方。未来網絡可能不仅傳輸數據,還会在邊缘完成感知、計算、分析和智能协同。
AI-RAN 的行業進展
AI-RAN 從概念走向產業行動的速度很快。2024 年 2 月,在巴塞罗那世界移動通信大会上,NVIDIA、SoftBank、Ericsson、Nokia、Microsoft 等创始成員發起成立 AI-RAN Alliance。该联盟最初有 11 個创始成員,并很快扩展到 100 多家運營商、廠商和生態伙伴。
2024 年 11 月,NVIDIA 和 SoftBank 宣布試驗他们稱為全球首個能够同時處理 AI 和 5G 工作負載的 AI-RAN 網絡。2025 年,NVIDIA 向 Nokia 投資 10 亿美元,成為其主要股東之一,并加強双方在 6G RAN 和 AI-RAN 解决方案上的合作。
NVIDIA 還持續構建全栈 AI-RAN 方案。2025 年,它推出 Aerial RAN Computer Pro,也稱 ARC-Pro,以及 AI Aerial 軟件平台。该方案集成 GB200、BlueField-3、Spectrum-X 網絡和 CUDA-X 庫等技術,用于電信級場景。
隨后,NVIDIA 及其合作伙伴推廣“All-American AI-RAN”技術栈,旨在為 vRAN 部署、AI 應用和 6G 研究在 GPU 内部或跨 GPU 動態分配計算資源。2026 年 3 月,NVIDIA 在 GTC 上提出 AI Grid 愿景。在该愿景中,AI-RAN 是关键的邊缘網絡和計算層,而 AI Grid 則提供分布式云和编排能力。
两条行業路径:加入或獨立構建
電信行業对 AI-RAN 正形成两類主要回應。第一条路径是全面拥抱基于 GPU 的 AI-RAN 架構。SoftBank 和 AT&T 等運營商关注網絡智能化、降低運營成本、创造新服務,以及在 6G 時代提前布局。有行業估算認為,在某些場景中,AI-RAN 式自動化和智能化可能使 OPEX 降低超過 30%。
Nokia 是这一路径中最受关注的設备廠商之一。其 anyRAN 軟件可與 NVIDIA GPU AI RAN 平台集成。2026 年 3 月,Nokia 宣布與 T-Mobile US、Telkom Indonesia 和 SoftBank 等運營商進行 AI-RAN 功能測試。
第二条路径是獨立探索。许多設备廠商和運營商認同 AI 將改變通信架構,但不希望深度鎖定在單一 GPU 廠商生態中。例如 Ericsson 一方面在 NVIDIA AI 平台上測試 RAN 軟件,另一方面也把可编程神经網絡加速器集成到自研 Ericsson Silicon 芯片中,并推動 AI 推理更靠近 AAU 和 RRU 等無線侧設备。
Huawei 和 ZTE 也在探索各自的 AI 與電信融合路線。Huawei 提出了 AI-Centric Network,ZTE 則推出 AIR MAX。这些策略說明,AI-RAN 不是某一個廠商的單一方案,而是正在成為具有多条技術路線的更廣泛行業方向。
為什么運營商既感興趣又担忧
運營商对 AI-RAN 感興趣,是因為它可能帮助他们摆脱“哑管道”困境。傳統運營商往往销售連接能力,但單纯連接的价值正承受壓力。如果基站能够成為可编程的 AI 邊缘服務節点,運營商就可能基于低時延 AI 推理、行業應用、數據開放、專網和邊缘計算服務建立新的商業模式。
一些運營商也談到從流量運營轉向“token 運營”,或從通信服務提供商轉型為計算服務提供商。AI-RAN 符合这一戰略目標,因為它把無線連接和邊缘 AI 計算結合在一起。
不過,運營商也存在担忧。如果基带處理和 AI 推理與某一 GPU 平台深度綁定,RAN 架構的控制權可能向该廠商生態轉移。这会带来供應商鎖定、技術主權、供應鏈依賴、成本透明度和长期議价能力等方面的担忧。
AI-RAN 的部署挑戰
在大規模部署成為常態之前,AI-RAN 面臨多項現實挑戰。第一是成本。由于 AI 加速器、服務器、網絡設备和站点升級都很昂贵,CAPEX 可能很高;GPU 系統也可能消耗大量電力,并要求新的散热、維護和運營流程,因此 OPEX 也可能很高。
第二個挑戰是商業模式設計。運營商必须回答一個困難問題:邊缘 AI 計算如何計量、定价、销售和運營?AI-RAN 容量應像云計算資源、網絡切片、行業服務,還是一種全新的服務類别来销售?
第三個挑戰是標準化。電信標準通常由 3GPP 推動,而 AI-RAN 由 AI-RAN Alliance 及相关生態玩家強力推動。对于數據語義、模型接口、服務编排、負載調度和商業責任,目前仍沒有完全統一的行業框架。
第四個挑戰是生態成熟度。芯片廠商、電信設备廠商、運營商、云服務商、終端廠商、應用開發者和 AI 模型提供商都需要决定支持哪条技術路線。目前许多企業仍在评估是否深度投入,以及如何避免押錯架構。
為什么异構計算可能是真正答案
AI-RAN 很可能会继續發展,但最終的計算架構未必是纯 GPU 架構。更現實的方向是异構計算,即組合 ASIC + GPU + CPU,并在某些場景中加入 FPGA。每類芯片都有自己的角色。
ASIC 适合固定電信負載,效率高;CPU 提供灵活的通用控制和業務處理;GPU 擅长并行 AI 計算和部分加速 RAN 負載;FPGA 可在專用場景中提供可编程加速。運營商可以根據性能、效率、成本、部署規模和生態要求混合不同計算資源。
这種混合架構可以帮助運營商避免過度依賴單一技術路線,也能让 AI-RAN 從網絡優化、邊缘視頻分析、工業定位、專網和 6G 研究平台等選定用例開始逐步部署。
推荐的 AI-RAN 方案架構
務實的 AI-RAN 方案應設計為分層架構,而不是簡單的硬體升級。無線層包括 RU、AAU、DU 和 CU 功能;計算層包括 ASIC、CPU、GPU,并可能包括 FPGA 資源;AI 層包括模型運行時、推理引擎、數據處理和優化算法;编排層負責負載調度、服務開放、監控和生命周期管理。
在这種架構中,電信負載必须始終保持確定性性能。AI 負載則可根據優先級、可用容量和時延要求進行調度。例如,實時 RAN 處理應優先于非关键 AI 推理;視頻分析、定位和低時延控制等工業應用應根據業務 SLA 分配資源。
運營商還應設計 AI-RAN 安全與治理層,包括數據隱私、模型安全、访問控制、審計日志、服務隔離和故障恢複。由于 AI-RAN 把網絡基礎設施與 AI 應用連接在一起,其安全要求可能比傳統基站部署更加複雜。
AI-RAN 用例
網絡優化
AI 可以預測流量模式、识别干扰、優化無線資源調度、提升節能效果,并支持自動網絡調優。这主要属于 AI for RAN。
邊缘視頻分析
具备邊缘 AI 計算能力的基站可以處理附近的視頻流,用于公共安全、工業監測、交通管理和智慧園區應用,從而减少把所有數據回傳到中心云的需求。
工業專網
在工廠、港口、矿山、能源場站和物流園區,AI-RAN 可以把私有 5G 連接與本地 AI 推理結合起来,支持機器視觉、機器人控制、人員安全、設备巡檢和低時延生產監測。
6G 研究與 AI 原生網絡
AI-RAN 可能成為 6G 的重要基礎。未来網絡可能融合通信、感知、計算和智能。AI-RAN 為这種 AI 原生網絡架構提供了一条可能路径。
結论
AI-RAN 是電信行業最重要的技術方向之一。它連接了 RAN 演進、AI 計算、邊缘基礎設施、Open RAN、GPU 加速和 6G 戰略。它的目標不仅是提升基站性能,更是把無線接入網轉變為智能邊缘計算平台。
不過,AI-RAN 仍處于早期階段。自 2024 年 AI-RAN Alliance 成立以来,行業進展很快,但大規模商業成功尚未得到保證。高 CAPEX、高 OPEX、功耗、供應商鎖定、不確定商業模式、標準化缺口和生態不成熟仍是主要挑戰。
最可能的未来不是用基于 GPU 的 AI-RAN 簡單替代傳統 RAN,而是异構計算、分階段部署、開放接口、商業模式驗證和面向 6G 的演進。AI-RAN 可能成為下一轮電信革命的核心技術,但它仍需要時間、真實部署和商業驗證。
FAQ
AI-RAN 是什么意思?
AI-RAN 是 Artificial Intelligence Radio Access Network,即人工智慧無線接取網。它指的是將 AI 技術應用到無線接入網,并把無線通信負載與 AI 計算負載進行融合。
AI-RAN 只是把 GPU 放進基站吗?
不是。GPU 是当前 AI-RAN 讨论中的重要部分,但 AI-RAN 更廣泛。它包括基于 AI 的網絡優化、共享 AI 與 RAN 的計算基礎設施,以及把 RAN 用作邊缘 AI 服務平台。
AI for RAN、AI and RAN 和 AI on RAN 有什么區别?
AI for RAN 用 AI 提升網絡性能和運維;AI and RAN 在共享基礎設施上運行 AI 和通信負載;AI on RAN 則把 RAN 網絡作為 AI 應用的邊缘平台。
為什么 AI-RAN 对 6G 很重要?
6G 預計將融合通信、感知、計算和智能。AI-RAN 可能提供这種演進所需的邊缘計算和 AI 原生網絡基礎。
AI-RAN 最大的挑戰是什么?
主要挑戰包括高 CAPEX、高 OPEX、功耗、供應商鎖定风險、不確定的商業模式、缺乏統一標準以及生態支持尚不成熟。
AI-RAN 最可能采用什么計算架構?
最可能的是异構架構。運營商可能結合 ASIC、GPU、CPU,有時還包括 FPGA,以平衡性能、效率、成本、灵活性和生態控制。