AI芯片+AI服務(wù)器,受益于AIGC+類GPT等應(yīng)用的鯰魚效應(yīng),帶來約百倍算力需求。原有英偉達(dá)等供給有限(根據(jù)IDC咨詢,預(yù)測2025年AI服務(wù)器市場空間僅僅318億美元,預(yù)計21-25年CAGR僅僅19.5%),因此國產(chǎn)AI芯片在邏輯上有爆發(fā)彈性,此外AI服務(wù)器也有成長空間。
人工智能芯片主要分為“訓(xùn)練(Training)”芯片和“推理(Inference)”芯片。從技術(shù)架構(gòu)來看,AI芯片主要分為圖形處理器(GPU)、現(xiàn)場可編程門陣列(FPGA)、專用集成電路(ASIC)、中央處理器(CPU)四大類。其中,GPU是較為成熟的通用型人工智能芯片,F(xiàn)PGA和ASIC則是針對人工智能需求特征的半定制和全定制芯片,GPU、FPGA、ASIC作為加速芯片協(xié)助CPU進(jìn)行大規(guī)模計算。
三類芯片用于深度學(xué)習(xí)時各有優(yōu)缺點:
(1)通用性:GPU>FPGA>ASIC,通用性越低,代表其適合支持的算法類型越少。
(2)性能功耗比:GPU<FPGA<ASIC,性能功耗比越高越好,意味著相同功耗下運算次數(shù)越多,訓(xùn)練相同算法所需要的時間越短。
目前AI芯片主要被國際廠商壟斷,根據(jù)Counterpoint、IDC數(shù)據(jù),Intel和AMD共計占2022年全球數(shù)據(jù)中心CPU市場收入的92.45%,Nvidia占2021年中國加速卡市場份額的80%以上。
在不同的應(yīng)用場景之下,已經(jīng)形成了不同的AI芯片競爭格局。
1.云和數(shù)據(jù)中心AI芯片市場
在云和數(shù)據(jù)中心AI芯片市場,“訓(xùn)練”和“推理”兩個環(huán)節(jié)都是英偉達(dá)GPU一家獨大,幾乎占據(jù)90%以上份額,包括AWS、微軟Azure、谷歌云、阿里云、華為云、騰訊云在內(nèi)的大部分公有云廠商上線的AI加速計算公有云服務(wù)絕大部分都是基于英偉達(dá)Tesla系列GPU。
(1)云端訓(xùn)練
云端訓(xùn)練用的幾乎全部是英偉達(dá)GPU,公有云廠商中僅谷歌云一家除了提供以英偉達(dá)GPU為主的云計算加速服務(wù)之外,還推出了基于自研AI芯片TPU的深度學(xué)習(xí)訓(xùn)練服務(wù);
(2)云端推理
云端推理目前出現(xiàn)了基于GPU、FPGA、ASIC三種不同芯片云計算服務(wù),但是市場份額仍然以英偉達(dá)GPU為主,其中AWS、阿里云、騰訊云、華為云等公有云廠商均推出了FPGA加速計算云服務(wù),另外AWS推出了基于自研AI芯片Inferentia的ASIC加速計算服務(wù),華為云推出了基于自研AI芯片昇騰310的ASIC加速計算服務(wù)。
2.設(shè)備端和邊緣計算“推理”市場
在設(shè)備端和邊緣計算“推理”市場,各類型芯片各自為陣,尚無絕對優(yōu)勢地位的芯片廠商出現(xiàn)——手機(jī)市場以高通、華為、蘋果原主控芯片廠商為主,自動駕駛、安防IPC領(lǐng)域英偉達(dá)暫時領(lǐng)先。
(1)國產(chǎn)CPU加速追趕
全球服務(wù)器CPU市場目前被Intel和AMD所壟斷,國產(chǎn)CPU在性能方面與國際領(lǐng)先水平仍有差距。根據(jù)Counterpoint數(shù)據(jù),在2022年全球數(shù)據(jù)中心CPU市場中,Intel以70.77%的市場份額排名第一,AMD以19.84%的份額緊隨其后,剩余廠商僅占據(jù)9.39%的市場份額,整體上處于壟斷局面;目前國內(nèi)CPU廠商主有海光信息、海思、飛騰、龍芯中科、申威等。通過產(chǎn)品對比發(fā)現(xiàn),目前國產(chǎn)服務(wù)器CPU性能已接近Intel中端產(chǎn)品水平。
值得一提的是,龍芯CPU從指令集、IP核、芯片模塊等完全自主設(shè)計,目前基于LoongArch(龍架構(gòu))的第四范式Sage AIOS平臺已完成與龍芯3C5000系列芯片的深度適配。通過軟硬件協(xié)同調(diào)優(yōu),邏輯回歸、決策樹模型、深度稀疏神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)算法在龍芯3C5000系列上的性能,接近某國外主流CPU的水平。
龍芯中科CPU方案推薦
龍芯中科設(shè)計推出軌道交通專用無風(fēng)扇ECU,整機(jī)采用龍芯3號CPU,板貼4G DDR4內(nèi)存顆粒,最大支持8G。支持3*VGA+1*LVDS顯示接口,最大支持4路獨立顯示。支持14個COM,6個USB,2個RJ45千兆網(wǎng)口,24路DIO。支持DC 9-36V寬壓輸入。該設(shè)備可廣泛應(yīng)用于軌道交通、輕軌和高鐵行業(yè)各種自助售檢票系統(tǒng)、屏蔽門等場景。
龍芯3號工控機(jī)
全球GPU芯片市場主要由海外廠商占據(jù)壟斷地位,國產(chǎn)廠商加速布局。全球GPU市場被英偉達(dá)、英特爾和AMD三強(qiáng)壟斷,英偉達(dá)憑借其自身CUDA生態(tài)在AI及高性能計算占據(jù)絕對主導(dǎo)地位;國內(nèi)市場中,景嘉微在圖形渲染GPU領(lǐng)域持續(xù)深耕,另外天數(shù)智芯、壁仞科技、登臨科技等一批主打AI及高性能計算的GPGPU初創(chuàng)企業(yè)正加速涌入。
(3)FPGA/ASIC國產(chǎn)替代正當(dāng)時
FPGA全球市場呈現(xiàn)“兩大兩小”格局,Altera與Xilinx市占率共計超80%,Lattice和Microsemi市占率共計超10%;整體來看,安路科技、紫光同創(chuàng)等廠商處于國際中端水平,仍需進(jìn)一步突破。工藝制程方面,當(dāng)前國產(chǎn)廠商先進(jìn)制程集中在28nm,落后于國際16nm水平;在等效LUT數(shù)量上,國產(chǎn)廠商旗艦產(chǎn)品處于200K水平,僅為XILINX高端產(chǎn)品的25%左右。
ASIC不同于CPU、GPU、FPGA,目前全球ASIC市場并未形成明顯的頭部廠商,國產(chǎn)廠商快速發(fā)展;通過產(chǎn)品對比發(fā)現(xiàn),目前國產(chǎn)廠商集中采用7nm工藝制程,與國外ASIC廠商相同;算力方面,海思的昇騰910在BF16浮點算力和INT8定點算力方面超越Googel最新一代產(chǎn)品TPUv4,遂原科技和寒武紀(jì)的產(chǎn)品在整體性能上也與Googel比肩。未來國產(chǎn)廠商有望在ASIC領(lǐng)域繼續(xù)保持技術(shù)優(yōu)勢,突破國外廠商在AI芯片的壟斷格局。
END