你的位置:首頁 > 互連技術(shù) > 正文

拿什么追趕英偉達(dá)、AMD?“AI芯片大戰(zhàn)”最新進(jìn)展

發(fā)布時間:2023-05-24 責(zé)任編輯:Doris

導(dǎo)



AI芯片+AI服務(wù)器,受益于AIGC+類GPT等應(yīng)用的鯰魚效應(yīng),帶來約百倍算力需求。原有英偉達(dá)等供給有限(根據(jù)IDC咨詢,預(yù)測2025年AI服務(wù)器市場空間僅僅318億美元,預(yù)計21-25年CAGR僅僅19.5%),因此國產(chǎn)AI芯片在邏輯上有爆發(fā)彈性,此外AI服務(wù)器也有成長空間。


01
AI芯片分類及優(yōu)缺點

人工智能芯片主要分為“訓(xùn)練(Training)”芯片和“推理(Inference)”芯片。從技術(shù)架構(gòu)來看,AI芯片主要分為圖形處理器(GPU)、現(xiàn)場可編程門陣列(FPGA)、專用集成電路(ASIC)、中央處理器(CPU)四大類。其中,GPU是較為成熟的通用型人工智能芯片,F(xiàn)PGA和ASIC則是針對人工智能需求特征的半定制和全定制芯片,GPU、FPGA、ASIC作為加速芯片協(xié)助CPU進(jìn)行大規(guī)模計算。

三類芯片用于深度學(xué)習(xí)時各有優(yōu)缺點:

(1)通用性:GPU>FPGA>ASIC,通用性越低,代表其適合支持的算法類型越少。

(2)性能功耗比:GPU<FPGA<ASIC,性能功耗比越高越好,意味著相同功耗下運算次數(shù)越多,訓(xùn)練相同算法所需要的時間越短。


02
AI芯片市場競爭格局

目前AI芯片主要被國際廠商壟斷,根據(jù)Counterpoint、IDC數(shù)據(jù),Intel和AMD共計占2022年全球數(shù)據(jù)中心CPU市場收入的92.45%,Nvidia占2021年中國加速卡市場份額的80%以上。

在不同的應(yīng)用場景之下,已經(jīng)形成了不同的AI芯片競爭格局。

1.云和數(shù)據(jù)中心AI芯片市場


在云和數(shù)據(jù)中心AI芯片市場,“訓(xùn)練”和“推理”兩個環(huán)節(jié)都是英偉達(dá)GPU一家獨大,幾乎占據(jù)90%以上份額,包括AWS、微軟Azure、谷歌云、阿里云、華為云、騰訊云在內(nèi)的大部分公有云廠商上線的AI加速計算公有云服務(wù)絕大部分都是基于英偉達(dá)Tesla系列GPU。


(1)云端訓(xùn)練


云端訓(xùn)練用的幾乎全部是英偉達(dá)GPU,公有云廠商中僅谷歌云一家除了提供以英偉達(dá)GPU為主的云計算加速服務(wù)之外,還推出了基于自研AI芯片TPU的深度學(xué)習(xí)訓(xùn)練服務(wù);


(2)云端推理


云端推理目前出現(xiàn)了基于GPU、FPGA、ASIC三種不同芯片云計算服務(wù),但是市場份額仍然以英偉達(dá)GPU為主,其中AWS、阿里云、騰訊云、華為云等公有云廠商均推出了FPGA加速計算云服務(wù),另外AWS推出了基于自研AI芯片Inferentia的ASIC加速計算服務(wù),華為云推出了基于自研AI芯片昇騰310的ASIC加速計算服務(wù)。


2.設(shè)備端和邊緣計算“推理”市場


在設(shè)備端和邊緣計算“推理”市場,各類型芯片各自為陣,尚無絕對優(yōu)勢地位的芯片廠商出現(xiàn)——手機(jī)市場以高通、華為、蘋果原主控芯片廠商為主,自動駕駛、安防IPC領(lǐng)域英偉達(dá)暫時領(lǐng)先。

03
國產(chǎn)AI芯片多領(lǐng)域追趕


(1)國產(chǎn)CPU加速追趕

全球服務(wù)器CPU市場目前被IntelAMD所壟斷,國產(chǎn)CPU在性能方面與國際領(lǐng)先水平仍有差距。根據(jù)Counterpoint數(shù)據(jù),在2022年全球數(shù)據(jù)中心CPU市場中,Intel以70.77%的市場份額排名第一,AMD以19.84%的份額緊隨其后,剩余廠商僅占據(jù)9.39%的市場份額,整體上處于壟斷局面;目前國內(nèi)CPU廠商主有海光信息、海思、飛騰、龍芯中科、申威等。通過產(chǎn)品對比發(fā)現(xiàn),目前國產(chǎn)服務(wù)器CPU性能已接近Intel中端產(chǎn)品水平。

值得一提的是,龍芯CPU從指令集、IP核、芯片模塊等完全自主設(shè)計,目前基于LoongArch(龍架構(gòu))的第四范式Sage AIOS平臺已完成與龍芯3C5000系列芯片的深度適配。通過軟硬件協(xié)同調(diào)優(yōu),邏輯回歸、決策樹模型、深度稀疏神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)算法在龍芯3C5000系列上的性能,接近某國外主流CPU的水平。


龍芯中科CPU方案推薦

軌道交通/地鐵站級系統(tǒng)設(shè)備解決方案

龍芯中科設(shè)計推出軌道交通專用無風(fēng)扇ECU,整機(jī)采用龍芯3號CPU,板貼4G DDR4內(nèi)存顆粒,最大支持8G。支持3*VGA+1*LVDS顯示接口,最大支持4路獨立顯示。支持14個COM,6個USB,2個RJ45千兆網(wǎng)口,24路DIO。支持DC 9-36V寬壓輸入。該設(shè)備可廣泛應(yīng)用于軌道交通、輕軌和高鐵行業(yè)各種自助售檢票系統(tǒng)、屏蔽門等場景。

龍芯3號工控機(jī)

產(chǎn)品特點

1. 采用龍芯3號低功耗版;

2. 采用全鋁型材無風(fēng)扇機(jī)箱設(shè)計;

3. 板貼4G DDR4內(nèi)存顆粒,最大可支持8G;

4. MiniITX 板型設(shè)計;

5. 獨立雙顯/獨立四顯可選,最大支持4路獨立顯示:1*LVDS+3*VGA;

6. 支持4*USB2.0/2*USB3.0/14*COM/2*LAN/2*SATA/1*MSATA/12*DI/12*DO;

7. 支持DC 9-36V寬壓輸入;

8. 支持專用設(shè)備版/Loongnix/UOS/麒麟等操作系統(tǒng);

9. 支持上電啟動/網(wǎng)絡(luò)喚醒/定時開機(jī);


方案應(yīng)用

自動/半自動售票機(jī)框圖


智慧高速ETC收費系統(tǒng)解決方案

龍芯中科推出交通行業(yè)專用邊緣計算設(shè)備,基于龍芯3A5000 CPU,采用無風(fēng)扇被動散熱設(shè)計,板載多路USB, COM, DIO 等接口,支持WIFI,可適應(yīng)多種應(yīng)用場景。其中12路3模式可選換串口RS232/422/485,現(xiàn)場適用性更廣;每個串口和每種模式均采用2.5KV光電隔離保護(hù),提高串口應(yīng)用可靠性;24路2.5KV光隔離DIO,提高開關(guān)控制的可靠性。軟件方面完美支持K8S, .Net6.0, Java8/11/17等常用基礎(chǔ)組件,大大提升系統(tǒng)構(gòu)建的靈活性和兼容性。

1684834930860.jpg

龍芯3A5000

產(chǎn)品特點

1. 龍芯3A5000 CPU, 主頻2.3-2.5GHz,四核;

2. 2*DDR4 3200MHz UDIMM內(nèi)存,最大64GB;

3. 1*VGA 和1*HDMI 獨立雙顯示;

4. 2*SATA,1*M.2 2280 NVMe存儲;

5. 4*USB3.0/2*USB2.0/2*LAN,/1*M.2 2230 E-Key支持WiFi&BT模塊/Audio out和Mic;

6. 12*DI/12*DO/12*COM;

7. DC 9-36V寬壓供電,帶反接、過流、過壓保護(hù);

8. 無風(fēng)扇被動散熱設(shè)計,采用超大鋁擠型材+雙銅管導(dǎo)熱+高導(dǎo)熱率硅脂散熱設(shè)計方案;

9. 工作溫度:-20~60℃,IP51防護(hù)等級;

10. 適配Loongnix、統(tǒng)信、麒麟、OpenEuler系統(tǒng);


方案應(yīng)用


ETC車道收費系統(tǒng)框圖


ETC門架收費系統(tǒng)框圖


申請樣片,方案技術(shù)資料,請掃二維碼。


(2)國產(chǎn)GPU生態(tài)體系逐步完善

全球GPU芯片市場主要由海外廠商占據(jù)壟斷地位,國產(chǎn)廠商加速布局。全球GPU市場被英偉達(dá)、英特爾和AMD三強(qiáng)壟斷,英偉達(dá)憑借其自身CUDA生態(tài)在AI及高性能計算占據(jù)絕對主導(dǎo)地位;國內(nèi)市場中,景嘉微在圖形渲染GPU領(lǐng)域持續(xù)深耕,另外天數(shù)智芯、壁仞科技、登臨科技等一批主打AI及高性能計算的GPGPU初創(chuàng)企業(yè)正加速涌入



(3)FPGA/ASIC國產(chǎn)替代正當(dāng)時

FPGA全球市場呈現(xiàn)“兩大兩小”格局,Altera與Xilinx市占率共計超80%,Lattice和Microsemi市占率共計超10%;整體來看,安路科技、紫光同創(chuàng)等廠商處于國際中端水平,仍需進(jìn)一步突破。工藝制程方面,當(dāng)前國產(chǎn)廠商先進(jìn)制程集中在28nm,落后于國際16nm水平;在等效LUT數(shù)量上,國產(chǎn)廠商旗艦產(chǎn)品處于200K水平,僅為XILINX高端產(chǎn)品的25%左右。

ASIC不同于CPU、GPU、FPGA,目前全球ASIC市場并未形成明顯的頭部廠商,國產(chǎn)廠商快速發(fā)展;通過產(chǎn)品對比發(fā)現(xiàn),目前國產(chǎn)廠商集中采用7nm工藝制程,與國外ASIC廠商相同;算力方面,海思的昇騰910在BF16浮點算力和INT8定點算力方面超越Googel最新一代產(chǎn)品TPUv4,遂原科技和寒武紀(jì)的產(chǎn)品在整體性能上也與Googel比肩。未來國產(chǎn)廠商有望在ASIC領(lǐng)域繼續(xù)保持技術(shù)優(yōu)勢,突破國外廠商在AI芯片的壟斷格局。




END




特別推薦
技術(shù)文章更多>>
技術(shù)白皮書下載更多>>
熱門搜索
?

關(guān)閉

?

關(guān)閉