研發(fā)一款完全自主的國產(chǎn)芯片架構(gòu)有多難?
隨著手機(jī)、PC等智能終端的普及,在終端廠商有意無意的營銷下,越來越多的普通消費(fèi)者也開始對(duì)“CPU、架構(gòu)、ARM、X86”這些名詞有了一定的了解,但是也很容易混淆。特別是近期越來越多的手機(jī)廠商的營銷變得越來越硬核,除了擺參數(shù),也開始談到“指令集、編譯器、芯片架構(gòu)”這些業(yè)內(nèi)人都不一定能完全懂的名詞。?對(duì)于普通消費(fèi)者來說,其實(shí)并不關(guān)心電子產(chǎn)品中用的是什么架構(gòu)的芯片,他們只需要更便宜、更高性能和低功耗的電子設(shè)備。所以對(duì)于終端廠商和芯片廠商來說,以往更傾向于直接購買國外已經(jīng)成熟的內(nèi)核技術(shù),如ARM、MIPS來開發(fā)最終產(chǎn)品。用這些架構(gòu)開發(fā)產(chǎn)品,在商業(yè)上是正確的,因?yàn)橛辛顺墒斓纳鷳B(tài)和工具支持,可以節(jié)省大量的時(shí)間和人力成本,快速上市搶占市場(chǎng)。?以手機(jī)芯片領(lǐng)域的代表廠商高通、華為、聯(lián)發(fā)科、紫光展銳為例,他們都是在ARM提供的芯片架構(gòu)基礎(chǔ)上進(jìn)行的二次開發(fā)設(shè)計(jì)。簡(jiǎn)單來說,ARM提供的微架構(gòu)相當(dāng)于房地產(chǎn)開發(fā)商提供的毛坯房,而高通等芯片商在毛坯房的基礎(chǔ)上進(jìn)行精裝修。由于這種模式大大降低了芯片廠商的開發(fā)難度,使得芯片上市時(shí)間大大縮短,加上ASIC簡(jiǎn)單指令集在低功耗領(lǐng)域表現(xiàn)優(yōu)異,因此ARM在追求低功耗的移動(dòng)終端市場(chǎng)取得了巨大成功。?近年來,盡管國產(chǎn)IC設(shè)計(jì)公司蓬勃發(fā)展,但是芯片架構(gòu)領(lǐng)域依然是歐美公司獨(dú)大。以X86、ARM為代表,除了ARM是英國(被日本孫正義收購)的外,其余的全是美國的。其中移動(dòng)處理器主要使用ARM架構(gòu)(華為海思、小米澎湃等),而PC處理器(桌面和服務(wù)器)主要使用MIPS(龍芯)和X86架構(gòu)(兆芯、海光等),而物聯(lián)網(wǎng)主要使用RISC-V(阿里中天微、松果電子等)架構(gòu)。??
真正自主掌握,為什么我們需要MVP核?
因?yàn)檫^于依賴國外的芯片架構(gòu),一旦遭遇類似中美貿(mào)易戰(zhàn)這樣的不可抗力,國產(chǎn)芯片很容易遭到針對(duì)性的打壓。比如最近就出現(xiàn)了幾件在業(yè)內(nèi)頗具影響力的事情:一是ARM說要暫停與華為的合作,二是AMD中止了X86架構(gòu)后續(xù)的授權(quán)給海光。盡管ARMv8技術(shù)專利權(quán)已被華為永久買斷,但后續(xù)的ARMv9華為很可能面臨“無米下鍋”的窘境。?隨著芯片架構(gòu)市場(chǎng)逐漸壟斷化,采用ARM架構(gòu)授權(quán)的成本其實(shí)也越來越高,動(dòng)輒千萬起跳。除了在手機(jī)等市場(chǎng)的玩家還能支付ARM高昂的授權(quán)費(fèi)用外,針對(duì)IOT領(lǐng)域碎片化市場(chǎng)的玩家已經(jīng)無法承擔(dān)了。?盡管業(yè)內(nèi)有人認(rèn)為華為可以采用最近比較熱的RISC-V來作為“備胎”,但RISC-V在手機(jī)芯片等消費(fèi)領(lǐng)域面臨不少天然的缺陷。此外RISC-V雖然是開源芯片架構(gòu),但依然來自于美國伯克利大學(xué)。依賴國外的芯片架構(gòu)來設(shè)計(jì)芯片雖然省時(shí)省力,但卻是受制于人,“技術(shù)無國界”在真實(shí)世界其實(shí)是不存在的。?正是看到了芯片架構(gòu)領(lǐng)域的壟斷,包括高通、三星等芯片商都開發(fā)過自己完全主導(dǎo)的芯片架構(gòu)。而據(jù)說國內(nèi)的紫光展銳、方舟科技也開發(fā)過自主芯片架構(gòu),從IC CORE設(shè)計(jì),指令集設(shè)計(jì),編譯器設(shè)計(jì),都是自主研發(fā)。不過在與ARM的競(jìng)爭(zhēng)中,都面臨生態(tài)系統(tǒng)不夠成熟的問題,而在市場(chǎng)上也沒有真正出現(xiàn)過采用自研芯片架構(gòu)的產(chǎn)品。至于其它的國產(chǎn)芯片,當(dāng)時(shí)龍芯用的是MIPS架構(gòu),中天微用的是C-core,至于RISC-V那是很后來的事情了。?在屈指可數(shù)的自研國產(chǎn)芯片架構(gòu)的先行者中,2009年成立的中微電具有非常重要的意義,其自研的MVP核在技術(shù)上非常超前。?所謂MVP(Multi-threaded Virtual Pipeline stream Processor),最初的意思是“多線程虛擬管線技術(shù)”。后來中微電將自研的處理器架構(gòu)IP命名為MVP。?中微電開創(chuàng)性的將CPU和GPU統(tǒng)一在一個(gè)核內(nèi),一個(gè)核既可以當(dāng)成CPU,也可以當(dāng)成GPU來使用,并且支持四個(gè)線程的并行運(yùn)算??梢哉f,MVP核是業(yè)界首次將CPU和GPU的功能集成在一個(gè)核上,同時(shí)也是國內(nèi)第一個(gè)基于并行計(jì)算的、且具有先進(jìn)的同步多線程設(shè)計(jì)的多核處理器芯片。?2011年12月,中國核高基及IC專家魏少軍教授,以及眾多集成電路行業(yè)專家分別到深圳中微電考察,當(dāng)時(shí)專家對(duì)中微電在沒有外部幫助的情況下,獨(dú)立完成了具有完全自主知識(shí)產(chǎn)權(quán)的MVP核表示高度贊揚(yáng),認(rèn)為融合了CPU和 GPU的指令集ISA是一個(gè)很大的創(chuàng)新。?
錯(cuò)失平板機(jī)會(huì),先驅(qū)成先烈 ?據(jù)了解,中微電的成立初衷源自于創(chuàng)始人梅思行的一個(gè)愿望。在硅谷從業(yè)多年的梅先生,一直希望為中國的技術(shù)發(fā)展做出自己的貢獻(xiàn)。作為Nvidia的主架構(gòu)師之一,梅先生直接參與了數(shù)代Nvidia圖形處理器芯片中的流處理器架構(gòu)和硬件設(shè)計(jì) ,包括第一個(gè)GPU(第一代GeForce),第一個(gè)可編程GPU(第一代xbox),第一個(gè)GPGPU(G80),可以說是芯片設(shè)計(jì)領(lǐng)域不折不扣的大牛。?正是由于有梅先生的堅(jiān)持,中微電從成立之初在技術(shù)上就極具前瞻性。當(dāng)時(shí)CPU和GPU的發(fā)展已經(jīng)沿著并行可編程的路線走到一個(gè)競(jìng)爭(zhēng)交叉點(diǎn),CPU和GPU都在互相融合互補(bǔ),越來越多的算法放到GPU中運(yùn)行,希望成為未來的計(jì)算中心平臺(tái),軟件編程的思路也在發(fā)生變化,越來越多的調(diào)用GPU的性能來進(jìn)行運(yùn)算。?按照梅先生的設(shè)想,中微電希望能用自研的MVP核來自己做芯片,對(duì)比ARM架構(gòu)的芯片,MVP核芯片在并行運(yùn)算上擁有功耗、成本、性能的多重優(yōu)勢(shì),多個(gè)MVP可組成一組強(qiáng)大計(jì)算能力的多核、多線程的處理器,特別適用在云計(jì)算服務(wù)器等需要大量多核運(yùn)算的設(shè)備中。可以讓系統(tǒng)級(jí)SOC設(shè)計(jì)成本遠(yuǎn)低于其它芯片設(shè)計(jì)公司。?_22.jpg)
_24.jpg)
?
方舟編譯器的誕生?2014年,大批來自清華、中科院的博士加入了華為方舟實(shí)驗(yàn)室。其中最重磅的是方舟編譯器的技術(shù)首席科學(xué)家周志德。?2015年,華為方舟實(shí)驗(yàn)室推出了自主研發(fā)的編程語言CM。2016年,華為專門成立了“編譯器與編程語言”的實(shí)驗(yàn)室。2019年4月,在華為P30系列國內(nèi)發(fā)布會(huì)上,華為發(fā)布了一個(gè)普通觀眾不太懂,但其實(shí)意義重大的技術(shù)——“方舟編譯器”。?這也是一家國內(nèi)消費(fèi)電子產(chǎn)品公司首次把編譯器作為一大亮點(diǎn)來介紹。編譯器的作用是把程序員編的高級(jí)語言代碼轉(zhuǎn)換成計(jì)算機(jī)的機(jī)器碼,起到承上啟下的作用。?在以前,每一家CPU架構(gòu)廠商都會(huì)開發(fā)自己的編譯器,但隨著CPU架構(gòu)從百花齊放走向逐漸壟斷,只剩下惠普、英特爾、英偉達(dá)、vmware等頭部的廠商仍然保留編譯器開發(fā)團(tuán)隊(duì)。?為什么周先生這么重要?40多年前,勞倫斯利弗莫爾國家實(shí)驗(yàn)室(LLNL:美國以核武器研發(fā)為主的兩個(gè)國家實(shí)驗(yàn)室之一),啟動(dòng)了名為“S-1”超級(jí)計(jì)算機(jī)項(xiàng)目,許多斯坦福學(xué)生/畢業(yè)生參與,其中包括周志德。?周志德是美國“S-1”項(xiàng)目編譯器的主力研發(fā)之一,于1977-1983年在斯坦福讀博,畢業(yè)后先去了Daisy Systems,該機(jī)構(gòu)與世界上最早的(之一)商業(yè)EDA公司——Valid Logic Systems齊名。?之后,周志德先后進(jìn)入MIPS和SGI任職,在SGI期間領(lǐng)銜開發(fā)出Pro64編譯器,后來演化為著名的Open64編譯器。因此,周樹立全球編譯器頂級(jí)權(quán)威地位,成為編譯器領(lǐng)域的頂級(jí)大佬。?此后,周志德又加入Cognigine,參與創(chuàng)立PathScale和ICube(周的LinkeIn),但隨著全球CPU體系結(jié)構(gòu)走向了高度壟斷,編譯優(yōu)化的價(jià)值也不再顯著,PathScale被反復(fù)賣了好幾輪。?周志德在離開PathScale之后,與英偉達(dá)出身的梅思行合作,共同創(chuàng)立了中微電,并主導(dǎo)了MVP的編譯器。?華為有了自己的編譯器,使得芯片架構(gòu)定制化有了實(shí)現(xiàn)的可能??梢韵裉O果一樣定制自己的芯片或者直接換掉ARM架構(gòu)。而對(duì)于中微電來說,盡管周志德離開了公司,但是周先生主導(dǎo)研發(fā)的MVP編譯器仍在發(fā)揮著作用。有了這個(gè)編譯器,應(yīng)用程序開發(fā)者的源代碼可以在MVP編譯器上編譯,直接在中微電MVP上運(yùn)行,大大的降低了開發(fā)難度。重新出發(fā),走IP路線時(shí)間來到2019年,與10年前相比,此時(shí)的中國半導(dǎo)體行業(yè)發(fā)展環(huán)境發(fā)生了天翻地覆的變化。?這中間隔著半導(dǎo)體大基金的成立、各地資本對(duì)集成電路企業(yè)的熱捧、中美貿(mào)易戰(zhàn)、中興與華為事件……半導(dǎo)體上下游的國產(chǎn)化被重新提上日程。半導(dǎo)體技術(shù)也從多核多線程的潮流轉(zhuǎn)向了人工智能。?市場(chǎng)的變化教育了資本,也教育了從業(yè)者。經(jīng)歷過低谷、重新出發(fā)的中微電,商業(yè)模式發(fā)生了悄然的改變。?據(jù)了解,中微電承擔(dān)過國家重大專項(xiàng)核高基項(xiàng)目的研發(fā)。同時(shí)承接了深圳市科創(chuàng)委、南山科技局的多項(xiàng)科技攻關(guān)項(xiàng)目,均已成功驗(yàn)收。華為事件后,國家對(duì)于重大技術(shù)專項(xiàng)項(xiàng)目的支持力度明顯加大”,中微電總裁王炳煌先生表示, “這的確是國產(chǎn)集成電路設(shè)計(jì)公司的福音”。_23.jpg)
對(duì)標(biāo)NVIDIA CUDA,什么是GPGPU??對(duì)于GPGPU的定義有很多種,利用GPU做一些非渲染的計(jì)算被稱為GPGPU——General-purpose computing on graphics processing units,圖形處理器通用計(jì)算。GPGPU的另一大優(yōu)勢(shì)就是支持與各大CPU架構(gòu)的適配,這樣兼容性變得更好。簡(jiǎn)單來說,就是將GPU和CPU結(jié)合在一起,用來進(jìn)行應(yīng)用程序加速,并將一些計(jì)算密集型任務(wù)從CPU移到到GPU。
?
可以說GPGPU正在重新定義數(shù)據(jù)處理和深度學(xué)習(xí)網(wǎng)絡(luò)方面的能力。據(jù)了解,NVIDIA CUDA的主要應(yīng)用將包括極高能效的百億億次AI超級(jí)計(jì)算機(jī)。?
2019年6月17日,在德國法蘭克福的國際超算大會(huì)上,NVIDIA宣布其獨(dú)有的CUDA編程架構(gòu)開放支持ARM CPU架構(gòu)。NVIDIA CUDA就是GPGPU的典型代表。NVIDIA將在今年年底前,向ARM生態(tài)系統(tǒng)提供全堆棧的AI、HPC軟件,可支持所有AI框架、600多個(gè)HPC應(yīng)用程序的加速。堆棧優(yōu)化完成后,NVIDIA將為所有主流CPU架構(gòu)提供加速,包括x86、POWER、ARM。?為了更好的支持ARM CPU架構(gòu),Nvidia還推出了一款形狀、外接口類似于樹莓派的嵌入式主板Jetson Nano,搭載Cortex-A57處理器,GPU則是128個(gè)NVIDIA CUDA核心,支持4K 60Hz視頻解碼。相比樹莓派,Jetson Nano要強(qiáng)大多了,支持深度學(xué)習(xí)、人臉識(shí)別等應(yīng)用,做個(gè)自動(dòng)駕駛小車控制也可以。其性能可以與搭配NPU的瑞芯微RK3399 PRO進(jìn)行對(duì)比。?
_18.jpg)
?
邊緣計(jì)算算力板性能對(duì)比?
中微電推出的邊緣計(jì)算算力板正好對(duì)標(biāo)Jetson Nano,除了采用自研的GPGPU 核之外,通過PCIE接口可支持ARM架構(gòu)CPU,如瑞芯微、MTK、全志等的處理器。支持的應(yīng)用場(chǎng)景包括邊緣計(jì)算場(chǎng)景中的圖像識(shí)別以及人工智能算法,如汽車駕駛眾的疲勞檢測(cè)、乘客識(shí)別。人臉閘機(jī)、人臉支付場(chǎng)景,公共場(chǎng)所視頻監(jiān)控場(chǎng)景,人數(shù)統(tǒng)計(jì)等。從上圖的性能參數(shù)對(duì)比可以看到,采用64個(gè)GPGPU 核,其FLOPs性能就超過128核的CUDA,同時(shí)在功耗、面積方面都更具優(yōu)勢(shì)。從性能上,MVP的核心架構(gòu)有自己的獨(dú)特優(yōu)勢(shì),根據(jù)FPGA的仿真驗(yàn)證和流片數(shù)據(jù),可以得出結(jié)論,功耗會(huì)小很多,面積小了流片成本也小很多。?
除了邊緣計(jì)算,其實(shí)中微電的MVP核也可以針對(duì)服務(wù)器端市場(chǎng)。不過這個(gè)市場(chǎng)由于玩家比較集中,目前并不是中微電的目標(biāo)市場(chǎng)。_18.jpg)
?
MVP或RISC-V,誰能打破ARM的生態(tài)壟斷?前面提到,最近這兩年開源的RISC-V架構(gòu)大熱,由于是開源的,所以被視作國產(chǎn)芯“自主可控”的發(fā)展契機(jī)。有數(shù)據(jù)顯示,中國有300家以上公司在關(guān)注RISC-V或以RISC-V指令集進(jìn)行開發(fā),并且有了一定的成果,有些芯片企業(yè)已經(jīng)做出了RISC-V的物聯(lián)網(wǎng)芯片,比如最近阿里系的“平頭哥”就大出風(fēng)頭。?不過盡管炒得很熱,但RISC-V和MIPS、MVP等所有非主流的芯片架構(gòu)一樣,都面臨生態(tài)問題。RISC-V在企業(yè)級(jí)、消費(fèi)級(jí)的工控和桌面辦公領(lǐng)域都無法真正解決生態(tài)問題。“除了X86和ARM,包括MIPS和RISC-V,任何不是銷量前二的指令集,都會(huì)有生態(tài)問題?!?/span>梅思行先生認(rèn)為,在不需跑第三方軟件的市場(chǎng),生態(tài)環(huán)境并不算什么問題,比如一些工業(yè)或行業(yè)應(yīng)用?!叭绻脩舻膽?yīng)用軟件是有源代碼的,我們可以負(fù)責(zé)移植;如果第三方應(yīng)用是JAVA,生態(tài)環(huán)境問題也不大,因?yàn)镸VP核可以跑Java vm?!泵废壬硎?。?生態(tài)環(huán)境的建立需要時(shí)間,arm在x86生態(tài)環(huán)境下的崛起過程,就是一個(gè)例子。?作為一個(gè)全新的CPU架構(gòu),MVP采取的策略是:1. MVP具備獨(dú)立且高效的C/C++的編譯器;2. MVP會(huì)運(yùn)行Android操作系統(tǒng)并會(huì)繼續(xù)支持其他開源的系統(tǒng);3. MVP會(huì)移植Android之上的所有應(yīng)用環(huán)境及普遍應(yīng)用程序;4. 如Android所提倡,MVP會(huì)有效運(yùn)行獨(dú)立于CPU的Java應(yīng)用程序,而事實(shí)上Android的Dalvik虛擬器也已經(jīng)是一個(gè)并行編程的適合MVP的軟件平臺(tái);5. MVP會(huì)提供高度靈活及高效率的QEMU軟件開發(fā)平臺(tái)。相信隨著時(shí)間推移,MVP的軟件生態(tài)環(huán)境會(huì)更趨成熟。?實(shí)際上,MVP和RISC-V架構(gòu)在指令集上非常相似,MVP的獨(dú)特之處是硬件多線程,同時(shí)涵蓋了shader language,集成了GPGPU的指令。?此外RISC-V雖然是開源的,但那個(gè)是最基礎(chǔ)的,真正實(shí)現(xiàn)量產(chǎn)上市仍然需要投入大量資源進(jìn)行第二次開發(fā)。相對(duì)來說,MVP似乎是介于ARM和RISC-V之間,有限的專利授權(quán)費(fèi),但是又提供成熟的開發(fā)工具。對(duì)于國產(chǎn)芯片設(shè)計(jì)公司來說,MVP顯然既能滿足完全國產(chǎn)化,又能夠滿足低成本和靈活性的多重需求。王炳煌表示,MVP也可以考慮進(jìn)行指令集的開源,聯(lián)合更多有實(shí)力的合作伙伴共同來壯大生態(tài)。??
點(diǎn)評(píng):芯片國產(chǎn)化東風(fēng)來臨,中微電未來可期作為一家本土市場(chǎng)成長(zhǎng)起來的IC設(shè)計(jì)公司。?在完全從零開始,打造自主知識(shí)產(chǎn)權(quán)開發(fā)的MVP項(xiàng)目中,中微電不但給后來者指明了方向,培養(yǎng)了一大批優(yōu)秀的半導(dǎo)體研發(fā)人員,同時(shí)也為自主指令集以及自研芯片架構(gòu)在業(yè)內(nèi)進(jìn)行了推廣普及。?盡管由于各種原因,目前的中微電在商業(yè)上不能算成功,但它的出現(xiàn)仍然是“中國芯”發(fā)展的一個(gè)重要里程碑。?在芯片投入上,盡管我國這幾十年來一直把集成電路技術(shù)作為高科技發(fā)展的內(nèi)容之一。然而對(duì)于資本和企業(yè)來說,芯片產(chǎn)業(yè)仍然是個(gè)高投入高風(fēng)險(xiǎn)的行當(dāng),投入并不一定有回報(bào),就算有回報(bào)也是很久之后的事情。?不過近年來,隨著半導(dǎo)體大基金的成立,以及資本的熱捧,半導(dǎo)體業(yè)變得日趨浮躁,很多項(xiàng)目匆忙上馬,缺乏對(duì)未來的長(zhǎng)遠(yuǎn)規(guī)劃。?在這種情況下,我們更加需要中微電這種多年來一直堅(jiān)持在國產(chǎn)自主指令集方向上深耕的企業(yè)。在中美貿(mào)易戰(zhàn)的大背景下,各行各業(yè)都將會(huì)加大對(duì)于國產(chǎn)芯片的采購力度。而在類似于政府采購項(xiàng)目、軍工等敏感項(xiàng)目,更是要求國產(chǎn)化率達(dá)到一定的標(biāo)準(zhǔn)以上。?筆者認(rèn)為,借著目前國產(chǎn)芯片替代的東風(fēng),中微電未來一定能脫穎而出,綻放國產(chǎn)處理器的光彩。同時(shí)MVP核作為國產(chǎn)自主的芯片架構(gòu),也必然在與ARM、RISC-V架構(gòu)的競(jìng)爭(zhēng)中,獲得自己的一席之地。?
文章標(biāo)簽:
處理器