中咨視界
趙穎君 | 我國發(fā)展人工智能面臨三方面挑戰(zhàn)及其建議
| |||||
| |||||
人工智能(AI)的發(fā)展已達(dá)60余年,涉及范圍非常廣泛,擁有比一般科技領(lǐng)域更復(fù)雜、更豐富的內(nèi)涵?,F(xiàn)階段人工智能技術(shù)研究將圍繞算法、框架軟件、芯片三個方面。未來十年是人工智能產(chǎn)業(yè)發(fā)展的重要時期,也是人工智能芯片技術(shù)突破的關(guān)鍵時期,遠(yuǎn)期人工智能技術(shù)的發(fā)展路徑將會沿著算法、算力兩條主線向前發(fā)展,并逐步帶領(lǐng)人類進(jìn)入到人機協(xié)同時代。發(fā)展人工智能的最終目標(biāo)并不是要替代人類智能,而是要與人類智能形成互補,使得人類從繁重的重復(fù)性工作中解放出來,從而專注于推動人類自身文明的進(jìn)步。 一、我國發(fā)展人工智能面臨三方面挑戰(zhàn) 我國發(fā)展人工智能當(dāng)前面臨的挑戰(zhàn)主要在AI算法、AI框架軟件及AI芯片三個方面,詳細(xì)論述如下。 (一)AI算法 人工智能技術(shù)常見的算法技術(shù)有決策樹、隨機森林、邏輯回歸、支持向量機、樸素貝葉斯算法等,國內(nèi)各大高校團隊一直有深入研究,但是在科研成果轉(zhuǎn)化領(lǐng)域一直發(fā)展緩慢,難點在于如何將算法和實際工程應(yīng)用結(jié)合,實現(xiàn)技術(shù)向生產(chǎn)力的轉(zhuǎn)化。目前以華為、阿里、騰訊等公司主導(dǎo)的技術(shù)研發(fā)團隊,將自身應(yīng)用和算法技術(shù)結(jié)合,從產(chǎn)業(yè)領(lǐng)域?qū)崿F(xiàn)算法的技術(shù)成果轉(zhuǎn)化。 底層數(shù)學(xué)庫的研究一直屬于冷門行業(yè),一方面因為技術(shù)成果轉(zhuǎn)化不易,另一方面因為研究領(lǐng)域狹窄,國內(nèi)僅有少數(shù)科研團隊專注于此。企業(yè)領(lǐng)域,主要是嘗試從底層硬件開發(fā)角度,通過優(yōu)化數(shù)學(xué)庫實現(xiàn)硬件效率最優(yōu)化的方式進(jìn)行研究,如美國NVIDIA公司開發(fā)了cuDNN的深度學(xué)習(xí)庫,是專門針對其CUDA GPU的優(yōu)化,但是并沒有對大規(guī)模機器學(xué)習(xí)場景中分布式并行的支持。美國IBM (PML)和Intel (DistML)在前些年均開發(fā)了機器學(xué)習(xí)/深度學(xué)習(xí)相關(guān)框架、庫和工具集,但均限內(nèi)部使用或者是簡單版本的開源。Databricks公司以Spark為核心開發(fā)支持機群學(xué)習(xí)相關(guān)的庫?;陂_源軟件Caffe擴展了基于MPI的分布式并行實現(xiàn)。從面向市場的產(chǎn)品角度看,這些目前還處于研制階段,性能和穩(wěn)定性改善空間潛力巨大。 算法領(lǐng)域的技術(shù)突破,我國科研機構(gòu)和企業(yè)的關(guān)注點是不一樣的??蒲蓄I(lǐng)域針對目前的已有算法進(jìn)行深度優(yōu)化,實現(xiàn)更好的處理效果,或者另辟蹊徑,對原有算法進(jìn)行脫胎換骨。而企業(yè)則更多立足于產(chǎn)業(yè)發(fā)展需要,將成熟的算法應(yīng)用到實際的工程項目中,實現(xiàn)人工智能產(chǎn)業(yè)化。 (二)AI框架軟件 國內(nèi)的AI框架軟件逐漸起步,也開始擁抱開源,并正在培育自己的生態(tài)環(huán)境??蚣苘浖侨斯ぶ悄苌鷳B(tài)中最重要的因素之一,我國需要促進(jìn)國產(chǎn)自研框架軟件的發(fā)展和推廣,擺脫國外的軟件生態(tài)標(biāo)準(zhǔn)制約。國產(chǎn)AI框架軟件需要和國產(chǎn)AI芯片及硬件進(jìn)行相互適配、性能優(yōu)化和應(yīng)用推廣,能夠形成面向行業(yè)應(yīng)用的軟硬件一體化平臺,促進(jìn)這種融合技術(shù)在各行業(yè)的產(chǎn)業(yè)推廣。 1.AI框架軟件 AI框架軟件是相關(guān)算法、庫、工具的集合。AI框架軟件的出現(xiàn)降低了使用門檻,開發(fā)人員借助計算框架,不需要從復(fù)雜的神經(jīng)網(wǎng)絡(luò)開始編寫代碼,可以依據(jù)需要,使用已有的模型,快速實現(xiàn)應(yīng)用??蚣苘浖峁┝艘幌盗械臋C器學(xué)習(xí)、深度學(xué)習(xí)組件,其中,通用的AI算法已集成實現(xiàn),若需要使用新的算法可根據(jù)自己的需求去定義,然后調(diào)用深度學(xué)習(xí)框架的函數(shù)接口使用戶自定義的新算法。隨著這些開源框架在全球范圍內(nèi)的廣泛使用,互聯(lián)網(wǎng)巨頭開始逐漸掌控了人工智能的應(yīng)用生態(tài),形成了幾乎所有的AI芯片、系統(tǒng)、平臺都需要與這些主流框架適配的局面。AI算法的生產(chǎn)與程序生產(chǎn)不同,是一個系統(tǒng)工程,需要能夠協(xié)同優(yōu)化數(shù)據(jù)、算法、算力的平臺級產(chǎn)品。深度學(xué)習(xí)對算力有較高需求,因此相繼出現(xiàn)了一些專門的計算框架軟件和平臺,如谷歌的TensorFlow、伯克利大學(xué)的Caffe、Facebook的PyTorch(基于Torch推出)、微軟的CNTK、亞馬遜的MXNet、百度的PaddlePaddle等。 2.國內(nèi)AI框架軟件主要研發(fā)廠商 國內(nèi)人工智能產(chǎn)業(yè)也是大面積采用國外研發(fā)的這些框架軟件,自研的AI框架軟件相對比較小眾,主要集中在從事AI算法研究比較早的幾個公司內(nèi)部使用,但是隨著技術(shù)進(jìn)步,逐漸開始進(jìn)入實用環(huán)節(jié),并開源發(fā)布。國內(nèi)比較知名的幾個框架軟件的情況如下。 百度飛槳PaddlePaddle:是國內(nèi)開發(fā)較為完善的AI計算框架,是集深度學(xué)習(xí)核心框架、基礎(chǔ)模型庫、端到端開發(fā)套件、工具組件和服務(wù)平臺于一體的開源深度學(xué)習(xí)平臺。目前百度有超過30個主要產(chǎn)品都在使用 PaddlePaddle,從市場接受程度判斷,目前還處于起步階段,使用群體相對較少,還需要加大研發(fā)投入和市場培養(yǎng)。 曠視Brain++:擁有自主研發(fā)深度學(xué)習(xí)框架,自主研發(fā)的AI算法平臺Brain++作為統(tǒng)一的底層架構(gòu),為算法訓(xùn)練及模型改進(jìn)過程提供重要支持。在算法開發(fā)方面,曠視自研開源深度學(xué)習(xí)框架MegEngine(Brain++核心組件之一),Brain++幫助曠視構(gòu)建了一條不斷自我改進(jìn)、不斷更加自動化的算法生產(chǎn)線,并能夠針對不同垂直領(lǐng)域的碎片化需求定制豐富且不斷增長的算法組合。 商湯Parrots:是一個訓(xùn)練框架,核心是一個動態(tài)的編譯與調(diào)度引擎,商湯Parrots采用動態(tài)實時編譯技術(shù),所有代碼都是在運行過程當(dāng)中即時編譯,并且放到計算芯片或引擎上大規(guī)模地并行執(zhí)行。具備了傳統(tǒng)靜態(tài)深度網(wǎng)絡(luò)的伸縮性,以及當(dāng)代動態(tài)編程模型的靈活性,達(dá)到了這兩者的最佳結(jié)合。 華為MindSpore:計算框架已經(jīng)正式開源。MindSpore原生適應(yīng)每個場景包括端、邊緣和云。通過MindSpore自身的技術(shù)創(chuàng)新及MindSpore與華為昇騰AI芯片的協(xié)同優(yōu)化,實現(xiàn)運行態(tài)的高效,大大提高了計算性能。 (三)AI芯片 早在上世紀(jì)80年代,學(xué)術(shù)界就提出了相當(dāng)完善的AI算法模型,但直到近些年,模型的內(nèi)在價值也沒有被真正實現(xiàn)過,這主要是受限于硬件水平難以提供可以支撐深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練/推理過程所需要的算力。AI芯片的出現(xiàn)顯著提高了數(shù)據(jù)處理速度,尤其在處理海量數(shù)據(jù)時明顯優(yōu)于傳統(tǒng)CPU。一般將AI芯片定義為“專門針對AI算法做了特殊加速設(shè)計的芯片”,根據(jù)技術(shù)體系結(jié)構(gòu),主要分為GPU、FPGA、ASIC和類腦芯片四大類。AI芯片在邊緣計算中是提供算力的靈魂和大腦,承載了為各種終端提供強大算力的重要任務(wù),直到近年,GPU、FPGA、ASIC等AI芯片被投入到相關(guān)領(lǐng)域應(yīng)用,才解決了算力不足的問題。 1.基于技術(shù)架構(gòu)分類的AI芯片 (1)GPU GPU(Graphics Processing Unit,圖形處理器),是利用處理圖形任務(wù)的圖形處理器來計算原本由中央處理器處理的通用計算任務(wù)。GPU經(jīng)過多年的生態(tài)發(fā)展,已經(jīng)對機器學(xué)習(xí)、深度學(xué)習(xí)類應(yīng)用具有良好的兼容性,通用性強、精度支持靈活、性能出眾。GPU面對的則是類型高度統(tǒng)一的、相互無依賴的大規(guī)模數(shù)據(jù)和不需要被打斷的純凈的計算環(huán)境。GPU的關(guān)鍵性能是并行計算,主流的GPU具有強大的計算能力和內(nèi)存帶寬,無論性能還是內(nèi)存帶寬,均遠(yuǎn)大于同代的CPU。CPU 由專為順序串行處理而優(yōu)化的幾個核心組成,而 GPU 則擁有一個由數(shù)以千計的更小、更高效的核心(專為同時處理多重任務(wù)而設(shè)計)組成的大規(guī)模并行計算架構(gòu)。同時CPU相當(dāng)一部分時間在執(zhí)行外設(shè)的中斷、進(jìn)程的切換等任務(wù),而GPU有更多的時間并行計算。 (2)FPGA FPGA(Field Programma-ble Gate Array,現(xiàn)場可編程門陣列),作為一種半定制電路,含有數(shù)字管理模塊、內(nèi)嵌式單元、輸出單元以及輸入單元等,對于特定運算,可以通過編程重組電路,直接生成專用電路,用戶可以通過 FPGA 配置文件來實現(xiàn)應(yīng)用場景的高度定制,可同時進(jìn)行數(shù)據(jù)并行和任務(wù)并行計算,進(jìn)而實現(xiàn)高性能、低功耗。FPGA一次性成本遠(yuǎn)低于ASIC,在芯片需求還未成規(guī)模、深度學(xué)習(xí)算法暫未穩(wěn)定,仍需不斷迭代改進(jìn)的情況下,利用FPGA具有可重構(gòu)的特性來實現(xiàn)半定制的AI芯片是最佳選擇之一。FPGA可以面向前端推理場景靈活設(shè)定功能,目前在人工智能推理市場應(yīng)用廣泛。 (3)ASIC ASIC(Application Specific Integrated Circuits,專用集成電路),是指應(yīng)特定用戶要求和特定電子系統(tǒng)的需要而設(shè)計、制造的集成電路。ASIC芯片可以面向一些成熟或特定的深度學(xué)習(xí)算法,定制電路和專用指令集,使效率和能效比達(dá)到最優(yōu)。當(dāng)前ASIC芯片主要面向人工智能推理應(yīng)用場景。針對特定用戶場景使用FPGA 進(jìn)行研發(fā),當(dāng)算法成熟、芯片設(shè)計固定后再以ASIC 的方式進(jìn)行大規(guī)模生產(chǎn),針對適用應(yīng)用場景,ASIC的性能和能耗都要優(yōu)于市場上的現(xiàn)有芯片,包括 FPGA 和 GPU。 TPU(張量處理單元,Tensor Processing Units),是一種定制化的ASIC芯片,TPU的單片存儲器容量是NVIDIA K80 GPU的3.5倍,但是它的體積相對更小。谷歌TPU已為谷歌的主要產(chǎn)品提供了計算支持,第一代 TPU 僅能用于推理,而目前發(fā)布的 TPU2.0 既可以用于推理,又可以用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)。 (4)類腦芯片 類腦芯片(Brain-Inspired Chip),可模擬人類大腦信息處理方式,能以極低的功耗對信息進(jìn)行異步、并行、低速和分布式處理,并具備自主感知、識別和學(xué)習(xí)等多種能力,使之能夠在推理、決策、記憶等方面達(dá)到類人智能水平。類腦芯片把數(shù)字處理器當(dāng)作神經(jīng)元,把內(nèi)存作為突觸,跟傳統(tǒng)馮諾依曼結(jié)構(gòu)不一樣,它的內(nèi)存、CPU和通信部件是完全集成在一起。因此信息的處理完全在本地進(jìn)行,而且由于本地處理的數(shù)據(jù)量并不大,傳統(tǒng)計算機內(nèi)存與CPU之間的瓶頸不復(fù)存在。 類腦智能借鑒大腦中“內(nèi)存與計算單元合一”等信息處理的基本規(guī)律,在硬件實現(xiàn)與軟件算法等多個層面,對于現(xiàn)有的計算體系與系統(tǒng)做出本質(zhì)的變革,并實現(xiàn)在計算能耗、計算能力與計算效率等方面的大幅改進(jìn)。IBM已經(jīng)開始進(jìn)行顛覆馮·諾依曼體系結(jié)構(gòu)的類腦智能算法與技術(shù)的探索,并已成功研制出TrueNorth芯片。 2.AI芯片特征對照及國內(nèi)外主要研制廠商 不同類型的芯片在通用性、應(yīng)用兼容性、編程難度、性能、能效比等方面具有各自的優(yōu)缺點,適用于訓(xùn)練、推理等不同的應(yīng)用場景。不同類型AI芯片的特征和優(yōu)缺點如表1所示。 表1 不同類型AI芯片的特征和優(yōu)缺點 當(dāng)前,AI芯片的核心技術(shù)和市場被美國廠商壟斷,雖然國內(nèi)一些廠商也在進(jìn)行AI芯片研制,但無論是技術(shù)成熟度還是市場占有率等方面,與國際巨頭的差距仍然非常明顯。AI芯片國內(nèi)外主要研制廠商如表2所示。 表2 AI芯片國內(nèi)外主要研制廠商 GPU:憑借GPU在當(dāng)前人工智能市場的主導(dǎo)地位,NVIDIA在AI芯片市場一家獨大。AMD新發(fā)布的GPU產(chǎn)品已經(jīng)實現(xiàn)了對主流AI框架軟件的良好支持,上升勢頭明顯。Intel也正在進(jìn)行GPU研發(fā)。在國內(nèi),目前海光公司正在按進(jìn)度推進(jìn)類GPU(DPU)芯片研制,目前已經(jīng)取得階段性進(jìn)展。 FPGA:市場份額排名第二的AI芯片F(xiàn)PGA,當(dāng)前完全被美國的兩家公司Xilinx和Intel(收購的Altera)所壟斷,全球市場占有率達(dá)90%。目前國內(nèi)從事FPGA芯片研發(fā)的廠商有紫光同創(chuàng)(Titan)、復(fù)旦微電子等企業(yè),其FPGA產(chǎn)品相比美國廠商落后一代,且產(chǎn)品性能只能達(dá)到國外品牌上一代同系列產(chǎn)品的中高端水平,尚不具備可抗衡實力。 ASIC:國內(nèi)多采用ASIC芯片架構(gòu)進(jìn)行創(chuàng)新,ASIC芯片相比國外廠商差距相對較小,特別是在芯片本身的性能和能效比方面,而在高性能 GPU 和 FPGA 芯片領(lǐng)域研發(fā)相對滯后。如寒武紀(jì)等的ASIC芯片已形成了量產(chǎn)產(chǎn)品。但相比國外巨頭仍然存在一些先天差距,如Google研制的TPU,可以和自己研發(fā)并開源的主流深度學(xué)習(xí)框架Tensor Flow進(jìn)行深入整合和優(yōu)化,有軟件生態(tài)的加持,將具有更好的生存優(yōu)勢。 二、我國發(fā)展人工智能的三個建議 (一)打造我國人工智能軟硬件產(chǎn)業(yè)生態(tài) PC時代的Wintel體系(微軟+Intel),以及移動終端時代的AA體系(ARM + Android),都是通過打造完整的產(chǎn)業(yè)生態(tài)來把控產(chǎn)業(yè)的主導(dǎo)權(quán),并且處于絕對的行業(yè)壟斷地位。人工智能產(chǎn)業(yè)屬于新型領(lǐng)域,目前尚未形成絕對主導(dǎo)的技術(shù)路徑依賴,產(chǎn)業(yè)生態(tài)也沒有形成絕對的壁壘,軟硬件協(xié)同優(yōu)化已成為提升技術(shù)的主要手段,單純的數(shù)據(jù)與算法優(yōu)化已不能滿足產(chǎn)業(yè)發(fā)展需求。 面對這一發(fā)展契機,我國應(yīng)強化人工智能產(chǎn)業(yè)發(fā)展頂層設(shè)計,加強人工智能軟硬件協(xié)同布局,如,鼓勵百度飛槳Paddle Paddle、曠視、商湯Parrots、華為Mind Spore等軟件框架企業(yè),與寒武紀(jì)(MLU)、華為(昇騰)、阿里(含光)、中星微(NPU)、比特大陸(算豐)、地平線、百度(昆侖)、海光(DPU)、紫光同創(chuàng)(Titan)、復(fù)旦微電子等AI芯片企業(yè)強強聯(lián)合,重點布局我國自主知識產(chǎn)權(quán)的“框架軟件+AI芯片”的人工智能生態(tài)體系,力爭五年內(nèi)在人工智能領(lǐng)域占據(jù)主導(dǎo)優(yōu)勢。 (二)采取全面布局、分步突破的芯片發(fā)展路徑 AI芯片的核心技術(shù)和市場均處于被美國廠商壟斷的狀態(tài),雖然國內(nèi)一些廠商也在進(jìn)行AI芯片研制,但無論是技術(shù)成熟度還是市場占有率方面,與國際巨頭的差距仍然非常明顯。目前來看我國GPU及FPGA基本完全依賴進(jìn)口。GPU方面全球70%的市場都被NVIDIA占據(jù)。FPGA呈現(xiàn)寡頭壟斷的競爭格局,美國兩家公司Xilinx和Intel(收購的Altera)所壟斷,全球市場占有率達(dá)到90%。三款A(yù)I芯片總體來看,ASIC國產(chǎn)化程度相對較好。 因此,現(xiàn)階段針對我國AI芯片的現(xiàn)實情況,可采取全面布局、分步突破的發(fā)展路徑,近期重點突破專用芯片ASIC,遠(yuǎn)期依次突破GPU、FPGA等通用芯片。由于ASIC專用性較強,不同廠商往往會根據(jù)特定的應(yīng)用場景需求進(jìn)行有針對性的研發(fā),而GPU、FPGA等通用芯片由于目前國外有較為成熟的標(biāo)準(zhǔn)化產(chǎn)品,國內(nèi)廠商自主研發(fā)或國產(chǎn)化替代的意愿并不強烈。因此從產(chǎn)業(yè)布局角度來看,政府應(yīng)加大力度助力有條件有意愿的企業(yè),在GPU、FPGA等通用芯片研制方面投入精力實現(xiàn)分步突破。 (三)加強類腦芯片等前沿領(lǐng)域的布局 類腦芯片研發(fā)領(lǐng)域?qū)儆谇罢靶灶I(lǐng)域,目前企業(yè)在此方面并不會過多涉及,因此應(yīng)充分發(fā)揮國內(nèi)高校以及科研院所力量進(jìn)行充分布局。目前,IBM研制的TrueNorth芯片作為類腦計算領(lǐng)域的突破性進(jìn)展,極大地推進(jìn)了人工智能的發(fā)展,但類腦計算仍存在很大的發(fā)展空間。隨著存儲、邏輯、傳感技術(shù)的改進(jìn),將來類腦計算芯片有望達(dá)到更低能耗、更緊湊結(jié)構(gòu)和更快速度。 我國針對類腦芯片的研究尚處于理論階段,國際龍頭企業(yè)還沒有形成明確的技術(shù)及知識產(chǎn)權(quán)壁壘,因此全球科技產(chǎn)業(yè)巨頭都在積極推動人工智能技術(shù)生態(tài)的研發(fā)布局,全力搶占人工智能產(chǎn)業(yè)的制高點和話語權(quán)。 三、結(jié)語 人們對人工智能的期望,絕不僅用來解決狹窄的、特定領(lǐng)域的某個簡單具體的小任務(wù),而是期望能夠真正像人類一樣,解決不同領(lǐng)域、不同類型的復(fù)雜問題,并進(jìn)行判斷和決策。 發(fā)展人工智能的終極目標(biāo)也不是要替代人類智能,而是要與人類智能形成優(yōu)勢互補,幫助人類處理許多雖然能夠處理但效率不夠高的工作,使得人類從繁重的重復(fù)性工作中解放出來,從而專注于推動人類自身文明的進(jìn)步。 參考文獻(xiàn) [1] 何寶宏,徐貴寶.人工智能前沿技術(shù)應(yīng)用趨勢與發(fā)展展望[J].中國工業(yè)和信息化,2019(04). [2] 王煥寧.人工智能芯片國產(chǎn)化路徑淺析[J].科學(xué)技術(shù)創(chuàng)新,2019(07). [3] 田雨晨.FPGA芯片設(shè)計及其應(yīng)用[J].數(shù)字通信世界,2019(04). [4] 譚鐵牛.人工智能的歷史、現(xiàn)狀和未來[J].智慧中國,2019(03). [5] 魏少軍.發(fā)展人工智能芯片中國還缺什么?[J].中國集成電路,2017(08). [6] 王鋒.智慧社會治理中人機合作的邊界[J].學(xué)海,2020(05). | |||||
相關(guān)鏈接
- 楊凱越 | 國際智庫成果特點及對...2020-09-15
- 張瀛瀚 陳淥萍 吳正宇 | 國際...2020-09-11
- 陳雷 朱宇平 胡珂銘 | 加快推...2020-08-31
- 陸君明 | 編制好“十四五”規(guī)劃...2020-08-27
- 李開孟 | 經(jīng)營性基礎(chǔ)設(shè)施項目融...2020-08-26