“飛槳”,顧名思義,想讓深度學(xué)習(xí)領(lǐng)域的開(kāi)發(fā)者順利渡河靠岸。10月16日,在首屆世界科技與發(fā)展論壇上,百度發(fā)布了飛槳產(chǎn)業(yè)級(jí)深度學(xué)習(xí)開(kāi)源開(kāi)放平臺(tái)。
飛槳以百度多年的深度學(xué)習(xí)技術(shù)研究和業(yè)務(wù)應(yīng)用為基礎(chǔ),同時(shí)與華為等芯片企業(yè)深入合作,集深度學(xué)習(xí)核心框架、基礎(chǔ)模型庫(kù)、端到端開(kāi)發(fā)套件、工具組件和服務(wù)平臺(tái)于一體,于2016年正式開(kāi)源。它的開(kāi)源開(kāi)放,降低了AI技術(shù)門(mén)檻,已累計(jì)服務(wù)150多萬(wàn)開(kāi)發(fā)者。
當(dāng)今時(shí)代,“開(kāi)源”,是一個(gè)不斷被提起的詞。百度首席技術(shù)官王海峰在接受科技日?qǐng)?bào)記者采訪時(shí)表示,開(kāi)源開(kāi)放,是人工智能發(fā)展的全球趨勢(shì)之一。
要開(kāi)源,也要自主可控
“深度學(xué)習(xí)是新一代人工智能的核心支撐。”王海峰介紹,在人工智能的技術(shù)體系中,深度學(xué)習(xí)框架處于硬件層和應(yīng)用層之間,其作用相當(dāng)于個(gè)人電腦時(shí)代的Windows和移動(dòng)時(shí)代的Android/IOS,堪稱智能時(shí)代的操作系統(tǒng)。以深度學(xué)習(xí)框架為核心的深度學(xué)習(xí)平臺(tái),是人工智能技術(shù)研發(fā)和產(chǎn)業(yè)化的關(guān)鍵基礎(chǔ)設(shè)施。
不過(guò),如果要獨(dú)立研發(fā)深度學(xué)習(xí)框架,搭建完整的深度學(xué)習(xí)平臺(tái),需要強(qiáng)大的技術(shù)支撐。迄今為止,全球范圍內(nèi)能夠做出功能完備深度學(xué)習(xí)平臺(tái)的企業(yè),只有Google、Facebook等少數(shù)幾家。而它們推出的深度學(xué)習(xí)開(kāi)源平臺(tái),也確實(shí)在全球人工智能領(lǐng)域占據(jù)很大份額,不少國(guó)內(nèi)企業(yè)同樣使用。
不過(guò),國(guó)內(nèi)企業(yè)也不能只想著“背靠大樹(shù)好乘涼”。畢竟,深度學(xué)習(xí)框架是如此重要,若只依賴少數(shù)幾個(gè),難免會(huì)有掣肘;況且,不同國(guó)家人工智能發(fā)展特點(diǎn)并不一樣,開(kāi)發(fā)者也需要更能滿足自身需求的平臺(tái)。
而且,開(kāi)源深度學(xué)習(xí)平臺(tái)若與人工智能芯片結(jié)合,便能發(fā)揮軟硬一體優(yōu)化的技術(shù)優(yōu)勢(shì),構(gòu)筑智能時(shí)代的“芯片+操作系統(tǒng)”聯(lián)盟,掌握話語(yǔ)權(quán)。另外,深度學(xué)習(xí)相關(guān)人才稀缺,培養(yǎng)成本高,如果沒(méi)有自建生態(tài),可能難以持續(xù)培養(yǎng)深度學(xué)習(xí)相關(guān)核心人才。
王海峰說(shuō),研究和發(fā)展技術(shù)領(lǐng)先、功能完備、自主可控的深度學(xué)習(xí)框架和平臺(tái),對(duì)于推動(dòng)我國(guó)人工智能的技術(shù)創(chuàng)新、產(chǎn)業(yè)發(fā)展和人才培養(yǎng),實(shí)現(xiàn)人工智能技術(shù)和產(chǎn)業(yè)的自主可控,加速各行各業(yè)智能化升級(jí),具有至關(guān)重要的作用。
據(jù)介紹,飛槳已經(jīng)在基本功能、性能、芯片支持的完備性等技術(shù)指標(biāo)上與國(guó)外框架相當(dāng),在中文自然語(yǔ)言處理的算法模型、大規(guī)模分布式訓(xùn)練、推理引擎等技術(shù)上還領(lǐng)先于國(guó)外框架。
“雖然在用戶規(guī)模、社區(qū)活躍度、使用便利性方面還存在短板,但是通過(guò)發(fā)揮我國(guó)在數(shù)據(jù)和人工智能產(chǎn)業(yè)應(yīng)用上的優(yōu)勢(shì),國(guó)產(chǎn)深度學(xué)習(xí)框架完全可以實(shí)現(xiàn)與國(guó)外并跑,并有能力領(lǐng)跑。”王海峰說(shuō)。
建設(shè)開(kāi)源社區(qū)的關(guān)鍵是樹(shù)立開(kāi)源思維
截至今年8月,開(kāi)源社區(qū)GitHub上已經(jīng)匯集了4000多萬(wàn)的開(kāi)發(fā)者、210萬(wàn)家公司和機(jī)構(gòu),擁有超過(guò)1億的代碼庫(kù)。“在GitHub上的熱門(mén)開(kāi)源項(xiàng)目中,人工智能類占了很大比例。開(kāi)源開(kāi)放是人工智能領(lǐng)域發(fā)展的全球主要趨勢(shì)之一。”王海峰說(shuō),人工智能的快速發(fā)展,推動(dòng)開(kāi)源開(kāi)放生態(tài)越發(fā)繁榮;而開(kāi)源開(kāi)放同時(shí)也推動(dòng)人工智能快速普及,兩者相互促進(jìn)。
GitHub算是一個(gè)開(kāi)源社區(qū)的典范。那么,要如何打造一個(gè)真正活躍的開(kāi)源社區(qū),補(bǔ)上上述所說(shuō)的短板?
王海峰認(rèn)為,開(kāi)源社區(qū)要有活力,核心是社區(qū)對(duì)開(kāi)發(fā)者要有價(jià)值;它要能提供大量有益的項(xiàng)目、工具和模型,并為產(chǎn)業(yè)創(chuàng)造價(jià)值,這樣一來(lái),開(kāi)發(fā)者會(huì)自發(fā)地積極貢獻(xiàn)自己的力量,讓社區(qū)持續(xù)繁榮。
“建設(shè)開(kāi)源社區(qū)的關(guān)鍵,一是建立我國(guó)軟件行業(yè)的開(kāi)源思維。”王海峰建議,可以鼓勵(lì)企業(yè)、高校和科研機(jī)構(gòu)建立開(kāi)源技術(shù)人才的評(píng)價(jià)和激勵(lì)機(jī)制,推動(dòng)高端人才隊(duì)伍建設(shè);支持相關(guān)企業(yè)聯(lián)合高校、科研院所等開(kāi)展開(kāi)源技術(shù)和應(yīng)用的教師培訓(xùn);在大學(xué)的課程教育中,也培養(yǎng)學(xué)生的開(kāi)源意識(shí),開(kāi)設(shè)國(guó)產(chǎn)軟件相關(guān)課程,培養(yǎng)更多的基礎(chǔ)軟件人才。
他也呼吁加強(qiáng)我國(guó)自主可控開(kāi)源軟件及平臺(tái)的推廣和應(yīng)用,通過(guò)政策引導(dǎo)、設(shè)立專項(xiàng)等方式,鼓勵(lì)廣大開(kāi)發(fā)者基于我國(guó)自主可控的開(kāi)源軟件、平臺(tái)和社區(qū)進(jìn)行創(chuàng)新。“在國(guó)家支持的重大科技和產(chǎn)業(yè)化項(xiàng)目中,也可以使用我國(guó)自主的開(kāi)源軟件開(kāi)展科研工作,確保底層自主可控和信息安全。”王海峰說(shuō)。(記者 張蓋倫)