人工智能(AI)真火,火到全球70%的企業(yè),都希望在2018年實(shí)施AI應(yīng)用[1];AI也真難,難到91%的企業(yè)預(yù)計(jì)會(huì)在采用AI的過程中遇到重大障礙[2]。這種冰與火般的矛盾,根源就在于AI太新,新到如Tara Data所說的那樣:企業(yè)用戶還普遍缺乏相關(guān)的IT基礎(chǔ)設(shè)施,以及專業(yè)的人才和知識(shí)積累[3]。
用戶欠缺的,正是公有云所具備的——背靠互聯(lián)網(wǎng)開源社區(qū)生生不息的創(chuàng)新活力,及其在AI算法研發(fā)上的先發(fā)優(yōu)勢(shì),坐擁大規(guī)模或超大規(guī)模的數(shù)據(jù)中心以及用戶多年積累的海量數(shù)據(jù);調(diào)動(dòng)麾下久經(jīng)考驗(yàn)的基礎(chǔ)設(shè)施運(yùn)維、應(yīng)用和服務(wù)開發(fā)人才,領(lǐng)先的云服務(wù)提供商們正忙著打磨自己的AI云服務(wù)。不過,即使是實(shí)力較強(qiáng)的云服務(wù)提供商,這種打磨也不是一帆風(fēng)順的。AI的三要素——數(shù)據(jù)、算法和算力中,數(shù)據(jù)和算法無須太多擔(dān)憂,但算力,也就是AI云服務(wù)所需的基礎(chǔ)設(shè)施,卻讓人煞費(fèi)思量。畢竟,目前用于AI的硬件包括了通用的CPU,還有專用的GPGPU和FPGA及ASIC,架構(gòu)不一,很容易讓人挑花眼。
那么,有沒有什么策略或者方法,能幫助云服務(wù)提供商更便捷地選擇和構(gòu)建AI云服務(wù)呢?當(dāng)然有!那就是要充分利用好他們既有的基礎(chǔ)設(shè)施,即基于英特爾架構(gòu)處理器的云基礎(chǔ)設(shè)施!原因如下:首先,不論是全球還是在中國(guó),不論是眼前還是長(zhǎng)期,AI云服務(wù)的主要目標(biāo)受眾,多數(shù)是希望采用AI既有創(chuàng)新成果,而非推動(dòng)AI技術(shù)演進(jìn)的普通企業(yè),這些企業(yè)使用AI,目標(biāo)也主要是將智能技術(shù)引入到他們現(xiàn)有業(yè)務(wù)數(shù)據(jù)處理和分析的流程和工具鏈條中,來實(shí)現(xiàn)更高級(jí)的、預(yù)測(cè)型的分析。
這種應(yīng)用,多是推理型的應(yīng)用,也多基于機(jī)器學(xué)習(xí)而非深度學(xué)習(xí)技術(shù),畢竟,智能化數(shù)據(jù)分析的輸出,要做到透明化和可解釋才有意義。
而這種情況,也就決定了云服務(wù)提供商面向這些用戶打造AI云服務(wù)時(shí),完全不必改弦更張、更起爐灶。畢竟目前的公有云服務(wù),包括數(shù)據(jù)存儲(chǔ)、處理和分析類服務(wù),多是構(gòu)建在英特爾架構(gòu)基礎(chǔ)設(shè)施上,因此將AI云服務(wù)構(gòu)建在同一平臺(tái)上,復(fù)用其資源,并與既有的數(shù)據(jù)處理工具對(duì)接的做法,與另尋其他架構(gòu)來搭臺(tái),且需要將海量數(shù)據(jù)在導(dǎo)構(gòu)平臺(tái)間移動(dòng)的做法相比,無疑用時(shí)更短、技術(shù)門檻、風(fēng)險(xiǎn)和成本也更低。此外,保持基礎(chǔ)設(shè)施的同質(zhì),或同構(gòu)性,也能大大減少云服務(wù)提供商在系統(tǒng)管理、維護(hù)和保障上投入的工作量。省時(shí)省力省錢是一方面,性能輸出上,基于英特爾至強(qiáng)處理器的基礎(chǔ)設(shè)施,也不輸專有架構(gòu)平臺(tái),尤其是在優(yōu)化之后。
UCloud的AI在線服務(wù)就是例證,它的算力主要源自既有基礎(chǔ)設(shè)施中常處于閑置狀態(tài)的至強(qiáng)E5處理器AVX處理單元,在搭配面向英特爾架構(gòu)優(yōu)化的Caffe框架后,整體執(zhí)行性能提高了10倍以上。在人臉表情識(shí)別的測(cè)試中,在有并發(fā)的前提下,其性能也可媲美,甚至是超越專有架構(gòu)平臺(tái)[4]。
而今,全新的英特爾至強(qiáng)可擴(kuò)展處理器,憑借全新的微架構(gòu)、進(jìn)一步增強(qiáng)的硬件特性,特別AVX512技術(shù),為那些打算利用既有基礎(chǔ)設(shè)施架構(gòu)構(gòu)建AI云服務(wù)的服務(wù)商帶來了更大的福音:在導(dǎo)入了針對(duì)英特爾架構(gòu)優(yōu)化的框架和軟件工具后,其推理性能可比上一代平臺(tái)實(shí)現(xiàn)最高超百倍的提升[5]! 來自科大訊飛AI開放平臺(tái)的實(shí)踐也證明:該處理器可提供在高性能工作負(fù)載下的高可擴(kuò)展性和可靠性,適用于深度學(xué)習(xí)中的復(fù)雜神經(jīng)網(wǎng)絡(luò)快速推理[6]。
或許有人會(huì)問,上面提的,多是推理,那么訓(xùn)練,尤其是深度學(xué)習(xí)的訓(xùn)練應(yīng)用,至強(qiáng)可否一戰(zhàn)?英特爾給出的實(shí)測(cè)數(shù)據(jù)是:與上一代產(chǎn)品相比,至強(qiáng)可擴(kuò)展處理器可將人工智能/深度學(xué)習(xí)的訓(xùn)練速度提供2.2倍[7], 在同樣導(dǎo)入優(yōu)化的框架和工具后,這一提升幅度也可以拉高到100多倍[8]。
可見,不論選擇哪種技術(shù)路徑,也不論是訓(xùn)練還是推理,優(yōu)先評(píng)估和發(fā)揮既有英特爾架構(gòu)基礎(chǔ)設(shè)施的潛力,都是云服務(wù)提供商構(gòu)建AI云服務(wù)的一條“捷徑”。并發(fā)、時(shí)延、成本等各方面,都對(duì)云平臺(tái)的基礎(chǔ)設(shè)施提出了更高的要求。
文章摘自子彈財(cái)經(jīng)
想購(gòu)買及了解更多英特爾產(chǎn)品詳情,歡迎咨詢以下聯(lián)系方式!
寶通集團(tuán)聯(lián)系方式
咨詢熱線:0755-88603572
寶通官網(wǎng):www.tgdh.net.cn
客戶垂詢郵箱:cuifang.mo@ex-channel.com
客戶垂詢QQ:1627678462
地址:深圳市福田區(qū)深南大道1006號(hào)國(guó)際創(chuàng)新中心C座11樓
郵編:518026