背景人工智能(Artificial Intelligence, AI)技術(shù)的突飛猛進(jìn),使其產(chǎn)業(yè)規(guī)模也獲得高速成長,吸引大批優(yōu)秀團(tuán)隊躋身其中。一項數(shù)據(jù)表明:“截至2017年12月,全球范圍內(nèi)總計2,075家與AI技術(shù)有關(guān)公司的融資總額已達(dá)65億美元”。作為其中著名的AI獨角獸企業(yè),地平線* (Horizon Robotics*)基于其自主研發(fā)的AI芯片和算法軟件,以智能駕駛、智慧城市和智慧零售為主要應(yīng)用場景,致力于為用戶提供高效、開放的應(yīng)用解決方案,為多種終端設(shè)備裝上智慧“大腦”。作為一家年輕的創(chuàng)業(yè)企業(yè),地平線從成立伊始就因其在AI芯片與算法領(lǐng)域方面的超前研究而備受矚目,成為投資人眼中的寵兒。2017年,地平線完成了由英特爾旗下英特爾® 投資(Intel® Capital)領(lǐng)投的近億美金A+輪融資。對于此項投資,英特爾全球副總裁丹尼爾·麥克納馬拉爾(Daniel McNamara)表示:“地平線匯聚了一批經(jīng)驗豐富的人工智能人才,他們在自動駕駛和人機交互界面等應(yīng)用領(lǐng)域尤為專業(yè)。英特爾的FPGA結(jié)合地平線的開放式技術(shù)融合模式,將為客戶提供一個既靈活又低功耗的計算平臺。”“面對即將到來的AI時代,地平線致力于以高性能的AI算法與芯片,為用戶提供高效、開放的AI應(yīng)用解決方案。在我們構(gòu)建深度學(xué)習(xí)基礎(chǔ)設(shè)施的過程中,英特爾與金山云一起,以多種高性能軟、硬件產(chǎn)品和技術(shù),為我們的深度學(xué)習(xí)系統(tǒng)提供了強有力的支撐。尤其是英特爾® 傲騰™ 固態(tài)盤的加入,使Ceph分布式存儲系統(tǒng)的性能大大提升,幫助地平線兼顧了高性能與大容量的需求。”地平線研究院副院長張健說。地平線構(gòu)建深度學(xué)習(xí)平臺面臨的挑戰(zhàn)人工智能(Artificial Intelligence, AI)技術(shù)的突飛猛進(jìn),使其產(chǎn)業(yè)規(guī)模也獲得高速成長,吸引大批優(yōu)秀團(tuán)隊躋身其中。一項數(shù)據(jù)表明:“截至2017年12月,全球范圍內(nèi)總計2,075家與AI技術(shù)有關(guān)公司的融資總額已達(dá)65億美元”。作為其中著名的AI獨角獸企業(yè),地平線* (Horizon Robotics*)基于其自主研發(fā)的AI芯片和算法軟件,以智能駕駛、智慧城市和智慧零售為主要應(yīng)用場景,致力于為用戶提供高效、開放的應(yīng)用解決方案,為多種終端設(shè)備裝上智慧“大腦”。作為一家年輕的創(chuàng)業(yè)企業(yè),地平線從成立伊始就因其在AI芯片與算法領(lǐng)域方面的超前研究而備受矚目,成為投資人眼中的寵兒。2017年,地平線完成了由英特爾旗下英特爾® 投資(Intel® Capital)領(lǐng)投的近億美金A+輪融資。對于此項投資,英特爾全球副總裁丹尼爾•麥克納馬拉爾(Daniel McNamara)表示:“地平線匯聚了一批經(jīng)驗豐富的人工智能人才,他們在自動駕駛和人機交互界面等應(yīng)用領(lǐng)域尤為專業(yè)。英特爾的FPGA結(jié)合地平線的開放式技術(shù)融合模式,將為客戶提供一個既靈活又低功耗的計算平臺。”“面對即將到來的AI時代,地平線致力于以高性能的AI算法與芯片,為用戶提供高效、開放的AI應(yīng)用解決方案。在我們構(gòu)建深度學(xué)習(xí)基礎(chǔ)設(shè)施的過程中,英特爾與金山云一起,以多種高性能軟、硬件產(chǎn)品和技術(shù),為我們的深度學(xué)習(xí)系統(tǒng)提供了強有力的支撐。尤其是英特爾® 傲騰™ 固態(tài)盤的加入,使Ceph分布式存儲系統(tǒng)的性能大大提升,幫助地平線兼顧了高性能與大容量的需求。”地平線研究院副院長張健說。深度學(xué)習(xí)的動力引擎:金山云EPC為了應(yīng)對深度學(xué)習(xí)系統(tǒng)日益增長的計算力和存儲能力需求,除了自建IDC以外,地平線也將目光投向日趨成熟的云服務(wù)。通過與金山云開展一系列的溝通與技術(shù)交流,地平線認(rèn)為通用的云服務(wù)并不完全契合自身的應(yīng)用需求。這其中的原因,固然有數(shù)據(jù)安全性、信息敏感性方面的顧慮,但更重要的是,通用云服務(wù)無法為地平線AI應(yīng)用提供其所需的某些特定性能指標(biāo),例如更高的算力和IOPS。為幫助地平線構(gòu)建高效的深度學(xué)習(xí)平臺,國內(nèi)領(lǐng)先的公有云服務(wù)提供商金山云* 為之提供了基于高性能云物理主機*(Elastic Physical Cloud,以下簡稱EPC*)集群的模型訓(xùn)練計算平臺。同時,金山云也聯(lián)手英特爾,借助英特爾領(lǐng)先產(chǎn)品和技術(shù)提供的強大計算、存儲和網(wǎng)絡(luò)性能,為這一深度學(xué)習(xí)平臺構(gòu)建了基于Ceph* 的高性能分布式存儲系統(tǒng)。借助英特爾® 傲騰™ 固態(tài)盤 DC P4800X與傳統(tǒng)HDD硬盤組合構(gòu)建的分層存儲能力,使得地平線深度學(xué)習(xí)平臺存儲系統(tǒng)在讀寫速度、存儲容量以及成本控制方面都獲得了可觀的收益。金山云提供的EPC云服務(wù)顯然更適于地平線的要求,如圖1所示。EPC是金山云基于裸金屬服務(wù)器理念構(gòu)建的創(chuàng)新型云服務(wù)產(chǎn)品,其可為地平線提供性能卓越的獨享物理服務(wù)器,通過安全、穩(wěn)定、便捷的計算、存儲服務(wù)幫助地平線快速構(gòu)建高性能的深度學(xué)習(xí)應(yīng)用平臺。同時,金山云優(yōu)秀的云網(wǎng)絡(luò)架構(gòu),也能讓地平線可以在云環(huán)境中方便地配置和使用物理服務(wù)器,既享受獨享物理服務(wù)器帶來的高性能,也能方便地獲取負(fù)載均衡、彈性IP等各類網(wǎng)絡(luò)服務(wù),并可進(jìn)行便捷的網(wǎng)絡(luò)部署與管理。
圖1. 金山云EPC集群構(gòu)成示意圖 除了向地平線深度學(xué)習(xí)應(yīng)用提供強有力的計算力支撐,金山云EPC另一個重要任務(wù)是為其提供高效、可擴展的存儲系統(tǒng)。為應(yīng)對不斷擴展的海量訓(xùn)練數(shù)據(jù)集,地平線利用金山云EPC提供的彈性、易擴展能力,構(gòu)建了基于Ceph的高性能分布式存儲系統(tǒng)。作為業(yè)界流行的開源分布式存儲系統(tǒng),Ceph可將文件分割后均勻隨機地分散在各個OSD節(jié)點上,并采用CRUSH算法來確定文件的存儲位置。通過解析集群的拓?fù)浣Y(jié)構(gòu),地平線深度學(xué)習(xí)應(yīng)用可以直接計算出文件的存儲位置,直接跟OSD節(jié)點通信獲取文件,而無需通過詢問中心節(jié)點來獲取文件位置。這一“去中心化”的設(shè)計,不僅大大地提升了數(shù)據(jù)訪問與處理性能,更有效降低了金山云 EPC存儲集群的管理復(fù)雜性,并顯著提高了可用性及可擴展性。同時,其采用存儲節(jié)點與訪問節(jié)點分離的設(shè)計,也使得地平線深度學(xué)習(xí)應(yīng)用的IO請求上升時,可為其單獨擴充訪問節(jié)點來提高讀寫性能,從而帶來良好的彈性擴展能力。另外,Ceph還對固態(tài)盤,以及分級存儲有著良好支持,這也能夠有效地提升數(shù)據(jù)讀寫效率。基于英特爾® 固態(tài)盤的分級存儲方案在利用深度學(xué)習(xí)方法研發(fā)AI芯片和算法過程中,地平線面臨著海量的數(shù)據(jù)處理需求。如前所述,以自動駕駛為例,每天的路面數(shù)據(jù)量高達(dá)4 TB,這就需要存儲系統(tǒng)具有足夠的容量。同時,這些數(shù)據(jù)通常是以幾十KB大小的小文件形式存在。當(dāng)?shù)仄骄€需要利用這些數(shù)據(jù)進(jìn)行深度學(xué)習(xí)所需的數(shù)據(jù)處理與訓(xùn)練時,對存儲系統(tǒng)的IOPS性能有著非常嚴(yán)苛的要求。囿于磁盤訪問速度的限制,傳統(tǒng)HDD機械硬盤的IOPS性能并不理想,在應(yīng)對地平線深度學(xué)習(xí)應(yīng)用所需的小文件高頻次讀寫需求時,往往難以勝任。全固態(tài)盤模式固然可以帶來高IOPS能力,但目前其相對昂貴的價格也構(gòu)成了巨大的成本壓力,限制了存儲系統(tǒng)在容量方面的擴展需求。分級存儲是緩解性能與容量這對矛盾的有效手段。在金山云EPC存儲集群采用的分級存儲方案中,如圖2所示,非活動數(shù)據(jù)(冷數(shù)據(jù))被存放在由12塊8 TB容量HDD硬盤組成的存儲池中,而活動數(shù)據(jù)(熱數(shù)據(jù))則被置放在甶375 GB版本的英特爾® 傲騰™ 固態(tài)盤DC P4800X構(gòu)成的緩存區(qū)中。
圖2. 英特爾® 傲騰™ 固態(tài)盤+HDD構(gòu)建的分級存儲模式 來自英特爾® 固態(tài)盤數(shù)據(jù)中心產(chǎn)品家族的英特爾® 傲騰™ 固態(tài)盤DC P4800X是基于創(chuàng)新的英特爾® 3D XPoint™ 技術(shù),以及一系列先進(jìn)系統(tǒng)內(nèi)存控制器、接口軟硬件構(gòu)建的全新存儲產(chǎn)品。與傳統(tǒng)NAND介質(zhì)的固態(tài)盤相比,其在IOPS、低延遲以及穩(wěn)定性方面都有著突破性的提升。一項測試數(shù)據(jù)表明,英特爾® 傲騰™ 固態(tài)盤DC P4800X的IOPS最高可達(dá)500,000,同時讀取響應(yīng)時間低于30微秒,并可承受最高2 GB/秒的隨機寫入壓力,因此非常適用于大數(shù)據(jù)、高并發(fā)的應(yīng)用場景。英特爾® 傲騰™ 固態(tài)盤在耐用性上也有出色表現(xiàn),英特爾® 傲騰™ 固態(tài)盤 DC P4800X的每天寫入次數(shù)(Drive Writes Per Day, DWPD)高達(dá)30,有力地保障了地平線深度學(xué)習(xí)系統(tǒng)的有效生命周期。當(dāng)?shù)仄骄€深度學(xué)習(xí)應(yīng)用對數(shù)據(jù)進(jìn)行訪問和操作時,Ceph分布式存儲系統(tǒng)的內(nèi)部處理器將優(yōu)先讀寫緩存區(qū)中的數(shù)據(jù),如果數(shù)據(jù)不在緩存區(qū)中, Ceph會通過請求命中算法、緩存刷寫算法、緩存淘汰算法等方式將數(shù)據(jù)從存儲池中“提取”到緩存區(qū)中。通過這一方式,既可使熱數(shù)據(jù)被高效地訪問和操作,縮短數(shù)據(jù)的訪問時延,也能以更合理的成本承載地平線深度學(xué)習(xí)應(yīng)用所需的海量數(shù)據(jù)。這一分級存儲方案同樣也被地平線用于Journal。Journal是Ceph分布式存儲系統(tǒng)最重要的安全機制之一,一旦發(fā)生停電、宕機或其他意外事件時,Ceph可利用Journal進(jìn)行系統(tǒng)重建。這樣的特性,意味著Ceph會事無巨細(xì)地將數(shù)據(jù)記錄到Journal中,因此Journal的IO請求非常密集,而采用英特爾® 傲騰™ 固態(tài)盤來承載Journal,無疑將使Ceph的讀寫性能獲得顯著提升。來自地平線的反饋表明,與上一 代 SATA固態(tài)盤產(chǎn)品 ,例如英特爾® SATA固態(tài)盤S3510 (480 GB規(guī)格)相比,英特爾®傲騰™ DC P4800X (375 GB規(guī)格)能實現(xiàn)非常可觀的性能提升。而與采用了NVMe接口規(guī)范的英特爾® 固態(tài)盤DC P3700(400 GB規(guī)格)相比,其性能提升也很顯著,可為地平線深度學(xué)習(xí)應(yīng)用帶來強勁的存儲能力支撐。結(jié)論數(shù)據(jù)與算力、算法,并列為AI的三大核心要素,一個高效、強力的存儲系統(tǒng)無疑將有利于提升整個AI系統(tǒng)的研發(fā)和應(yīng)用效率,這意味著AI領(lǐng)域的數(shù)據(jù)科學(xué)家、應(yīng)用幵發(fā)者,以及使用者,都需要耗費較多的精力在數(shù)據(jù)處理上。通過金山云EPC及英特爾® 傲騰™ 固態(tài)盤等先進(jìn)產(chǎn)品與技術(shù)的引入,地平線深度學(xué)習(xí)應(yīng)用的總體效率獲得了大幅提升,有力地推動了地平線基于深度學(xué)習(xí)的芯片與算法的研發(fā)進(jìn)程。在本案例中引入了英特爾為提升存儲系統(tǒng)緩存性能而開發(fā)的專項技術(shù)——英特爾® 高速緩存加速軟件(Intel® Cache Acceleration Software,英特爾® CAS),該技術(shù)已在大量的實踐部署中被證明可進(jìn)一步提升分級存儲的效能。同時,金山云EPC在地平線深度學(xué)習(xí)系統(tǒng)上的成功應(yīng)用,也為裸金屬服務(wù)這一新興的云服務(wù)模式在AI研發(fā)領(lǐng)域中的落地積累了寶貴的經(jīng)驗,為云服務(wù)如何高效地助力AI研發(fā)提供了有益的范例。在未來,地平線、金山云和英特爾三方還將繼續(xù)開展更深層次的技術(shù)合作,將更多先進(jìn)產(chǎn)品與技術(shù)納入到深度學(xué)習(xí)研發(fā)中去。
文章摘自英特爾精英匯
想購買及了解更多英特爾產(chǎn)品詳情,歡迎咨詢以下聯(lián)系方式!
寶通集團(tuán)聯(lián)系方式
咨詢熱線:0755-88603572
寶通官網(wǎng):www.tgdh.net.cn
客戶垂詢郵箱:cuifang.mo@ex-channel.com
客戶垂詢QQ:1627678462
地址:深圳市福田區(qū)深南大道1006號國際創(chuàng)新中心C座11樓
郵編:518026