阿里云宣布推出自動駕駛領域模型訓練、推理加速框架PAI-TurboX。該框架通過優(yōu)化CPU親和性、動態(tài)編譯、流水線并行等策略,顯著提升模型訓練推理效率。在數(shù)據(jù)側,PAI-TurboX提出高性能的DataLoader引擎,優(yōu)化數(shù)據(jù)預處理流程,實現(xiàn)智能訓練樣本分組,有效提升數(shù)據(jù)處理效率。此外,PAI-TurboX還提供算子優(yōu)化和量化等能力,減少訓練階段的訪存延遲,提升吞吐效率,同時在推理任務中保障精度的同時降低計算開銷與內(nèi)存帶寬需求,實現(xiàn)異構平臺下的高性能推理部署。

PAI-TurboX在自動駕駛的3D物體檢測模型BEVFusion訓練任務中,可將訓練時間縮短58.5%;在實時在線矢量化高精地圖構建模型MapTR訓練任務中,可將訓練時間縮短53%;在端到端自動駕駛模型SparseDrive訓練任務中,PAI-TurboX在感知模塊訓練和聯(lián)合訓練兩個階段可獲得明顯的速度提升,相同訓練步數(shù)下兩個階段可分別縮短51.5%和48.5%。