圖森未來(TuSimple)成立於2015年,是一家專注於L4級無人駕駛卡車技術研發與應用的人工智能企業,已經實現卡車在幹線物流場景和半封閉樞紐場景下的無人干預駕駛。圖森未來品牌旗下產品——圖森未來 L4 級別無人駕駛卡車能夠實現環境感知、定位導航、決策控制等自動駕駛核心功能,可應用於高速公路貨運和港內集裝箱碼頭運輸及其相似場景。
公司於2019年9月完成總額2.15億美元D輪融資,資方:UPS、鼎暉資本、萬都中國、累計融資超過3億美元,最新估值超過12億美元,是卡車無人駕駛頭部企業,也是全球第一家無人駕駛卡車獨角獸企業。
圖森未來的業務主要在美國和國內兩地展開,在美國主要是高速公路幹路貨運場景,國內業務開始以連接樞紐場景的幹線物流貨運為主。
在美國,圖森未來已經向包括UPS、USPS、McLane、U.S. Xpress在內的18家客戶提供無人駕駛物流服務。
今年年初,圖森未來的無人駕駛卡車還上了“鋼鐵俠”的扮演者小羅伯特·唐尼主持的科技聚集劇集《The Age of A.I.》(《AI時代》),在劇中不僅順利完成無人駕駛的行駛任務,還與圍追堵截的攝像車“鬥智鬥勇”,在攝像車各種找拍攝角度的情況下,自動自我調整,化險為夷,避讓既禮貌又安全。
國內方面,2018年 10月,圖森未來拿到國內第一張針對無人駕駛卡車在公開道路測試的測試牌照。依託上海市政府的政策支持,以及臨港片區真實場景的需求,圖森未來的無人駕駛卡車已經在東海大橋上進行了長時間的測試,截至2020年7月,累計測試里程已超過5萬公里,具備了在東海大橋上不需要接管的無人駕駛能力。
在北京,圖森未來攜手北汽福田、首發集團等合作伙伴,實現了在京禮高速(延崇北京段)總長14公里(包括9.8公里連續特長隧道群路段)的三車無人駕駛隊列跟弛測試,順利完成中國首次高速公路全封閉環境下、基於C-V2X車路協同技術的隊列跟馳測試工作。
飛天AI加速器提升訓練性能,加速模型迭代
一臺車自動駕駛卡車,兩個星期會產生大約50TB的數據。圖森未來目前有超過70臺卡車在上路,意味著每天有大量的數據產生。為了讓自動駕駛卡車更聰明,就需要不斷地積累更多的真實數據集訓練它目標檢測與物體識別框架的能力。
隨著業務高速發展,迭代越來越快,圖森未來的模型也越來越複雜。每次模型迭代,都需要短時間調度大規模的GPU資源來分佈式地進行模型訓練。
然而,GPU服務器採購成本高,運維複雜,圖森未來不得不投入越來越多的精力到運維工作中;更重要的是,圖森未來發現,隨著所用GPU數量增長,GPU的利用率卻並不高。
為什麼會這樣?理論上來說,GPU卡越多,整體算力越大,但是隨著機器數的增加,不同機器的GPU之間的配合難度會越來越大,單張GPU卡的利用率反而會下降。所以增加了幾十倍的卡的成本,但是性能卻很難隨之線性增長。
阿里雲的飛天AI加速器AIACC團隊,針對圖森未來的場景,在底層針對通訊、計算、時延和帶寬等做了深度優化,將訓練性能提升了將近60%,大大縮短了圖森未來的模型優化時間,加速模型迭代,提高技術門檻。
飛天AI加速器是AIACC業界首個統一加速,Tensorflow、MXNet、Caffe、PyTorch等主流深度學習框架的加速引擎,拿下斯坦福深度學習榜單Dawnbench圖像識別四個世界第一。
Serverless容器,提升仿真測試效率,縮短60%模型測試時間
每次迭代的模型訓練完成之後,圖森未來需要對優化後的模型進行測試。如果每次都要上路測試,成本大、風險高、而且不能驗證各種極端情況。
幸虧,圖森未來有個汽車仿真平臺,模擬在各種環境下(例如:晴天、陰天、雨天、霧霾天、夜晚),模型的處理能力。
這種測試任務依賴開發人員的開發節奏,具有突發、臨時、短期的特徵,並且需要的算力規模非常大,如果包年包月地購買海量算力,則很多時候都處於閒置狀態,需求來了可能算力又不夠用,仿真模擬任務需要排隊完成,影響開發人員的開發效率和模型的迭代速度。
由於圖森未來的整體業務架構早已實現容器化,為這類臨時高峰場景做好了敏捷的業務儲備。通過阿里雲ASK(Alibaba Cloud Serverless Kubernetes)容器服務,圖森未來可以在需要測試的時候,在阿里雲上秒級啟動大規模的容器集群,即刻獲取海量算力,縮短了60%的模型測試時間;完成測試之後迅速釋放算力,避免資源浪費。
阿里雲ASK是Serverless免運維的K8s容器服務,底層使用阿里雲ECI(Elastic Container Instance彈性容器實例)作為容器計算基礎設施,提供高彈性、低成本、免運維的Serverless容器運行環境,免去用戶對容器集群的運維和容量規劃工作,大大節省了圖森未來運維的工作量。
另外,ASK的計費粒度精確到秒,非常適用於仿真計算這類突發的高併發短時任務;針對長期的訓練任務,圖森未來則使用包年包月的ACK(Alibaba Cloud Kubernetes)。通過適用於長短任務的ACK+ASK產品搭配,即提升了圖森未來的資源利用率,又節省了成本。