一、背景及現狀
近些年,國內道路交通及相關設施的基礎建設日新月異。廣大用戶日常出行需求旺盛,對所使用到的電子地圖產品的數據質量和現勢性提出了更高的要求。傳統的地圖數據採集和生產過程,即通過採集設備實地採集後對採集資料進行人工處理的模式,其數據更新慢、加工成本高等問題矛盾日益突顯。
高德地圖憑藉視覺AI和大數據技術優勢引領地圖數據產業變革,通過圖像AI技術從採集資料中直接識別提取各類數據要素,為實現機器代替人的作業模式提供最堅實的技術基礎。
高德地圖通過對現實世界高頻高密度的數據採集,運用圖像視覺AI能力,在海量的採集圖片庫中自動檢測識別並確定出各種交通標誌標線標牌的內容及位置,再通過與歷史資料信息的對比,能快速發現現實世界的變化信息,同時結合強大而專業的數據融合能力,實現100%信息融入,從而構建出高現勢性的全國基礎地圖。
綜上,通過算法、地圖工程的深度技術合作,以及與資料採集、數據生產的業務拉通,搭建一條以圖像識別、位置服務、差分過濾、數據融合等為核心技術的基礎地圖數據生產全自動化產線,從而建立起從真實世界到地圖應用終端,高效高質量的數據信息流水線生產通道。
二、自動化產線的可行性及重點
從圖像物體分類和檢測進展來看,圖像物體的分類和檢測已經有幾十年的歷史,湧現了一系列經典的算法。近些年隨著圖像識別技術特別是深度學習技術的快速發展及GPU計算能力的發展,分類和檢測技術有了極大的提升。
從自動化需要的大數據來看,高德地圖專注地圖數據製作十幾年,積累了覆蓋全國、豐富且準確的數據,加之每天擁有大量採集信息的匯入,這些數據都成為算法訓練天然的樣本池;同時一整套專業化、標準化的地圖生產作業規範為數據融合打下了堅實的理論基礎。
因此,從算法儲備能力、數據和工藝的積累來看,自動化產線搭建具有較強的可行性,其重點圍繞著以下四部分組成:
圖像識別:圖像識別的目標是從輸入圖像中解析出地圖數據相關的現實信息,通過檢測、識別圖片中的交通標誌標線標牌信息,細分其類型,並理解其中的數字和文字,以文本形式表達內容。此外,由於輸入的是連續圖像,單個標誌標線標牌可以在多個圖像上觀察到,因此整合多張圖像中的同一信息,並選擇最合適的圖像作為主圖展示。
位置服務:基於低精度GPS和採集圖像,位置服務推算出自身和場景物體的精確位置,並映射到地圖數據中。其中包括圖像道路理解、標誌位置解析、採集軌跡匹配等核心能力。依據軌跡特性和道路連通性,建立對定位位置、角度、速度等與候選道路關係的匹配概率模型,將軌跡關聯到地圖數據上。通過對多張圖片中場景的理解,給出圖片相對於路口的相對位置,結合地圖道路數據的形態,進一步確定物體的作用位置。
圖像差分和語義過濾:目的是將新採集資料與已有母庫中的數據進行一致性對比,自動將相同的信息進行差分與過濾操作,留下變化的信息。兩者不同之處在於前者是檢測相同位置新一次採集的圖片相對於歷史採集圖片是否有變化,從軌跡和圖像本身的角度對比;後者從數據的角度看圖像識別後內容,對於母庫數據是否有變化,從地圖語義的角度做比較。
基於位置的數據融合:圖像識別的成果,結合位置服務提供的作用位置,獲取到作用道路。通過抽象路口的模型,在該道路或路口做數據融合,即新增或者更新地圖數據。
三、 關鍵技術能力
1.圖像識別
圖像識別主要面臨三大挑戰:一方面場景多樣,類型繁多。待檢測對象種類繁多,如交通標誌標牌、地面引導線、電子眼等。比如正常的方向信息標牌如下圖:
特殊的方向信息牌標牌:
而同類檢測對象的樣式也是繁雜的,國標通用的交通標誌有幾百個類型,而各地也會有一些地方特色的交通標誌,所以需支持定製化檢測識別。常見標牌形狀多樣,三角、圓形、方形、菱形、八邊形等,同時顏色分佈廣泛,如黃色、紅色、藍色、綠色、黑色、白色等,另外,還需要排除自然場景內一些類似交通標誌的標語、廣告牌等,以減少對識別準確率的影響。
另一方面,在自然場景下圖片質量差異巨大,其中很多圖像質量偏低。再加上面臨遮擋、逆光、雨雪天等極端戶外場景。這些在檢測環節都是要重點考慮及解決的問題。
最後,待檢測對象的尺寸差異較大,大如方牌(幾百個像素大小),小如電子眼、交通燈(十幾個像素大小)。而小尺度檢測,辨識度很差,對檢測算法有比較高的要求。
綜上,對於算法能力本身而言,交通標誌檢測實際上是一個多類型的目標檢測任務,主流的方法是基於深度學習的End2End方案,在一個網絡中同時完成檢測與細分類任務。常用的dataset一般是PASCAL VOC(20類)和COCO(90類)等。
根據業務的實際需要,整個方案分為目標檢測與精細分類兩部分組成,目標檢測階段通過Faster-RCNN在圖片中檢測所有的交通標誌,該階段要求極高的召回率和執行速度,相應在準確率方面可以放寬要求;精細分類階段對目標檢測階段得到候選框,然後進行精細分類並濾除噪聲,最終保證極高的召回率和準確率。
2.位置服務
軌跡漂移對位置匹配地圖的準確性一直都是極大的挑戰,一方面平行路、高架場景,尤其是主輔路這種距離1-2個車道的平行路,需要很高的定位精度,常規的GPS定位精度在5-10m,很難達到80%的主輔路識別率。另外基礎地圖數據本身也存在GPS精度問題。
通過規則及隱馬爾科夫模型的學習、推理以及維特比算法等基礎理論以外,合理地抵抗定位漂移問題,是軌跡匹配成功的關鍵。通過對軌跡形態進行學習和總結,找出其規律,建立符合其特性的概率模型,精準地表達匹配建立過程,合理地平衡匹配準確性和抗漂移能力二者之間的關係。另外,通過長軌跡的連通性和圖像識別車道數或道路位置關係,以解決平行路的部分場景的問題。
而對作用道路和作用位置的確定,目前依賴於圖像識別對於路口位置的識別及融合對地圖數據場景的理解和判斷,例如標牌對路或路口的相對位置靠識別本身很難確定,需要融合對數據路網數據特性的理解和判斷,這種判斷比較複雜,人一眼就看明白了,但是機器很難用規則去描述。所以,通過路段中直行、路口中直行及拐彎等場景的分析,對比地圖路段或路口的模型,來確定作業道路,根據不同屬性計算作用位置。
3.圖像差分和語義過濾
圖像差分主要會面臨資料對齊問題,即同一位置的多次採集資料,會受GPS自身精度及因衛星信號遮擋導致的漂移帶來的所在道路判斷偏差的影響。另外,在語義識別上,受自然環境下的環境因素,如遮擋、模糊、陰影、雨雪天氣、視角變化等,會影響後續算法對圖像的深層語義信息(如類型、內容等)的解析。兩種因素的疊加,在多張圖像和語義的一致性比對時,難度就提高了不少。
這方面,算法大幅快速提升了識別和一致性判斷的準確率,以避免錯誤匹配對數據更新的影響。圖像差分分為資料對齊和局部匹配兩部分,資料對齊回答兩次採集圖像是否在同一位置、視角等,通過GPS軌跡粗篩、圖像匹配等手段,判斷兩張圖像的位置關係。局部匹配則需要回答兩個物體是否為同一類型,對於有文本內容的物體,還需要檢測版式、文本的一致性。因此除引入常見的點特徵匹配技術外,也使用了基於深度學習的圖像匹配網絡。對於文本內容部分,藉助OCR能力完成內容的理解和解析,最終判斷兩次採集的內容完全一致性。
4.基於位置的數據融合
由於現實世界的複雜性,地圖生產經驗積累形成了大量標準化地圖數據製作規範,這些都是能合理抽象、準確表達現實世界的無形資產。即便現實路網形態千奇百怪,但都能通過模型進行抽象歸類,建立不同場景下相對通用的地圖數據模型,從而在其上建立沉澱大量的地圖數據處理的工具類和方法,以確保數據自動化融合能力的廣泛使用。
四、總結
高德SD基礎地圖數據生產自動化實現,本質上就是在基礎地圖數據生產過程中,引入圖像AI技術和數據融合技術,結合多年地圖數字化生產作業規範及經驗,創新出一套面向資料的自動化生產線,形成自動化解放人工持續提供高效高質量的地圖數據,以解決地圖供應商生產產線專業化程度高、人工成本大、作業效率低等產線問題,最終滿足廣大用戶出行過程對電子地圖產品數據現勢性的需求。