近日,計算機視覺A類頂級會議CVPR 2020 開幕在即, 由Kaggle承辦的FGVC(Fine-Grained Visual Categorization,細粒度圖像分類)全球挑戰賽結果揭曉,支付寶天筭安全實驗室奪冠,超越全球1316支頂尖計算機視覺團隊。Kaggle是全球最大機器學習平臺。
Kaggle 2020-FGVC挑戰賽官方排名
作為人工智能核心能力,計算機視覺對細粒度圖像分類技術要求越來越高。只有讓機器「看得」更細更準,機器的判斷才能有所突破。細粒度圖像分類針對的是更微觀的物體類別,比如,不僅要識別出它是一隻鳥,還要判斷具體屬於哪一類鳥,識別出車要判斷它的款式等。
細粒度圖像分類是計算機視覺領域極具挑戰的方向。今年,圍繞該方向Kaggle共發起六項任務,支付寶參加其中的患病植物圖像分類。比賽考察AI視覺識別技術對蘋果樹葉子圖片進行不同種類的疾病區分能力,在訓練集1821張圖像和測試集1821張圖像中,完成高精確度的判別。
模型不僅可以準確分類,還能通過熱力圖的方式較為準確地定位到患病區域
世界上有約37萬種植物,不同植物的病因完全不同,但多數植物的病態外觀和特徵卻非常相似。另一方面,採集拍攝中存在姿態、視角、光照、遮擋、背景干擾等影響因素,使分類更加具有難度。
支付寶天筭安全實驗室使用的原創模型,是基於數據增強、知識蒸餾方法,實現在大量信息干擾下進行物體具像化特徵識別,使細粒度識別精度大幅提升。支付寶是比賽中唯一使用知識蒸餾這種深度學習方法的團隊,在最終測試中,支付寶分數達 0.98445,排名第一。
例如,生了病的兩片樹葉,同樣出現了破損孔洞,在傳統模型訓練下,AI最多可以識別出它們都是蘋果樹的樹葉,很難確定兩個孔洞之間的區別,進而給出推斷樹葉究竟得的是哪兩種疾病。而支付寶的AI模型通過明確識別關鍵是孔洞大小、數量、位置,以及周邊是否有斑點,最終快速給出樹葉由於化學藥品濫用造成損傷的判斷。
缺乏標準信息數據導致難以判別的核心痛點,在醫療、金融、客服等領域大量存在,意味著這項技術擁有廣闊的應用空間。在支付寶交易糾紛、資金盜用、醫療保險報銷等場景中,AI團隊已經開始使用該技術方法,快速識別並進行更準確的風險預測,保障用戶需求在安全環境中被滿足。
人工智能是螞蟻集團核心技術引擎之一,研究領域涵蓋NLP、計算機視覺、智能風控、智能營銷、智能資金管理等,並在大規模分佈式機器學習、深度圖學習、多方安全與隱私計算、博弈與對抗智能、多智能體、強化學習等方向取得突破。螞蟻集團首席AI科學家 、達摩院金融智能負責人漆遠帶領的全球化團隊,在深度賦能螞蟻各條業務的同時,相繼在國際人工智能頂級會議NeurIPS、ICML 、AAAI等,發表近60篇高質量論文成果,申報了超200個專利。
作為一家創新型科技公司,螞蟻集團(支付寶母公司)科技戰略進程不斷加速。除AI之外,在區塊鏈、數據庫等領域近期也頻現突破性進展。日前,螞蟻集團將數據庫業務OceanBase升格為獨立公司,未來三年計劃服務全球客戶超萬家;螞蟻區塊鏈的跨鏈技術在獲得專利授權的同時,還被全球最大專業技術組織IEEE認定為國際標準。目前,螞蟻集團員工中,技術人員佔比已經超過63%。