人工智能的發展
人工智能的發展經歷過三次高峰。第一次高峰產生於五十年代人工智能技術初步興起,第二次熱潮產生於八十年代,其代表為專家系統。目前世界上正在經歷人工智能的第三次發展高峰。前兩次高峰並未給社會帶來預想的翻天覆地的變化,這次的高峰是否會重蹈覆轍,還是會有不同?其實,本次發展高峰有以下4個不同於以往的特點:
1.深度學習:作為人工智能強大的輔助工具,深度學習的出現為很多尚未解決的難題提供瞭解決方法;
2.強大計算:雲計算和芯片算力的提升大大增加了計算機處理數據的能力;
3.海量數據:各行各業中積累的海量數據,為人工智能的應用提供了創造價值的條件;
4.成功案例:搜索引擎、電商推薦、涮臉支付等成功的應用案例為人工智能技術的發展提供了參考。
人工智能產業的快速增長
人工智能產業從2012年前後開始經歷了一段快速發展的時期。2017年及之前全球湧現了8000餘家AI創業公司,活躍的AI創業公司數量較過往增加了14倍。在2017年當中,167家中國AI公司獲得了總計50多億的USD投資。目前絕大多數公司都成立了自己的AI實驗室,試圖通過人工智能技術輔助公司業務發展。
AI之困境
當前AI技術雖然發展的如火如荼,但在技術實際的應用過程中仍然存在營收困難、數據差異大、核心價值難以實現、用戶期望過高等多種問題。
營收問題
如何利用AI技術創造營收是AI企業面臨的首要難題。根據2018年的數據統計,超過90%的AI公司營收都在虧損。公司承接的AI項目定製成本及開發所用人力成本都很高,且項目資金不易迴流,造成了AI項目投入大回報低的缺陷。同時由於各家公司技術差距的不斷縮小,開發AI通用產品所能獲得的回報也在逐漸減少。
實驗室VS真實世界
人工智能技術落地的第二個困境是實驗數據與實際數據的差異巨大。由於公開數據集與真實企業數據之間的巨大差異,企業真實場景中的結果常常不能令人滿意。這使得企業無法正確估量相關技術應用後的效果,大大消減了企業的信心。例如在人臉識別技術的應用中,開發者們的代碼往往可以在著名人臉識別數據集LFW上取得極高的準確率。但當代碼被用在真實場景中時,由於不同使用場景差異很大,代碼也常常不能獲得很好的效果。
另一個例子,人員重識別(Person Re-ID),公開測試數據集與實際應用的區別則更大。相較於公開數據集的數據,真實場景中的人員會穿著不同的衣服,乘坐不同的交通工具並正在進行不同的動作。這些變化都給算法的識別造成了很大的困難,使得算法的準確度大大下降。
成熟的技術VS用戶的需求
成熟的技術與用戶實際需求之間較大的差異是AI技術應用的第三個困境。企業的用戶對AI技術抱有很高的期望,常常寄希望於通過AI解決絕大部分業務問題。實際上AI技術僅能對業務中的某一類問題提供很好的解決方法,並不能解決全部的業務需求。
AI技術和應用成功的關鍵因素
AI技術成功應用的關鍵因素往往在於其能否為企業帶來相應的核心價值。AI技術的價值可以分為以下三個境界。
1.錦上添花:若企業在錦上添花階段投入大量人力物力,往往得不到理想的產出並會造成資源的浪費。
2.雪中送碳:在這個境界中,企業開發的技術能為行業帶來不可替代的價值,為解決某些業務問題提供了良好的解決方法。
3.無中生有:因為某項AI技術的產生,從而衍生出相關的需求與業務。例如,手機的大屏,就是個很好的例子。用於通訊的手機通過技術的發展實現大屏觀看視頻、瀏覽網站、視頻通信等需求,大屏並不是手機的“初衷”,但現在已經成為了手機不可缺少的功能。
大規模人工智能應用場景
阿里巴巴的人工智能技術研發背靠大規模人工智能應用場景,通過解決實際應用場景中出現的問題促進相應AI技術的發展。下圖展示了阿里巴巴中人工智能技術的部分應用場景,下面本文將圍繞其中一些AI技術應用實例進行介紹。
視覺搜索應用場景
目前視覺搜索技術的應用非常廣泛,該技術普遍應用於通用搜索、商品搜素、城市搜索及原料搜索等多個領域之中。下面將以電商中的視覺搜索作為例子,介紹視覺搜索的關鍵技術點。
視覺搜索流程
電商的視覺搜索的流程可以分為6個部分,分別是類目識別、主體檢測、特徵提取、檢索、排序及結果呈現。算法首先對圖片中的商品類別進行識別,將商品正確劃歸到其所屬的類別之下。在類目識別後,通過主體檢測方法將待觀測商品在圖片中標註出來,算法會將商品圖像的像素轉化為可以計算的特徵,商品圖搜搜索引擎對得到的特徵數據與索引中的數據進行特徵的比對及檢索,並對返回的結果進行相似度的排序,最後將經過重排後的商品列表呈現在用戶面前。
特徵學習
特徵學習是視覺搜索中十分關鍵的步驟。基於深度學習的特徵學習方法會在圖片中提取商品的特徵,也就是將圖片轉化成可以比較的向量。深度學習技術的出現提升了特徵學習的效果,通過深度學習的方式,可以設計網絡結構迫使神經網絡將圖像特徵收斂到理想的狀態,從而大大提升搜索算法的準確率和召回率。
索引和搜索系統
索引與搜索系統是視覺搜索中另外兩個大挑戰。如何對向量數據進行搜索是一個難點,較為常見的方法是採用量化方式處理,將圖像的向量特徵轉變為可以索引的數據。在搜索階段,企業搭建相應的搜索系統處理用戶的搜索請求,搜索系統會將索引數據分配至多臺服務器中儲存,並把每個搜索請求分到不同的服務器中進行處理,最後彙總所有的搜索結果進行排序。
技術效果
淘寶App中的拍立淘功能使用視覺搜索技術實現了識別用戶圖片並進行商品檢索的功能。下圖展示了拍立淘功能的效果,可以看到系統檢索出的商品與用戶上傳圖片中的商品基本為同款同型號或類似的產品。淘寶通過這種方式減少了用戶手動搜索商品的時間,大大提高了用戶的購物體驗。
視覺製造應用場景
視覺製造技術可以應用算法制造視覺數據,包括圖像、三維圖形和視頻。該技術通過結合視覺分析、搜索技術,以及視覺製造引擎將用戶的想法轉換為可見的視覺數據。以下為視覺製造技術在不同場景下的應用實例。
AlibabaWood商品頁面秒變視頻
阿里巴巴應用視覺製造技術在淘寶中實現了商品頁面秒變視頻的功能。系統會自動進行商品頁面的圖像分析及文本分析,並將分析得到的數據自動生成視頻。通過將靜態商品頁面轉換為動態播放視頻的形式,增加了該種商品的點擊率與轉化率,同時節省了製作相關視頻所需的成本。
視頻修復增強
使用視覺製造技術還可以實現對低質量視頻的修復。一部1.5小時的老舊電影,傳統手工修復要40天,AI智能修復則只需3個小時。阿里巴巴與優酷聯合上線的“經典高清”專區即通過視頻修復增強方式在極短的時間內對超過1000部經典老片進行自動修復,使影片煥發出了新的生命力。下圖所示為通過該方式對影視劇士兵突擊修復後的效果,曾在電影院高清屏幕上播放,獲得了觀眾的大量好評。
視頻植入:從點位檢測跟蹤到渲染嵌入
通過視頻製造技術可以在視頻中找到合適的位置放入企業的植入廣告。視頻植入技術通過算法解析視頻中的場景,在較為合適的水平或垂直平面或曲面放置企業的廣告並將廣告無縫渲染進場景之中。這種方式幫助企業做宣傳的同時,同時保證了植入廣告的自然度,並且不佔用觀眾的時間,也不破壞視頻內容,不會引起觀看者的反感。下圖所示為視頻植入技術在視頻中的應用效果。
鹿班:自動平面設計
鹿班智能平臺是視覺製造技術的另一應用實例。阿里巴巴設計開發的鹿班智能平臺可以為使用者自動設計平面廣告。使用時,鹿班平臺會整合用戶的文案、圖片及希望的廣告風格,自動生成符合用戶需求的廣告圖片或海報。鹿班平臺可以以本科畢業生的水平每秒製作8000個banners圖。在2017年的雙十一期間,阿里巴巴集團使用鹿班平臺共生成了4.1億個banners圖,增大了雙十一活動的宣傳影響力,併為企業節省了很大的宣傳成本。
鹿班平臺的開發為企業積累了成功的經驗。鹿班這種場景,也就是大批量短時間產生廣告圖的需求,原來是沒有的,因為人力很難實現。但自動設計技術使得這種場景變成可能,從而這項技術也成為大促場景的剛需了。企業認識到AI技術的應用要注重於關注剛性需求,而不是注重於炫酷的技術。新的AI技術可以提升商業創新,商業創新則可以反哺技術上的創新。
視覺診斷
視覺診斷技術為AI技術的另一重要應用,可以分為兩類:診斷人,也就是醫療影像技術;診斷產品或機器,也就是工業視覺技術,特別是質量檢測技術。以下為阿里巴巴集團在視覺診斷方面落地的技術和應用。
智能醫療健康
阿里巴巴的醫療健康AI團隊致力於讓AI技術輔助醫療保健,使醫療分析和健康管理變得更高效、普惠、低成本。數據統計發現在保證人們健康的諸多因素中,保持健康行為對人體健康的收效最高,因素比例高達50%,而目前人們的健康花費卻大多集中在醫療服務方面。醫院ICU往往成為了人們為健康花費最多的場所。如何更有效的保障人們的身體健康?阿里巴巴醫療團隊通過採集人體聽覺、視覺、感知及文本的數據搭建智能健康管理平臺。平臺會對人體數據整合分析,為糖尿病、高血脂、心血管等高危疾病的病人提供預警服務,為使用用戶提供每日健康數據的分析。幫助使用者實時瞭解自己的身體狀況,並通過身體狀況信息隨時調節自己的身體,達到通過促進用戶保持健康行為保障身體健康的效果。
精準的冠狀動脈CTA影像分析
通過深度學習方法及三維圖像檢測方式,CTA影像分析技術可以對心臟冠狀動脈進行非常精細的分割和命名,並對冠狀動脈中出現的狹窄區域及細小的病變斑塊進行識別。通過精準的圖像及深度學習技術可以檢查出病人體內所有細微的病變。
智能骨科:脊柱MRI智能診斷
應用AI技術在骨科中可以進行脊柱結構的提取,對脊柱中錐體和椎間盤進行高精度的分割與測量。同時算法可以輔助醫生進行輔助診療,以細粒度的級別區分退變性疾病,大大提升醫生的診斷效率。
下圖為智能骨科技術在髖膝關節手術測量中的應用示例。算法可以自動標註出關節中特徵點的位置、角度和長度,為醫生實施手術提供可靠的參考。
尋微:醫療健康搜索平臺
通過阿里巴巴搭建的醫療健康搜索平臺,醫生可以在平臺中找到與當前相似的病例信息及醫療影像,通過參考歷史治療記錄及治療經驗更好的診斷病人併為之制定更合理的治療方案。
健康精靈解決方案
阿里巴巴將有關醫療健康知識的數據構建成知識圖譜,儲存到天貓精靈可訪問的數據庫中。用戶通過與天貓精靈對話可以調取數據庫中的信息,天貓精靈會根據知識圖譜為用戶提供改善健康的方案。天貓精靈還可以對用戶健康狀況進行自動的分析管理。
未來健康管理
傳統醫學文化強調治未病,即在人體未生病時便開始對健康干預。阿里巴巴構建的未來健康管理通過認知、判斷、決策、學習四個部分幫助用戶防範健康問題於未然,結合AI醫療的技術為人們的身體健康保駕護航。
新冠肺炎CT影像分析
阿里巴巴AI醫療團隊在2月16日成功上線了針對於新冠肺炎疫情的CT影像分析系統。系統會在20秒內對患者的患新冠肺炎的概率及病區佔肺部的百分比等數據進行分析輸出,預測的準確度高達96%,現已落地160多家定點醫院,經過29萬餘次調用(最新數據),為新冠肺炎的快速確診提供了可靠的幫助。
全基因測序數據分析
阿里巴巴為新冠肺炎設計的全基因測序分析技術在10分鐘內即可完成全部基因組的比對工作,算法通過高達95%的全基因序列覆蓋使得確診的準確度基本上接近100%。由此,將全鏈路的新冠病毒全基因測序從兩三天降低到14小時。
行業視覺診斷
行業視覺診斷技術廣泛應用於電池板、紡織業、大型機械等工業製造過程中的產品質量檢測和故障診斷中,旨在節省人力並提高產品的良品率和設備的精確度與穩定性。以下為行業診斷技術在各行各業中的應用實例。
太陽能電池板瑕疵檢測
針對以往人工檢測太陽能電池板瑕疵消耗時間長、不能全部檢測等問題,阿里巴巴設計實現的太陽能電池板檢測系統可以實現全量電池板的檢測,通過AI技術輔助分析的方式使相關企業檢測效能提升36倍。下圖以準確率、速度與識別顆粒度為指標對人工與AI技術檢測的效果做了對比。相較於人工方式的準確度、速度及識別顆粒度,AI技術均有很大提升。
更多行業視覺檢測
行業視覺檢測技術同時廣泛應用於輸電線路巡檢、食品質檢等多個行業的場景之中,並取得了良好效果。
智能養豬
阿里巴巴創建的智能養豬場使用AI技術可以實時掌握每頭豬的身體狀況。AI技術可以對豬場進行遠程計數,通過對豬的行為與飲食分析瞭解豬的情況,並在必要時對豬的健康報警。
城市大腦
阿里巴巴集團設計實現的城市大腦旨在打通城市中積累的大量數據,通過人工智能分析採集的數據,併為城市提出相應的優化方案。城市大腦應用AI技術與算力相結合,分析城市中的數據,使城市治理和服務數據化、智能化,做到高效、低耗、便捷的管理城市。實現城市在治理模式、服務模式、產業發展上的多方面突破。
下圖為城市大腦的結構示意圖。 城市大腦首先會彙集視頻、GPS、微波等多種類型的數據,並對視頻數據進行分析理解,對數據產生初步的認知。對於已經生成的認知信息,城市大腦會通過AI算法對數據進行分析處理並提出優化決策,優化方案包含且不限於紅綠燈優化、公交優化、事故事件報警等等。通過將城市中的要素放入搜索引擎,系統將會自動進行搜索與數據挖掘,此時系統可以同時進行可疑車搜索、發現交通規律、尋找擁堵原因等多個任務。系統在提供管理優化方案的同時提供數據預測功能,可以根據當前交通狀況、天氣、事件等因素對交通流量、交通事故概率等多方面數據做出預測,並基於預測數據進行相關的干預。
目前阿里巴巴的城市大腦系統已實現30餘個城市或城區60餘個項目的部署,企業開發的城市大腦人工智能開放創新平臺支持十餘家研究機構及第三方廠商的研發與部署。城市大腦系統的6組產品已廣泛應用於交通、平安和市政管理等多個重要領域中。
城市大腦人工智能開放創新平臺
城市大腦人工智能開放創新平臺具有功能全面、使用靈活、實時性高、運行高效及開放性高等五大優點,可以為開發及研究團隊提供安全可靠的AI平臺層的支持。平臺提供的大規模視頻分析處理加速技術可以支持一臺服務器同時處理超過100路視頻,大大的增加了處理視頻數據的效率。
全天候異常事件事故檢測
城市大腦的全天候異常事故檢測功能會將近實時檢測到的城市中的事件事故自動排列在數據大屏上並對發生的事故不斷的更新數據信息,根據事件事故的不同類型,系統自動處理或由交通警察及時進行相關處理。
杭州城市大腦交通態勢/信號燈優化/事件優化
通過阿里巴巴城市大腦提供的交通態勢、信號燈優化,杭州的交通通行效率比以往提升了15.3%,每天系統可報告2萬起事件事故信息,準確度達96%。
杭州城市大腦:特種車優先通行
針對特殊車輛如警車、救護車、救火車等,城市大腦會通過干預信號燈、優化道路交通等方式為該種車輛保駕護航,使特殊車輛可以更快的到達目的地。
城市大腦其他功能
城市大腦同時提供車輛巡檢、高危駕駛行為識別、車流量人流量預測、市政管理及智能安全檢測等多個功能。通過這些功能為城市的發展提供保障。
城市3D重建和4D推理
城市大腦提供的城市3D重建及4D推理功能可以將城市的狀態用實時3D沙盤的方式呈現給用戶,並通過AI技術在3D沙盤上還原城市在不同時刻的運行情況。
在城市大腦的設計實現過程中,阿里巴巴AI團隊通過AI技術創造出不可替代的價值,潛心理解應用場景並打磨產品功能,建立起產品的核心競爭力,最後通過打造平臺建立起生態,實現了從項目到產品再到平臺的演變,為城市的治理、管理提供了有力的技術支撐。
人工智能未來趨勢
今天的人工智能方法論雖有侷限,但各行各業之中有很多問題尚未解決,故人工智能仍有很大的發展空間。對於傳統產業和數字產業,擁抱AI技術才可以更好的發展。對於人工智能的從業者而言,深入理解行業至關重要。對人工智能的商業化而言,需要用技術為客戶創造足夠的價值,否則無法很好的規模化落地。對於每個人來說,人工智能已經開始深入人們生活的方方面面,擁抱AI技術發展帶來的變化不可避免。
人工智能技術到底是風是雲是雨,取決於我們如何看待、研發或使用這些技術。如果不能選擇好的路線,AI可能會如風般不實,如雲般縹緲;若能可以深入研究技術,使用先進的核心技術打造產品,創造不可替代的價值,AI技術便可變成滋潤萬物的春雨,幫助我們走向成功。