大數據

網絡安全:步入與AI結合新時代

網絡安全:步入與AI結合新時代

在 2020 支付寶合作伙伴大會上,已有 12 億用戶的支付寶宣佈轉型數字生活開放平臺。海量用戶,還要對外開放,在這背後,需要極強的安全風控能力。但一般人不知道的是,如此重大艱鉅的任務背後,也有著歷屆應屆生的功勞。

應屆生如何參與支付寶安全風控的核心研發?我們找到了支付寶安全部門的資深技術專家王維強,請他給我們做一下介紹。

支付寶安全團隊的數據大牛們

隨著時代發展,業務安全風控逐漸走入人工智能時代,支付寶安全團隊就招募了幾位 Kaggle Grandmaster。

Kaggle 是安東尼·高德布盧姆(Anthony Goldbloom)2010 年在墨爾本創立的,主要為開發商和數據科學家提供舉辦機器學習競賽、託管數據庫、編寫和分享代碼的平臺。該平臺已經吸引了超過 100 萬名數據科學家的關注,可以說是數據科學行業最大的交流平臺。

Kaggle Grandmaster 是在 Kaggle Competitions 平臺上舉辦的比賽中,連續取得非常優異的成績才會獲得的頭銜,可以說是數據科學方面萬里挑一的頂級高手。目前,Kaggle 只有 180 位 Grandmaster。

支付寶安全團隊近幾年陸續招募了三位 Kaggle Grandmaster,他們的強項各不一樣,有的擅長對結構化數據進行特徵挖掘,有的對圖像檢測識別非常精通,還有的對 NLP、深度文本挖掘方面很有研究。

崔世文就是其中的一位,在 2019 年,他和螞蟻的其它幾個小夥伴們組隊,利用業餘時間在 KDD Cup 2019 Regular ML Track 全球競賽中獲得冠軍,這項比賽被譽為數據挖掘界的奧林匹克。

image.png

除此之外,團隊在過去兩年的螞蟻數據挖掘內部賽中連續獲得冠軍。也更是在專業賽道比如 CCL 2019 中國法研杯比賽,獲得了總分第一。

說起如何找到這些高手,王維強直言是機緣巧合。原來團隊裡有同學在 Kaggle平臺上參加比賽交流,通過選手之間的交流知道了圈內的牛人,而支付寶安全團隊也剛好需要這個領域的高手加入,於是伸出了橄欖枝。

對於這些數據大牛來說,選擇是雙向的,他們並不缺乏工作機會,但很多人希望能夠有一個較好的平臺能夠一展所長,或者身邊有牛人可以互相交流學習。

支付寶安全團隊的業務非常有挑戰性,團隊擁有數據科學領域各個方面的人才,橫向學習的氛圍很濃。也正是這些原因,讓這些大牛心甘情願的加入團隊。其中還有一位同學拒掉了外部的高薪 offer 來到螞蟻,因為短期利益不如長期價值。

另外,他們也認可支付寶安全團隊所做的事情,認可支付寶對於用戶和社會的價值,認同支付寶做事情簡單的價值觀,跟一群有情有義的人去做一些有意義的事情。

做安全為何要這麼多數據人才

支付寶安全團隊需要保護 12 億用戶的賬戶和資金安全,責任重大,那麼他們具體需要做哪些事情呢?

業務上來講,安全團隊需要負責建設和維護支付寶賬號體系、資金交易、商家服務的一整套業務安全防控機制。比如用戶的賬號是不是被盜了,某筆交易是不是被詐騙了,交易是否用於違規違禁用途如賭博等,還有如商家行為違反監管規定等,這些都會對支付寶的用戶和資金造成風險,這些風險的管控就是大安全所做的事情。

在與黑產和羊毛黨對抗的過程中,雙方的技術都在不斷升級,業務安全風控也必須應用最新的技術。隨著機器學習開始在數據科學領域大放異彩,做安全的同學也開始利用人工智能來保護業務安全。

具體的手段包括,通過機器學習的算法和模型、與安全策略一起,通過數據挖掘來做風險識別和風險管控,另外也會會涉及到決策優化。

這裡面的技術包括數據挖掘、機器學習、決策優化等等。機器學習很廣泛,像裡邊的集成樹模型,深度學習中的深度文本挖掘,圖像識別,運籌優化,強化學習,對抗機器學習等,在支付寶的安全風控中都會使用到。

至於未來安全風控領域未來的技術趨勢,王維強目前比較關注這些方向:模型可解釋性,知識推理、圖計算、決策優化等。首先模型可解釋性,機器學習算法在業務安全落地對可解釋性要求是非常高的,完全黑盒的模型可能造成不可預料的後果,這在業務安全上不可接受;其次是知識推理,前些年的機器學習通過學習做判斷或預測,但推理比較少,從學習到推理是人工智能下一步的方向;然後是圖計算,過去在解決業務問題時,對關係的描述還是靠人工經驗,做安全需要對關係進行精細化刻畫,因為需要在上億的用戶裡和極少數黑產進行對抗;最後則是決策優化,這說的是更好的平衡用戶的風險和安全感體驗,避免只強調安全而破壞用戶的體驗,而這裡面要做到一個什麼樣的程度,就是決策優化需要做的事情,對一個決策來說需要從很多角度去平衡。

總體上來講,業務安全風控的未來將會更智能化。一方面在基礎技術上,人工智能需要從學習到推理,再發展到強人工智能,才能應對更多更復雜的場景;另一方面,在安全風控場景中,我們需要更精準的去描繪更復雜的關係,從而更好的調整和應對,而這離不開 AI 的助力。

安全團隊需要什麼樣的應屆生

除了上面那些競賽大牛外,還有不少校招應屆生在支付寶安全團隊大展拳腳。

比如,算法工程師王寶坤就是校招進來的,他來自復旦大學,2018 年碩士畢業後加入團隊。他負責的是圖計算、圖表徵等比較前沿的方向,因為在大學的實驗室裡也是做這個方向,所以積累很深,加入團隊後很快的理解業務,主動提議用圖計算做團伙挖掘的場景,並取得了很好的成果。

王維強介紹說,他們希望招募到研究型 + 業務型的綜合性人才。一方面,希望新人在機器學習和大數據分析等方面有比較深入的技術積累,對技術吃的比較透,因為團隊做的是沒人做過的事情,在業界也屬於前沿,所以沒有參考,不能套用別人的方案,別人的算法也不能拿來就用,必須要根據業務做相應的創新,而這隻有對技術十分了解才能做到。

另一方面,因為安全團隊是業務部門裡的技術團隊,市場形勢複雜多變,業務也隨之而快速變化,只有非常快的消化技術並理解業務,才能找到風險類型的算法落地的方案,然後把這些新的技術落地到業務裡,才能拿到結果。

因此,在校生如果今後想從事業務安全風控行業的話,建議深鑽技術,在掌握學校裡的技術基礎課程的同時,也可以去了解當前大數據和機器學習的主流和前沿技術。在實習或者做項目時,要多問幾個為什麼,一方面通過了解項目背景從而更好的理解業務,另一方面瞭解所使用的技術背後的原理,而不是知其然而不知所以然。

Leave a Reply

Your email address will not be published. Required fields are marked *