大數據

起底滴滴數據科學團隊:面對超複雜線下場景,要數據驅動,但拒絕“唯數據論”

面對疫情這樣的重大社會事件,數據科學團隊能做什麼?

16萬、37987名、1500萬公里,這是滴滴數據科學團隊在醫護車隊項目中交出的答卷。

臘月二十九武漢“封城”,大量醫護人員出行不便,滴滴隨即組建醫護保障車隊,為醫護人員免費提供出行服務,除夕當晚,50輛車投入運營。如今,即使防疫進入常態化,但每次回想起春節期間的醫護車隊項目,滴滴數據科學與智能部高級數據科學總監李偉健還是充滿了感慨。

3個多月的時間裡,共有300多名司機加入武漢醫護車隊,累計為武漢16家醫院近2萬名醫護人員提供了近50萬單服務。而在全國15座城市,共近16萬名司機自願報名加入滴滴醫護車隊,總計服務37987名醫務工作者,行駛總里程超過1500萬公里。

能夠在短時間內組織運營醫護車隊,除了高效的線下能力,滴滴多年來積累的出行數據和團隊用數據解決問題的經驗也很關鍵。李偉健介紹道,醫護車隊上線初期主要依靠工作人員手動匹配,為了提高發單效率,滴滴緊急為醫護人員研發了線上產品,第二天,武漢醫護人員就可以在APP線上發單。
滴滴數據科學與智能部也在第一時間加入,在訂單級別從數據角度針對醫護人員的用車規律和出行場景進行實時分析。比如,他們發現,早上七點是醫務人員的上下班高峰,很多醫生下班後不會回家,而是前往酒店等。

除此之外,對出行高峰、出行熱區等的預判,也能有效幫助業務團隊提前對司機進行調度,更高效地保障醫護人員的出行。整個春節,李偉健都在和同事一起,在相對較小樣本的環境下輸出了大量分析結果,有效地支撐著醫護車隊項目決策的快速迭代。
滴滴線下防疫點工作人員在對車輛進行消毒

海量數據背後,是滴滴數據科學體系的支持和承接,在大數據文摘採訪幾位負責人的過程中,隱藏在滴滴的數據基因也逐漸顯露出來。

數據體系團隊四大模塊,助力業務可持續發展

作為一家老牌互聯網公司,數據思維一直貫穿著滴滴各項業務的發展。

早在出租車時代的各項服務中,滴滴的數據思維就已經顯現,以司乘規模、供需匹配等交易環節為中心,數據分析評估已經覆蓋到了體驗、司乘生態、城市交通安全等眾多場景。

2017年,滴滴正式組建數據科學部,他們的目標是用數據為滴滴的運營和產品提供洞見,幫助業務在快速的迭代中科學決策,實現“數據驅動”,一方面要重視數據積累,另一方面也要辯證地看待和使用數據。

這對滴滴數據科學團隊的後續發展也起到了一定的影響,在數據科學團隊內部,奉行著這樣一條不成文的規律,先找準業務中最需要利用數據的模塊,在這些領域中體現出數據價值後,再將數據決策擴展到其他業務模塊上去。

也正是秉承著這樣的傳統,滴滴的數據科學家們也天然地和業務部門很是親近。

據滴滴技術副總裁、數據科學與智能部的負責人賴春波介紹道,滴滴的數據體系分為四大模塊,大數據架構、數據平臺、數據治理、數據科學。在職位劃分中,下面三大模塊多為工程師、產品經理、數據開發工程師,數據科學分為數據分析師和數據科學家,他們數量最多,以“嵌入式”的方式,分佈在不同的業務部門中。其中,數據科學團隊,需要在業務形態中實現廣泛的運營智能、產品智能和決策智能,助力業務可持續發展。

數據科學:通過系統的數據挖掘和主動深入的業務分析, 看清業務發展方向和要素,提出策略建議,幫助業務實現用戶價值與商業價值;並通過科學的實驗設計和評估,輔助管理層更快更準確地進行業務決策,保證決策質量;
數據治理(DG):通過系統、管理流程、意識提升等手段,體系化治理全公司數據資產,向前賦能,提高數據使用效率,發揮數據生產力;
數據平臺(DP): 通過工具產品,向前提升生產效率、可靠性和可擴展性;
大數據架構(Dinf): 構建穩定可靠、低成本、高性能的大數據基礎設施,賦能業務。

2017年首份《頂級數據團隊建設全景報告》調研瞭解,頂級數據團隊一般具有相似的特徵:所在組織或機構數據驅動戰略明確,數據團隊運作高效;高層需要設置清晰的數據團隊建設目標並將數據納入決策流程;數據團隊的高效運作則需要優秀的團隊領導、合理的組織架構和多樣化的人才。

高層中心化的數據指導部門對於一家公司的數據科學團隊建設的效用顯而易見,包括聯想集團、瓜子二手車等公司,都設置有中心化的組織,統一領導公司數據化運營。

滴滴也不例外。根據賴春波介紹,由於滴滴有網約車、車主服務、兩輪車、代駕、出租車等多個業務群,滴滴的數據科學家也就很自然地分散在不同的業務部門裡。為了能更全面準確賦能業務,滴滴組建了數據科學委員會,增強跨業務數據科學家間的交流和協作,同時對複雜問題進行決策,迭代數據體系建設。

與瓜子二手車的“技術委員會”不同的是,滴滴的數據科學委員會成員佔比最多的是數據分析師,他們每季度開會一次,主要針對公司的規劃服務和長期定位等進行商討。

而這些例行會議並不只是技術交流。畢竟除了技術能力和批判性思考的能力外,一個好的數據分析師還需要足夠的商業能力、戰略視野、影響力、領導力和同理心等素養,每次會議也不可避免地涉及到相關領域的討論。

“分析師需要把自己腦袋的東西放到別人腦袋,是靠嘴吃飯的。”賴春波笑稱。

不過要想真正提升產品、運營和決策的智能化,只靠一張嘴是遠遠不夠的。賴春波介紹,數據科學團隊每週會產出四五十份的專題分析研究和每週幾千次的實驗和評估,這些都隨時可能影響到公司決策。前者會呈金字塔式排列,最頂端的體系化和方向性研究是真正實現輔助戰略的決策智能,投入的精力也更多;後者主要針對業務或產品的方案進行評估,相對更加自動化和流程化。

構建智慧交通,數據共建共享很關鍵

如今,滴滴已經成為國內最大的一站式移動出行服務平臺,每天處理的數據量高達4875TB。但滴滴想做的還遠不止於此。賴春波說,滴滴希望能幫助構建智慧城市,在交通汽車產業做得更好。

要實現這個目標,僅靠滴滴內部數據是不夠的,需要從更大的社會維度進行數據的共建共享。據介紹,滴滴正攜手國家預警信息發佈中心、各地交通管理部門以及行業合作伙伴,進一步豐富平臺天氣特徵、路網信息,積極鼓勵司機和乘客進行交通上報,加強數據的完善。

也正是得益於與外界的眾多合作,滴滴在二十多個城市基於平臺車輛數據及城市交警卡口、地磁等多元數據,落地了包括智慧信號燈、智慧交通誘導屏、交通信息系統等智慧交通項目。不僅如此,滴滴還向學界免費開放脫敏後的出行場景數據,助力學界更好地進行前沿探索。

從2017年接入ofo,2018年正式託管小藍單車,到上線自有品牌青桔,伴隨著用戶騎行數據的不斷完善,滴滴還與公交集團開展定製公交、實時公交等合作,用戶出行生態就能夠在多維度進行描繪。

但得到數據還只是第一步,全球AI諮詢公司Pactera Edge副總裁Rajeev Sharma在提到數據系統時曾說過這麼一句話,“你面對的,是一個有生命的、會呼吸的系統”。

數據在體系內的應用則更加重要。對供給和需求進行有效預測,並提前進行調度,是提升網約車效率和服務體驗的關鍵。溫度、降水、司乘活動,以及是否是工作日等都會對供需情況產生影響,基於海量數據和機器學習等算法,滴滴也能模擬未來供需和歷史供需、司乘補貼、城市、天氣、節日關係,進而對未來的供需情況進行預測,進而更加精細化地提前進行調度,進一步提升成交率和司乘兩端的出行體驗。

而在安全層面,數據分析也在發揮巨大的價值。 由於疲勞駕駛危害極大,通過大量的分析,自去年6月起,滴滴在《道路交通安全法實施條例》要求的基礎上還上線了防疲勞駕駛的長時策略,司機達到一定計費時長後休息6小時才能上線;之後又進一步在車載錄像設備中設計了疲勞駕駛預警系統,能在設備中自動進行圖像處理與分析,檢測司機的疲勞特徵,在司機進入疲勞狀態前語音提醒司機注意行車通風、及時休息。

相關分析還顯示,不僅僅是在夜間,在凌晨或午後一些其他時段,司機重度疲勞的概率也會更高,為此,滴滴擴大了易疲勞時間段的覆蓋範圍,開始在易疲勞時段對全量司機進行實時的加強提醒,以進一步幫助提升駕駛安全。

依賴數據,但不“唯數據論”

這些工作能夠順利完成,與滴滴內部已形成共識的數據文化思維有密切的關係。實際上,廣受社會關注的安全事件發生後,滴滴還開始在網約車引入“安全派單”,這對數據模型的要求也變得更高。派單系統需要分析評估發單場景可能存在的風險,充分考慮乘客的性別、出行習慣、訂單時間、訂單距離等訂單特徵和司機的駕駛習慣、歷史訂單信息、投訴記錄等服務質量分級,在此前全局派單的基礎上來進一步綜合分析司機和乘客是否合適出行。

賴春波也坦言,安全派單一定程度上可能也會傷害乘客體驗,出現女乘客深夜有時更難打到車的情況,策略還需要不斷調整優化。

也正是有了這樣的案例,對於如今的滴滴來說,數據面臨的問題不在於對“數據驅動”本身的質疑上,而在於當評估業務中一個不可量化的任務時,如何把握好“度”。

交通行業是一個系統工程,很多環節面臨的問題都沒有也沒有任何一個完美的模型可以解決。一邊要千方百計從技術上去做更好的算法,但同時也需要企業更多考慮現實和線下場景的複雜性。

滴滴數據治理和數據平臺部負責人王勇總結稱,“要依賴數據做決策,但不能只依賴數據做決策”。

在他看來,和電商業務不同,滴滴的雙邊交易市場是實時地一對一撮合交易,是處於更加零和博弈的狀態。同時,移動出行的行業滲透率有限,滴滴兼具線上和線下特徵,線下數據顯得十分重要,但行業內專家相對有限,這就需要大家持續探索利用數據進行不斷地試錯迭代,沉澱方法論和戰略視野。

李偉健也表示,正是這些讓滴滴場景裡的實驗和評估等數據科學問題變得更加獨特和有價值。比如當滴滴在乘客端做了實驗優化後,卻發現因為司機端運力被搶奪導致結果不理想。“這裡面有很多有挑戰性的問題,我們也非常歡迎優秀的統計人才加入”。

據介紹,為了更好地將數據文化貫徹到整個公司內部,滴滴數據體系還面向全員開設了以提升數據能力、培養數據思維為目標的能力提升課程,並結合技術分享、訓練營等多樣化方式展開交流。

針對數據科學家,則會在專業技能之外會更側重培養商業理解能力、洞察力和影響力,以進一步提升通用素質和專業技能。在學習互動過程中,加強團隊信任,通過切實案例理解數據驅動,這對每個崗位來說都是必要的。

在數據應用落地上,為了讓數據、業務、工程三方合作更和諧,滴滴成立了data business partner團隊,既要強調客戶意識導向的文化,也要強調價值牽引技術驅動的背景,很多時候只依靠任何一方都是不行的。

在談到對數據人才的期待時,滴滴表示,他們會重點關注以下五個方面:
用戶導向思維,數據發揮價值要跟創造用戶價值聯繫在一起;
認識數據的邊界和侷限性;
要有同理心,數據方雖不直接負責業務,但需要了解彼此目標;
佈道者角色,讓數據文化落地,影響更多人;
敬畏數據安全和隱私。

Leave a Reply

Your email address will not be published. Required fields are marked *