大數據

近10年數據智能團隊建設,聯想總結了由內而外的發展經驗 | 專訪聯想集團副總裁田日輝

去年6月,聯想集團公開宣佈,成立數據智能業務集團 (Data Intelligence Business Group,DIBG),由藍燁擔任高級副總裁,直接向楊元慶彙報。同時,聯想集團副總裁田日輝負責數據智能業務集團的產品和生態業務,彙報給藍燁。

在當時寫給數據智能業務集團的內部信中,聯想集團董事長兼首席執行官楊元慶表示,“在大數據積累的基礎上成立聯想數據智能業務集團,是為了加速智能化變革,是實施聯想行業智能(Smart Verticals)戰略的重要舉措。”

這也是一直被外界譽為信息化標杆企業的聯想,向數據智能領域延伸業務的一次重要的商業佈局。

其實聯想內部廣義上的信息化早在2000年左右就開啟了。經過20多年的信息化實踐和積累,聯想目前的大型主系統有上千套,整個公司服務器加起來有上萬臺,數據鏈量級已經達到十幾個PB。

同時,聯想在全球都運營著龐大的上下游生態,在全球兩百多個國家和地區同步進行用戶服務與體系構建,目前有50多家上游企業,2000多家下游渠道企業。

經過一年的發展,聯想數據智能業務集團發展如何?聯想集團的數據平臺構建與數據團隊建設又有怎樣的進展?針對以上問題,上個月,我們對聯想數據智能業務集團產品及生態總經理田日輝先生進行了一次專訪。

三階段數據團隊建設,打造全價值鏈數據智能平臺

在成立數據智能業務集團之前,聯想內部的數據團隊其實已經初具規模,團隊建設也不是一蹴而就的。

自2011年聯想開始應用大數據至今,聯想的數據平臺建設主要可以劃分成三個階段:
第一階段:企業內部先進數據應用建設;
第二階段:在內部和外部構建平臺;
第三個階段:構建上下游企業的數據智能生態。

2011年到2015年是聯想數字團隊建設的起步階段。當時的數據團隊還主要是服務聯想內部拓展數據的應用,因此數據團隊的規模很小,只有十幾個人,四年後慢慢擴展到一百多人。

田日輝告訴我們,當時團隊研發中國第一款安卓系統手機樂phone,通過應用商店、SBK模擬器、開發環境與數據分析工具等來構建一套大數據體系,進而幫助應用商店開發者收集相關使用數據。聯想的數據團隊最早就是從此入手,幫助應用商店的開發者分析月活、日活與產品質量等數據,持續不斷優化這些智能應用。

田日輝表示,在初期內部硬件的生產上,聯想就對於信息化比較重視,是國內首批使用ERP的企業之一,因為自2004年收購IBM 的PC業務後,全球化運作對信息系統的要求較高,IBM原本的很多系統被逐漸廢掉,聯想也構建了自有系統,提升效率。

之後隨著這些應用的深入,大數據不僅能在應用層對產品提供優化,企業內部大量的運營數據,對企業產品研發、供應鏈管理、市場營銷還有很多影響,使得數據應用可以擴展到整個延產供銷服務全價值鏈。

2016年到2019年下半年,聯想開始進入了數據團隊建設的第二階段,開始把數據應用大規模進行平臺化和推廣,並開始將能力對外輸出,拓展給外部用戶,並在公司內部構建平臺。

這一階段,聯想開始有計劃的建設全公司“人人都能使用”的數據平臺,“這個過程中,公司內部核心策略就是人人都是分析師。”

田日輝提到,數據團隊負責建平臺,把核心數據和公用數據幫用戶整理好;業務人員(IT部門、業務部門等)完成平臺分析工作,大量人員參與進來,使得業務經驗能夠與數據分析方法更好結合起來,以自服務式應用致力於解決數據科學家缺失的難題。數據團隊開發平臺性產品之後,在公司內部先部署與使用,比較成熟之後,再服務外部客戶(汽車、石化、鋼鐵等企業)。外部客戶因為和與內部的應用模式有所不同,有很多創新的需求和應用點,通過反饋去優化產品,增加內部應用平臺的功能特性,並建立內外部互動模式。

而到了現在,聯想數據團隊建設已經進入了構建生態化階段。聯想所處的行業生態鏈中,上下游企業都處於數據智能轉型時期,聯想數據團隊現在已經構建了上下游合作伙伴都能利用的智能化應用平臺。平臺除了提供算法工具之外,還預置了多年積累的分析數據模型,包括預測、倉儲優化、用戶畫像、精準營銷等,使合作伙伴能夠很快地使用,把數據與業務模型對接,實現業務價值閉環。上下游企業可以選擇用聯想平臺去做智能化軟件,也可以使用聯想的產品構建私有平臺。下游大量中小型製造業企業受限於信息化成本,在數字化轉型過程面臨很多挑戰,建立生態系統可以使其直接使用經過實踐驗證的平臺。

聯想希望在對外服務的同時,也能夠建立起生態系統,服務更多的尤其是中小企業客戶,推動中國智能製造快速轉型。

內外部數據治理結合,優化數據平臺結構

細數數據團隊建設的三個階段,田日輝對第二個階段的印象最為深刻。

和很多業務部門較多的集團型企業一樣,業務規模如此龐大的聯想也面臨著數據分散在不同的業務系統中,難以整合的痛點。數據團隊建設在初具規模之後的最重要任務,就是建立起一個更完善的企業級數據分析平臺,把這些內部分散的數據以集中的方式進行整合管理併科學地利用起來。

正如上文提到,聯想注重業務與數據團隊的緊密結合,內部的數據團隊與不同業務部門分工合作。因此從2016年開始,聯想就開始把聯想幾十年信息化中的大小數據系統整合起來,形成企業整體數據湖,並構建統一的數據模型。

數據團隊在中央提供分析算法工具,積累推廣模型,提供複雜建模過程的二線幫助並舉辦培訓活動,輔助業務部門採取自助式的服務。

田日輝給我們舉了個銷量預測的例子,說明聯想數據智能團隊內部是如何使用內部流程化工具為業務部門提供輔助的。

聯想生產銷售各種複雜的設備,因此銷量預測是多層次的,總銷量預測會分不同地區和不同產品線。在不斷發展中,數據團隊把預測模型放到平臺上,通過幾輪配型後,進行模型積累。平臺本身提供很多分析和算法工具,使業務人員運用不同的數據級,使用自動化機器學習工具測試不同的算法,並給出最優結果,同時根據業務實踐來判斷哪個參數和配置最符合要求。

由於相關數據表極其龐大,可能會存在一些數據衝突,因此公司級大平臺可以進行統一數據治理,讓所有人的分析工作達到比較好的效果。

要做一個有效的預測或者優化,數據鏈,尤其數據的廣度是非常關鍵的,因此聯想也引入了很多外部數據。在內部平臺建設的同時,聯想接入大量外部數據進行合作。合作的供應商、市場預測部門、客戶滿意度調查,各種產品質量反饋等數據都會作為外部數據彙總進來。

內部的數據平臺建設逐漸成熟後,聯想的數據團隊也開始將數據能力輸出給提供商與服務提供商,更需要深入理解客戶業務和機理模型。

對於外部行業客戶,聯想內部的數據科學家在專業知識理解方面相對薄弱。在進入行業初期,團隊與客戶的行業專家一起做項目,客戶對企業的數據積累情況與行業的機理模型更清楚,而團隊對數據與算法比較清楚。漸漸,客戶本身會具備數據使用能力,團隊也會積累一些所謂的行業專家,進而把應用模型帶給其他客戶。由於很多案例和應用框架可以複用,團隊也一直在嘗試加強對行業的理解,建立一些行業專家人才隊伍。

因此,田日輝對於意向進入數據科學領域的高校學生,也提出了一些行業知識的期待。

“掌握新技術有較好的基礎,且自學能力與使用能力強。但是應該更多理解企業的運營模式,業務需求和機理模型,多參加一些真正與實戰相結合的活動,或到企業裡面參與一些實際的工作與項目。”

明確團隊績效指標,“不是一件難事”

很多團隊關心數據團隊本身的商業影響力及其產生的價值,相比一些傳統的部門,數據團隊的價值比較難估計與量化。

但在聯想內部,估算產出投入與價值卻並不是一個很困難的事情。

田日輝提到,由於在第二階段建設了全集團統一的數據平臺,只需要瞭解公司內外對於數據平臺的調用有多少,並且在平臺內的操作幫助業務部門創造了多少價值即可。

具體來說,團隊關鍵KPI有用戶數,產生的價值量等。由於最終的應用由業務部門完成,完成這個項目後,它的質量提升了多少,它的預測精準度提高了多少,意味著多少業務價值,都是很明顯的。

到了第三階段,對於上下游企業來說,外部企業客戶最直接的價值就是其購買產品與服務花費的數額,且客戶對於投入產出比的敏感性,這個指標也是很容易衡量的。

舉個例子,2017年底聯想開始與中國頂尖的石化企業合作,一起做催化裂化裝置的工藝參數優化。最後聯想的投入是客戶出資的五六倍,但是團隊也樂於與跟客戶一起,把石化行業的標杆客戶拿下,這件事對企業有非常大的業務價值,且這類價值比較容易衡量。

今年的疫情期間,雖然全球經濟都受到了影響,但是田日輝的團隊並沒有改變原有的發展路線圖和考核標準。

田日輝告訴我們,從用戶使用的角度來說,雲模式的產品無論從分析還是從報表各方面,基本上沒有太大的影響。中央的數據團隊雖然在家裡遠程辦公,數據用戶也在家裡辦公,但是整個平臺運轉還是很正常。

疫情對團隊業務本身供應鏈會有一些影響,即用戶的需求。由於疫情影響,客戶對聯想的產品,無論是業內產品還是雲服務的產品,以及數據智能轉型服務這些產品的需求,都是有所提升的。聯想的私有云給外部客戶提供的服務略有影響,體現在團隊幫助客戶來構建私有云之後,在建設初期,需要做用戶訪談和數據治理,和雲業務部門有比較多的溝通,這些項目會受一定的影響,但是比例不是很大。在面對疫情等重大社會事件下的經濟現狀中,田日輝也希望團隊保持積極心態,推定數據平臺與服務升級,尋求穩定發展。

Leave a Reply

Your email address will not be published. Required fields are marked *