前言:
-更多關於數智化轉型、數據中臺內容請加入阿里雲數據中臺交流群—數智俱樂部 (文末掃描二維碼或點此加入)
-阿里雲數據中臺官網 https://dp.alibaba.com/index
(作者:數智從業者)
在當今企業紛紛推動數字化運營的背景下,“No Data, No BB”成了職場人的口頭禪。做一份好的數據分析報告,大到成為能否幫助企業做出正確的商業決策,小到成為能否說服老闆獲取業務資源的關鍵因素。因此做出一份高質量的數據分析報告是一個職場人必備的利器。
有人說,數據分析報告,不就是一堆的餅圖、柱狀圖、散點圖放到PPT上嗎?我們嘗試從這個人人習以為常的操作中看看是否有不變的門道。
注:本文中圖表通過“阿里雲 QuickBI”實現,中國首個入選Gartner魔力象限的BI產品
表達主題決定了我們的圖表形式
決定分析報告圖表形式的並不是擁有的數據是什麼,而是你所需要表達的主題是什麼。
圖1和圖2是根據一份相同的數據,展現的2個不同的圖表:
上圖可以發現對於相同的數據,因為我們所需表達的主題的差異,也將呈現完全不同的展現方式。圖1表達的主題是爽膚水和沐浴露兩個品類在不同城市的銷量排名,圖2主要表達的主題是在相同城市在兩個不同的品類的銷量差異。
因此在下筆做分析報告之前,先仔細想好自己要表達的主題是什麼。
在進行了完整的分析後,要抵制住把所有向聽眾展示的衝動,而應該把所有注意力集中到需要表達的主題重點上來,因為這些才是聽眾所需要了解的信息。
為了找到我們分析的主題,需要了解分析報告針對的對象。詳細的瞭解聽眾的背景和觀點,並思考清楚我們期望聽眾對我們的看法。在內容上,希望聽眾瞭解什麼,瞭解了以後有什麼行動。瞭解了聽眾和內容後,再確認數據的表達形式,只展現能支持主題的數據。
整篇分析報告要能通過三分鐘說得清楚,每頁報告都能一句話概括清楚。
不要放棄“標題”這個絕佳的位置
有些圖表的標題就和猜謎一樣,例如:公司銷售趨勢、分公司銷售分佈情況。完全沒有指出圖表的重點,公司銷售趨勢是怎麼樣的?分公司銷售分佈又是如何?
別把我們需要強調的重點當做祕密一樣不肯透露,而應該把它放在圖表最前面,減少聽眾誤解的可能性,並讓他們的注意力集中到我們所想強調的數據上。
如下圖,這張圖到底是為了表達全量銷售金額沒有明顯的增長呢?還是為了表達2月份銷售金額斷崖式下跌?還是為了表達其它什麼主題呢。請在標題上明確的告訴聽眾。
處理“成分對比”的關係
成分對比主要體現在對與一個整體的每個部分的百分比的對比。常常出現“份額”、“百分比”等詞彙。成分對比通常使用餅圖來展現:
餅圖在使用中建議不超過6個部分,如果超過6個部分,可以把剩餘部分歸類到“其它”項中。另外由於人們看數據習慣順時針看數據,因此可把最重要部分放到12點位置,並用對比度強烈的顏色突出顯示。
餅圖主要在標識單一整體各部分比例,如果需要比較兩個整體的成分時,重點考慮柱狀圖(圖3)。因為如果使用餅圖(圖4)會導致讀者視線需要在不同圖表間來回移動:
成分分析可能包括子成分分析,需要把整體的一部分再作為整體進行分析,這時可將餅圖放在開始的地方,百分比的柱狀圖放在後面:
我們要儘可能少使用餅圖,餅圖佔整體的比例一般不超過5%。儘量不使用3D餅圖或甜甜圈餅圖。永遠記住,圖表只是為了讓我們聽眾更好理解我們的數據,而不是圖表有多與眾不同。
處理“項目間對比”的關係
項目間對比主要是比較不同項目間的情況。常常出現“排名”、“大小”等詞彙。項目間對比通常使用條形圖來展示:
我們對於條形圖的順序需要深思熟慮,如果天然是有序的則按天然的順序,例如人生階段嬰兒、少年、青年、中年、老年。但是如果沒有這種天然順序,需要考慮什麼順序對於我們數據主題是最有意義的。
根據我們所需要突出的主題,選擇條形圖的排序方式。展現條形圖數值的方式包括刻度尺或在條形圖上顯示數字,可根據情況選擇其中一種方式,但是不要兩處都顯示,多餘容易導致圖形的混亂。同時標識數字時,把小數點後的數值去掉,3%總是比3.1415%容易被聽眾記住。
對於項目間對比有時也會通過柱狀圖來代替,但是條形圖相較於柱狀圖有兩點明細的優勢:第一,減少聽眾與時間序列對比的混淆;第二,條形圖有較大的空間填寫各項目的名稱。
項目間對比,還可以通過背離式條形圖,往往可以形象的將有利與不利的情況分離開來:
項目間還可能針對一個範圍進行對比,這時可使用範圍條形圖:
當比較的項目由多個部分組成,可通過堆積條形圖,必須將最重要的成分放在靠近基線的地方,因為只有這部分才可被準確度量:
處理“時間序列對比”的關係
時間序列對比關心的是隨時間變化的對比。常常出現“變化”、“增長”、“下降”等詞彙。時間序列對比通常使用柱狀圖或折線圖來展示,如果時間點不多時可以使用柱狀圖,如果時間點是很長一段時間範圍使用折線圖更為合適:
對於折線圖,趨勢線一定要比背景線粗。當存在同一張折線圖存在多條折線時,需要將最關注的線加粗加亮。但是當出現非常多折線時,我們的折線圖就會呈現出“方便麵式”圖表,往往導致圖表混亂。如下圖:
解決“方便麵式”圖表的方式可通過將折線圖拆分到不同的小的折線圖中,雖然圖表變多了,但是所需要表達的主題也能更加清晰:
在時間序列對比中,可通過箭頭、線條、陰影等方式強調數據的某一部分,將聽眾的注意力集中到你所期待關注的點上:
同樣,時間序列對比也可以通過刻度的正負來區分正面情況和負面情況:
我們常常在時間序列中,可能包括實際值和預計值,可通過將實際值設置為實線,將預計值設置為虛線的方式:
當一個折線圖的數值,是可通過一個公式生成的,可將公式中的計算因子分別拆分到計算樹中,使聽眾可清晰看到每部分計算因子的變化情況:
如果只有兩個時間點,可展現兩組數據之間各維度的提升和降低的差異,形成斜率圖,連接的線條可以直觀的感受到提升與降低的程度:
不同的刻度基線會產出完全相反的數據主題解讀。看以下2張圖,同樣都是對杭州房價的描述:
同樣的數據,產出的圖表給人截然不同的感覺。那麼我們到底應該如何定義刻度呢。其實關鍵取決於我們對於變化的理解,100塊錢對於房價來說可能微不足道,但是對於動車票價格可能就是至關重要。我們應該選擇一個刻度,能準確反映對變化重要性的理解。如果通過使用不合適的刻度基線來誤導聽眾,只要有辨別能力的聽眾都能發現問題,那麼我們的整套言論和信譽就會被唾棄。
處理“頻率分佈對比”的關係
頻率分佈對比表現的是數據分佈範圍情況。常常出現“範圍”、“密度”、“分佈”等詞彙。頻率分佈對比通常使用柱狀圖或折線圖來展示,當比較範圍數量較多時可使用折線圖,較少時可通過柱狀圖:
頻率分佈的範圍大小非常重要,既不能太大也不能太小,建議5到20個分組。不同分組的大小應相同,否則會造成數據扭曲。
對於即需要展示頻率分佈,又需要進行項目間對比,可將分佈柱狀圖進行組合,其中一個分佈柱狀圖作為另一個的背景圖:
處理“相關性對比”的關係
相關性對比表現的是不同變量之間的關係。常常出現“與XX有關”、“隨XX增長”等詞彙。相關性對比通常使用散點圖或雙條形圖來展示。如下圖:
在雙條形圖中,我們將獨立變量按順序排在左邊,而把對比值放在右邊,如果期望模式與實際模式一致時,右邊的條形圖就會變成左邊的條形圖的鏡像,如下面左圖。當關系不符合預期時,兩組條形圖則會發生偏離,如下面右圖:
處理“多重對比”關係
對比可能不僅僅是一種對比關係,有可能是結合上文所說的成分、項目間、時間序列、頻率分佈、相關性對比中的一種或多種組合而成,我們稱之為“多重對比”。例如“銷售額在過去10年內穩步增長,但利潤卻沒有同步增長”,這案例第一部分“銷售額在過去10年內穩步增長”屬於“時間序列對比”,第二部分“但利潤卻沒有同步增長”屬於項目間對比。對於這種情況,我們需要確定哪一種關係是主要的,哪一種是次要的。案例中,第一部分隨時間變化是主要的,而銷售額與利潤項目間對比是次要的,因此最好選擇以時間變化對比的折線圖,併為每一個項目畫一條支線的方式實現,如下圖:
不僅僅只有圖表
當然,對於數據分析報告,可定量信息我們可以通過圖表構建,但是對於不可定量的信息,我們可以通過一些幾何圖形形成概念性視覺圖像,或通過一些日常事務作視覺比喻。例如說到目標,可以形成高山這樣的視覺圖像。這需要發揮自己的想象力,平時多留意寫優秀的海報廣告,在生活中尋找靈感,在報告中能夠做到與聽眾產生共鳴的效果。
消除認知負荷
聽眾在接受我們分析報告信息時,需要消耗腦力去學習新知識,腦力是有限的,因此需要消除聽眾無關緊要的腦力消耗。造成無關緊要腦力消耗最大的問題就是“雜亂”,因此消除雜亂是數據分析報告需要重點關注的。
通過將文字從原來居中對齊調為左對齊,進行相關的無關數據的淡化的處理,能減少聽眾的認知負荷,把關注點轉移到我們的重點上::
通過將網格線消除、標記點消除、金額度量轉換、直接標記數據等手段降低認知負荷,右圖是修改後的圖表:
通過消除一些干擾,能突出我們所需要表達的重點。所有的數據不是相同重要,消除不需要關注的元素,或將不直接影響內容的元素融入背景。去掉這個東西會有什麼變化?如果不會,那麼就去掉吧。
同時要突出我們需要吸引聽眾實現的地方。在文字中可通過加粗、顏色、斜體、大小、空間隔離、下劃線等手段突出文字關鍵詞。在圖表中主要通過顏色、大小突出需要強調的內容。在使用顏色時需慎重選擇,不能在一張圖中有太多顏色,造成視覺干擾;可以使用顏色的不同飽和度來強調數據;根據分析報告背景,可選擇對於的互補色來做內容的突出強調。
講好分析報告
分析報告做好了,還需要以更好的語言表達方式呈現給聽眾。可以把分析報告當做一個故事來說,能更加引人入勝。
首先對整個背景做設定,接著介紹什麼因素上下文驅動情節的演進,舉例說明發生了什麼樣的衝突,基於這些衝突有哪些假設,再基於這些假設如何做數據驗證,最後通過什麼方式帶來什麼解決方案。
為了保證整個分析報告的邏輯清晰,可以構建類似金字塔的邏輯結構,以某一箇中心論點為塔尖,在其以下分支出不同論點的數據分析支撐。讓聽眾對我們的分析報告有個清晰的邏輯結構。
最後,希望每個職場人都能用數據分析報告打開一個新的天地。廣闊數據天地,大有可為。
工慾善其事必先利其器,BI工具,推薦“QuickBI”,眾多可視化組件拖拖拽拽就完成了,人人都是數據分析師。
數據中臺是企業數智化的新基建,阿里巴巴認為數據中臺是集方法論、工具、組織於一體的,“快”、“準”、“全”、“統”、“通”的智能大數據體系。目前正通過阿里雲數據中臺解決方案對外輸出,包括零售、金融、互聯網、政務等領域,其中核心產品有:
- Dataphin,一站式、智能化的數據構建及管理平臺;
- Quick BI,隨時隨地 智能決策;
- Quick Audience,全方位洞察、全域營銷、智能增長;
- Quick A+, 跨多端全域應用體驗分析及洞察的一站式數據化運營平臺;
官方站點:
數據中臺官網 https://dp.alibaba.com