大數據

和你談談數據分析報告

前言:
-更多關於數智化轉型、數據中臺內容請加入阿里雲數據中臺交流群—數智俱樂部 (文末掃描二維碼或點此加入

-阿里雲數據中臺官網 https://dp.alibaba.com/index

(作者:數智從業者)

在當今企業紛紛推動數字化運營的背景下,“No Data, No BB”成了職場人的口頭禪。做一份好的數據分析報告,大到成為能否幫助企業做出正確的商業決策,小到成為能否說服老闆獲取業務資源的關鍵因素。因此做出一份高質量的數據分析報告是一個職場人必備的利器。

有人說,數據分析報告,不就是一堆的餅圖、柱狀圖、散點圖放到PPT上嗎?我們嘗試從這個人人習以為常的操作中看看是否有不變的門道。

注:本文中圖表通過“阿里雲 QuickBI”實現,中國首個入選Gartner魔力象限的BI產品

表達主題決定了我們的圖表形式

決定分析報告圖表形式的並不是擁有的數據是什麼,而是你所需要表達的主題是什麼。

圖1和圖2是根據一份相同的數據,展現的2個不同的圖表:
image.png
image.png

上圖可以發現對於相同的數據,因為我們所需表達的主題的差異,也將呈現完全不同的展現方式。圖1表達的主題是爽膚水和沐浴露兩個品類在不同城市的銷量排名,圖2主要表達的主題是在相同城市在兩個不同的品類的銷量差異。

因此在下筆做分析報告之前,先仔細想好自己要表達的主題是什麼。

在進行了完整的分析後,要抵制住把所有向聽眾展示的衝動,而應該把所有注意力集中到需要表達的主題重點上來,因為這些才是聽眾所需要了解的信息。

為了找到我們分析的主題,需要了解分析報告針對的對象。詳細的瞭解聽眾的背景和觀點,並思考清楚我們期望聽眾對我們的看法。在內容上,希望聽眾瞭解什麼,瞭解了以後有什麼行動。瞭解了聽眾和內容後,再確認數據的表達形式,只展現能支持主題的數據。

整篇分析報告要能通過三分鐘說得清楚,每頁報告都能一句話概括清楚。

不要放棄“標題”這個絕佳的位置

有些圖表的標題就和猜謎一樣,例如:公司銷售趨勢、分公司銷售分佈情況。完全沒有指出圖表的重點,公司銷售趨勢是怎麼樣的?分公司銷售分佈又是如何?

別把我們需要強調的重點當做祕密一樣不肯透露,而應該把它放在圖表最前面,減少聽眾誤解的可能性,並讓他們的注意力集中到我們所想強調的數據上。

如下圖,這張圖到底是為了表達全量銷售金額沒有明顯的增長呢?還是為了表達2月份銷售金額斷崖式下跌?還是為了表達其它什麼主題呢。請在標題上明確的告訴聽眾。

image.png

處理“成分對比”的關係

成分對比主要體現在對與一個整體的每個部分的百分比的對比。常常出現“份額”、“百分比”等詞彙。成分對比通常使用餅圖來展現:

image.png

餅圖在使用中建議不超過6個部分,如果超過6個部分,可以把剩餘部分歸類到“其它”項中。另外由於人們看數據習慣順時針看數據,因此可把最重要部分放到12點位置,並用對比度強烈的顏色突出顯示。

餅圖主要在標識單一整體各部分比例,如果需要比較兩個整體的成分時,重點考慮柱狀圖(圖3)。因為如果使用餅圖(圖4)會導致讀者視線需要在不同圖表間來回移動:
image.png
image.png

成分分析可能包括子成分分析,需要把整體的一部分再作為整體進行分析,這時可將餅圖放在開始的地方,百分比的柱狀圖放在後面:
image.png

我們要儘可能少使用餅圖,餅圖佔整體的比例一般不超過5%。儘量不使用3D餅圖或甜甜圈餅圖。永遠記住,圖表只是為了讓我們聽眾更好理解我們的數據,而不是圖表有多與眾不同。

處理“項目間對比”的關係

項目間對比主要是比較不同項目間的情況。常常出現“排名”、“大小”等詞彙。項目間對比通常使用條形圖來展示:
image.png

我們對於條形圖的順序需要深思熟慮,如果天然是有序的則按天然的順序,例如人生階段嬰兒、少年、青年、中年、老年。但是如果沒有這種天然順序,需要考慮什麼順序對於我們數據主題是最有意義的。

根據我們所需要突出的主題,選擇條形圖的排序方式。展現條形圖數值的方式包括刻度尺或在條形圖上顯示數字,可根據情況選擇其中一種方式,但是不要兩處都顯示,多餘容易導致圖形的混亂。同時標識數字時,把小數點後的數值去掉,3%總是比3.1415%容易被聽眾記住。

對於項目間對比有時也會通過柱狀圖來代替,但是條形圖相較於柱狀圖有兩點明細的優勢:第一,減少聽眾與時間序列對比的混淆;第二,條形圖有較大的空間填寫各項目的名稱。

項目間對比,還可以通過背離式條形圖,往往可以形象的將有利與不利的情況分離開來:

image.png

項目間還可能針對一個範圍進行對比,這時可使用範圍條形圖:

image.png

當比較的項目由多個部分組成,可通過堆積條形圖,必須將最重要的成分放在靠近基線的地方,因為只有這部分才可被準確度量:

image.png

處理“時間序列對比”的關係

時間序列對比關心的是隨時間變化的對比。常常出現“變化”、“增長”、“下降”等詞彙。時間序列對比通常使用柱狀圖或折線圖來展示,如果時間點不多時可以使用柱狀圖,如果時間點是很長一段時間範圍使用折線圖更為合適:
image.png

對於折線圖,趨勢線一定要比背景線粗。當存在同一張折線圖存在多條折線時,需要將最關注的線加粗加亮。但是當出現非常多折線時,我們的折線圖就會呈現出“方便麵式”圖表,往往導致圖表混亂。如下圖:

image.png

解決“方便麵式”圖表的方式可通過將折線圖拆分到不同的小的折線圖中,雖然圖表變多了,但是所需要表達的主題也能更加清晰:
image.png

在時間序列對比中,可通過箭頭、線條、陰影等方式強調數據的某一部分,將聽眾的注意力集中到你所期待關注的點上:
image.png

同樣,時間序列對比也可以通過刻度的正負來區分正面情況和負面情況:

image.png

我們常常在時間序列中,可能包括實際值和預計值,可通過將實際值設置為實線,將預計值設置為虛線的方式:
image.png

當一個折線圖的數值,是可通過一個公式生成的,可將公式中的計算因子分別拆分到計算樹中,使聽眾可清晰看到每部分計算因子的變化情況:
image.png

如果只有兩個時間點,可展現兩組數據之間各維度的提升和降低的差異,形成斜率圖,連接的線條可以直觀的感受到提升與降低的程度:
image.png

不同的刻度基線會產出完全相反的數據主題解讀。看以下2張圖,同樣都是對杭州房價的描述:
image.png

同樣的數據,產出的圖表給人截然不同的感覺。那麼我們到底應該如何定義刻度呢。其實關鍵取決於我們對於變化的理解,100塊錢對於房價來說可能微不足道,但是對於動車票價格可能就是至關重要。我們應該選擇一個刻度,能準確反映對變化重要性的理解。如果通過使用不合適的刻度基線來誤導聽眾,只要有辨別能力的聽眾都能發現問題,那麼我們的整套言論和信譽就會被唾棄。

處理“頻率分佈對比”的關係

頻率分佈對比表現的是數據分佈範圍情況。常常出現“範圍”、“密度”、“分佈”等詞彙。頻率分佈對比通常使用柱狀圖或折線圖來展示,當比較範圍數量較多時可使用折線圖,較少時可通過柱狀圖:
image.png

頻率分佈的範圍大小非常重要,既不能太大也不能太小,建議5到20個分組。不同分組的大小應相同,否則會造成數據扭曲。

對於即需要展示頻率分佈,又需要進行項目間對比,可將分佈柱狀圖進行組合,其中一個分佈柱狀圖作為另一個的背景圖:
image.png

處理“相關性對比”的關係

相關性對比表現的是不同變量之間的關係。常常出現“與XX有關”、“隨XX增長”等詞彙。相關性對比通常使用散點圖或雙條形圖來展示。如下圖:

image.png

在雙條形圖中,我們將獨立變量按順序排在左邊,而把對比值放在右邊,如果期望模式與實際模式一致時,右邊的條形圖就會變成左邊的條形圖的鏡像,如下面左圖。當關系不符合預期時,兩組條形圖則會發生偏離,如下面右圖:
image.png
image.png

處理“多重對比”關係

對比可能不僅僅是一種對比關係,有可能是結合上文所說的成分、項目間、時間序列、頻率分佈、相關性對比中的一種或多種組合而成,我們稱之為“多重對比”。例如“銷售額在過去10年內穩步增長,但利潤卻沒有同步增長”,這案例第一部分“銷售額在過去10年內穩步增長”屬於“時間序列對比”,第二部分“但利潤卻沒有同步增長”屬於項目間對比。對於這種情況,我們需要確定哪一種關係是主要的,哪一種是次要的。案例中,第一部分隨時間變化是主要的,而銷售額與利潤項目間對比是次要的,因此最好選擇以時間變化對比的折線圖,併為每一個項目畫一條支線的方式實現,如下圖:

image.png

不僅僅只有圖表

當然,對於數據分析報告,可定量信息我們可以通過圖表構建,但是對於不可定量的信息,我們可以通過一些幾何圖形形成概念性視覺圖像,或通過一些日常事務作視覺比喻。例如說到目標,可以形成高山這樣的視覺圖像。這需要發揮自己的想象力,平時多留意寫優秀的海報廣告,在生活中尋找靈感,在報告中能夠做到與聽眾產生共鳴的效果。

消除認知負荷

聽眾在接受我們分析報告信息時,需要消耗腦力去學習新知識,腦力是有限的,因此需要消除聽眾無關緊要的腦力消耗。造成無關緊要腦力消耗最大的問題就是“雜亂”,因此消除雜亂是數據分析報告需要重點關注的。

通過將文字從原來居中對齊調為左對齊,進行相關的無關數據的淡化的處理,能減少聽眾的認知負荷,把關注點轉移到我們的重點上::

image.png

image.png

通過將網格線消除、標記點消除、金額度量轉換、直接標記數據等手段降低認知負荷,右圖是修改後的圖表:

image.png

通過消除一些干擾,能突出我們所需要表達的重點。所有的數據不是相同重要,消除不需要關注的元素,或將不直接影響內容的元素融入背景。去掉這個東西會有什麼變化?如果不會,那麼就去掉吧。

同時要突出我們需要吸引聽眾實現的地方。在文字中可通過加粗、顏色、斜體、大小、空間隔離、下劃線等手段突出文字關鍵詞。在圖表中主要通過顏色、大小突出需要強調的內容。在使用顏色時需慎重選擇,不能在一張圖中有太多顏色,造成視覺干擾;可以使用顏色的不同飽和度來強調數據;根據分析報告背景,可選擇對於的互補色來做內容的突出強調。

講好分析報告

分析報告做好了,還需要以更好的語言表達方式呈現給聽眾。可以把分析報告當做一個故事來說,能更加引人入勝。

首先對整個背景做設定,接著介紹什麼因素上下文驅動情節的演進,舉例說明發生了什麼樣的衝突,基於這些衝突有哪些假設,再基於這些假設如何做數據驗證,最後通過什麼方式帶來什麼解決方案。

為了保證整個分析報告的邏輯清晰,可以構建類似金字塔的邏輯結構,以某一箇中心論點為塔尖,在其以下分支出不同論點的數據分析支撐。讓聽眾對我們的分析報告有個清晰的邏輯結構。

最後,希望每個職場人都能用數據分析報告打開一個新的天地。廣闊數據天地,大有可為。

工慾善其事必先利其器,BI工具,推薦“QuickBI”,眾多可視化組件拖拖拽拽就完成了,人人都是數據分析師。

數據中臺是企業數智化的新基建,阿里巴巴認為數據中臺是集方法論、工具、組織於一體的,“快”、“準”、“全”、“統”、“通”的智能大數據體系。目前正通過阿里雲數據中臺解決方案對外輸出,包括零售金融互聯網政務等領域,其中核心產品有:

官方站點:
數據中臺官網 https://dp.alibaba.com
數據中臺釘釘群二維碼2.jpg

Leave a Reply

Your email address will not be published. Required fields are marked *