投資中的數據視覺化:致我們那嗜圖如命的大腦

作者:陳達美股投資   |   2017 / 04 / 09

文章來源:雪球   |   圖片來源:Jayroz


這兩天利用了一些“碎片化的時間”,讀了耶魯教授 Edward Tufte 的小冊子《圖表設計的現代主義革命 (The Visual Display of Quantitative Information)》,感覺搞金融投資的平常難免與大量的數據和圖表相愛相殺,分享一些讀書心得給大家開開眼界,內容很輕鬆。

首先我們先要下一個重要的結論,人類的大腦嗜圖如命,但其實對數據很無感。所以好的數據視覺化過程會將我們對數據的無感轉化為我們對圖象的有感。一個很有意思的例子就是安斯庫姆四重奏 (Anscombe’s quartet) 。

投資中的數據視覺化致 我們那嗜圖如命的大腦-04

上面是一二三四,四組數據,每一組數據都包括了 11 個 XY 坐標軸上的點。比如第一組數據包括了 (x=10,y=8.04)、(x=8,y=6.95)、…、 (x=5, y=5.68) 十一個點。首先大家一看這些數據肯定暈,這很自然,把一大堆數據赤裸裸地喂給你,我們的腦子是不吃的。但是沒關係,睿智的統計學家們這個時候會扛著一把大尺子進來,然後告訴你這四組數據統統展現出如下的性質:

投資中的數據視覺化致 我們那嗜圖如命的大腦-05

於是你一看,這些數據表現的關鍵統計量都一模一樣啊,那這幾組都是差不多的數據嘛。大家都共享同一個回歸線性方程 (y=3.00+0.5x) ,如同遠去的列車穿梭而過那一片寧靜的霓虹啊。同一個世界,同一根歸線。

於是我們向統計學家致敬,並下了如此的結論:這幾組數據都是一樣的。

而事實上,如果我們把這幾個點在坐標軸上畫出來……

投資中的數據視覺化致 我們那嗜圖如命的大腦-06

……你就會發現生活欺騙了你。

這個生動的例子說明,在這個連賣個粽子、剃個頭都要講大數據的時代,很多數據必須要用視覺化的方式呈現,不然你根本把握不住這些數據的意義,哪怕我把所有的統計量都給你算出來。

一張好圖是可以救命的,甚至可以普度蒼生

1854 年倫敦爆發霍亂,短時間內數百人因之喪命。那時候人們其實並不知道霍亂的傳播機理,沒有細菌的概念,還以為霍亂乃是吸霾所致;那既然是吸霾,就只能聽天由命。有一個叫 John Snow 的醫生開始對吸霾論表示懷疑,他認為更大的可能是水裡有毒。然後 Snow 醫生就明察暗訪,收集了大量死者的死亡位置數據,並發揚了數據視覺化的精神,把所有的點數據都投射到倫敦的地圖之上;另外他把倫敦的七個主要水泵的位置也用“X”標了上去。

投資中的數據視覺化致 我們那嗜圖如命的大腦-07

數據視覺化會讓一些原本撲朔迷離的關聯瞬間變得明如星漢。Snow 醫生張開明亮的大眼睛這麼一瞅就發現,同志們這陣亡得好有規律。基本上大量死者都是密佈在城中心的寬街 (Broad Street) 周圍,而寬街上正好有一個方圓 X 裡以內唯一的水泵。洞悉真相的 Snow 醫生趕緊通知政府關掉了那個水泵,疫情立馬就停了,萬千蒼生得以倖免。

當然你也可以把這些點數據用經緯度量化出來,再編一個誰知道長什麼樣子的程序去運算,再加一點運氣最後你可能也還是能把那個水泵給算出來;但是在這個例子中,什麼方法可能都不如將數據視覺化,然後通過我們嗜圖如命的大腦去解出最終的謎底。

然而也正是由於我們的大腦嗜圖如命,在投資和生活中我們一定要警惕那些充滿了惡意要來蒙你的壞圖。

首先古諺有云:“如果你吃進去垃圾,那麼你拉出來的必然也是垃圾” (garbage in garbage out) 。所以無論你的視覺圖多麼婷婷裊裊,如果你的數據本身是垃圾或者別有用心,那麼出來的圖肯定也是垃圾或者別有用心。

以下是 1929 年紐約與倫敦股市的走勢圖,但是中間混進了一個奇怪的東西 — 太陽輻射熱量 (solar radiation) 。這張圖要傳遞的意思是太陽輻射導致了 1929 年股市的起伏與最終的大崩潰。當然明眼人一看就知道這是假的,相關性不代表因果性 (correlation does not imply causation)。所以當本身數據就有巨大缺陷時,你的圖肯定不善良。

投資中的數據視覺化致 我們那嗜圖如命的大腦-08

但有的時候數據是好好的數據,卻被人惡意地用視覺化來呈現。舉幾個最常見的把你當成傻子的壞圖典型吧。

一、

比如市面上有一個基金,叫小達基金,另外在業內還有小魑、小魅、小魍、小魎四個同風格同規模的基金,乃是小達基金的直接競爭對手。一年下來由於鴻運當頭, 小達基金當年收益率略壓群芳,這五個基金收益率分別是 8.27%、 8.01%、 8.12%、 7.98% 和 8.07%。

然後小達基金的經理就叫手下去做宣傳材料,必須要在投資者報告裡吹噓一波當年的表現,結果手下做了這麼一個圖表:

投資中的數據視覺化致 我們那嗜圖如命的大腦-09

一看此圖經理龍顏大怒,這是什麼玩意你要我怎麼誇大?來人啊把這幫廢物拉出去斃了,順便再去請師爺。

師爺徐徐而來,他老人家搞了這麼一個圖表。

投資中的數據視覺化致 我們那嗜圖如命的大腦-10

師爺大獲全勝。

惡圖蒙你第一招:Y 坐標不從零開始,故意使差距戲劇化。

二、

經理想了想投資者報告上還要放一張基金規模對比圖。當時小達、小魑、小魅、小魍、小魎五個基金的規模分別是 2 億、2.2 億、1.9 億、2.2 億和 2.1 億,小達排名倒數第二,看起來不大理想。經理又喚來了剛剛槍斃過的那幾個,讓他們畫圓餅圖,於是這幫人就畫了這張很自然的大餅:

投資中的數據視覺化致 我們那嗜圖如命的大腦-11

這張圖除了餅夠大以外實在乏善可陳,還有什麼可說的,直接再斃了請師爺吧。師爺再次奉上傑作:

投資中的數據視覺化致 我們那嗜圖如命的大腦-12

3D 圖由於構圖使用透視法,近大遠小,因此在前面的內容哪怕本身數字不大,體積也會顯得很大。

惡圖蒙你第二招:以炫酷的 3D 圖來製造視覺假象 (大家尤其要提防 3D 餅圖,此乃是製圖界的安隆) 。

三、

倚靠上面那兩張神圖,小達基金在投資者報告會上收穫了掌聲,在接下來的一年裡小達基金再接再厲,取得了-20% 的一塌糊塗的表現,而魑魅魍魎四對手當年分別斬獲了 11%、12%、13%、14%的收益率。這就很尷尬了,如果繼續讓那幫人做圖,一定會出現以下這副慘像:

投資中的數據視覺化致 我們那嗜圖如命的大腦-13

但是我們有師爺智多星啊,來一招偷天換日。

投資中的數據視覺化致 我們那嗜圖如命的大腦-14

如果你浮光掠影地一看,還以為小達基金當年獨領風騷,在同行一片蕭瑟的時候搞出了社會主義建設的新高度。但你仔細一看 Y 坐標從上而下的排列就要會心一笑。你可能要疑惑人會那麼傻不看數字只看圖嗎?我出於經驗主義的回答是:會的。如此的不利局面師爺都可以挽狂瀾於既倒,此處應當有掌聲。

另外這裡也體現了識別惡圖的一項原則:一個圖越花俏,越有可能是企圖要掩蓋某一些原始的訊息。

惡圖蒙你第三招:不按常理出牌,偷換既定的數據呈現規則。

四、

由於基金經理投資風格比較激進狂野,小達基金每年的表現呈現兩極分化,收益率變化也跟著非常狂野。

投資中的數據視覺化致 我們那嗜圖如命的大腦-15

這樣投資者看到了歷史表現就會陡生狐疑:你這狀態好像有點不穩定啊,那我投資你的基金豈不是在押大小。所以狡猾的我們應該一下撕掉上面的圖,而讓土豪金主們看到下面這張:

投資中的數據視覺化致 我們那嗜圖如命的大腦-16

惡圖蒙你第四招:擅變坐標刻度,呈現戲劇化 (或極為平穩) 的波動。

五、

我們假設小達基金洗心革面煥發了生機,終於開始不虧錢了,從 2017 年到 2021 年的五年中,每年的收益率分別為 10%、8%、6%、4%、2%,雖然一直在賺錢,但是頽勢非常明顯。所以如果用一般的圖來表達,肯定讓人看了想死。

投資中的數據視覺化致 我們那嗜圖如命的大腦-17

但如果用師爺親手特製的累積收益率 (cumulative return) 圖,一切看起來就將很美。

投資中的數據視覺化致 我們那嗜圖如命的大腦-18

你會說這不是騙人嘛。但是其實人家已經清楚告訴你這個基金收益率是累積收益率啦,你仔細地看是能看出來的。

惡圖蒙你第五招:以累積成長替代成長,以試圖掩蓋成長頽勢的慘像。

六 、

終於到了 202X 年,風水輪流轉,絶境中的小達基金由於豪賭朝鮮主權債務違約成功  (其實基金表現一般都有一個均值回歸的趨勢) ,在該年一雪前恥揚眉吐氣地拿下了 80% 的收益,同年魑魅魍魎四弟兄收益率都不及 5%,於是你想,這張圖太好辦啦,那幫廢物來搞就可以了。

投資中的數據視覺化致 我們那嗜圖如命的大腦-19

但如果你覺這就夠好了,那未免有一些傻白甜。請看師爺的匠心修改:

投資中的數據視覺化致 我們那嗜圖如命的大腦-20

惡圖蒙你第六招:故意將一維數據 (比如收益率高低) 轉換為二維圖象 (比如一個財神) ,以不恰當的比例來突出自己與其他對比對象的差距 (本來只是長度差別,現在變成了體積差別) ,造成視覺衝擊。

那麼與這些惡圖相比,什麼樣的圖是好圖呢?

Edward Tufte 教授認為,很簡單,好圖與好翻譯一樣,應該做到三個標準:信、達、雅。簡單地說就是 1. 真實地表達豐富的數據,避免扭曲數據 (avoid distorting data) ;2. 目的清晰,發人深省,激發觀察者去比較不同的數據內容 (serve a clear purpose and encourage the eye to compare) ;3. 有美感 (aesthetic) ,當然與 1 和 2 相比,此標準居次席。

教授認為在人類歷史的長河中,有一張好圖真正達到了“一圖抵萬言”的至臻境界,一張好圖的訊息量可以抵得上一本書,但閲讀她卻只需要花掉你一點點的時間。

投資中的數據視覺化致 我們那嗜圖如命的大腦-21

首先,這是一張難得的將空間與時間完美交織的時間地圖。你肯定見過很多時間序列圖 (最常見的就是股價走勢圖) ,你也肯定見過很多地圖,但是把地圖放到時間序列上的奇葩,估計你這輩子見過的應該用一隻手都能數完。

此圖的作者是法國攻城獅 Charles Minard,其描繪了拿破崙去俄羅斯的那一場宿命般的出差。1812 年的這次御駕親征,拿破崙於六月領兵 42 萬人 (史說 61 萬) 入波蘭之境,越過最左邊的涅曼河,然後向東北方的莫斯科突擊。俄軍一路堅壁清野,法軍一路非戰減員 (饑餓與疾病) ,終於九月兵臨莫斯科,在距莫斯科一百多公里的博羅金諾村發生了激戰,雙方共傷亡 6 萬 6500 人,史稱博羅金諾戰役,是人類戰爭史上最血腥的一天。

當法軍進入俄羅斯首都,莫斯科已然是一片焦土上的空城 (聯想到二戰抵抗希特拉,自殘起來真的是挺捨得的) 。結果大家都知道,十月來了 winter is coming,法軍凍成狗,咬咬牙只能撤。然後就是敵軍跟在法軍後面一路踹屁股,尤其是在別列津納河,砲兵一頓狂轟,頓時人間地獄。最後,拿破崙這邊不到一萬人 (史說六萬人) 逃出俄國。

這一張地圖上有六個變數: 法軍的規模、法軍的位置 (橫縱兩個變數) 、法軍的行軍路線、法軍撤軍的時間序列和法軍撤軍時的氣溫。

圖中米色的那一路是拿破崙的進軍路線,下方黑色的那一路是撤軍路線,而線條的寬度表示兵力多寡,我們可以看出拿破崙是如何粗大雄壯地入俄,然後纖細綿軟地出俄。從圖中我們可以看出那一些大戰役大減員,比如在別列津納河,本來僥倖會師的兩股法軍,瞬間又吃一記猛削,軍力驟然變細。

鐵棒磨成鏽花針。

另外圖的下方標註了法軍撤退的時間序列,還有隨之相應的俄羅斯隆冬的氣溫 (攝氏度) 。通過觀看這張圖,我們可以想像出絶望無助的拿破崙軍隊在俄羅斯廣袤的冰原之上掙扎著咆哮嘶吼的窮途末路。請問,哪位歷史家或者小說家能夠在這麼幾個平方釐米上如此細膩地傳遞出如此豐富的訊息?

面對這張神圖,Tufte 教授只能感嘆:這應該是歷史上人類畫過最好的一張統計圖了。

雪球》授權轉載

【延伸閱讀】

喜歡這篇文章?加入你的S夾!

雪球
「雪球」是一個社交投資網絡,它有網頁版(xueqiu.com)和手機客戶端。用戶可以通過雪球:
● 訂閱股票、封基、ETF,全方位收取新聞、公告和用戶討論
● 通過自選股功能查看股票漲跌
● 通過持倉盈虧功能管理個人投資組合
● 和其他投資者實時交流互動
雪球的最新文章
More