<pre id="co8k0"><cite id="co8k0"></cite></pre><strike id="co8k0"></strike>
  • <acronym id="co8k0"><cite id="co8k0"></cite></acronym>
  • <nav id="co8k0"></nav>
    <input id="co8k0"><em id="co8k0"></em></input>
  • 原來看著數據還有可能被騙啊,現在就教你如何姿勢正確地戳穿那些數據“假象”

    【IT時代網、IT時代周刊銳觀察】當復雜的數據又多又快地撲向我們身邊時,我們簡直被這“亂花漸欲迷人眼”的數據景象蒙蔽了,看著一份份調查數據,好像都是證據確鑿,很難讓人產生懷疑。這些數據真的是客觀的嗎?真的是真實可信的嗎?那可不一定。一旦統計數據被“假包裝”了,我們還真需要一些方法來戳穿這些假象。

    難辨虛實的抽樣

    調查問卷你肯定知道,多半還做過。在統計上,問卷調查屬于抽樣調查。再大規模的抽樣調查,都可能存在著意想不到的“假象”。不妨讓我們穿越到 1936 年的美國,看一個被許多書本都引用過的實例吧。

    1936 年美國總統大選在即,當時一本著名雜志 《文學文摘》 就在讀者中做了一次問卷調查,斷言共和黨的蘭登即將以 57% 對 43% 的絕對優勢大勝民主黨的羅斯福——這可是根據 240 萬份調查問卷得到的結果。這么大規模的調查,如同宣告了蘭登的勝利,可是,最后的結果卻讓人大跌眼鏡:羅斯福以 62% 的支持率成功連任美國總統。出現了這個戲劇性的丑聞后,《文學文摘》業績直接掉落為零,最后竟然倒閉了。

    現在看來,《文學文摘》的調查問卷雖然數量龐大,但是樣本構成大有問題。首先,最可能看到這個調查的是這個雜志的常客,而他們參加調查的動機各有不同。另外,這個話題更能引發人的興趣,有些則只是很少的人關心。這都會導致最終參加調查的人是一個有偏的樣本。結論可能代表了這些人群,卻不能推廣到全體。

    其次,問卷的回收率只有 24% ,忽略那些沒有被回收的問卷就等于是忽略了剩余 760 萬人的意見。《文學文摘》雜志社還通過電話調查的方式對自己的讀者進行了抽樣,但在 1936 年,并不是每一個家庭都能裝得起電話——那些訂閱雜志、用電話的人家往往都是有錢的人,他們并不能代表全美國的選民意見。最終,這些看起來不算起眼的問題對他們的預測結果產生了巨大影響,事情的發展也走向了完全相反的方向。

    暗流涌動的圖表

    為了讓沒有直接接觸數據的人也能直觀地感受到其中的一些信息,人們發明了各種各樣漂亮的統計圖表。但是就是“客觀”的圖表里面也存在著各種各樣的陷阱。

    在制作統計圖表時,一個常用的欺騙手法便是改變統計圖形的坐標尺度,從而改變了整個圖形的陡峭程度。

    當然,還有比拉伸圖表更隱蔽的手法。比如有一組羅坦提亞和美國的木匠平均周收入,如果做成條形圖就會大相徑庭。為了視覺效果,它被做成更形象的卡通圖,這其實暗中改變了人們對這個統計事實的印象。

    圖表的差異隨著大數據可視化的發展會帶來越來越嚴重的“可能性假象”。現在的數據可視化效果越來越多,國內大數據的領軍大數據魔鏡的可視化效果已達到500多種。可以想象,在接下來的幾年內,可視化將是大數據發展的一個重要方向。當這個方向越走越深,可能出現的偏差也可能會增大。

    如何戳穿數據假象”

    既然有了這些很容易讓公眾迷惑的統計假象,那當我們看到各類統計數字時,應該如何判斷它是否客觀呢?

    首先要細心尋找統計中的偏差。比較明顯的是在描述上有意識進行的偏差。比如濫用平均數等帶來的問題:“我們工廠 3000 人,月平均工資有 5000 塊。”看起來比較不錯的待遇,實際上可能是一個月薪 100 萬的老總加上每個月拿著可憐薪水的上千名工人簡單平均起來的結果。同時報道中常常聲稱的“升高”和“下降”并不一定真的如此。在面對類似“這段時間氣溫異常升高,熱浪持續一周導致城市死亡人數激增至 300 人”這樣的標題時,我們往往要小心這里所說的“激增”是否屬實。一個一定規模的城市在一周內有 300 人死亡并不算是異常的數字,而熱浪實際上是一個沒有多少分量的因素。

    其次我們要尋找潛伏著的無意識偏差,這種偏差帶來的結果往往影響更深遠——《文學文摘》就是無意識偏差的受害者。無意識偏差常常會體現在對樣本的選取不注意上。一個超市對50名顧客進行了調查,得出了“ 75% 的人聲稱喜歡喝茶而不是咖啡”的結論,那么我們大可不必去相信這個結論,因為相比起總數來說, 50 個人實在是微不足道的。

    最后我們要注意保持對統計圖示和統計數據的敏感性。圖標會有意無意地通過巧妙設計(比如橫縱軸的尺度問題),從而使得這幅圖凸顯的內容就是作者期望讀者能夠收到的信息。在觀看圖表的時候,我們可以試圖在腦海中想象出與圖像所對應的具體數據。

    我們每天接觸著的數據信息太多,多到大多數都容不得我們細想。但是當我們仔細去觀察的時候,身邊有多少數據是以假亂真的?又有多少數據只是一個“騙局”呢?這還得要多費點心思了。【責任編輯/梁浩】

    來源:IT時代網、IT時代周刊

    IT時代網(關注微信公眾號ITtime2000,定時推送,互動有福利驚喜)所有原創文章版權所有,未經授權,轉載必究。
    創客100創投基金成立于2015年,直通硅谷,專注于TMT領域早期項目投資。LP均來自政府、互聯網IT、傳媒知名企業和個人。創客100創投基金對IT、通信、互聯網、IP等有著自己獨特眼光和豐富的資源。決策快、投資快是創客100基金最顯著的特點。

    相關文章
    原來看著數據還有可能被騙啊,現在就教你如何姿勢正確地戳穿那些數據“假象”

    精彩評論