在開始分析的旅程前,想要先針對整個流程中最重要的「故事」與「敘事」方法來做統整。
最近在閱讀「資料故事時代」這本書,讓我發現自己過去在工作或專題的數據解讀上太過淺薄與充滿偏誤。
這次的分析過程,將會借助受此書啟發的分析注意事項以及敘事架構來處理。
以下來整理/節錄幾點在這本書第五章節【打下資料故事的地基】和第六章節【說故事的技藝】中的內容,希望用自己的文字來梳理後能達到吸收的最佳化:
驗證資料故事基礎
我們處在一個資訊量爆炸的時代,承載過量的資訊時,很常會忽略了資料解釋的正確性。
一昧接受而不經過思考時,便有可能落入一些經過「特別設計」的偏誤資訊。
以近期的選舉議題來舉例,選前的民意調查是不少候選人都會做的,
但是有關注過選前與選後結果的你,是不是曾對於票數與選前支持度落差大而感到疑惑的經驗?
明明選前好像聲勢很大,然而結果卻大相逕庭。
這時就可以退一步來想想,當你是支持A黨派的選民,在接到A黨民調電話時會很樂意回答(有些可能還可愛地守在電話前XD),但是接到B黨的電話時呢?是否還會有上述的現象呢?
另外,電話所針對的年齡層、涵蓋率以及是否表態也會影響最終結果,這就是為何民調常常僅能作為「參考」而不能過度樂觀的原因。
舉個在書中的例子。
在2015年時,一群德國的研究人員得出了「吃巧克力可以減重」的研究成果,並將論文刊載在「國際醫學檔案」中。這個實驗的年齡層包含19~67歲的成人,並分成低碳水組、低碳水+巧克力棒、對照組等,最後的實驗成果是低碳水+黑巧克力的組別體重下降的速度快了10%。
單就上面的敘述,你可能會覺得「沒問題啊?實驗中既包含不同年齡測試者、分了組別,而且又是專家團隊的研究」,但卻忽略了這個實驗究竟有多少人參與(樣本數多寡)?是否有其他外在因素沒被考慮進去?
資料的使用如果用在錯的地方,便有可能造成破壞你的資料故事。
書中指出可以用兩點來驗證自己的資料地基是否穩固: 相關性 和 可信度
1.相關性: 這個資料跟你想解決的問題關聯性高嗎?資料的時效性為何?
2.可信度: 資料的可靠度為何?在資料處理與整理的過程中是否盡量保持數據的純淨
敘事結構
有幸以非本科出身的履歷拿到幾次面試機會,但每次面談完都感到自己在描述過去數據應用經歷與問題點時,是以蠻表面的看法來敘述的,在這本書中也教了幾個敘述資料故事時的可用架構。
從亞里斯多德的劇本(簡單)到神話與寓言的結構(複雜),脫離不了的流程都是「故事設定-見解鋪陳-頓悟時刻-後續步驟」。
本次我將跟著作者也認為較折衷的【弗萊塔克的金字塔】的五個階段來進行分析練習
1.說明
2.鋪陳
3.情節高潮
4.轉弱
5.結論
對於資料故事有興趣的人,很推薦看看這本【資料故事時代】
有機會再將想Highlight的地方分享在接下來的分析文章中
明天見!終於要正式的進入Data的世界了!