本文作者翁偉基(Michael Yung),為數據素養協會資深創會會員
數據是石油,還是原油?2006 年,英國數學家 Clive Humby 創造了「數據是新的石油。(Data is the new oil)」這句說話。
由於某些原因,這句說話被人扭曲了,譬如著名的《Wired.com》就發表過:「二十一世紀的數據就像十八世紀的石油 — 一種尚未開發的、極其寶貴的資產,就像石油一樣,對於那些看到數據的基本價值並學會提取和使用它的人來說,將會有巨大的回報。」
換句話說,它表明我們的數據就像一口噴湧的油井,我們應該在從數據中流出的利潤中分一杯羹。這本來沒有什麼錯,但 Humby 先生真正想說的是「數據,就像 Crude Oil/原油一樣,必須經過提煉和轉化才能變成有用的產品和服務。只有這樣,它才變得有價值」。
換句話說,數據是必須經過處理和分析才能有價值。擁有數據並不是關鍵,每間公司都有大量的數據。然而,關鍵在於你是否已經將你的數據轉化為信息、知識、見解,並最終令公司交付出更優秀的產品及服務。
數據又是水嗎?
1971 年,李小龍在有參與演出的美國電視劇《Longstreet》內,對劇中男主角 Michael Longstreet 說了一段話,翻譯成中文後,大意是:「放空你的思想,變得無形。無形,就像水。如果你把水放進一個杯子,它就變成那個杯子。你把水放進一個瓶子,它就變成那個瓶子。你把它放在一個茶壺裡,它就變成那個茶壺。現在,水可以流動,也可以崩潰。朋友,你要成為水。」
其實,數據亦都像水一樣,也是可以無形的。如果你把數據放進一個列表(List),它就變成那一個列表。你把數據放進一個績效儀表板(Performance Dashboard),它就變成那個績效儀表板。你把它放在一個數據倉庫裡(Data Warehouse),它就變成那個數據倉庫。所以,數據亦都是可以流動,是可以多型態的。
數據亦都像水一樣,也是可以無形的。
那麼,數據會隱形嗎?
筆者是作家 Tim Harford 的忠實粉絲,他每一本著作都會細讀。2021 年,在他的作品《Data Detective》一書中,他表示我們在接觸數據及統計數字的時候,需要保持好奇、務實和貫徹的精神,而且遵循十條清晰易懂的規則。而其中,筆者對規則五,六,七最為認同:
- 規則五:了解數據背後的故事
當你擁有大量數據的時候,理解數據背後的故事與數據本身是一樣重要的:譬如,數據是否遺漏了一些相關內容?報告是否遺漏了什麼特別的內容?所有的發現都清楚了嗎?
- 規則六:了解數據背後的重要假設
正當大數據開始成為新常態,很多時候,只有數據收集者才知道正在收集哪些資料。不過,數據很可能有偏差,這意味著在顯示結果時,可能做出了重要假設,所以我們對這些假設一定要清楚。
- 規則七:對數據要求透明度
小數據的分析往往很容易評估和審核,我們不需要花巧的演算法才能得出結論。另一方面,自從大數據開始大放異彩以來,其他更精細的演算法也隨之興起。這些先進的演算法通常會帶來更好的結果,但代價是成為不易解釋的「黑盒子」。所以擁抱數據固然重要,但也一定要了解處理數據的「黑盒子」!
最後,你認識的數據是甚麼型態呢?是原油,水,還是隱形的呢?是時候加入數據素養協會,對數據再一次深入了解。
Visit here to read the article: 數據的型態(翁偉基) – EJ Tech (hkej.com)