Big Data 素養 5
~ 素養,是個人與外界作合理而有效的溝通或互動所需具備的條件
要從 Big Data 中提取「價值」,這已經是此議題共同的結論。「Monetize」,是最能體現企業對資料價值轉兌期待的動詞。
企業資料價值精煉金字塔
如下圖 1. 中的金字塔,是一般我們會在企業訴說資料,由下往上,一路被精煉的過程:
Data (資料) → Information (資訊) → Knowledge (知識) → Insight (洞見) → Action (行動)
其中 Insight (洞見) 也可以被換成 Intelligence (智慧)。
每一層,我們都可以在 Wikipedia 上找到定義與說明。
還是很抽象?我們來看看以下的例子:
- Data: 394 公里。
- Information: 台灣南北全長 394 公里。
- Knowledge: 一般人騎單車的時速約 15 公里;台灣夏季吹南風,冬季吹東北風。
- Insight: 台灣夏季由北騎到南,一般人不可能達到平均時速 15 公里。
- Action: 暑假計畫要從台灣南騎到北,目標在 3 天內完成。
圖 1. 企業資料價值精煉架構
在 IT 上,企業早聽慣了這些與金字塔對應的管理系統與應用:
- DBMS/EDW (Database Management System/Enterprise Data Warehouse)
- EIP (Enterprise Information Portal)
- KM (Knowledge Management)
- BI (Business Intelligence)
- DMS (Decision-making Support)
目前 IT 系統對於資料分析後的 Action,大部分還停留在「決策支援」,從企業運作的角度,很容易理解,因為決策需要考慮的面向太廣。除非,找得到從資料蒐集到價值轉兌行動可以端到端 (End-to-End) 一線自動化完成。像電子商務這種基於瀏覽者行為的精準推薦,是難得的一氣呵成實例。
Big Data 撞擊金字塔
當最底層的 Data 變成 Big Data,大量、多架構、又要及時,企業會面臨的挑戰包括:
- 金字塔最底層的 Data 範疇變廣了。從結構化的 DBMS/EDW,擴大到半結構化與非結構化資料。精煉的過程,必須加入像 Hadoop 這樣的巨量資料處理技術。
- 對 Information 與 Knowledge 的分析,即使模型 (Model) 相同,需要放入更多的關聯 (Correlation)、行為 (Behavior)、屬性 (Attribute)、狀態 (State)、意義 (Meaning),才能求得 Insight。所以需要多維、跨界串連。
- 要擬定 Action Plan 所需參考的 Insight 面向更廣了。這是好事,但也會是難題。
從上而下,我們在圖 1. 標注了三種角色:
- CxO:關注 Action 與 Insight 這兩層,是策略的制定者與計畫的執行者;價值兌換重點落在 Action。
- BI/DW:關注 Insight 與 Knowledge 這兩層,是資料的探勘者或分析者;價值兌換重點落在 Insight。
- IT:關注 Knowledge、Information、與 Data 這三層,是資料的處理者;價值兌換重點落在 Knowledge。
Big Data 的什麼不外包?
答案其實已經很明顯,越在金字塔底層、距離策略擬定、行動計畫越遠,就越容易外包或透過對外採購來完成。IT 的資料處理角色肯定可以,BI/DW 的資料分析角色也許還行,但應該沒有企業會將 CxO 角色外包的吧,除非他們與策略無涉 (!?)
圖 2. 是完整的企業資料價值精煉流程,也是整個 Data Science 的範疇。原圖來自 Rachel Schutt 博士的《Next-Gen Data Scientists》,但我為之加上三種角色發功的領域,讓大家可以 End-to-End 地拆解 Data 是如何被 Monetized 的。是為總結。
圖 2. 企業資料價值精煉流程與角色對應
(source: Next-Gen Data Scientist, Dr. Rachel Schutt)
留言
張貼留言