Big Data 的什麼不外包?


Big Data 素養 5


~ 素養,是個人與外界作合理而有效的溝通或互動所需具備的條件 


要從 Big Data 中提取「價值」,這已經是此議題共同的結論。「Monetize」,是最能體現企業對資料價值轉兌期待的動詞。

企業資料價值精煉金字塔

如下圖 1. 中的金字塔,是一般我們會在企業訴說資料,由下往上,一路被精煉的過程:

Data (資料) → Information (資訊) → Knowledge (知識) →  Insight (洞見) →  Action (行動)

其中 Insight (洞見) 也可以被換成 Intelligence (智慧)。

每一層,我們都可以在 Wikipedia 上找到定義與說明。

還是很抽象?我們來看看以下的例子:
  • Data: 394 公里
  • Information: 台灣南北全長 394 公里
  • Knowledge: 一般人騎單車的時速約 15 公里;台灣夏季吹南風,冬季吹東北風
  • Insight: 台灣夏季由北騎到南,一般人不可能達到平均時速 15 公里
  • Action: 暑假計畫要從台灣南騎到北,目標在 3 天內完成

圖 1. 企業資料價值精煉架構 

在 IT 上,企業早聽慣了這些與金字塔對應的管理系統與應用:
  • DBMS/EDW (Database Management System/Enterprise Data Warehouse)
  • EIP (Enterprise Information Portal)
  • KM (Knowledge Management)
  • BI (Business Intelligence)
  • DMS (Decision-making Support)
這裡面,越往塔的高處爬,就越難;但可以轉兌的價值,卻越高。最難的,是 Action,而這也就是為何像 Gartner 這樣的研究機構要在 Big Data 領域大大強調 Actionable Analytics (可行動化的分析) 的原因 —— 難,才能墊高進入門檻,建立差異化競爭優勢。

目前 IT 系統對於資料分析後的 Action,大部分還停留在「決策支援」,從企業運作的角度,很容易理解,因為決策需要考慮的面向太廣。除非,找得到從資料蒐集到價值轉兌行動可以端到端 (End-to-End) 一線自動化完成。像電子商務這種基於瀏覽者行為的精準推薦,是難得的一氣呵成實例。

Big Data 撞擊金字塔

當最底層的 Data 變成 Big Data,大量、多架構、又要及時,企業會面臨的挑戰包括:
  1. 金字塔最底層的 Data 範疇變廣了。從結構化的 DBMS/EDW,擴大到半結構化與非結構化資料。精煉的過程,必須加入像 Hadoop 這樣的巨量資料處理技術。
  2. 對 Information 與 Knowledge 的分析,即使模型 (Model) 相同,需要放入更多的關聯 (Correlation)、行為 (Behavior)、屬性 (Attribute)、狀態 (State)、意義 (Meaning),才能求得 Insight。所以需要多維、跨界串連。
  3. 要擬定 Action Plan 所需參考的 Insight 面向更廣了。這是好事,但也會是難題。
打造 Big Data 價值金字塔的三種角色

從上而下,我們在圖 1. 標注了三種角色:
  • CxO:關注 Action 與 Insight 這兩層,是策略的制定者與計畫的執行者;價值兌換重點落在 Action。
  • BI/DW:關注 Insight 與 Knowledge 這兩層,是資料的探勘者或分析者;價值兌換重點落在 Insight。 
  • IT:關注 Knowledge、Information、與 Data 這三層,是資料的處理者;價值兌換重點落在 Knowledge。
我們可以注意到,這三種角色的作業區域兩兩交疊,這說明了企業價值要得轉兌與精煉,就要能整合與流動。Data Silo (資料孤島) 往往是價值發揮的阻礙者。

Big Data 的什麼不外包?

答案其實已經很明顯,越在金字塔底層、距離策略擬定、行動計畫越遠,就越容易外包或透過對外採購來完成。IT 的資料處理角色肯定可以,BI/DW 的資料分析角色也許還行,但應該沒有企業會將 CxO 角色外包的吧,除非他們與策略無涉 (!?)

圖 2. 是完整的企業資料價值精煉流程,也是整個 Data Science 的範疇。原圖來自 Rachel Schutt 博士的《Next-Gen Data Scientists》,但我為之加上三種角色發功的領域,讓大家可以 End-to-End 地拆解 Data 是如何被 Monetized 的。是為總結。


圖 2. 企業資料價值精煉流程與角色對應 
(source: Next-Gen Data Scientist, Dr. Rachel Schutt)




留言