2015年5月24日 星期日

企業資料經濟第三講:打造一個具生態觀的資料產品團隊,給 Data Team Lead

我們在《企業資料經濟第一講:打造企業的資料價值平台,給 CxO》的結論中指出:Big Data 是企業管理議題,需要具經營高度的策略來思考與妥善料理。

企業管理議題不能僅用硬的 KPI 數字來表達,更重要的是要靠「生態」來解,而這個生態的建構與運作,我們可以從資料產品團隊 (Data Product Team,或簡稱 Data Team) 談起。

什麼是資料產品團隊?

筆者曾在《一位產品經理對 Open Data 的幾點思考》 中述及,最能夠發揮資料價值的載體,應該就是以資料為原料的應用產品或服務了,所以我們以「資料產品」(Data Product) 來概括這些因資料而生的產品或服務。而打造供企業內部或外部使用的資料產品者,通常不是一個個人,而是一個團隊,是為資料產品團隊。

圖 1. 資料產品團隊 > 資料科學團隊

Data Team 根據不同企業的不同目標,可能會有不同的角色編制。我們取其最大者,大到可以產出與管理 Go-to-Market 的資料產品團隊,必須包含:
  1. 策略者 (Product Manager)
  2. 架構者 (Architect)
  3. 處理者 (Developer)
  4. 分析者 (Analyst)
  5. 測試者 (QA)
  6. 支援者 (Support)
  7. 包裝者 (Product Marketing Manager)
  8. 行銷者 (Marketer)
  9. 銷售者 (Business Development/Sales)
若是只交付服務企業內部使用的 Data Team,從權責面來說,則應該包含 1.~6. 的角色。

如何建構 Data Team?

我們曾在《2015 台灣 Big Data 市場五大趨勢預測》中談過「資料產品建構者」(其中的圖 3.) 包含:
  • Data Owner
  • Domain Expert
  • Data Science Team
一個以交付資料產品為任務的團隊,在建構時,必須思考如何涵括或連結以上三種角色,豐富資料價值的生態系統。

這些思考,跟 Data Team 在組織中的定位息息相關。有關 Data Science Team,筆者在本部落格中已經談很多了,以下僅深入討論 Data Owner 與 Domain Expert。

關於 Data Owner

資料是數位時代的價值資源,殆無疑義。資料產品需要以資料當提煉的原料,這是定義的一部分,也不需再多做解釋。這個 End-to-End 的價值提煉過程,有其步驟:

1) 提出問題;
2) 剖析探索解答所需的分析方法;
3) 確認所需的資料集與其來源;
4) 進而有目的性地蒐集資料。

這是一個 SA/SD 找出所需資料集的過程,在這之後,才是啟動資料串接、儲存、預處理/清洗/結構化資料、資料分析、資料視覺化、探索與洞見等資料科學作業的執行。後者我們不妨以軟體開發 (Development) 來對等看待。

確認了所需的資料集,下一步當然就要確保這些資料集的擁有者 (Data Owner),是否願意提供。倘若 Data Team 本身就是 Data Owner,那當然最好,但若特定資料集必須取自企業內其他部門,或是外部其他組織,那就必須注意資料取用上的 5 個要點:
  • 授權:讓 Data Team 擁有使用權、重製權、或是散佈權。
  • 格式:讓 Data Team 取用資料的方式。如給予不同格式的檔案 (例如 CSV、JSON、XML),或是連線接取的 API。
  • 品質:低落的資料品質會讓 Data Team 花更多時間在清洗或正規化原始資料,而非專注在更具價值的分析上。
  • 更新:資料集是否有更新的固定頻率。
  • 成本:Data Owner 會怎麼跟  Data Team 收取費用。
同樣的道理,一個 Data Team 若是具有原始資料,或是處理加值過的資料,也可以根據上述 5 個要點,提供給有需求的人。

關於 Domain Expert

我們在《資料價值還缺一味,資料科學團隊還缺一位》中曾說:「資料價值的提取,如果能夠有一位領域專家隨侍在側,即問即答,必然可使如瞎子摸象的外行臆測行為降低,讓潛規則浮露,真實湧現。」、「領域專家滿堂,可以讓資料科學更加立體、更添生命力、觀點更加圓滿周到。」

Data Team 中或許有統計學博士,具有豐富的 Data Mining 與 Data Exploration 經驗,熟稔資料分析工具的使用,做出漂亮的視覺呈現,但對於分析結果的洞察與解釋,卻可能不如一位具多年行業與現場經驗的老師傅來得直接乾脆。

過往的 KM,是企圖把老師傅的知識系統化、結構化,存放在關聯式資料庫中加以應用。在 Big Data 時代,Data Team 追求的,是將老師傅的知識融入迴歸、關聯、或預測模型中,以便企業可以儘早感知、儘早採取行動。

這其中的挑戰,是要如何將過往利用資料取樣 (Sampling) 所做的單機或 Client/Server 資料分析模型運算架構,可以轉換成透過分散式系統進行全資料的平行化運算。這個任務,必須有賴 Data Team 與 Domain Expert 攜手合作,一起征服。

我們很難想像成功的企業,或是具有一定歷史的企業,組織中會沒有 Domain Expert,重點是如何進一步細分一個行業中的 Sub-domain,以零售為例,可以細分為展店、網店、物流、金流、採購、行銷……,這些都可以在組織中找出對應的專家。對 Data Team 來說,不一定會常態性地編制各種 Domain Expert,但卻必須建立一套跟不同 Domain Expert 協作的機制。通常,制定共同的 KPI,會是跨部門合作的關鍵趨力,而 Data Team Lead 也絕對不能忘記,企業內部的 Domain Expert,會有他們各自的部門老闆,怎樣讓 Domain Expert 的老闆願意支持 Data Team,這也是合作成功與否的關鍵議題。

Data Team Lead 在帶領資料產品團隊時,若能夠掌握好 Data Owner 與 Domain Expert 這兩環,再加上讓團隊內外鍛鍊順暢的工作架構,必能在一個良好的資料價值生態體系中,開出一朵朵漂亮的資料產品之花。




沒有留言:

張貼留言