2015年7月27日 星期一

資料未必氾濫,但洞察的確難求

筆者即將在 8/21 參與《DSP 資料開竅.企業論壇》其中一場座談的主持工作,在該論壇的活動說明中,開宗明義即道:「資料氾濫,洞察難求」。

從 Data Owner 的角度來看,資料可能多到不可勝數,的確氾濫。但從擁有資料科學技能,但卻苦無資料可以發揮的 Data Science Team 看來,資料可能永遠缺一集。所以,我想說的是:「資料未必氾濫,但洞察的確難求」。

為什麼會這樣?可以歸結為 Data Owner、Data Science Team、Domain Expert 三者無法有效結合。而通常感覺不到資料價值的人,是因為他/她連洞察 (Insights) 都還沒看見。

圖 1. 資料價值由資料產品傳遞,需要三種角色有效結合

如上圖 1. 所示,資料價值的載體是 Data Product (資料產品),而 Data Owner (資料擁有者)、Data Science Team (資料科學團隊)、與 Domain Expert (領域專家),則是打造 Data Product 的鐵三角,缺一不可。但我們觀察這鐵三角的發展現狀,正面臨一些問題,說明如下。

在 Data Owner 端

通常 Data Owner 也扮演所在行業或領域的 Domain Expert,但卻可能面臨以下問題:
  1. 使用跨界資料來探索商業問題,還是需要跨界的領域知識,所以只具備自身的領域知識還是有所不足,需要其他的 Domain Expert 來共同探討。
  2. 原本就沒有完整的 Data Science Team;或是本來在做資料分析的人員,並不具備多結構化資料處理與平行運算操控的能力。所以在團隊人員的補充,或是在應對 Big Data 真實環境的能力養成上,都必須要有一套發展的策略。
在 Data Science Team 端

不管是商業世界中以資料產品或專業服務存在的資訊服務業者,或是在學術世界中以各類研究存在的機構或實驗室,即使有非常完整且分析經驗豐富的 Data Science Team,但常常還是:
  1. 苦無資料,如巧婦無米,只得向外求取資料。Open Data 與公開的社群媒體資料,或許比較容易取得,但具有更高價值的行業資料,通常是被鎖在企業內部,無法一窺究竟。
  2. 就算拿到了資料,但在分析過程與結果的解釋上,還是需要 Domain Expert 來協助梳理與判讀。
在 Domain Expert 端

由於 Domain Expert 本身並不是一個職務 (大家應該很少看到有人名片上印 「XX 專家」這種職銜的吧?),所以光是要在茫茫人海中辨識出他們,就是一件不容易的事,更遑論要跟他們一起發展出合作的架構。有許多的「老師傅」,本身不具備操作資料的習慣或能力,而有以下的挑戰:
  1. 在心理上,害怕領域知識一旦分享出去,會降低自身的價值。
  2. 在系統上,未曾嘗試結構化本身寶貴的領域知識。
  3. 在認知上,不知資料科學為何物,不知道該如何與 Data Science Team 合作。
產生洞察的的工作架構亟待建立

在「資料未必氾濫,但洞察的確難求」的現狀底下,信資料價值者有之,不信資料價值者也不乏其人。《DSP 資料開竅.企業論壇》主辦單位提出幾個關鍵性的問題:
  • 如何跨域合作,開發由資料驅動的產品或服務?
  • 在組織內部,如何建立、訓練與管理資料科學團隊?
  • 資料科學團隊要如何和其他部門溝通與合作?
希望能夠透過邀請到的 16 家「資料型企業」的公開分享,藉由涵蓋交通運輸、網路通訊、電信服務、行動應用、電子商務、衛星與地理資訊、物聯網相關的「資料科學商業應用案例」,從團隊、應用、合作到商業模式,一起探討如何將資料價值落實於企業創新,讓企業藉洞察而開竅。

我們相信,個別企業要發展 Data Product 的差異性可能很大,但都應該先專注在「如何有效率地產生洞察」此一基礎性的工作架構上。

分享依靠著資料分析而來的洞察,會給予工作團隊真實的力量,讓資料價值更有感,是引起決策者重視與支持的最佳利器。

8/21,我們中央研究院會場見。




沒有留言:

張貼留言