2014年8月26日 星期二

資料價值還缺一味,資料科學團隊還缺一位


時間:2014.8.16-17 (Sat-Sun)
地點:高雄醫學大學濟世大樓二樓 CS201 教室
活動:Code for Healthcare (CfH) 工作坊

* 活動緣由請見這裡

Code for Healthcare 工作坊團隊簡報時間:《轉診系統初探》

活動名稱雖冠以「工作坊」,但其實這是一場 Hackathon,它與一般滿聚程式高手、間有 UI 設計者駭客松的不同之處,是參與者除了資料科學團隊中常見的資料處理者 (程式設計師)、資料分析者 (統計、資料探勘專家)、視覺與服務體驗設計師外,還有大半是醫傷、醫管、急救領域的專業人士。所以它不只是一場駭客松,它更是一場充滿領域知識專家 (Domain Expert) 的資料科學駭客松。

來瞧瞧其中一隊的陣容:外傷科醫師 X 4、整形外科主治醫師 X 1、外傷登錄師 X 3、資料科學講師 X 1,他們做的主題是「外傷登錄分析」; 另一隊成員則有來自統計、醫管、醫療資訊、資訊工程、後勤中心、服務設計等背景,他們做的主題是「肺炎轉診分析」。


這次 CfH 工作坊的主、協辦單位提供了三個資料集:高屏澎區域緊急醫療應變聯盟資料、急診轉診資料、外傷登錄資料,並於活動之前就先公布部分 Sample Data,以便參與者可以預做功課,甚至是可以形成提案內容,以便第一天下午 Pitch (上台提案) 時,就能夠跟其他參與者介紹自己想要做的主題方向,以及需要怎樣的幫助,吸引有興趣的幫手來一起組隊打怪。

筆者當天感覺非常強烈的一個時刻是:當參與此次活動的 DSP 講師 JohnsonJerry,以到達現場才拿到的完整資料集,都分別快速做出了令現場所有人都感驚艷的資料分析圖表與模型,但在先後上台 Pitch 時,他倆卻異口同聲地說:「根據資料分析的結果,在這張圖表上,我們可以看到一些有趣的現象......,但我現在沒有辦法解釋它們,期待在場的相關領域專家,可以協助給予說明。」

此刻的資料科學團隊成員,期待能在一場資料科學駭客松中與 Domain Expert 交流,碰撞火花,可以讓分析後的數字與圖表訴說一則則真實生活的故事,或是照亮特定領域中的眉眉角角。

誠如 Johnson 在活動後的部落文《資料科學 in 白色巨塔》中提及的:「資料科學是一門實實在在的入世學問,理論與技術專精的資料科學家能夠與第一線的 domain experts 進行團隊合作才能完全發揮該學門的精神。前線人員提出他們面臨的真實問題,透過跨領域團隊合作才能夠提出確實的建議」。

資料價值還缺一味:Domain Knowledge

在 Etu 團隊打造特定行業 End-to-End Big Data Solution 的過程中,我們始終覺得,當涉及資料分析,但卻缺乏領域經驗或知識來添味,往往數字只是數字、圖表只是圖表,探索無方,洞見難生。

資料科學團隊還缺一位:Domain Expert

在 DSP 的招牌《團訓班》課堂上,我們將資料處理者、資料分析者、資料產品策略者、設計者聚合一組,給資料,做分工團隊的主題式訓練;而在另一堂課《看資料找故事工作坊》中,則著重在探索資料,嘗試挖掘出其中的故事、梗點。無論是上課實作,還是應用在實際的工作場合,這些資料價值的提取,如果能夠有一位領域專家隨侍在側,即問即答,必然可使如瞎子摸象的外行臆測行為降低,讓潛規則浮露,真實湧現。

CfH,突破一般的程式駭客松格局,讓我們親身體驗到領域專家滿堂,可以讓資料科學更加立體、更添生命力、觀點更加圓滿周到的可能。




沒有留言:

張貼留言