一場資料科學的實踐 ── 從 DSP 團訓班看 Open Data 的困窘

什麼人最能夠發揮資料的價值?

EtuCode for Tomorrow 共同發起與主辦的資料科學計畫 (DSP) 認為,與其寄望身負多項絕技、萬中選一的資料科學家,不如先培養能夠跨界分工的團隊:讓 Campaigner, Analyst, Hygienist, 與 Designer 同桌而坐,為共同的問題尋找答案,在有限的 4 週團隊合作時間中,交付資料產品 (Data Product),以 Team Project 闡釋資料應用的價值。

在已經舉辦的兩期 DSP 團訓班過後,我們留下了 10 個 Team Project 與對資料科學滿懷熱情的 60 多位校友。從實踐的過程中,我們看到了什麼、學到了什麼?更重要的是,我們有沒有更堅定的意志要鼓勵更多的人,投入資料科學探索之路?

圖 1. DSP 團訓班第 2 期「愛。住易」團隊的作品《找尋銀髮幸福宅》
(完整 Infographic PDF 下載:http://goo.gl/fKdXXi)


在 DSP 團訓班第 2 期 (2014.03.08-2014.03.29) 的成果發表會上,第 3 組「愛。住易」團隊展現了傑出的作品 ──《找尋銀髮幸福宅》,企圖透過資料科學找到台北市最適合老人居住的幸福地。於此,他們先對銀髮族的幸福做出定義,制訂了醫療資源、疾病傷亡數、休閒活動資源、樂齡教育資源、社會參與程度等五大樂齡指標,除了利用團訓班所給的「內政部不動產實價登錄資料」,還另行增加運算指標所需的各行政區 Datasets,蒐集與整理、創建模型。

面對不只是 《找尋銀髮幸福宅》的 Team Project 成果,我們明白,從培養專業分工合作的資料科學教育目標而言,DSP 團訓班是成功的,結果是令所有講師、助教、工作人員感到驕傲的。但即使是心法與技能都學會了,學員也能找到一群志同道合的夥伴,這些畢業的 DSP 校友,面對的還是一個如彭啟明會長在 Open Data 聯盟第 01 期月刊《開放資料 台灣還需更加把勁!》一文所述的大環境:「政府的開放資料不夠、多停留在政府資訊公開的層次、部分單位缺乏產業觀」,巧婦難為無米之炊,實乃想要力借 Open Government Data,建構資料科學創意服務者所面臨的一大窘境。

表 1. DSP 團訓班第 1 & 2 期 Team Project 列表
組別 團訓班第 1 期 團訓班第 2 期
#1
我要成為天聾人股份有限公司
《Bargaining Power》
無殼蝸牛聯盟
《房價正義》
#2
遊戲茄子
《驚爆房地產》
航海王
《部落客銀行》
#3
逆轉人生全球顧問股份有限公司
《小資男女翻身計畫》
愛。住易
《找尋銀髮幸福宅》
#4
光點選址服務
《小火鍋創業選址模型》
小資“救世“組
《千金買房‧萬金買鄰》
#5
財團法人避稅剋星
《土地買賣稅費異常資料查詢平台》
Captain
《Hot Zone》


透過 DSP 團訓班的經驗,我們驗證並確信了以下幾點:
  1. 對資料有感,讓應用有感,是資料科學訓練的成功關鍵要素。
  2. 資料科學是一個連續的、End-to-End 的過程,跨界專業分工團隊,是萃取資料價值的必要實踐。
  3. 台灣不是沒人才,人才不是沒有競爭力,缺的可能是 Team Up 的組織力。
當開放政府資料的當責單位認可民間的資料科學創意豐沛,想要藉此提昇社會的競爭力,那就請再加把勁,在去除架在 Open Government Data 的桎梏上,可以更有效率與更加透明。





留言