Big Data技術發展的一體兩面
 
從2012年開始,Big Data話題便一直延燒至今,對於某些產業來說,Big Data的應用或許是一個新商機的曙光,但對於情資單位來說,資訊被廣泛蒐集的情況下,資安疑慮令人頭痛,Big Data是什麼?對於產業又該如何被應用?
 
撰文:編輯部 分享到 Facebook
  好友人數
 

 
量、速度、精準度的平衡
台大資工系副教授洪士灝指出,Big Data的Big不是普通的修飾詞,並不是隨便一個資料庫就可以稱為Big Data,它是需要很大的量,以IBM近期開放給全球研究人員共享的安全情報Big Data為例,就高達700兆位元組(Terabyte)。但是到底需要多大的資料量才稱得上是Big Data,洪士灝表示,基準是浮動的,在每個領域也不盡相同,簡單來說,當資料數量大到能應付該領域的應用需求,那我們就可以宣稱該領域的Big Data已成熟完備,但一般來說,越多的資料對於應用越有幫助,例如預測結果會比較準確,但資料量越大,處理的時間便會更多,而且所需的成本越大。因此,Big Data的應用與準確度往往受到成本和處理時間的限制,必須在資料量、速度、精準度、成本這些因素上取得平衡,Big Data應用才能發揮最佳效果。

跨領域人才的整合
洪士灝也強調,Big Data需要三大類人才跨領域的整合,分別是(1)各領域知識專家、(2)資料科學家、(3)開發系統和應用程式的人才。之所以需要各領域的知識專家是因為,如果要處理特定領域的問題,該領域的專業知識必不可少,因此各領域專家的協助是很重要的。而資料科學則是對於資訊學科和數學、統計學科知識的整合,有了資料科學的人才,才有能力對資料進行分析,將龐大、零散的資訊,整理成結構性資料、建立資料模型,以利檢索。有了知識庫、資料的分析方法,最終還需要有能快速處理資料的平台,才能將Big Data的應用實現,因而就需要擁有開發系統和應用程式能力的專家來配合。

技術要求
由於資料量的龐大,洪士灝指出,Big Data的處理平台,通常必須運用「分散式運算技術」,以提高運算量和儲存量。即由多台電腦組成叢集、裝置分散式檔案系統,讓每台電腦提供運算能量,並利用網路進行不同電腦間的資料交換,因此網路的速度和穩定性很重要。

此外,雲端儲存的需求增加,儲存技術也必須同時朝快速讀寫的方向發展。使用可以多次擦寫、高速、省電的固態硬碟(Solid State Disk,SSD)代替傳統硬碟作為儲存裝置,甚至新型態的儲存媒體的研發,是持續快速發展中的方向。

那理想的Big Data平台究竟是什麼樣子呢?洪士灝認為,IBM近年積極研發的華生(Watson)電腦系統,其實就是最好的例子之一,華生電腦背後擁有一個龐大的資料庫,當它聽到一個問題,能瞬間將問題與龐大的資料進行比對,從中整理出資訊,給出需要的答案。2011年華生電腦甚至在益智節目「危險邊緣」(Jeopardy!)中擊敗人類選手,贏得100萬美元。洪士灝直言,Big Data結合近年人工智慧領域中機器學習(Machine Learning)的發展,是在近年來雲端普及致蒐集資料方便,加上系統運算快速演進下的發展趨勢。

Big Data於各產業的應用
近年來各家電廠商都極力開發智慧電視產品,Smart TV,是利用電視螢幕的影音輸出結合電腦及網路功能,也因導入作業系統像是Android及ios,智慧電視也可以和攜帶裝置互通,例如看電視看到一半必須離開去做家務,卻又不想錯過正精彩的節目,這時可以將節目內容轉移到攜帶式裝置上便可繼續觀看,解決了地點的限制;反之,攜帶式裝置上的內容也可轉移到電視進行觀看與操作。軟體開發商可以設計各種APP,讓電視操作也能依照個人的需求來使用,從另一個層面來看,廠商透過這些APP進而蒐集到使用者觀看電視的習慣與喜好,未來的Smart TV可能會發展成依據不同的家庭成員提供更適合的節目供選擇。

但黃士嘉表示,大多數廠商發展Smart TV都著重在電視平台上的軟體功能,卻都忘了電視的好朋友─遙控器的智慧化,或許一般人覺得遙控器沒什麼,但對於最常坐在電視前的族群─老年人來說,簡單易操作的數位遙控器才是最方便他們的產品。

越來越符合人性的智慧車(Smart Car)發展與應用也漸漸和科技領域的業者合作,在安全需求意識高漲的現今,輔助駕駛的系統功能愈來愈多元,像是衛星導航、防碰撞的感測器、行車記錄器、倒車攝影等,都是利用攝影和感測器的結合,大多數的設備也已經成為標配。黃士嘉預測,未來智慧車的發展,便是能夠透過全車360。攝影機記錄街道上的標的物,例如大樓、店面,蒐集大量路面資訊後該怎麼應用呢?當開車時忽然需要找文具店,只要輸入「文具店」指令,車載系統便會透過BigData的分析技術,依據過去蒐集到的大量路面資料,快速找出最近的文具店並規劃好前往路線,當然目前的導航也做得到,只是得一步一步操作,而未來的智慧車導航則可能是直接顯示在擋風玻璃上,不需要移開視線用手操作,既智慧又安全。不只科技業需要Big Data技術,零售業、製造業、服務業…等甚至是新創產業,都可以透過Big Data來輔助產業提昇。

其實Big Data並不是近幾年才發展的技術,早在2009年 Google藉由分析數百萬條,搜尋詞彙間的關聯性,成功預測H1N1病毒的傳播速度及區域;日本京都大學的研究室也創造了名為「流感君 」的網站,流感君主要的功能是在進行感冒訊息的檢索,透過網路上發佈關於流感的訊息進行分類判斷真偽,結合GPS 定位自動在日本地圖上標記,如此便能清楚的得知,哪些地區流感病毒的肆虐最為嚴重;以上便是利用Big Data統計運算達到比專家學者的人腦還精準快速的應用實例。2012年《紐約時報》的一篇專欄中寫到,「大數據」時代已經降臨,在商業、經濟及其他領域中,決策將日益基於資料和分析而作出,而並非基於經驗和直覺。

是否過分樂觀Big Data帶來的產業效應?
對於現在人人看好Big Data所帶來的可能,甚至把Big Data視為台灣產業轉型、升級的機會,洪士灝認為,不應過度樂觀,他指出,目前台灣產業界還沒走出代工思維,眼光往往看得比較近,只照顧到比較直接有利益的東西。現在業界往往希望對於零組件、硬體這些做得比較好的產業加值,侷限於現有的優勢。問題是,遵循別人訂的標準、規格做東西,當越來越多廠商生產一樣的東西,利潤只會越來越低,真正有價值的產業還是訂規格、建系統的,而這也是台灣產業是否能搭上這波趨勢,順利轉型的關鍵。
因此,洪士灝現在鼓勵頭腦靈活的青年去參與自造者(Maker) 的活動,雖然一開始可能還不太成氣候,但是慢慢摸索,總會創造出一些有意思的東西。他認為台灣目前除了需要跨領域專家的結合,更迫切需要能針對各領域需求設計應用程式、作業系統的人才,雖然門檻高,產業需要比較長期的投資,不能期望一蹴可及,但如果台灣產業真能為各種領域的Big Data需求設計出好用的應用或系統,那將會是一個機會,但如果只是把Big Data掛在嘴巴上當作廣告詞,像「雲端」一詞被用於行銷房屋建案,反而無濟於事。

安防上的應用
至於Big Data應用在安防領域上,洪士灝認為,首先必須依靠各類的安全、犯罪知識專家,包括行為科學家、犯罪心理學家建立相關知識庫,其次,由於安防領域收集到相關資料,很大部分是監控設備所捕捉的的影像,除了影像的清晰度很重要,因為影像紀錄所佔據的儲存空間是非常龐大的,但其中有價值的訊息佔比卻又非常低,因此一方面要擁有夠大的資料傳輸頻寬,以完成大量的資料傳輸,另一方面系統及時處理影像,汰除不必要的影像,保存有價值的紀錄能力也很重要。

洪士灝表示,目前的電腦運算尚無法透過影像去即時辨識、比對知識庫,判定一個人的行為舉止是否有異狀,但是他也樂觀的認為,以目前電腦運算上的演進速度,5年增長20倍,所以可以預期再過個5年、10年,這樣的能力是指日可待的,到了那個時候,監視設備將不只是被動取證、監控的功用,系統透過監視器一發現舉止可疑的人可立即通知安全人員,而能扮演更積極的預防角色。

雖然當前技術上能做的有限,洪士灝認為,還是能做一些簡單的應用,例如建立能快速調閱的城市監視影像資料系統,包括能以畫面特徵迅速查找相似、相符影像的系統,這方面的系統,對於現階段安全維護就已有很大的幫助。

Big Data應用的倫理爭議
不過,Big Data應用雖然開啟許多可能,也提供機會,但也存在著許多疑慮。光是Big Data的取得方面,就存在著許多爭議的手段。洪士灝舉例,一些企業製做免費的應用程式供人下載使用,其實目的是要取得用戶的個人資料,另外也有些大公司會在網路上佈署監控、攔截機制,資料經過就複製一份,這些方式都是透過無形手段竊取個資來豐富自身的資料庫。而我們的資料被這些企業拿去後,在使用方面也往往難以監管,即使公司在這些資訊的使用上,經過匿名處理,但是仍有透過資訊的細節推斷出資料所屬者的風險,尤其是當該資訊的稀有性和特殊性特別明顯的時候。

歐洲一些國家基於上述原因,已開始立法限制Google和Apple這些大企業蒐集資料,甚至限制相關產品的上市。除了企業的資料蒐集,像各國政府國安、情報單位運用情蒐資料,對特定人民、國家進行監控也不是新聞。洪士灝認為,台灣民眾在這方面的警戒意識相對薄弱,往往沒發覺自身的權益受到侵害。
由於政府和大企業最有能力蒐集、掌控資料,一般民眾、小公司則相對困難,在這種資訊掌握不對等的情況下,如果沒有相關配套,Big Data應用的時代也可能造就更有利於權貴、財閥而不利於小公司、小市民的社會。

除了上述資安和資訊對等的疑慮,因為 Big Data應用需將資料分門別類,在對人進行判斷時,也有貼標籤、塑造刻板印象的疑慮,尤其在安防應用上,更存在著人權爭議。譬如美國已經在做的,利用Big Data判定出犯罪熱點,讓警方加強警力在這些熱點進行預防性巡邏和稽查,以期達到預防犯罪的效果,只是這樣做卻也會造成對特定社區刻板化的問題,長久下來甚至可能衍伸為一種歧視、偏見。假使未來該應用擴大到去判定什麼樣的群體和人犯罪率較高,那更會造成嚴重的污名化和侵害。

洪士灝也以電腦防毒做舉例,他說,我們可以運用Big Data和機器學習的技術去判定惡意程式、阻擋電腦病毒,類似的作法在理論上可延伸運用去判定壞人、罪犯,做到防範犯罪,然而這牽涉到倫理的問題。面對人,即便是1%的出錯,都可能造成對人權的侵犯,因此在使用上必須很小心,可能必須給予範圍的限制。如何在執行電腦的判斷上顧及程序正義,都是將來在應用上所必須思考和取捨的。

「Big Data的應用就像很多事物一樣是兩面刃。」它為社會帶來了新的機會和更便利的可能,也同樣為社會帶來新的風險及挑戰,如何妥善的應用,考驗著人們的智慧,而這都有賴於我們積極的關心。
 

 
   

 
 
 
  • 一「棒」在手 Hi Magic挑戰購物新體驗
  •  
  • 熱像儀的類別與應用
  •  
  • 無人機:無限可能的「新藍海」
  •  
  • Big Data:運算技術成熟下的資料分析與應用-專訪 遠通電收資訊處 陳聲鏗 副總經理
  •  
  • 【我的安防手札】「物聯網」,台灣安防產業的翻轉契機
  •  
  • 希捷科技發布2016年六大科技趨勢
  •  
  • 【交通安防應用】瞄準智慧交通發展趨勢,打造應用實績「劫」取國際大訂單
  •  
  • 「雲」不再高掛於天際,運用智慧鑄造武器
  •  
  • 你心中的智慧家庭是什麼樣貌?安心、便利、舒適才是核心訴求
  •  
  • NFC技術應用無所不在,門禁的未來發展值得期待
  •  
  • CVI、TVI、AHD-高清類比三雄誰領風騷?
  •  
  • 物聯網系列報導-物聯網的美麗與哀愁
  •  
  • 物聯網安防應用專題-從安保到決策的轉變
  •  
  • 探索物物相聯新世界‧啟動智慧城市新紀元
  •