謝清麟教學/研究 blog: 大數據‧大危機‧大機遇──網絡時代的又一顛覆

2013年7月12日星期五

大數據‧大危機‧大機遇──網絡時代的又一顛覆

經濟時報社論：
「大數據具有「4V」的特點：體量巨大（Volume）、類型繁雜（Variety）、價值密度低（Value）、處理速度快（Velocity）。」

「「大數據時代」基本建立在三個基礎之上：
一、數以億計的人們，無時無刻，不知不覺地在生產大量數據，每一個人在每一時間每一地點，那怕是一個最不經意的微小行為，就是一個數據。所以，合起來，就是「海量」的數據；
二、數據雖已產生並存在，除非把它「上窮碧落下黃泉」地全數蒐集網羅起來，否則沒有意義，這就要靠像「稜鏡」一樣的網路技術；
三、最後一步，就是將「海量」的數據以超級快的速度加以歸納、計算與分析，這就靠一代又一代推陳出新的超級電腦。
第一個基礎是從來就有的，現在，加上了第二與第三，人類就進入到了「大數據時代」了。」

健保資料庫就是一例，只是內容深度不足，這要靠「病歷記錄 [(醫療人員 + 病人)一直不斷地大量產生」，而且病歷內容須統一，以補其不足。 if so, 這些大數據的用途將十分驚人！

5 則留言:

五隻魚2013年7月16日上午10:40
我最近看的兩本書（搜尋引擎沒告訴你的事、網路讓我們變笨）也提到大數據的趨勢。
由於人們在網路上的所有行動都會被瀏覽器與搜尋引擎記錄下來，並交由特定的資料分析公司（例如：Acxiom）將所有個人資料分類歸檔，再將分析結果賣給搜尋引擎與瀏覽器的公司，以便他們瞭解網路使用者的各項基本資料與好惡。

以商業的角度而言，網路使用者得到免費的搜尋與瀏覽器服務，
搜尋引擎與瀏覽器的公司可以用更精準的方式行銷廣告。
（例如我自從五月參加研討會之後，開網頁最常看到的廣告就是這次參加研討會搭乘的航空公司）

以搜尋結果的全面性而言，網路使用者越常查詢某方面的資訊，
越容易查到與某方面相關的資訊。
但這樣的搜尋結果可能無法呈現相關資訊的全貌，而是經由「個人化」的篩選結果。
所以點閱許多文章，卻都是同一個主題，永遠只能聽到自己的回音。

以健保資料庫而言，我認為使用者在這個資料庫主動暴露/被動登錄的個人資訊有限，
健保資料庫的大數據的實用性可能無法與「瀏覽器與搜尋引擎」直接累積的結果比擬。
回覆刪除
回覆
Ching-Lin 清麟2013年7月16日中午12:33
thanks!
您覺得「健保資料庫的大數據（尤其是我提到的補充病歷資料之後）」可有那些用途？
回覆刪除
回覆
Ching-Lin 清麟2013年7月19日清晨6:41
我想再澄清「健保資料庫的大數據的實用性可能無法與「瀏覽器與搜尋引擎」直接累積的結果比擬。」語意為何？
回覆刪除
回覆
五隻魚2013年7月19日晚上11:02
以下是個人淺見，如果不恰當的地方，再請老師指正。
健保資料庫的大數據來源是病人的就診記錄。就診記錄是由醫療人員被動記錄。
若病人沒有就醫，就無法得知。

「瀏覽器與搜尋引擎」的大數據來源是網路使用者每天使用網路的紀錄，
而「瀏覽器與搜尋引擎」是所有網路使用者一定會用到的媒介，
而且網路使用者是主動在網路上大量分享個人資訊，例如在臉書、Google +、推特等社群網站/軟體上公開自己的動態。
即使網路使用者已將資訊設定為只分享給好友，「瀏覽器與搜尋引擎」仍可記錄這些內容並轉賣給其它公司（即使不一定知會消費者），以便推出更容易被網路使用者接受的資訊。
因此，就廣泛的實用性而言，
「瀏覽器與搜尋引擎」的大數據可用在廣告行銷、思想傳遞、情報搜查、家庭關係與生活習慣搜查等，幾乎涵蓋生活中所有事物，只是消費者不一定有察覺。
以上是我的補充說明。
回覆刪除
回覆

新增留言

訂閱：張貼留言 (Atom)

2013年7月12日 星期五

大數據‧大危機‧大機遇──網絡時代的又一顛覆

5 則留言:

2013年7月12日星期五