2013年7月12日 星期五

大數據‧大危機‧大機遇──網絡時代的又一顛覆

經濟時報社論
大數據具有「4V」的特點:體量巨大(Volume)、類型繁雜(Variety)、價值密度低(Value)、處理速度快(Velocity)。」

「大數據時代」基本建立在三個基礎之上:
一、數以億計的人們,無時無刻,不知不覺地在生產大量數據,每一個人在每一時間每一地點,那怕是一個最不經意的微小行為,就是一個數據。所以,合起來,就是「海量」的數據;
二、數據雖已產生並存在,除非把它「上窮碧落下黃泉」地全數蒐集網羅起來,否則沒有意義,這就要靠像「稜鏡」一樣的網路技術;
三、最後一步,就是將「海量」的數據以超級快的速度加以歸納、計算與分析,這就靠一代又一代推陳出新的超級電腦。
第一個基礎是從來就有的,現在,加上了第二與第三,人類就進入到了「大數據時代」了。」

健保資料庫就是一例,只是內容深度不足,這要靠「病歷記錄 [(醫療人員 + 病人)一直不斷地大量產生」,而且病歷內容須統一,以補其不足。 if so, 這些大數據的用途將十分驚人!

5 則留言:

  1. 我最近看的兩本書(搜尋引擎沒告訴你的事、網路讓我們變笨)也提到大數據的趨勢。
    由於人們在網路上的所有行動都會被瀏覽器與搜尋引擎記錄下來,並交由特定的資料分析公司(例如:Acxiom)將所有個人資料分類歸檔,再將分析結果賣給搜尋引擎與瀏覽器的公司,以便他們瞭解網路使用者的各項基本資料與好惡。

    以商業的角度而言,網路使用者得到免費的搜尋與瀏覽器服務,
    搜尋引擎與瀏覽器的公司可以用更精準的方式行銷廣告。
    (例如我自從五月參加研討會之後,開網頁最常看到的廣告就是這次參加研討會搭乘的航空公司)

    以搜尋結果的全面性而言,網路使用者越常查詢某方面的資訊,
    越容易查到與某方面相關的資訊。
    但這樣的搜尋結果可能無法呈現相關資訊的全貌,而是經由「個人化」的篩選結果。
    所以點閱許多文章,卻都是同一個主題,永遠只能聽到自己的回音。

    以健保資料庫而言,我認為使用者在這個資料庫主動暴露/被動登錄的個人資訊有限,
    健保資料庫的大數據的實用性可能無法與「瀏覽器與搜尋引擎」直接累積的結果比擬。

    回覆刪除
  2. thanks!
    您覺得「健保資料庫的大數據(尤其是我提到的補充病歷資料之後)」可有那些用途?

    回覆刪除
    回覆
    1. 我認為在補充病歷資料之後,
      或許可以有下列三項用途:
      1.詳盡記載個人病史,以便醫療人員診斷與治療。
      2.較易瞭解某個疾病的危險因子及預後影響因子。
      3.可瞭解不同地區、醫療方式、醫療人員、個人習慣對於治療成效之影響。

      刪除
  3. 我想再澄清「健保資料庫的大數據的實用性可能無法與「瀏覽器與搜尋引擎」直接累積的結果比擬。」語意為何?

    回覆刪除
  4. 以下是個人淺見,如果不恰當的地方,再請老師指正。
    健保資料庫的大數據來源是病人的就診記錄。就診記錄是由醫療人員被動記錄。
    若病人沒有就醫,就無法得知。

    「瀏覽器與搜尋引擎」的大數據來源是網路使用者每天使用網路的紀錄,
    而「瀏覽器與搜尋引擎」是所有網路使用者一定會用到的媒介,
    而且網路使用者是主動在網路上大量分享個人資訊,例如在臉書、Google +、推特等社群網站/軟體上公開自己的動態。
    即使網路使用者已將資訊設定為只分享給好友,「瀏覽器與搜尋引擎」仍可記錄這些內容並轉賣給其它公司(即使不一定知會消費者),以便推出更容易被網路使用者接受的資訊。
    因此,就廣泛的實用性而言,
    「瀏覽器與搜尋引擎」的大數據可用在廣告行銷、思想傳遞、情報搜查、家庭關係與生活習慣搜查等,幾乎涵蓋生活中所有事物,只是消費者不一定有察覺。
    以上是我的補充說明。

    回覆刪除