經濟時報社論:
「大數據具有「4V」的特點:體量巨大(Volume)、類型繁雜(Variety)、價值密度低(Value)、處理速度快(Velocity)。」
「「大數據時代」基本建立在三個基礎之上:
一、數以億計的人們,無時無刻,不知不覺地在生產大量數據,每一個人在每一時間每一地點,那怕是一個最不經意的微小行為,就是一個數據。所以,合起來,就是「海量」的數據;
二、數據雖已產生並存在,除非把它「上窮碧落下黃泉」地全數蒐集網羅起來,否則沒有意義,這就要靠像「稜鏡」一樣的網路技術;
三、最後一步,就是將「海量」的數據以超級快的速度加以歸納、計算與分析,這就靠一代又一代推陳出新的超級電腦。
第一個基礎是從來就有的,現在,加上了第二與第三,人類就進入到了「大數據時代」了。」
健保資料庫就是一例,只是內容深度不足,這要靠「病歷記錄 [(醫療人員 + 病人)一直不斷地大量產生」,而且病歷內容須統一,以補其不足。 if so, 這些大數據的用途將十分驚人!
我最近看的兩本書(搜尋引擎沒告訴你的事、網路讓我們變笨)也提到大數據的趨勢。
回覆刪除由於人們在網路上的所有行動都會被瀏覽器與搜尋引擎記錄下來,並交由特定的資料分析公司(例如:Acxiom)將所有個人資料分類歸檔,再將分析結果賣給搜尋引擎與瀏覽器的公司,以便他們瞭解網路使用者的各項基本資料與好惡。
以商業的角度而言,網路使用者得到免費的搜尋與瀏覽器服務,
搜尋引擎與瀏覽器的公司可以用更精準的方式行銷廣告。
(例如我自從五月參加研討會之後,開網頁最常看到的廣告就是這次參加研討會搭乘的航空公司)
以搜尋結果的全面性而言,網路使用者越常查詢某方面的資訊,
越容易查到與某方面相關的資訊。
但這樣的搜尋結果可能無法呈現相關資訊的全貌,而是經由「個人化」的篩選結果。
所以點閱許多文章,卻都是同一個主題,永遠只能聽到自己的回音。
以健保資料庫而言,我認為使用者在這個資料庫主動暴露/被動登錄的個人資訊有限,
健保資料庫的大數據的實用性可能無法與「瀏覽器與搜尋引擎」直接累積的結果比擬。
thanks!
回覆刪除您覺得「健保資料庫的大數據(尤其是我提到的補充病歷資料之後)」可有那些用途?
我認為在補充病歷資料之後,
刪除或許可以有下列三項用途:
1.詳盡記載個人病史,以便醫療人員診斷與治療。
2.較易瞭解某個疾病的危險因子及預後影響因子。
3.可瞭解不同地區、醫療方式、醫療人員、個人習慣對於治療成效之影響。
我想再澄清「健保資料庫的大數據的實用性可能無法與「瀏覽器與搜尋引擎」直接累積的結果比擬。」語意為何?
回覆刪除以下是個人淺見,如果不恰當的地方,再請老師指正。
回覆刪除健保資料庫的大數據來源是病人的就診記錄。就診記錄是由醫療人員被動記錄。
若病人沒有就醫,就無法得知。
「瀏覽器與搜尋引擎」的大數據來源是網路使用者每天使用網路的紀錄,
而「瀏覽器與搜尋引擎」是所有網路使用者一定會用到的媒介,
而且網路使用者是主動在網路上大量分享個人資訊,例如在臉書、Google +、推特等社群網站/軟體上公開自己的動態。
即使網路使用者已將資訊設定為只分享給好友,「瀏覽器與搜尋引擎」仍可記錄這些內容並轉賣給其它公司(即使不一定知會消費者),以便推出更容易被網路使用者接受的資訊。
因此,就廣泛的實用性而言,
「瀏覽器與搜尋引擎」的大數據可用在廣告行銷、思想傳遞、情報搜查、家庭關係與生活習慣搜查等,幾乎涵蓋生活中所有事物,只是消費者不一定有察覺。
以上是我的補充說明。