1. 如前所提,我們的CATs對於極端個案(功能很差或很好)之誤差偏高而且須要比較多的題目(一般CATs亦常發生此問題)
這樣的現象(缺點)對臨床人員而言,似難接受。因為極端個案之評估,臨床人員容易「一目了然」,也就是毋須多少評估項目,即能掌握個案之功能,且臨床人員應覺得誤差不高(因為很容易看得出來個案功能)。也就是對於極端個案,臨床人員可以快、準地評估!但是我們的 CATs 之表現卻是須要測試很多題項,且誤差大!
2. 或許 multi-dimensional CATs 或可解決上述部分問題,也就是利用向度間相關,以提升評估效能。臨床人員也經常利用此概念(如動作及認知功能差者,其ADL也差;下肢動作能力高,其平衡能力好),以提升臨床效能。所以,上述1.所提問題,在臨床多向度的功能評估時,且極端個案,問題更為明顯。
我之前寫過幾篇論文,利用 multi-dimensional model 以簡化評估項目並降低測量誤差。然而,這些研究樣本皆被施測所有多向度的題目。也就是如果需要測試所有 ADL & Balance CAT 題庫項目,才能運用multi-dimensional model。那將因為題目過多,可行性就降低許多。
若可只測試數個 CATs,即可運用multi-dimensional model,那可行性就增加許多! 但須要多少個案!?個案之能力分布如何?可模擬分析成效如何嗎!?
3. 臨床各功能向度間的關聯,尤其在極端值,都是線性的!?
如前述,動作及認知功能極差(佳)者,臨床人員可(常)自動將ADL, balance 評為最最低(高)分,但如果動作與認知功能在中度者,臨床人員就難以判斷個案之ADL, balance 功能(須要費時施測)。這樣的觀察所得,也就代表臨床人員的判斷是:對極端個案者,各功能間的相關性極高,但對中間能力者,各功能間的相關性較低。也就是各功能間的關聯是「非線性」!
然而目前,此「線性關聯」問題恐不易獲得實證,因為若就我們的 CAT 或 IRT/CAT 測量而言,極端個案之功能估計皆誤差大(或欠缺題目),將導致對些極端個案不同功能間的關聯估計產生較大的誤差,也就是不易驗證。除非我們可以增加題目(這難度很高)以降低測量誤差。
此問題會影響問題 2... 但短期間並不易處理。
關於「運用multi-dimensional model提昇極端個案的評估精準度」,我的看法是:將各domain(如:balance, ADL)的題庫縮減成IRT-based short forms,然後一起放進一個item pool。這樣或許比直接用所有domain題庫項目施測多了些可行性?之後,試著用bifactor model分析。Bifactor model是multidimensional IRT models的一種,item pool裡面的item皆有二個factor loadings,一個是”general” factor loading, 一個是”domain-specific” factor loading。我看過的IRT論文中,有一些HRQOL評估工具的驗證是使用bifactor model,我認為將balance, ADL, cognition…等評估分數綜合起來,應該蠻像HRQOL的概念,比較屬於formative model。或許balance, ADL, cognition…等評估分數綜合起來,可以形成一個”functional status index”? 符合bifactor model也可進一步發展成CAT。
回覆刪除這是目前看了一些IRT論文後的想法,不曉得正不正確,之後若有其它想法或修正會再post上來。
1. short form 的做法OK,只是 ADL 沒 short form. 且不易做(主要是 IADL 項目一般個案之從事比例不高,故難挑選題目)。
回覆刪除2. 可否釐清 bifactor 的主要功能?如發展「綜合指標」or 「降低誤差」 or both. 綜合指標的「內容概念(如結合 balance, ADL, cognition)」複雜/混淆,所以目前的QOL還是以多層面指標 (profile) 為主流。