2021年5月9日 星期日

發展短版工具之方法與結果比較

我們團隊使用過4種方法 以發展短版工具【簡化良好的標準化評估工具,以提升施測效能】:

1.傳統計量(如挑選信度與反應性良好之項目,或簡化量尺)

2.多向度 Rasch model (利用向度間關聯以提升信度,故可刪減題數且保持信度)

3.電腦適性測驗

4.AI

代表性著作對應如下

1. Chou CY, Chien CW, Hsueh IP, Sheu CF, Wang CH, Hsieh CL. Developing a short form of the Berg balance scale for people with stroke. Phys Ther. 2006;86:195-204

2. Hsieh YW, Hsueh IP, Chou YT, Sheu CF, Hsieh CL, Kwakkel G. Development and validation of a short form of the Fugl-Meyer motor scale in patients with stroke. Stroke. 2007;38:3052-3054

3. Hou WH, Shih CL, Chou YT, Sheu CF, Lin JH, Wu HC, et al. Development of a computerized adaptive testing system of the Fugl-Meyer motor scale in stroke patients. Arch Phys Med Rehabil. 2012;93:1014-1020

4.Lin GH, Huang CY, Lee SC, Chen KL, Lien JJ, Chen MH, et al. A 10-item Fugl-Meyer motor scale based on machine learning. Phys Ther. 2021;101

優缺點如下

1.傳統計量之優點為簡易/直觀,可換算成原始分數;但缺點為評分簡化,個別層級反應性變差。

詳:Chen KL, Chou YT, Yu WH, Chen CT, Shih CL, Hsieh CL. A prospective study of the responsiveness of the original and the short form berg balance scale in people with stroke. Clin Rehabil. 2015;29:468-476

2.多向度 Rasch model 短版之優點包含 Rasch 分數具有等距特質;但分數為標準分數,除了無法對應原始分數,一般使用者不易解讀。一般使用者需要APP轉換為 Rasch 分數。

3.電腦適性測驗之施測項目最少;但分數為標準分數,且施測者須孰悉所有項目,訓練較花時間。且施測須電腦,造成臨床人員不便。

4.AI短版之優點為項目少且可獲致類似原始總分之分數,亦可預測其它未施測項目之分數(此功能將於之後的稿件發表);目前唯一缺點為需要APP轉換分數。

我們可寫篇 review article 比較這些方法(或其它相關方法)之優缺點,並提出未來研究建議。有興趣者歡迎找我。

Note 1: 萌生此構想之緣由有三:1.之前 Stroke rehabilitation guideline (2016) 所推薦的評估工具(包含多個我們發展的CAT),作者不熟悉CAT,但提到其未來性。這是遠因。2.最近的AI短版稿件(2021),editor 不熟悉CAT與AI短版之差異,希望我們說明。這是近因。3.時機到了...我們有多人參與此歷程/我們經驗/成果豐富/方法也夠先進!! 自我感覺/信心良好!!
Note 2. 傳統計量方法這篇 "Developing a short form of the Berg balance scale for people with stroke"論文被引用次數最多(Google 約200次).... CAT 那篇被引用的就少很多(約30次)...  目前解釋為:曲高和寡。那AI短版呢?? 我蠻有信心的喔!!

沒有留言:

張貼留言