我們在臨床收集到的團體錄影檔,應該超過100個團體/錄影檔。
現有AI的技術至少可以分析其音檔/逐字稿(順道做成錄影檔的字幕),且速度快!!
所以我們已啟動「主持人帶領團體表現」之評估與回饋研究計畫!!
另,後續臨床帶領的團體影音檔,我們應可於2天之內及完成評估與回饋!!
也可交給帶領者自行操作,以快速獲得評分與回饋!!
加上之前計畫書的評分與回饋,即可更完整!!
我相信後續應可證實這些評估與回饋可讓團體帶領的品質與成果「顯著提升」!!
從2009年7月生涯第1次研究休假開始撰寫 blog,以跟同學、好友交流教學/研究,甚至臨床之心得。
以下是我的座右銘:
Try hard enough, you can get what you want!
Talent is the desire to practice.
Slow and Steady wins the game.
Better to light one candle than to curse the darkness.
你現在的努力 要感動未來的你!
只有藉由他人的視野,才能看到自己思考上的盲點。
我們在臨床收集到的團體錄影檔,應該超過100個團體/錄影檔。
現有AI的技術至少可以分析其音檔/逐字稿(順道做成錄影檔的字幕),且速度快!!
所以我們已啟動「主持人帶領團體表現」之評估與回饋研究計畫!!
另,後續臨床帶領的團體影音檔,我們應可於2天之內及完成評估與回饋!!
也可交給帶領者自行操作,以快速獲得評分與回饋!!
加上之前計畫書的評分與回饋,即可更完整!!
我相信後續應可證實這些評估與回饋可讓團體帶領的品質與成果「顯著提升」!!
早上測試 ChatGPT vs Gemini vs Claude 之 Deep Research 表現 (June 8, 2025)。
我的 prompt: "請彙整2023年迄今,以大型語言模型發展虛擬病人或虛擬考官之實證論文,且可於 PubMed 或 Scopus 資料庫可查詢到的實證論文"
三者皆自動解讀 prompt,列出特定執行流程與範疇,以供使用者確認。
如 Gemini:
----------------------------------------------------------------------------
(1) 針對 PubMed 與 Scopus 資料庫,設定關鍵字組合進行檢索,關鍵字包含「大型語言模型」(Large Language Model, LLM)、「生成式AI」(Generative AI)、「虛擬病人」(virtual patient)、「標準化病人」(standardized patient)、「虛擬考官」(virtual examiner) 及「客觀結構式臨床測驗」(OSCE) 等,並將發表日期限定在2023年1月1日迄今。
(2) 篩選搜尋結果,識別出屬於「實證研究」性質的論文,排除純理論探討、評論或會議摘要等非實證文章。
(3) 針對每一篇符合條件的論文,詳細摘要其核心內容,包括:
(a) 研究使用的具體大型語言模型(例如 GPT-4, Llama 等)。
(b) 虛擬病人或考官的應用情境(例如:醫學教育、臨床技能訓練、能力評估)。
(c) 研究方法與設計,包含系統開發流程與評估方式。
(d) 主要研究發現、數據結果與成效。
(4) 綜合所有論文的資訊,分析當前以大型語言模型發展虛擬病人或考官的技術趨勢、主要挑戰(如:回答的準確性、安全性、倫理問題)以及未來研究方向。
(5) 比較不同研究在方法學上的異同,例如提示工程(prompt engineering)的技巧、評估虛擬角色表現的指標,以及衡量的教育成效。
---------------------------------------------------------------------------
我確認或修改後,他們就開始執行!!
約10分鐘後(可去喝茶/咖啡),就彙整出來了,包含參考文獻(正確率很高,皆可連結/驗證)!
效能一定超越碩班畢業生水準,因為時間效率(應是50:1--碩班畢業生至少要花50倍的時間,品質就不說了;博班生或是20:1)。
ChatGPT vs Gemini vs Claude 三者表現差異呢? 我覺得差不多!!
如 4. 擬定適當且完整治療計畫。
5. 記錄與報告病人的臨床事件。
6. 記錄與報告精神疾病病人的臨床資料。
生成式AI醫學教育標準---
後續宜發展「以生成式AI發展影音教材之SOP與評估標準」&「以LLM發展虛擬病人與虛擬考官之SOP與評估標準」,因為這些SOP與評估標準皆對於後續的醫學教育研究具有很重要的指引與驗證需求。
---------------------------------------
以下是針對「以生成式AI發展影音教材之SOP與評估標準」的評論:
獨特價值:技術創新與教育結合:
個人化學習的突破:
教學設計整合:
---------------------------------------------------
「以LLM發展虛擬病人與虛擬考官之SOP與評估標準」
創新價值:
---------------------------------------------------
VP 驗證模式:
對話內容之一致性與正確性(>12項*2種對話來源[自然對話(>10 examiness)與設定對話(New Chat 3次)]*>5VP)
對話風格之一致性與正確性(>5項*2種對話來源[自然對話與設定對話]*>5VP)
專家設定對話,以FIFE言,可約12題(可驗證prompt有無舉例/設定)
VR (virtual rater) 驗證模式:
評分與回饋內容之一致性與正確性