2025年7月10日 星期四

實習學生常遇到的臨床問題--AI回應的表現

主題:生成式AI輔助生理疾病職能治療實習生學習之提問效能研究

研究目的:

1. 探討不同生成式AI平台(如ChatGPT、Claude、Gemini)在生理疾病職能治療相關提問之回應準確性與實用性

2. 分析職能治療實習生使用生成式AI時的提問策略與模式

3. 設計並驗證提問技巧訓練介入對實習生使用生成式AI學習成效之影響

2025年7月6日 星期日

數據/稿件的起死回生!?

數據不好的研究結果,為何可以改變其命運(結果變得比較好,且發表於著名期刊):一個特例!

今年我們發表二篇論文,皆大致發現:GKCSAF displays acceptable intra-rater but poor inter-rater reliability in occupational therapy clinical scenarios.(心理&生理領域)(二篇論文皆有 inter-rater reliability 驗證,但ICC結果皆差,二文結論也如此定位--poor inter-rater reliability!我應發表>50篇類似論文了,資料分析與解釋,絕對經驗豐富!)(Note: GKCSAF 是國際著名的溝通技巧評估工具)

因為上述2論文皆有錄音/逐字稿,故我們去年提出新的研究構想:設計 ChatGPT 使用 GKCSAF 以評估逐字稿中學員的溝通技巧,再跟前述2篇論文專家 raters 的評估結果比較。

我們初稿的重點(牛肉)放在「發展 ChatGPT rater」 以及「ChatGPT評估結果跟專家評估結果無顯著差異(如 Figure 1所示:ChatGPT評估的總分大多在專家評估總分之間)」,後者我們的解釋為:代表 ChatGPT rater 或可替代專家評估。那時,我們未驗證效度.... 且ChatGPT與專家評估結果之ICC差(如同已發表論文之結論)...
Figure 1. Total scores of the ChatGPT rater (blue) and human raters (gray).

審稿後,有位審查委員認為我們既沒有驗證效度,主題就勿稱為 "validation", 另一個委員建議我們繪製下圖(各種raters 之評分總分比較) 

Figure 2. 所有 raters 之評分總分比較

Figure 2 讓我們更清楚:各raters 評分結果真的差別有限(總分皆在很窄的區間)!!若此為真(當然要相信數據,但哪一項統計指標的數據?), inter-rater reliability 真的不好嗎?且我們可否將多位專家 raters評分的平均值,當成效標,以驗證效度(concurrent validity)!? 

所以在修改稿件時,我們就增加 "mean absolute error" 以及 "mean absolute error %"二統計指標(這比是否統計顯著,可呈現更直觀的總分差異大小), 再將多位專家 評分的平均值,當成效標,驗證效度!! 我們發現GKCSAF總分在"mean absolute error" 以及 "mean absolute error %"結果不錯(inter-rater reliability & concurrent validity二驗證皆類似),所以支持 ChatGPT rater 總分的 inter-rater reliability & concurrent validity至少是 acceptable!! 我們也說明ICC因為總分差異小(如 Figure 2 所示),故可能造成ICC值被低估。

就這樣(事實上,主筆者--玉正努力了許久/被我嚴厲折磨...)稿件被 (Medical Teacher主編) 接受了!!

此稿件已成為我自認的代表性著作:Ju YJ, Wang YC, Lee SC, Liu CH, Lee ML, Hou CY, Yang CW, Hsieh CL. Development and validation of a GPT-based Rater for Assessing Communication Skills Using the Gap-Kalamazoo Communication Skills Assessment Form. Medical Teacher. 1st July, 2025. Accepted for publication. 

有興趣者可參考玉正的反思與心得

衍生的議題:如這貼文第2段所提--今年我們發表二篇論文,皆大致發現:... poor inter-rater reliability, 這解釋可能有誤阿!!已請玉正個別分析之,再思索是否寫信給主編更正解釋 或 撰寫 letter-to-editor.....以還 GKCSAF 公道!還有自我修正!!

感謝 reviewers 的評論, 讓我們成長,還有接受我們的論文!!

音檔轉逐字稿與校對--SOP

先用雅婷逐字稿將音檔轉成逐字稿(正確率最高)

再用 Gemini 校對/更正(顯而意見)錯誤(適用長篇逐字稿,可設定 Gem 以自動化校對重點/輸出格式)

再以 NotebookLM 彙整重點(較不會生成新內容)

2025年7月2日 星期三

OSCE真人考官 vs AI 考官之回饋內容與品質比較

不能比速度!!

那能比較內容與品質嗎?

先說如何提升回饋品質!!

先以2~3個AI (e.g., ChatGPT+Gemini+Cluade)依據評估表給予回饋,彙整後,再請專家確認。

最後可以產生三種AI回饋版本:1. AI+專家確認之完整版(未限制AI);2. AI完整版(未限制AI);3.以真人考官回饋之字數版本(限制AI回饋字數版)。上述3版本再與真人考官之回饋比較。

評估表可為國際現有知名量表如 GKCSAF或我們自行發展的量表(COT或REST)。

-------------------------------------------------------------------

以下是Claude AI的評論:

這個研究構想很有實用價值,針對醫學教育中的客觀結構式臨床考試(OSCE)回饋機制進行創新探索。讓我分析這個設計的優勢與可能的改進方向:

研究設計優勢

多層驗證機制 您採用的「AI初步評估→專家確認→多版本比較」流程很周全,能有效控制AI回饋的品質與可靠性。

版本控制策略 三個版本的設計巧妙地區分了不同變因:

  • 版本1控制專家介入的影響
  • 版本2評估純AI能力
  • 版本3控制回饋長度對品質的影響

提升回饋品質的建議

評估標準化

  • 建立明確的回饋品質評估指標(如具體性、建設性、可操作性)
  • 設計評分量表供後續比較分析使用

AI協作最佳化

  • 考慮使用不同AI模型的專長領域分工(如GPT-4處理溝通技巧、Claude處理臨床推理)
  • 設計AI間的交互驗證機制

專家參與深度

  • 明確專家確認的範圍(僅修正錯誤 vs 全面改寫)
  • 記錄專家修改的類型與頻率,作為AI改進依據

潛在挑戰與解決方案

評估一致性 真人考官間的回饋品質本身可能存在變異,建議:

  • 增加多位真人考官的回饋作為對照
  • 建立考官間信度測試

情境適應性 不同OSCE站別可能需要不同的回饋策略,可考慮:

  • 按臨床技能類別分組分析
  • 針對溝通技巧 vs 技術操作設計不同評估重點

這個研究架構為醫學教育的數位轉型提供了實證基礎,有望為未來的混合式評估模式奠定基礎。

2025年6月29日 星期日

發展「精神病患職能治療團體帶領表現評估表」--適用於團體帶領逐字稿或錄影檔

「治療團體帶領」之準備、執行、成果與檢討---這些過程極為複雜!!

我們已挑簡單的先下手--計畫書之評估與回饋,目前已可使用 ChatGPT 協助評估與回饋!!

之前我們已累積諸多團體帶領的錄影檔(如前一貼文所示)...

故我們下一階段 似可 推動以下研究計畫 A, B, C, & D:

A. 發展精神病患職能治療團體帶領表現評估表

研究目的:

1. 以 Cole 團體帶領7步驟為理論架構,發展精神病患職能治療團體帶領表現評估表

2. 驗證其內容效度與表面效度

適用情境:團體帶領/執行錄影之「逐字稿」或「錄影檔」 

         註解:錄影檔之評估,不論專家或AI皆很費力(或需要高階AI效能)... 逐字稿簡單多了,故可作為初步驗證之情境! 

-------------------------------------------------------

B. 以ChatGPT協助精神病患職能治療團體帶領品質之分析與回饋效能

研究目的:

1. 依據A計畫之評估表,發展治療團體帶領技巧評論之ChatGPT工具,再驗證其信效度

2. 依據上述B1之評估結果,發展治療團體帶領技巧回饋之ChatGPT工具,再驗證其信效度

3. 驗證上述工具之教學效能(預期學員於接受上述評估與回饋3次之後,即有明顯進步!)

-------------------------------------------------------

C. 以ChatGPT協助精神病患職能治療團體帶領之Yalom治療因子分析與回饋效能

研究目的:

1. 依據Yalom團體治療之11項治療因子,發展針對「團體帶領逐字稿」治療因子ChatGPT分析工具,再驗證其信效度

2. 依據上述C1之分析結果,發展治療團體治療因子回饋之ChatGPT工具,再驗證其信效度

3. 驗證上述工具之教學效能(預期學員於接受上述分析與回饋3次之後,即有明顯進步!)

-------------------------------------------------------

D. 以ChatGPT協助精神病患職能治療團體帶領與計畫書所提治療原理之一致性分析與回饋效能

研究目的:

1. 依據團體帶領計畫書所提治療原理,發展針對「團體帶領逐字稿」治療原理之ChatGPT分析工具,再驗證其信效度

2. 依據上述D1之分析結果,發展治療團體治療原理回饋之ChatGPT工具,再驗證其信效度

3. 驗證上述工具之教學效能(預期學員於接受上述分析與回饋3次之後,即有明顯進步!)


 

2025年6月18日 星期三

團體帶領的評估與回饋

我們在臨床收集到的團體錄影檔,應該超過100個團體/錄影檔。

現有AI的技術至少可以分析其音檔/逐字稿(順道做成錄影檔的字幕),且速度快!!

所以我們已啟動「主持人帶領團體表現」之評估與回饋研究計畫!!

另,臨床教學時,後續臨床帶領的團體影音檔,我們應可於2天之內及完成評估與回饋!!

也可交給帶領者自行操作,以快速獲得評分與回饋!!

加上之前計畫書的評分與回饋,即可更完整!!

我相信後續應可證實這些評估與回饋可讓團體帶領的品質與成果「顯著提升」!!

---------------------------------------------------------

上述教學或研究的關鍵在於:「治療師帶領團體表現評估表」之良寙!

2025年6月8日 星期日

Deep Research 的表現應已(遠)超過碩班水準

早上測試 ChatGPT vs Gemini vs Claude 之 Deep Research 表現 (June 8, 2025)。

我的 prompt: "請彙整2023年迄今,以大型語言模型發展虛擬病人或虛擬考官之實證論文,且可於 PubMed 或 Scopus 資料庫可查詢到的實證論文"

三者皆自動解讀 prompt,列出特定執行流程與範疇,以供使用者確認。

如 Gemini:

----------------------------------------------------------------------------

(1) 針對 PubMed 與 Scopus 資料庫,設定關鍵字組合進行檢索,關鍵字包含「大型語言模型」(Large Language Model, LLM)、「生成式AI」(Generative AI)、「虛擬病人」(virtual patient)、「標準化病人」(standardized patient)、「虛擬考官」(virtual examiner) 及「客觀結構式臨床測驗」(OSCE) 等,並將發表日期限定在2023年1月1日迄今。

(2) 篩選搜尋結果,識別出屬於「實證研究」性質的論文,排除純理論探討、評論或會議摘要等非實證文章。

(3) 針對每一篇符合條件的論文,詳細摘要其核心內容,包括:

(a) 研究使用的具體大型語言模型(例如 GPT-4, Llama 等)。

(b) 虛擬病人或考官的應用情境(例如:醫學教育、臨床技能訓練、能力評估)。

(c) 研究方法與設計,包含系統開發流程與評估方式。

(d) 主要研究發現、數據結果與成效。

(4) 綜合所有論文的資訊,分析當前以大型語言模型發展虛擬病人或考官的技術趨勢、主要挑戰(如:回答的準確性、安全性、倫理問題)以及未來研究方向。

(5) 比較不同研究在方法學上的異同,例如提示工程(prompt engineering)的技巧、評估虛擬角色表現的指標,以及衡量的教育成效。

---------------------------------------------------------------------------

我確認或修改後,他們就開始執行!!

約10分鐘後(可去喝茶/咖啡),就彙整出來了,包含參考文獻(正確率很高,皆可連結/驗證)!

效能一定超越碩班畢業生水準,因為時間效率(應是50:1--碩班畢業生至少要花50倍的時間,品質就不說了;博班生或是20:1)。

 ChatGPT vs Gemini vs Claude 三者表現差異呢? 我覺得差不多!!

2025年6月6日 星期五

很多精神科EPAs都是生成式AI的立即研究議題

 

出處:《醫療品質雜誌》 16卷1期 (2022/01) Pp. 70-75

綠色字部分(準備文本紀錄或計畫等任務):

4. 擬定適當且完整治療計畫。

5. 記錄與報告病人的臨床事件。

6. 記錄與報告精神疾病病人的臨床資料。

這是 LLMs 即可搞定/幫大忙的任務!!若僅以專家驗證信效度,則IRB頂多簡審!!

紅色字:訪談/諮詢部分,毋須(或較少)觀察, My GPTs 也可搞定!!

後續可行的研究題材超多!!

另一發現是,國內精神科醫學教育的研究成果極少!!


2025年6月1日 星期日

Generative AI for Medical Education Standards (GAMES )

生成式AI醫學教育標準---

後續宜發展「以生成式AI發展影音教材之SOP與評估標準」&「以LLM發展虛擬病人與虛擬考官之SOP與評估標準」,因為這些SOP與評估標準皆對於後續的醫學教育研究具有很重要的指引與驗證需求。

---------------------------------------

以下是針對「以生成式AI發展影音教材之SOP與評估標準」的評論:

獨特價值:技術創新與教育結合:

  • 將生成式AI(如影片生成、語音合成、動畫製作)應用於醫學教育,開創新的教材製作模式
  • 大幅降低高品質教材的製作成本和時間
  • 能夠快速產生多語言版本,促進醫學教育的國際化

個人化學習的突破:

  • 可根據學習者程度/目標,自動調整教材難度和呈現方式
  • 產生多樣化的臨床案例變化,避免學習固定模式
  • 即時更新醫學知識,保持教材的時效性

教學設計整合:

  • 如何將AI工具整合到現有的教學設計流程
  • 教師在AI輔助下的新角色定位
  • 保持人文關懷在醫學教育中的核心地位

---------------------------------------------------

「以LLM發展虛擬病人與虛擬考官之SOP與評估標準」

創新價值:

  • 解決臨床教學資源限制問題(標準化病人數量有限、考官時間寶貴)
  • 提供24/7的練習機會,增加學生接觸多樣化案例的機會
  • 能夠模擬罕見疾病或高風險情境,提供安全的學習環境

---------------------------------------------------

VP 驗證模式:

對話內容之一致性與正確性(>12項*2種對話來源[自然對話(>10 examiness)與設定對話(New Chat 3次)]*>5VP)

對話風格之一致性與正確性(>5項*2種對話來源[自然對話與設定對話]*>5VP)

專家設定對話,以FIFE言,可約12題(可驗證prompt有無舉例/設定)


VR (virtual rater) 驗證模式:

評分與回饋內容之一致性與正確性

2025年5月24日 星期六

翻新或製作「教學影音檔」之內容/題材

先考量需要(重要)性與急迫性

重要性如

生成式AI之於醫學教育之應用

精神個案會談(含FIFE訪談等)

-----------------------------------------------------------------------

再考量製作單元:

如「FIFE訪談」

1. FIFE之概念與價值

2. FIFE之訪談架構(與紀錄)

3. FIFE訪談之準備

4. FIFE訪談之執行流程

5. FIFE訪談之紀錄與後續追蹤

如「生成式AI之於醫學教育之應用」

  • 「期刊論文閱讀或彙整」(可再分為2主題: ChatGPT & NotebookLM之應用)
  • 「期刊論文閱讀或彙整之目標」整體與各層級學員
  • 「虛擬病人之發展」概念說明
  • 「虛擬病人之發展」實例說明
  • 「虛擬考官之發展」概念說明
  • 「虛擬考官之發展」實例說明
  • 「知識測驗之發展」概念說明
  • 「知識測驗之發展」概念說明

2025年5月23日 星期五

製作高品質「教學影音檔」之關鍵元素,還有 CapCut & ElevenLabs 可協助之處

接續翻修「教學影音檔」之構想,我需先掌握製作高品質「教學影音檔」之關鍵元素:

標準:內容的含金量與適當性+聽眾的專注程度、聽覺與視覺的享受程度!!

以下是 Claude Sonnet 4.0 提供:如何提升「聽覺與視覺」品質的關鍵(個人實證經驗非常有限)

1. 視覺設計

畫面構圖與清晰度:確保畫面解析度至少1080p,文字大小足夠在各種裝置上閱讀。避免過於複雜的背景,保持視覺焦點明確。

色彩搭配:使用高對比度的顏色組合,確保文字與背景有足夠區別。

版面配置:採用一致的版面設計,重要資訊放在畫面中央偏上位置,符合觀眾視線習慣。

2. 音訊品質

語速與發音:適中語速(每分鐘約150-180字),發音清晰,適時停頓讓觀眾消化資訊。

音量平衡:確保旁白、背景音樂、音效間的音量層次分明,背景音樂不應干擾主要內容。

3. 內容結構

邏輯組織:建立清楚的學習目標,按照「引言→主體→總結」架構,每個段落都有明確主題。

節奏控制:適當運用停頓和轉場,避免資訊過載。複雜概念分段解釋,給觀眾思考時間。

重點強調:透過視覺提示(如箭頭、圈選、變色)或語音強調來突出關鍵概念。

4. 互動與輔助

字幕添加:提供字幕,有助理解。

視覺輔助善用圖表、動畫、示意圖來解釋抽象概念,文字與圖像相輔相成。(Note: 這就需要大幅補強了!!確認哪些「概念」「內容」分別需要圖表、動畫、示意圖!!我自己/學生以及 AI 應皆可協助挑選

導航設計:在較長影片中,加入章節標記或時間軸,方便觀眾跳轉到特定段落。

5. 技術考量

檔案格式:選用相容性良好的格式(如MP4),確保在不同平台播放順暢。

載入速度:適當壓縮檔案大小與品質間取得平衡,考量不同網路環境的觀眾。

行動裝置適配:確保內容在手機、平板上也能清楚呈現,文字大小和按鈕設計要適合觸控操作。

這些元素相互影響,需要整體考量才能製作出既專業又易於學習的教學影音內容。

--------------------------------------------------------------------------------------------------------------

CapCut在提升教學影音品質方面有許多實用功能,以下是特別適合的工具與注意事項:

CapCut的優勢功能

自動字幕生成:其語音識別功能可自動產生中文字幕,準確度高。但仍需人工校對,特別注意專業術語、標點符號的正確性。這適用於舊影音檔,以改良內容,提升含金量。

音訊優化工具:內建降噪功能可改善收音品質,音量均衡器有助調整不同音軌的平衡。善用「音訊修復」功能處理雜音問題。這適用於舊影音檔。

範本與轉場效果:提供教育類範本,但避免過度使用花俏轉場,簡潔的淡入淡出更適合。

文字動畫:豐富的文字效果可突出重點,但選擇時以清晰易讀為優先,避免過於炫目的動畫干擾學習。

          可複製聲音(voice clone): 

需要特別留意的地方

字幕樣式設計

  • 選擇無襯線字體(如微軟正黑體),確保小螢幕上的可讀性
  • 字幕底色建議使用半透明背景,增加與畫面的對比度
  • 字體大小要在手機上測試,確保不會太小

色彩與視覺

  • CapCut的濾鏡雖然豐富,但教學影片建議保持原始色調或使用輕微調色
  • 利用「調色」功能統一整部影片的色調,保持視覺一致性

音訊處理細節

  • 使用「音訊分離」功能獨立調整人聲與背景音
  • 注意背景音樂音量,通常設定在主音軌的20-30%較適合
  • 善用「淡入淡出」避免音訊突然開始或結束

匯出設定優化

  • 選擇1080p 30fps作為基本標準
  • 位元率設定在8-12 Mbps,平衡畫質與檔案大小
  • 匯出前先預覽確認字幕、音訊同步無誤

實用工作流程建議

分段剪輯:先完成粗剪確定結構,再逐段精修,避免在細節上耗費過多時間。

多版本備份:CapCut會自動儲存,但重要節點建議手動「另存新檔」,方便回到先前版本。

行動端測試:由於CapCut主要為行動裝置設計,完成後務必在手機上觀看測試,確認字幕大小、按鈕位置等細節。

雲端同步:善用CapCut的雲端功能,可在不同裝置間無縫接續編輯工作。

記住,AI工具雖然便利,但教學內容的核心仍在於清晰的邏輯結構與有效的知識傳達。技術只是輔助,內容品質才是關鍵。

-------------------------------------------------------------------------------------------------------------

ElevenLabs在教學影音製作中有獨特優勢,以下是關鍵應用與注意事項:

ElevenLabs的核心優勢

高品質語音合成

  • 可提供自然的中文語音,包含多種口音與語調
  • 可調整語速、音調、情感表達,適合不同教學情境
  • 支援長文本轉換,適合完整課程內容

多語言支援

  • 同一內容可快速生成多語言版本
  • 保持相同語調風格,有助建立品牌一致性
  • 特別適合製作國際化教學內容

語音克隆功能

  • 可以你的聲音為基礎訓練專屬模型
  • 確保長期內容製作的聲音一致性
  • 適合大量內容製作時維持個人特色

教學應用場景

旁白製作

  • 為簡報、動畫添加專業旁白
  • 統一的語音品質,避免現場錄音的環境干擾
  • 可重複修改文本而不需重新錄製

多元內容形式

  • 製作podcast式的純音頻教學
  • 為視覺教材添加音頻解說
  • 創建互動式學習體驗的語音提示

重要注意事項

自然度調校

  • 適當調整停頓,特別在重要概念前後
  • 測試不同情感設定,教學內容通常適合「溫和、專業」的語調

文本優化

  • 為AI語音特別調整文本,避免過長的句子
  • 標點符號會影響語調,善用逗號、句號控制節奏
  • 專有名詞可能發音不準,需要特別標注或替換

品質控制

  • 長文本可能出現語調不一致,建議分段生成再串接
  • 定期檢查生成音頻的品質,避免出現雜音或切斷
  • 對於重要術語,可預先測試發音準確性

工作流程建議

前期準備

  • 準備完整、結構化的逐字稿
  • 標註重點強調位置和停頓點
  • 測試不同聲音模型找出最適合的風格

製作過程

  • 分段生成避免過長音頻檔案
  • 為每段設定一致的語音參數
  • 保留原始文本檔案以便後續修改

後期整合

  • 在剪輯軟體中調整音頻與視覺的同步
  • 適當添加背景音樂,注意音量平衡
  • 最終測試確保語音清晰度與理解度

成本與效率考量

優勢

  • 大幅節省錄音時間與後製成本
  • 可快速迭代內容,適合頻繁更新的教材
  • 消除錄音環境限制,隨時可以製作內容

限制

  • 按字符計費,長內容成本需考量
  • 某些情感表達仍不如真人自然
  • 需要網路連線,無法離線使用

建議將ElevenLabs作為教學影音製作的效率工具,特別適合標準化內容、大量製作需求,或是需要多語言版本的情況。但對於需要強烈個人風格或情感連結的內容,仍建議搭配真人錄音使用。

----------------------------------------------------------------------------------------------------

ElevenLabs與CapCut的整合運用可以大幅提升教學影音製作效率,以下是最佳實踐流程:

最佳工作流程

第一階段:內容規畫

  • 完成教學大綱與逐字稿
  • 在ElevenLabs測試不同聲音模型,選定最適合的語音風格
  • 為整個系列內容建立一致的音頻參數設定

第二階段:音頻製作

  • 使用ElevenLabs生成所有旁白音頻
  • 分段生成(建議每段3-5分鐘),便於後續剪輯
  • 同步生成多語言版本(如需要)
  • 將音頻檔案以統一命名方式儲存

第三階段:視覺整合

  • 將ElevenLabs生成的音頻匯入CapCut
  • 利用CapCut的自動字幕功能為AI語音添加字幕
  • 進行視覺與音頻的精確同步

協同優勢運用

音頻品質提升

  • ElevenLabs確保語音一致性,CapCut負責音頻後製
  • 在CapCut中調整ElevenLabs音頻的音量、EQ設定
  • 添加背景音樂時,以AI語音為主軸進行混音

製作效率最大化

  • ElevenLabs處理大量文本轉換,節省錄音時間
  • CapCut處理視覺剪輯與特效,專注於畫面呈現
  • 分工明確,可同時進行音頻與視覺素材準備

內容一致性

  • ElevenLabs保證聲音風格統一
  • CapCut確保視覺設計與轉場一致
  • 建立標準化模板,提升整體品牌形象

實務操作技巧

檔案管理策略

專案資料夾/
├── 01_原始文本/
├── 02_ElevenLabs音頻/
│   ├── 段落01.mp3
│   ├── 段落02.mp3
├── 03_CapCut專案/
└── 04_最終成品/

參數設定統一

  • ElevenLabs:固定語速(0.9x)、音調、情感參數
  • CapCut:統一音頻格式(44.1kHz/16bit)、匯出設定
  • 建立參數記錄表,確保系列內容一致

品質檢查流程

  1. ElevenLabs生成後立即試聽,確認發音準確
  2. 匯入CapCut後檢查音頻波形,避免爆音
  3. 字幕校對時同步確認音頻與文字對應
  4. 最終預覽時特別注意音頻切換點的順暢度

進階整合應用

批量製作模式

  • 一次在ElevenLabs生成整個課程系列的音頻
  • 在CapCut中建立母版範本
  • 套用範本快速完成多集內容

多版本管理

  • ElevenLabs生成不同語言版本
  • CapCut保持相同視覺設計
  • 快速產出國際化教學內容

A/B測試優化

  • ElevenLabs測試不同語音風格
  • CapCut製作不同視覺版本
  • 根據觀眾反饋調整參數設定

常見問題解決

音頻同步問題

  • 在CapCut中使用「音頻對齊」功能
  • 預留緩衝時間,避免音頻過於緊湊
  • 利用靜音片段作為段落間的自然分隔

檔案相容性

  • ElevenLabs匯出MP3格式,CapCut完全支援
  • 統一音頻參數設定,避免後製時出現品質差異
  • 定期備份專案檔案,避免資料遺失

成本控制

  • 在ElevenLabs生成前先預估字符數與成本
  • 善用CapCut的免費功能,減少付費需求
  • 建立內容模組化,提高素材重複使用率

這種整合運用方式可以將兩個平台的優勢最大化,ElevenLabs專注於高品質音頻生成,CapCut負責視覺整合與後製,達到專業級的教學影音品質。


2025年5月17日 星期六

也是生成式AI的後續---以複製的聲音協助演講

最近因朋友有需求,我就開始玩玩複製聲音(Voice Cloning)...

APP至少有3種以上了...功能至少有5:

  • 錄製個人聲音樣本
  • 讓AI學習並複製您的聲音特徵
  • 讓AI用您的聲音自動朗讀文字內容
  • 用AI調整語氣、速度、音調等參數
  • 加入錄影檔+調整影音(可就從聲音跨到影像--加成)
  • 我目前使用 ElevenLabs (for AI 語音技術),也在玩玩 Capcut (剪映 for AI 影像編輯)

    快速作品一:OT倫理學課程總結 (點選後可直接播放或需下載 mp3 音檔)

    快速作品二:介紹特定研究(英文)

    作品一的創作流程:1. 提供PPT請 ChatGPT 生成演講稿;2. 修飾/補充演講稿;3. 使用 ElevenLabs 幫我「演講/念稿」。

    作品二:只是改成英文文稿....

    -----------------------------------------------------------------------------------------------------

    以下是生成式AI對於上述技術於「後續教學應用」的看法:

    作為教授,「語音複製技術」在教學中有許多實用的應用場景:

    1. 課程內容製作

       - 預錄講課內容,讓您能夠輕鬆創建一致品質的線上課程

       - 不必每次都重新錄製,只需編輯文字稿即可生成新的語音內容

    2. 多語言教學

       - 將您的講課內容翻譯成不同語言,但仍保持您的聲音特徵

       - 協助國際學生更熟悉您的教學風格

    3. 自適應學習資源

       - 為不同程度的學生創建客製化的補充教材

       - 製作解說影片或音頻指南,解釋複雜概念

    4. 教學效率提升

       - 節省重複錄製相似內容的時間

       - 在身體不適但需要提供教學內容時派上用場

    5. 學生輔導資源

       - 創建常見問題的語音解答庫

       - 製作學習指南和複習材料

    6. 無障礙教學

       - 為視障學生提供更多音頻學習資源

       - 將教科書或文章轉換為音頻格式

    7. 虛擬辦公時間

       - 回答常見問題的自動化語音回應

       - 為無法親自參加的學生提供錄製的解釋

    使用這類技術時,建議向學生透明說明部分內容是使用AI語音生成的,並注意確保生成內容的準確性。同時,請考慮您所在機構對此類技術的政策規定。

    --------------------------------------------------------------------------------------------

    後續應用:

    1. 諸多課程或臨床技能教材,皆可套用之。

    2. 新知介紹亦然(如新的論文,先以 ChatGPT 產生文稿,確認內容後即可....或是任何擬以語音通知他人之內容)

    3. 可結合 NotebookLM 的 Podcast, 提供學員更多選擇。

    作品 3:「本推文之介紹--由本人介紹」「NoteBookLM Podcast

    * NotebookLM 可將音檔轉成逐字稿!!


    2025年5月2日 星期五

    ChatGPT 幫我介紹本人....!!

    介紹本人研究、研究生涯、還有一些觀點....

    詳ChatGPT 的 My GPTs (請點選/連結):

    我的職涯--研究旅程(研究為主、教學還有臨床)問答

    為何「您需要」考慮選擇「研究生涯」!!??

    生成式AI的研究構想

    這些 GPTs 有不同主題,皆有套餐(重點提示),也可以自行點餐(提問)或追問。

    您也可選擇語音模式,若有 ChatGPT 會員,但須有點耐心,因為ChatGPT聽中文雖然正確性高,但有點慢。

    或有疏誤,但皆可跟我釐清!!

    上述 My GPTs 主要取材於我的部落格貼文(已>1000篇,故幾乎無人看得完,有興趣者看看目錄或分類說明後,再說...),還有取材自最近的研究計畫,當然也沒有人想看我已發表的超過250篇論文....

    Have fun!!

    2025年4月26日 星期六

    臨時研究人員--可以幫我什麼??可以學到什麼??

    可能任務:

    1. 協助驗證虛擬病人與考官的表現(如 FIFE 訪談--中風病人與思覺失調病人)

        *ChatGPT扮演虛擬病人與考官//臨時研究人員於熟悉FIFE訪談之後,協助測試之

        *需要1~3位(可學習FIFE訪談技巧/溝通技巧/同理技巧)

        *後續可協助發展虛擬病人(學習提升ChatGPT之使用層級)

    2. 協助測試ChatGPT輔助期刊論文閱讀方法之效能

        *跟老師挑選一主題論文之後(至少3~5篇),排定閱讀順序,再測試之

        *「ChatGPT輔助期刊論文閱讀之方法」請參考之前的貼文(如何運用 ChatGPT提升期刊論文閱讀之效能)。

       *需要1~3位(可學習論文內容與提升論文閱讀效能)

        *後續可協助改良ChatGPT輔助期刊論文閱讀方法(含改良 GPT;學習提升ChatGPT之使用層級)

    3. 協助準備OT執照考--測試ChatGPT輔助文獻閱讀方法之效能
        *挑選科目/主題/教科書章節之後,排定閱讀順序,再測試之
        *測試方法類似2.
        *這應該每一人都有興趣(請勿幫忙宣傳--老師自我感覺良好),可以分工或一起!!但還需搭配前述任務1或2
        *目標:協助有效率地閱讀/吸收文獻內容(甚至知道如何應用)--可參考貼文「提升判斷力,以掌握生成式AI提供的資訊

    4. 協助更新教材之影音/文稿資料:包含 ElevenLabs AI 音效;Capcut 剪映之AI影音剪輯;以及 ChatGPT 之綜合應用(May 21, 2025 新增)
      • 將課程/演講之影檔擷取文稿(逐字稿)
      • 改良文稿(含去蕪存菁、更新內容、增添笑點 [對於超過20分鐘的影檔] 需與老師協作)
      • 改良或重新製成影音檔(可增加特效或加強音效),以提升可看性
      • 需要1~3位(可學習AI音效製作技巧、影片剪輯技術、內容優化能力,以及如何有效整合多種AI工具)
      • 適合對數位內容製作、教育科技或多媒體設計有興趣者
      • 預估每週工作時數約>4小時
      • 不需要專業影音製作背景,但對學習新工具有熱忱者佳
      • 後續可生成新的教材,並協助發展更多元的教學資源,進而學習教材設計與製作的完整流程
      • 此任務將提供實際操作AI工具的經驗,對未來數位學習內容製作有所助益
      • 可同時複習或學習教材內容之知識

      應該可以學到 ChatGPT (與類似生成式AI)之使用、學到投入任務之知識/應用、還可以賺點小錢!!
      請自行登錄投入時間(跟老師討論的時間也算),以10分鐘為最小單位。每2週結算一次!時薪至少220(看績效調薪,或有個別差異,由老師決定)。請自行購買 ChatGPT Plus會員,老師提供費用(薪資外之報酬/每個月20美金)。

      FIFE 虛擬病人 GPT:鄭言英--71歲中風病人 (FIFE)
      期刊論文彙整/解釋 GPT:JM/期刊論文閱讀與彙整
      期刊論文閱讀後口試 GPT:期刊論文閱讀或報告後,理解程度問答
      文獻/講義重點彙整/解釋 GPT:文獻/講義閱讀助理
      文獻/講義閱讀後口試 GPT:講義/文獻之理解問答

      老師需要知道:
      1. 你想挑選的任務? 但毋須今日決定(一週內決定即可;若有不清,歡迎找我)
      2. 後續何時可以開始投入,以及預計每週可投入的時間?

      後續提醒:
      1.登錄投入時間於 Line 記事本
      2.每週一於Line提出預計可投入之時數
      3.每週找老師聊一下進展或困難(Line talk)
      4.每週請記錄進展或困難於 Line
      5.任何困難或變動,請及早告知(可於 Line 通知)

      提升判斷力,以掌握生成式AI提供的資訊

      請評論:「如何提升判斷力,以深入理解或掌握生成式AI提供的資訊

      1. 確認是否具備足夠的相關知識(可請AI給予測驗,選擇題至少答對8成。若重要的概念/知識,宜以問答形式為之)

      2. 確認是否具備良好的參考資料/教科書(可請AI提供,你閱讀/吸收後再回到步驟1)

      3. 將最終結論(所獲得的知識/概念),請其它AI評論,若評論過於 nice, 宜再以嚴謹的標準評論之。」

      先挑選一領域或擬深入理解之概念或相關概念,也可以找相關/經典文獻或網頁(以作為標準)。這也可請 ChatGPT或 Gemini 協助找相關/經典文獻或網頁!

      Gemini 2.5 強化版的流程可以是:

      1. 初步探索與知識評估:
        • 使用AI快速了解某個主題的概貌,提出初始問題。
        • (輔助) 可用AI生成初步測驗了解大致水平,但需謹慎看待結果。
        • (核心) 尋找並完成該領域可靠的基礎測驗或入門評估(如教科書練習題)。
      2. 深入學習與資源篩選:
        • 請AI推薦參考資料,但僅作為起點
        • (核心) 主動透過學術資料庫、圖書館、大學課程、專家推薦等渠道,篩選並確定權威、可靠的學習資源(教科書、核心論文、官方文件等)。
        • 進行主動學習(筆記、摘要、討論、應用)。
      3. 理解建構與批判性評估:
        • 利用AI輔助整理筆記、草擬摘要或解釋概念(將AI視為助手而非知識來源)。
        • (核心) 持續運用批判性思維,質疑AI提供的任何資訊,不斷與步驟2中確定的權威來源交叉比對。注意不一致、矛盾或過於簡化的部分。
      4. 驗證與深化:
        • (核心)將自己形成的理解/結論,與權威資料進行嚴格比對。
        • (核心)尋求人類專家、教師或可信賴同儕的意見和反饋。
        • 進行獨立的事實查核。
        • (輔助) 或許可以讓AI扮演「反方辯友」(Devil's Advocate)的角色,要求它從不同角度質疑你的結論,但對其提出的質疑點仍需獨立判斷和查證。




      關鍵在於: 將AI視為一個有效率的助手、靈感來源或初步資訊整理者,而不是知識的最終權威或驗證者。真正的判斷力提升,來自於你主動學習、批判性思考、多元驗證以及與真實世界(包括專家和權威資料)的互動。


      2025年4月25日 星期五

      FIFE疾病經驗訪談之研究議題

      1. FIFE知識之教學方法與效能驗證

      2. 訪談技能(包含記錄)評估工具發展與驗證(含訪談能力、溝通技巧/同理心、記錄與應用能力)

      3. 虛擬病人發展與驗證(不同診斷)

      4. 虛擬考官發展與驗證(依據#2以及回饋模式)(結合 #2 量表與自動回饋模組,可形成完整「自學—自評—即時回饋」生態系。)

      5. FIFE訪談學習模式(多種模式,如線上到實務;不同設計)發展與驗證(含學員對於FIFE之態度驗證--(FIFE Attitude Scale, 需自行研發並驗證))

      ---------------------------------------

      CBME 之 milestones (ChatGPT 生成)



      參考CBME 里程碑以及 FIFE 訪談所需的多面向能力,重新改寫整體研想構想如下(與 Gemini 2.5討論):

      研究計畫總標題:

      建構、實施與評估一個基於能力導向醫學教育(CBME)里程碑之 FIFE 訪談核心能力整合性培育計畫

      計畫願景 (Overall Goal / Vision):

      本研究旨在發展、實施並評估一個全面性的 CBME 教育計畫,聚焦於「病人疾病經驗」-- FIFE(感受 Feelings, 想法 Ideas, 功能 Function, 期望 Expectations)訪談核心能力。此計畫將透過明確的發展性里程碑,系統性地培育學習者掌握執行有效 FIFE 訪談所需的相關知識與能力(包含基本知識、閱覽病歷資料/擷取相關資訊、溝通技巧、同理心、認知整合(記錄)與應用能力及相關態度),建立一個從學習、準備、練習、應用、評估到回饋的完整教育生態系,最終目標在於提升以病人為中心的溝通品質與醫療照護成效。(自我學習的生態系統!?)

      核心理念與概念框架 (Conceptual Framework):

      1. 採納 CBME 模式: 以學習成果為導向,強調學習者能力的達成。
      2. 運用里程碑 (Milestones) 作為發展藍圖: 將 FIFE 訪談能力視為一項關鍵的臨床溝通實踐活動,界定其從新手到熟練者的可觀察、發展性的里程碑。
      3. 承認 FIFE 訪談的複雜性與多面向特質: 成功的 FIFE 訪談需要整合以下要素:
        • 知識基礎: 理解 FIFE 概念、溝通理論及其重要性。
        • 溝通技能: 包含提問、傾聽、非語言溝通、同理心展現 (NURS) 等可訓練技巧。
        • 認知整合與應用: 能綜合 FIFE 資訊進行臨床推理、記錄並應用於共享決策。
        • 情感態度: 具備同理心、尊重、好奇心、自我覺察與專業態度。
      4. 整合性培育: 研究計畫的各個環節(教學、評估、科技工具)將圍繞這些里程碑及所需的多面向能力進行設計與驗證。

      具體研究目標與內容 (Specific Research Aims / Phases):

      第一階段:奠定 FIFE 能力框架與評估基礎 (Foundation & Assessment)

      • 目標 1.1 (界定里程碑): 依據文獻、專家意見及學習者發展理論,界定一套適用於目標學習者(例如:醫學生、住院醫師)的 FIFE 訪談能力發展里程碑。此里程碑需具體描述不同階段學習者在上述多面向能力上的預期行為表現。完成後需進行專家內容效度驗證。
      • 目標 1.2 (發展評估工具): 基於已驗證的 FIFE 里程碑,發展並驗證一套多面向、多來源的評估工具組合(例如:包含針對溝通技巧觀察的評分量表 Rubric、評估記錄與應用能力的案例分析或病歷審查標準、可能的自我評估或同儕回饋表單)。此工具組合需具備良好的信效度,能可靠區分不同里程碑水平的學習者,並能評估 FIFE 所需的多元能力。

      第二階段:設計與驗證里程碑導向的學習體驗 (Learning Experiences)

      • 目標 2.1 (教學策略效能): 設計並比較不同教學方法(如:互動式工作坊、標準化病人演練、虛擬病人模擬、線上學習模組、案例討論、反思練習等)對於促進學習者在 FIFE 里程碑上進展的相對效能,特別關注不同方法對特定面向能力(如:同理心展現、資訊整合)的提升效果。
      • 目標 2.2 (學習路徑優化): 規劃並評估不同的整合性學習路徑(例如:線上知識學習 -> VP 模擬練習 -> SP 實境演練與回饋),探討何種組合模式最能有效支持學習者循序漸進地達成 FIFE 能力里程碑。
      • 目標 2.3 (態度量表與影響): 開發並驗證一個「FIFE 學習與實踐態度量表」,用以測量學習者對 FIFE 的價值觀、自我效能、學習動機等,並探討態度與學習模式選擇、里程碑達成度之間的關係。

      第三階段:開發與整合科技輔助學習與評估工具 (Technology Integration)

      • 目標 3.1 (分級虛擬病人 VP): 開發一系列具備不同臨床情境與溝通挑戰複雜度的虛擬病人案例。這些案例需能對應 FIFE 里程碑的不同階段,提供標準化、可重複、具針對性的模擬練習機會,特別是用於練習較難透過傳統方式標準化的情境(如:處理強烈情緒、文化差異)。
      • 目標 3.2 (智慧虛擬考官 VE): 研發一個能整合 VP 系統的智慧虛擬考官。此 VE 需能:
        • 運用第一階段發展的里程碑導向評估工具(或其演算法化的版本)分析學習者與 VP 的互動數據(文本、語音、行為)。
        • 自動評估學習者在 FIFE 各面向能力的表現,並判斷其當前所處的里程碑級別。
        • 提供具體、可操作、針對其里程碑水平的形成性回饋,引導學習者自我修正與成長,實現「練習-評估-回饋」的即時自主學習循環。

      第四階段:整合性計畫實施與成效評估 (Program Implementation & Evaluation)

      • 目標 4.1 (計畫試行): 在目標學習者群體中,試行整合前三階段成果的 FIFE 能力培育計畫(包含課程、教學活動、VP/VE 工具、評估機制)。
      • 目標 4.2 (總體成效評估): 全面評估此整合性計畫的可行性(Feasibility)、學習者與教師的接受度(Acceptability)及成效(Effectiveness)。成效指標應包含:學習者 FIFE 能力里程碑的達成率與進展速度(使用目標 1.2 工具)、知識與技能的提升、態度的轉變(使用目標 2.3 量表),以及探索對臨床行為(如病歷記錄品質)或病人回饋(若可行)的潛在影響。

      研究流程與關聯性 (Interdependencies & Flow):

      第一階段是整個計畫的基石,其產出的里程碑框架與評估工具是後續所有研究的依據與標準。第二、三階段可部分平行展開,但教學活動(第二階段)的設計與成效評估需依賴第一階段的工具,科技工具(第三階段)的開發也需以第一階段的框架為基礎。第四階段則是對前三階段成果的整合應用與總體檢驗。

      預期貢獻與影響 (Expected Impact):

      • 為 FIFE 訪談能力的培育提供一個具體、可行的 CBME 實施範例。
      • 產出經過驗證的 FIFE 能力里程碑、多面向評估工具及態度量表。
      • 提供不同教學策略與學習路徑對 FIFE 能力發展成效的實證依據。
      • 開發創新的科技輔助工具(VP/VE),促進自主學習與形成性評估。
      • 最終有望提升臨床人員的 FIFE 訪談能力,改善醫病溝通品質,促進以病人為中心的照護。

      這個修訂後的計畫更強調能力的發展性、多面向性,並將 CBME 里程碑作為貫穿始終的核心架構,希望能更全面且深入地探討 FIFE 的教與學。