二主軸:
主軸一:Development Methodology of Virtual Patients
探討 VP 如何被建構、訓練、擴充、控制與更新。
主軸二:Validation Methodology of Virtual Patients
探討 VP 如何被驗證、評估、校正、監測與維持品質。
七大主題:
1. VP generation and modeling (虛擬病人的建立與發展方法學)
重點包括:
以真實資料、synthetic data、expert-authored data 混合建模:特定臨床情境或溝通任務的專屬 VP 模型
- persona consistency、symptom completeness、dialogue diversity
- prompt-based、fine-tuning、RAG、knowledge-constrained generation 等建模策略
這主題回答的是:VP 怎麼做出來?
2. VP corpus and database infrastructure (虛擬病人資料庫與多模態語料基礎建設)
納入:
- demographic and clinical profile schema
- standardized dialogue corpus
- multimodal interaction parameters(voice, facial expression, gesture)(先收集資料。應用時,目前以逐字稿為標的,後續再擴展)
- annotation standards (規定研究團隊如何對逐字稿、對話片段、表情、語氣、臨床資訊、情緒反應等資料,進行一致化標註,避免不同標註者各自用不同標準理解資料。)
- metadata、versioning、benchmark sets(metadata:「描述資料的說明」,如逐字稿的建立日期、病例編號、語言、情境類型、標註版本、資料來源等)(Benchmark sets 是一組經過設計、整理與固定化的標準測試資料或測試任務,用來評估不同 VP 系統、不同版本,或不同方法之間的表現差異。)
這主題探究:VP 研究的「資料基礎」如何建立?這研究將決定虛擬病人資料庫是否具有 可重複性(reproducibility)、可比較性(comparability)、可追蹤性(traceability),以及後續研究發展所需的 品質控制基礎。
3. VP performance validation and quality assurance (虛擬病人表現驗證與品質確保方法學)
包含 psychometric and QA framework:
- content validity
- response accuracy
- style consistency
- scenario fidelity
- inter-session stability
- controllability under prompt variation
- SOP for error detection, revision, and revalidation
這主題探究:VP 的表現是否可信、穩定、可控?
4. Virtual Interviewer and co-adaptive interaction research (虛擬訪員與人機互動引導機制之開發)
重點包括:
特定 interviewing framework(如 FIFE)之 agent design
- elicitation effectiveness
- depth of disclosure
- co-adaptation between interviewer prompts and VP response depth
- dialogue strategy optimization
這主題探究:AI 訪員能否有效引出病人經驗,並與 VP 共同演化?
5. Multi-agent testing framework and Virtual Rater (多重 AI 代理人測試框架與虛擬評分員之發展)
包含:
- test-interviewer GPT
- adjudicator GPT
- meta-rater GPT
- rating rubric alignment
- agreement with human experts
- feedback usefulness and calibration
這主題探究:如何以多代理人方式自動化測試與評分 VP?
6. Generalizability and model drift (外在效度)
- cross-scenario generalizability
- cross-population robustness
- longitudinal stability
- post-update drift monitoring
7、Ethics, governance, and safety (倫理治理、安全性與公平性評估)
- privacy and consent
- bias and representational fairness
- hallucination risk
- harmful or misleading responses
- transparency and auditability