謝清麟教學/研究 blog: 未來的作業與考試--書面作業評量之改良

「較有前景的評量改革」包含口頭答辯、歷程導向評量、多模態寫作任務、專題式學習，以及 AI 素養課程，並說明它們如何讓評量從「看最後成品」轉向「看學習歷程」。

這篇論文Reimagining writing assessment for the AI era: a systematic review on balancing AI support and authentic skill growth認為，AI 時代的寫作評量不能再只問：「這篇文章是不是學生自己寫的？」而應該改問：「學生在寫作過程中，是否真的有思考、判斷、修正、整合與形成自己的觀點？」這就是作者所說的評量重點要從「產品」轉向「歷程」。也就是說，最後交出來的文章固然重要，但更重要的是學生如何完成這篇文章：他如何構思、如何使用 AI、如何判斷 AI 的建議、如何修正草稿、如何形成論點，以及是否能解釋自己的寫作選擇。

一、口頭答辯：確認學生是否真正理解自己的文章

口頭答辯，英文常稱為 oral defense 或 viva，是讓學生在繳交書面作品後，現場口頭說明自己的論點、資料來源、寫作選擇與結論。這種方法的重點不是再考一次記憶，而是確認學生是否真的理解自己寫出來的內容。

在 AI 時代，學生可能用 ChatGPT 產生一篇看似流暢的文章，但如果他沒有真正理解文章內容，當教師追問時就會露出問題。例如教師可以問：「你這段論點為什麼這樣安排？」「你為什麼採用這個例子，而不是另一個例子？」「AI 給你的建議中，你拒絕了哪些？為什麼？」這些問題要求學生即時組織想法，展現真正的理解與判斷能力。

因此，口頭答辯的價值在於它能測量 AI 不容易替學生完成的能力：即時推理、概念理解、批判性解釋與個人立場。論文指出，這類評量可以提高 AI 代寫的難度，因為即使學生能提交 AI 生成的文章，也必須能親自說明與防衛文章內容。

簡單來說，口頭答辯像是「要求學生不只交出一道菜，還要說明他如何備料、為什麼這樣調味、火候如何控制」。如果學生只是買現成料理，就很難說出真正的烹調歷程。

二、歷程導向評量：不只看成品，而是看學生如何完成作品

歷程導向評量是這篇論文非常強調的改革方向。傳統寫作評量常常只看最後一篇文章，教師根據文章結構、文法、論點與引用給分。但 AI 出現後，最後成品已經不一定能準確代表學生的真實能力，因為文章可能大量受到 AI 生成或改寫。

因此，歷程導向評量會要求學生保留並提交寫作歷程證據，例如初稿、修改稿、AI 提示詞、AI 回覆內容、修改前後對照、反思紀錄等。教師評量的不只是「最後文章好不好」，而是「學生是否經歷了有效的思考與修正過程」。

例如，一份 AI 時代的寫作作業可以要求學生繳交：

第一版構想或大綱、使用 AI 的提示詞紀錄、AI 提供的建議、學生採納或拒絕這些建議的理由、修改前後的段落對照，以及最後的反思說明。這些資料可以幫助教師看見學生是否只是複製 AI 內容，還是真的有判斷、選擇、修改與內化。

這種方法的核心精神是：AI 可以參與寫作，但學生必須對每個寫作決定負責。學生不能只說「AI 幫我改的」，而要說明「AI 建議我這樣改，但我根據文章目的與讀者需求，決定保留、修改或拒絕」。這樣一來，AI 使用本身就變成後設認知訓練，也就是訓練學生思考自己的思考。

三、多模態寫作任務：讓學生整合文字、圖像、聲音與情境

多模態寫作任務是指不只要求學生寫一篇純文字文章，而是要求學生整合不同表達形式，例如文字、圖表、簡報、影片、聲音、概念圖、資訊圖表、手繪示意圖或案例分析。論文認為，這類任務比較能抵抗單純 AI 代寫，因為它要求學生跨媒介整合與轉化知識。

例如，傳統任務可能是：「請寫一篇 1500 字文章，說明 AI 對學術寫作的影響。」多模態任務則可以改成：「請製作一份包含短文、流程圖、案例分析與口頭說明的作品，解釋學生如何適當使用 AI 完成寫作。」這樣的任務不只是要求學生會寫，也要求他能把抽象概念轉換成視覺結構、教學說明或實際情境。

多模態任務的好處是，它讓學生必須真正理解概念，才能把概念轉換成不同形式。能寫出文字不代表真正理解；但若學生能畫出流程圖、舉出實例、說明判斷標準，通常代表他對概念有較深層的掌握。

以本篇論文的主題為例，學生可以被要求設計一張「AI 寫作使用決策圖」：什麼情況可以用 AI？什麼情況不能用？何時需要揭露？如何檢查 AI 錯誤？如何保留自己的聲音？這樣的任務比單純交一篇文章更能看出學生是否理解 AI 素養與學術誠信。

四、專題式學習：用真實問題促進高層次思考

專題式學習，或 project-based learning，是讓學生處理較真實、複雜、開放性的問題，而不是只回答標準答案。論文認為，AI 比較擅長產生一般性、表面完整的答案，但面對需要脈絡判斷、實際資料、個人經驗、在地問題與多步驟決策的任務時，學生仍需要投入大量思考。

例如，與其要求學生寫一篇「AI 對教育的優缺點」，教師可以要求學生完成一個專題：「請調查本班學生使用 AI 寫作工具的情況，設計一份班級 AI 使用指引，並提出評量改革建議。」這個任務需要學生蒐集資料、分析同儕需求、比較政策、設計規範、提出理由，最後再反思限制。

這種任務比較能促進 Bloom’s Taxonomy 中較高層次的能力，例如分析、評估與創造。學生不能只複製 AI 的一般性回答，因為他必須處理具體脈絡：本班學生的需求是什麼？教師最擔心什麼？哪些 AI 使用是合理輔助？哪些會破壞學習？這些問題都需要人類判斷。

專題式學習也能讓 AI 變成「工具」而不是「代工者」。學生可以用 AI 幫忙整理資料、生成初步問題、檢查文字，但最終的問題界定、決策、證據選擇與成果設計仍必須由學生負責。

這難度高，或可改調整成「論文結果的解讀、應用與限制」--與第一項整合。

五、明確的 AI 素養課程：教學生如何正確、批判且倫理地使用 AI

這篇論文特別指出，學生不當使用 AI 很多時候並不是出於惡意，而是因為規範不清、倫理界線模糊、缺乏具體教學。因此，AI 素養課程非常重要。所謂 AI 素養，不只是教學生「怎麼下提示詞」，而是教學生理解 AI 的能力、限制、風險與倫理責任。

AI 素養至少包含幾個面向。第一，學生要知道 AI 可以協助哪些寫作任務，例如構思、語言潤飾、文法檢查、摘要、提供反例或協助修改結構。第二，學生要知道 AI 不應該取代哪些任務，例如形成核心論點、決定研究立場、捏造文獻、代寫整篇文章，或未揭露地提交 AI 生成內容。第三，學生要學會檢查 AI 的錯誤，因為 AI 可能產生看似合理但其實錯誤的資訊。第四，學生要能揭露自己的 AI 使用方式，說明哪些部分受到 AI 協助，以及自己如何判斷與修改。

這種課程的重點是把 AI 使用從「地下化」轉成「可討論、可教學、可評量」的能力。當學生知道界線在哪裡，就比較不會因為模糊而誤用。教師也能從單純抓作弊，轉向教學生如何成為負責任的 AI 使用者。

六、為什麼這些方法都指向「從產品到歷程」？

這五種改革雖然形式不同，但背後有同一個邏輯：AI 時代不能只評量最後結果，因為最後結果可能被 AI 大幅加工；必須評量學生在完成作品時展現的思考歷程。

傳統評量像是只看「最後交出來的成品」。例如一篇文章文法正確、結構清楚、論點完整，就可能拿高分。但 AI 可以快速幫學生做到這些表面特徵。因此，教師若只看成品，就很難知道學生是否真的學會寫作。

歷程評量則像是看學生「如何走到這個結果」。它關心的是：學生原本怎麼想？遇到什麼問題？AI 給了什麼建議？學生如何判斷這些建議？他修改了什麼？為什麼修改？最後形成了什麼自己的理解？這些過程比較能反映學生的真實學習。

換句話說，AI 時代的寫作評量要從「你交了什麼？」轉向「你如何完成？你如何判斷？你如何負責？」這正是論文所說的 authentic skill development，也就是真實能力的發展。

七、實際應用範例：一份 AI 時代寫作作業可以怎麼設計？

假設教師要學生完成一篇學術短文，主題是「AI 對高等教育寫作評量的影響」。傳統作業可能只要求學生繳交 1500 字文章。但依照這篇論文的建議，可以改成以下形式：

學生先繳交一份研究問題與大綱，說明自己想探討什麼；接著繳交初稿，並標示哪些地方使用 AI 協助；再繳交 AI 提示詞與 AI 回覆紀錄；之後提交修改前後對照，說明自己採納、修改或拒絕 AI 建議的原因；最後繳交完成稿與 300 字反思，說明自己在過程中學到什麼、AI 幫助了什麼、AI 的建議有哪些限制。

教師評分時可以分成幾個面向：最後文章品質、論點清楚度、資料整合能力、AI 使用透明度、對 AI 輸出的批判判斷、修改歷程的品質，以及口頭答辯表現。這樣的評量就比較能分辨學生是「用 AI 幫助自己學習」，還是「讓 AI 取代自己學習」。

八、這些改革對學生與教師的意義

對學生而言，這些改革代表他們不能只追求快速完成作業，而要學會解釋自己的學習歷程。學生可以使用 AI，但必須展現主體性，也就是能說明自己為什麼這樣寫、如何修改、如何判斷 AI 的內容。

對教師而言，這些改革代表評量設計要更重視過程證據。教師不只是批改最後文章，而是要設計能讓學生展示思考歷程的任務。這會增加一些教學設計負擔，但也能讓評量更有效、更公平，並降低單純依賴 AI 偵測工具的問題。

對學校而言，這些改革表示制度上不能只制定「禁止 AI」或「允許 AI」的簡單規則，而應該建立更細緻的 AI 使用政策、學生指引、教師培訓與 AI 素養課程。

總結來說，這篇論文所說的評量改革，不是要完全排除 AI，而是要重新安排 AI 在學習中的位置：AI 可以是輔助者、回饋者、語言支架與構思工具，但不能取代學生的判斷、理解、倫理責任與原創思考。

謝清麟教學/研究 blog

2026年6月12日星期五

未來的作業與考試--書面作業評量之改良

一、口頭答辯：確認學生是否真正理解自己的文章

二、歷程導向評量：不只看成品，而是看學生如何完成作品

三、多模態寫作任務：讓學生整合文字、圖像、聲音與情境

四、專題式學習：用真實問題促進高層次思考

五、明確的 AI 素養課程：教學生如何正確、批判且倫理地使用 AI

六、為什麼這些方法都指向「從產品到歷程」？

七、實際應用範例：一份 AI 時代寫作作業可以怎麼設計？

八、這些改革對學生與教師的意義

沒有留言:

張貼留言

網誌存檔

2026年6月12日 星期五

未來的作業與考試--書面作業評量之改良

一、口頭答辯：確認學生是否真正理解自己的文章

二、歷程導向評量：不只看成品，而是看學生如何完成作品

三、多模態寫作任務：讓學生整合文字、圖像、聲音與情境

四、專題式學習：用真實問題促進高層次思考

五、明確的 AI 素養課程：教學生如何正確、批判且倫理地使用 AI

六、為什麼這些方法都指向「從產品到歷程」？

七、實際應用範例：一份 AI 時代寫作作業可以怎麼設計？

八、這些改革對學生與教師的意義

沒有留言:

張貼留言

2026年6月12日星期五