2026年6月12日 星期五

未來的作業與考試--書面作業評量之改良

「較有前景的評量改革」包含口頭答辯、歷程導向評量、多模態寫作任務、專題式學習,以及 AI 素養課程,並說明它們如何讓評量從「看最後成品」轉向「看學習歷程」。


這篇論文Reimagining writing assessment for the AI era: a systematic review on balancing AI support and authentic skill growth認為,AI 時代的寫作評量不能再只問:「這篇文章是不是學生自己寫的?」而應該改問:「學生在寫作過程中,是否真的有思考、判斷、修正、整合與形成自己的觀點?」這就是作者所說的評量重點要從「產品」轉向「歷程」。也就是說,最後交出來的文章固然重要,但更重要的是學生如何完成這篇文章:他如何構思、如何使用 AI、如何判斷 AI 的建議、如何修正草稿、如何形成論點,以及是否能解釋自己的寫作選擇

一、口頭答辯:確認學生是否真正理解自己的文章

口頭答辯,英文常稱為 oral defense 或 viva,是讓學生在繳交書面作品後,現場口頭說明自己的論點、資料來源、寫作選擇與結論。這種方法的重點不是再考一次記憶,而是確認學生是否真的理解自己寫出來的內容。

在 AI 時代,學生可能用 ChatGPT 產生一篇看似流暢的文章,但如果他沒有真正理解文章內容,當教師追問時就會露出問題。例如教師可以問:「你這段論點為什麼這樣安排?」「你為什麼採用這個例子,而不是另一個例子?」「AI 給你的建議中,你拒絕了哪些?為什麼?」這些問題要求學生即時組織想法,展現真正的理解與判斷能力。

因此,口頭答辯的價值在於它能測量 AI 不容易替學生完成的能力:即時推理、概念理解、批判性解釋與個人立場。論文指出,這類評量可以提高 AI 代寫的難度,因為即使學生能提交 AI 生成的文章,也必須能親自說明與防衛文章內容。

簡單來說,口頭答辯像是「要求學生不只交出一道菜,還要說明他如何備料、為什麼這樣調味、火候如何控制」。如果學生只是買現成料理,就很難說出真正的烹調歷程。

二、歷程導向評量:不只看成品,而是看學生如何完成作品

歷程導向評量是這篇論文非常強調的改革方向。傳統寫作評量常常只看最後一篇文章,教師根據文章結構、文法、論點與引用給分。但 AI 出現後,最後成品已經不一定能準確代表學生的真實能力,因為文章可能大量受到 AI 生成或改寫。

因此,歷程導向評量會要求學生保留並提交寫作歷程證據,例如初稿、修改稿、AI 提示詞、AI 回覆內容、修改前後對照、反思紀錄等。教師評量的不只是「最後文章好不好」,而是「學生是否經歷了有效的思考與修正過程」。

例如,一份 AI 時代的寫作作業可以要求學生繳交:

第一版構想或大綱、使用 AI 的提示詞紀錄、AI 提供的建議、學生採納或拒絕這些建議的理由、修改前後的段落對照,以及最後的反思說明。這些資料可以幫助教師看見學生是否只是複製 AI 內容,還是真的有判斷、選擇、修改與內化。

這種方法的核心精神是:AI 可以參與寫作,但學生必須對每個寫作決定負責。學生不能只說「AI 幫我改的」,而要說明「AI 建議我這樣改,但我根據文章目的與讀者需求,決定保留、修改或拒絕」。這樣一來,AI 使用本身就變成後設認知訓練,也就是訓練學生思考自己的思考。

三、多模態寫作任務:讓學生整合文字、圖像、聲音與情境

多模態寫作任務是指不只要求學生寫一篇純文字文章,而是要求學生整合不同表達形式,例如文字、圖表、簡報、影片、聲音、概念圖、資訊圖表、手繪示意圖或案例分析。論文認為,這類任務比較能抵抗單純 AI 代寫,因為它要求學生跨媒介整合與轉化知識。

例如,傳統任務可能是:「請寫一篇 1500 字文章,說明 AI 對學術寫作的影響。」多模態任務則可以改成:「請製作一份包含短文、流程圖、案例分析與口頭說明的作品,解釋學生如何適當使用 AI 完成寫作。」這樣的任務不只是要求學生會寫,也要求他能把抽象概念轉換成視覺結構、教學說明或實際情境。

多模態任務的好處是,它讓學生必須真正理解概念,才能把概念轉換成不同形式。能寫出文字不代表真正理解;但若學生能畫出流程圖、舉出實例、說明判斷標準,通常代表他對概念有較深層的掌握。

以本篇論文的主題為例,學生可以被要求設計一張「AI 寫作使用決策圖」:什麼情況可以用 AI?什麼情況不能用?何時需要揭露?如何檢查 AI 錯誤?如何保留自己的聲音?這樣的任務比單純交一篇文章更能看出學生是否理解 AI 素養與學術誠信。

四、專題式學習:用真實問題促進高層次思考

專題式學習,或 project-based learning,是讓學生處理較真實、複雜、開放性的問題,而不是只回答標準答案。論文認為,AI 比較擅長產生一般性、表面完整的答案,但面對需要脈絡判斷、實際資料、個人經驗、在地問題與多步驟決策的任務時,學生仍需要投入大量思考。

例如,與其要求學生寫一篇「AI 對教育的優缺點」,教師可以要求學生完成一個專題:「請調查本班學生使用 AI 寫作工具的情況,設計一份班級 AI 使用指引,並提出評量改革建議。」這個任務需要學生蒐集資料、分析同儕需求、比較政策、設計規範、提出理由,最後再反思限制。

這種任務比較能促進 Bloom’s Taxonomy 中較高層次的能力,例如分析、評估與創造。學生不能只複製 AI 的一般性回答,因為他必須處理具體脈絡:本班學生的需求是什麼?教師最擔心什麼?哪些 AI 使用是合理輔助?哪些會破壞學習?這些問題都需要人類判斷。

專題式學習也能讓 AI 變成「工具」而不是「代工者」。學生可以用 AI 幫忙整理資料、生成初步問題、檢查文字,但最終的問題界定、決策、證據選擇與成果設計仍必須由學生負責

這難度高,或可改調整成「論文結果的解讀、應用與限制」--與第一項整合。

五、明確的 AI 素養課程:教學生如何正確、批判且倫理地使用 AI

這篇論文特別指出,學生不當使用 AI 很多時候並不是出於惡意,而是因為規範不清、倫理界線模糊、缺乏具體教學。因此,AI 素養課程非常重要。所謂 AI 素養,不只是教學生「怎麼下提示詞」,而是教學生理解 AI 的能力、限制、風險與倫理責任。

AI 素養至少包含幾個面向。第一,學生要知道 AI 可以協助哪些寫作任務,例如構思、語言潤飾、文法檢查、摘要、提供反例或協助修改結構。第二,學生要知道 AI 不應該取代哪些任務,例如形成核心論點、決定研究立場、捏造文獻、代寫整篇文章,或未揭露地提交 AI 生成內容。第三,學生要學會檢查 AI 的錯誤,因為 AI 可能產生看似合理但其實錯誤的資訊。第四,學生要能揭露自己的 AI 使用方式,說明哪些部分受到 AI 協助,以及自己如何判斷與修改。

這種課程的重點是把 AI 使用從「地下化」轉成「可討論、可教學、可評量」的能力。當學生知道界線在哪裡,就比較不會因為模糊而誤用。教師也能從單純抓作弊,轉向教學生如何成為負責任的 AI 使用者。

六、為什麼這些方法都指向「從產品到歷程」?

這五種改革雖然形式不同,但背後有同一個邏輯:AI 時代不能只評量最後結果,因為最後結果可能被 AI 大幅加工;必須評量學生在完成作品時展現的思考歷程。

傳統評量像是只看「最後交出來的成品」。例如一篇文章文法正確、結構清楚、論點完整,就可能拿高分。但 AI 可以快速幫學生做到這些表面特徵。因此,教師若只看成品,就很難知道學生是否真的學會寫作。

歷程評量則像是看學生「如何走到這個結果」。它關心的是:學生原本怎麼想?遇到什麼問題?AI 給了什麼建議?學生如何判斷這些建議?他修改了什麼?為什麼修改?最後形成了什麼自己的理解?這些過程比較能反映學生的真實學習。

換句話說,AI 時代的寫作評量要從「你交了什麼?」轉向「你如何完成?你如何判斷?你如何負責?」這正是論文所說的 authentic skill development,也就是真實能力的發展。

七、實際應用範例:一份 AI 時代寫作作業可以怎麼設計?

假設教師要學生完成一篇學術短文,主題是「AI 對高等教育寫作評量的影響」。傳統作業可能只要求學生繳交 1500 字文章。但依照這篇論文的建議,可以改成以下形式:

學生先繳交一份研究問題與大綱,說明自己想探討什麼;接著繳交初稿,並標示哪些地方使用 AI 協助;再繳交 AI 提示詞與 AI 回覆紀錄;之後提交修改前後對照,說明自己採納、修改或拒絕 AI 建議的原因;最後繳交完成稿與 300 字反思,說明自己在過程中學到什麼、AI 幫助了什麼、AI 的建議有哪些限制。

教師評分時可以分成幾個面向:最後文章品質、論點清楚度、資料整合能力、AI 使用透明度、對 AI 輸出的批判判斷、修改歷程的品質,以及口頭答辯表現。這樣的評量就比較能分辨學生是「用 AI 幫助自己學習」,還是「讓 AI 取代自己學習」。

八、這些改革對學生與教師的意義

對學生而言,這些改革代表他們不能只追求快速完成作業,而要學會解釋自己的學習歷程。學生可以使用 AI,但必須展現主體性,也就是能說明自己為什麼這樣寫、如何修改、如何判斷 AI 的內容。

對教師而言,這些改革代表評量設計要更重視過程證據。教師不只是批改最後文章,而是要設計能讓學生展示思考歷程的任務。這會增加一些教學設計負擔,但也能讓評量更有效、更公平,並降低單純依賴 AI 偵測工具的問題。

對學校而言,這些改革表示制度上不能只制定「禁止 AI」或「允許 AI」的簡單規則,而應該建立更細緻的 AI 使用政策、學生指引、教師培訓與 AI 素養課程。

總結來說,這篇論文所說的評量改革,不是要完全排除 AI,而是要重新安排 AI 在學習中的位置:AI 可以是輔助者、回饋者、語言支架與構思工具,但不能取代學生的判斷、理解、倫理責任與原創思考。

沒有留言:

張貼留言