2025年5月17日 星期六

也是生成式AI的後續---以複製的聲音協助演講

最近因朋友有需求,我就開始玩玩複製聲音(Voice Cloning)...

APP至少有3種以上了...功能至少有5:

  • 錄製個人聲音樣本
  • 讓AI學習並複製您的聲音特徵
  • 讓AI用您的聲音自動朗讀文字內容
  • 用AI調整語氣、速度、音調等參數
  • 加入錄影檔+調整影音(可就從聲音跨到影像--加成)
  • 我目前使用 ElevenLabs (for AI 語音技術),也在玩玩 Capcut (剪映 for AI 影像編輯)

    快速作品一:OT倫理學課程總結 (點選後可直接播放或需下載 mp3 音檔)

    快速作品二:介紹特定研究(英文)

    作品一的創作流程:1. 提供PPT請 ChatGPT 生成演講稿;2. 修飾/補充演講稿;3. 使用 ElevenLabs 幫我「演講/念稿」。

    作品二:只是改成英文文稿....

    -----------------------------------------------------------------------------------------------------

    以下是生成式AI對於上述技術於「後續教學應用」的看法:

    作為教授,「語音複製技術」在教學中有許多實用的應用場景:

    1. 課程內容製作

       - 預錄講課內容,讓您能夠輕鬆創建一致品質的線上課程

       - 不必每次都重新錄製,只需編輯文字稿即可生成新的語音內容

    2. 多語言教學

       - 將您的講課內容翻譯成不同語言,但仍保持您的聲音特徵

       - 協助國際學生更熟悉您的教學風格

    3. 自適應學習資源

       - 為不同程度的學生創建客製化的補充教材

       - 製作解說影片或音頻指南,解釋複雜概念

    4. 教學效率提升

       - 節省重複錄製相似內容的時間

       - 在身體不適但需要提供教學內容時派上用場

    5. 學生輔導資源

       - 創建常見問題的語音解答庫

       - 製作學習指南和複習材料

    6. 無障礙教學

       - 為視障學生提供更多音頻學習資源

       - 將教科書或文章轉換為音頻格式

    7. 虛擬辦公時間

       - 回答常見問題的自動化語音回應

       - 為無法親自參加的學生提供錄製的解釋

    使用這類技術時,建議向學生透明說明部分內容是使用AI語音生成的,並注意確保生成內容的準確性。同時,請考慮您所在機構對此類技術的政策規定。

    --------------------------------------------------------------------------------------------

    後續應用:

    1. 諸多課程或臨床技能教材,皆可套用之。

    2. 新知介紹亦然(如新的論文,先以 ChatGPT 產生文稿,確認內容後即可....或是任何擬以語音通知他人之內容)

    3. 可結合 NotebookLM 的 Podcast, 提供學員更多選擇。

    作品 3:「本推文之介紹--由本人介紹」「NoteBookLM Podcast

    * NotebookLM 可將音檔轉成逐字稿!!


    沒有留言:

    張貼留言