- 取得連結
- X
- 以電子郵件傳送
- 其他應用程式
很榮幸在「國文教學創新工作坊」分享。除了介紹熱門語言 GPT 機器人,建立自己的 GPT 機器人,建議能夠明確定義角色、系統性拆解任務、重視迭代與回饋,以及制訂行為指引。
Made with DALL-E |
一、熱門語言 GPT 機器人
從 OpenAI GPTs 商店的統計排行數據 (截至今年 7/2), 整理其中的「寫作」與「教育」類的 GPT (基於轉換器的生成式預訓練模型, Generative pre-trained transformers) 機器人。篩選出和語文有關的機器人。將語文類機器人進一步分類成:寫作與創作、外國語言學習、數位行銷、學術寫作、履歷與面試準備、溝通與諮詢、其他語言工具。
- 簡介:專業寫作助手,可根據使用者需求建立各類內容,並提供大綱、分段寫作和最佳化。
- 提供的對話範例:(1) 寫 1000 字的 GPT 未來綜合分析、(2) 寫 200 字的高級紅色螺絲起子產品敘述、(3) 寫 3000 字 ChatGPT 取代傳統搜尋引擎的部落格 (blog) 文章、(4) 寫關於野獸派建築 (brutalist architecture) 的五個段落。
2. 外國語言學習:「史密斯語言老師」(Language Teacher | Ms. Smith) 機器人
- 簡介:個性化語言學習助手,提供多語言、不同程度的互動式學習體驗。
- 提供的對話範例:選擇想要學習的語言,例如西班牙語、法語、德語或其他語言。
3. 數位行銷:「完全 SEO 最佳化的文章,包括常見問題解答」(Fully SEO Optimized Article including FAQ's) 機器人
- 簡介:產生 SEO 最佳化 (搜尋引擎最佳化) 的文章,包括 FAQ 部分,適用網站內容和部落格文章。
- 提供的對話範例: (1) 寫一篇關於 iPhone 16 Pro Max 特點的 1000 字文章、(2) 用西班牙語,寫一篇關於瑜珈好處的 1500 字文章、(3) 用法語,寫一篇健康飲食的文章、(4) 寫一篇 5000 字的介紹性文章,主題為網際網路的歷史。
4. 學術寫作:「學術論文作家」(Essay Writer 👌) 機器人
- 簡介: AI 論文寫作與生成工具,可以選擇論文類型或協助精鍊主題、發展大綱、逐步寫作。克服寫作障礙,激發創意靈感。
- 提供的對話範例:(1) 我要寫論文、(2) 你有哪些功能?
5. 履歷與面試準備:「成功掌握面試秘訣」(Master Interview🚀) 機器人
- 簡介:提供多個產業領域職務的真實面試練習,以及根據產業標準、目標職位需求、「應徵者篩選系統」 (Applicant Tracking System, ATS) 的運作原理、量化成就、履歷的可讀性、語言精確性、錯誤檢查等方面,協助求職者改善履歷表內容。
- 提供的對話範例:(1) 上傳履歷表,開始面試練習、(2) 常見的 25 個面試問題 (Behavior Questions)。
二、GPT 機器人的配方
從熱門語言機器人的系統提示 (system prompt) 歸納四個原則:定義角色需求、拆解工作任務、合作和回饋和行為指引。
1. 定義角色需求
常見機器人角色設定是「我是位語言學習好幫手」,但是 Sander Schulhoff 的研究指出「角色提示對準確性影響有限,在最新的模型中,角色提示對於提高準確性並沒有顯著效果,甚至可能會有不可預測的影響。」文章提到「提供兩個範例的關聯思考」(2-Shot Chain-of-Thought) 效果最好。
相較於模糊的角色設定,初始提示要求機器人詢問使用者需求、提供先備知識結構、迭代循環對話、重視品質、強調互動學習等, 提升問題回答的準確率。以「為我寫作」 (Write For Me) 機器人為例, (1) 瞭解寫作需求:詢問內容用途(如部落格、社交媒體等)、確認目標對象(年齡層、興趣、背景知識)、確定語調(正式、非正式、專業或對話式)、(2) 釐清主題細節:深入了解主題核心內容、討論需要涵蓋的關鍵點、確認是否包含特定的 SEO 關鍵字、(3) 確認格式:詢問字數要求、風格偏好、技術格式(Markdown、HTML、純文字等)。
先備知識結構部份,則可以事先提供知識檔案,緩解電腦幻覺問題。實際測試沒有提供「兒童華語文能力測驗情境詞彙表」知識檔案狀況下,機器人回答會夾雜錯誤詞彙。如何免受 AI「幻覺」影響?3 個檢查重點,確保生成內容正確性,提到交叉比對、追問 AI 細節、最後一點雖然是檢查 AI 生成圖片的細節是否錯誤,但指的是本身需要具備相關領域專業,才能辨識出 AI 生成的圖片或文章中的內容錯誤。
2. 拆解工作任務
以「史密斯語言老師」(Language Teacher | Ms. Smith) 機器人為例,工作任務的拆解流程包含 (1) 選擇語言:可以選擇西班牙語、法語、德語、英語、日語、國語等 16 種語言、(2) 選擇難度:可以切換初級、中級、高級難度、(3) 選擇討論主題:選定初級後,可以選擇我的一天、我的家人和朋友、食物和飲料、興趣和休閒、市場、(4) 對話練習:找出錯誤、提供更好的表達方式、解釋改進原因、示範正確用法、引導進一步練習。
3. 迭代和回饋
今年六月登山界傳出令人惋惜的意外新聞,查詢法國外電新聞得知來自「Non-technical」詞彙,將整篇新聞餵給傳給機器翻譯、大型語言模型,翻譯結果分別是:
(1) 國內知名媒體:這是「一個沒有技術難度的地段」
(2) Google 翻譯:該山峰位於白雪皚皚的非技術區 …
(3) ChatGPT 4o 翻譯:「非技術性」雪地區域,進行攀登 ... 在尚未使用繩索的情況下 ...
(4) 文章翻譯 GPT:該區域積雪且無需技術攀爬。他們還沒有繫上繩索 …
網友提供 Non-technical 的意思是「不需要特殊裝備」,並不是沒有(登山技術上的)難度。比較四種翻譯結果,編號 (1) 翻譯結果是錯誤的、編號 (2)、(3) 翻譯結果則是難以理解、編號 (4) 的翻譯結果則最好的。
文章翻譯 GPT 參考「科技文章翻譯」 GPT 的系統提示的迭代回饋步驟:(1) 直譯:根據原文內容直譯,保持原有格式,不遺漏任何資訊、(2) 反思:根據第一步直譯的結果,指出其中存在的問題、(3) 意譯:根據第一步直譯的結果和第二步指出的問題,重新進行意譯,維持內容原意,使其更容易理解。
4. 行為指引
除了前面三點提到功能相關的提示,行為指引就像是專業指引。以「為我寫作」 (Write For Me) 機器人為例,定義了 (1) 專業語調:始終保持專業的語調、(2) 澄清請求:如果使用者的請求不明確,詢問更多資訊,確認理解後才開始對話、(3) 高品質內容:優先考慮內容的準確性、相關性和價值,努力追求卓越、(4) 更新與回饋:讓使用者瞭解任務的進展。尋求使用者回饋以確保內容符合他們的期望。
三、當每個人都可以寫程式、寫小說
當 GPT 機器人讓技術門檻降低,每個人輸入指令,就可以快速寫程式、快速完成小說。我覺得除了快速產生內容,很重要的是培養自己原創內容和鑑賞好內容的眼光。創作前先問自己「為什麼寫」?第二個問題是同樣的素材,要如何「烹調」,同樣是羅馬假期題目,可以是疫情時代的羅馬假期、夜店速食風的羅馬假期、或者台灣東海岸的羅馬假期。從會寫文章,到寫出好文章,需要回歸基本寫作訓練。寫作的段落內容展開,何嘗不像是旅行過程,食物、人文、歷史、建築都需要很踏實的查找與認識。
培養鑑賞好內容的眼光,才能在 AI 生成的大量資訊中辨識出真正有價值的內容。
相關文章
參考資料
- 微軟「教育用提示」 (Prompts for Education)
- Bea Stollnitz - How GPT models work: accessible to everyone
- 如何免受 AI「幻覺」影響?3 個檢查重點,確保生成內容正確性
留言