CriticGPT扮演模型訓練人員的AI助手角色,輔助審查ChatGPT所生成的程式碼並找出錯誤
圖片來源: OpenAI
OpenAI周四(6/27)揭露一個奠基於GPT-4的新模型CriticGPT,它目前扮演人類訓練師的AI助手角色,可用來審查ChatGPT所生成的程式碼,並找出錯誤。
現階段的ChatGPT也是基於GPT-4模型,它藉由人類反饋的強化學習(Reinforcement Learning from Human Feedback,RLHF)來調整其輸出表現,亦即由人類訓練師根據模型的行動來提供反饋或意見,而CriticGPT也能用來審核ChatGPT輸出程式碼時的表現,OpenAI正在將CriticGPT整合到RLHF的標籤管道中,以替人類訓練師提供明確的AI說明。
OpenAI指出,隨著模型行為與推論的進步,ChatGPT變得更加精確,錯誤也變得更為微妙,令人類的AI訓練師更難找出其錯誤之處,並對RLHF方法造成了挑戰,使得模型的調整愈來愈困難,這使得他們訓練CriticGPT來進行評論,以突顯ChatGPT輸出的錯誤。
根據OpenAI的測試,人類訓練師在取得CriticGPT的協助之後,審核ChatGPT生成程式碼的表現在大多數時候(60%),優於沒有CriticGPT幫忙的時候。
總之,OpenAI發現,在CriticGPT的協助下,人類訓練師不僅得以發現更多的問題,而且還能藉由CriticGPT強化人類的技能,提出更全面的批評,還能減少幻覺錯誤。
只是CriticGPT現階段仍有其侷限性,例如所支援的答案很短,也還會產生幻覺,尚未能解決分散的錯誤,也還無法處理過於複雜的任務或回應。
網頁設計.企業形象網站 / 服務類
網站技術:PHP
主要是處理不動產評估,包括土地建築物評估、土地資源評估、建築設備、廠房評估等。 若是民眾手上有任何的不動產物件,都可以請公會協助評估喔。
網頁設計.RWD響應式網站.行動版網站.企業形象網站 / 休閒餐飲類
網站技術:PHP . Javascript
可以透過網站選購美食產品,選擇寄送位置與付款方式且操作方式不複雜。首頁點選「產品介紹」利用下方分類選擇商品,針對自己想購買的商品加入購物車並完成訂購;也可登入會員確認商品運輸進度。
精選專案.網頁設計.RWD響應式網站.企業形象網站 / 戶外旅遊類
網站技術:PHP/MySql
每個人旅遊方式百百種,有人喜愛快節奏、刺激;有人喜愛慢節奏、輕旅行。 樂晴可以為你設計一套獨一無二的套裝行程,針對不同的對象、目的都是可以安排的。不用擔心會玩的不開心,只怕會玩的太快樂!!
電話:(02)2739-9096 | 傳真:(02)2739-6637 | 客服:[email protected] | 臺北市信義區和平東路3段257號6樓map
© 2019 傑立資訊 All rights reserved.| 網站隱私政策