導(dǎo)讀 6月28日消息,OpenAI公布了一個(gè)基于GPT-4訓(xùn)練的模型CriticGPT,主要用于捕捉ChatGPT代碼輸出中的錯(cuò)誤。簡(jiǎn)單來說,通過這一模型,人類訓(xùn)練者...
6月28日消息,OpenAI公布了一個(gè)基于GPT-4訓(xùn)練的模型CriticGPT,主要用于捕捉ChatGPT代碼輸出中的錯(cuò)誤。
簡(jiǎn)單來說,通過這一模型,人類訓(xùn)練者可以利用GPT-4查找并改進(jìn)GPT-4自身的不足,OpenAI的實(shí)驗(yàn)顯示,在CriticGPT的輔助下,訓(xùn)練師發(fā)現(xiàn)錯(cuò)誤的能力提升了60%。
CriticGPT的工作機(jī)制包括對(duì)ChatGPT提供的代碼進(jìn)行評(píng)審,并提出改進(jìn)建議,盡管CriticGPT的建議并非總是完美無缺,但它的引入顯著提升了訓(xùn)練師在發(fā)現(xiàn)模型問題上的能力。
OpenAI表示,因?yàn)闆]有更好的工具,所以人們目前難以評(píng)估高級(jí)AI的表現(xiàn),而CriticGPT意味著,OpenAI向能夠評(píng)估高級(jí)AI系統(tǒng)輸出的目標(biāo)邁進(jìn)了一步。
OpenAI也坦誠(chéng)地指出了CriticGPT的局限性,包括對(duì)長(zhǎng)任務(wù)理解的不足、幻覺錯(cuò)誤的產(chǎn)生、分散錯(cuò)誤的識(shí)別難題,以及在面對(duì)極端復(fù)雜任務(wù)時(shí)的評(píng)估局限。
CriticGPT的發(fā)布也引發(fā)了熱烈討論,有網(wǎng)友用左腳踩右腳上天”來形容這一自我改進(jìn)的過程。