GPT-4 OpenAI的最新模型聲稱在考試中表現(xiàn)優(yōu)于人類
OpenAI是ChatGPT和其他一些流行人工智能的創(chuàng)建者,宣布發(fā)布其最新的AI模型GPT-4。該公司聲稱,這種新的人工智能模型是其深度學(xué)習(xí)研究的一個(gè)重要里程碑,可以在許多領(lǐng)域超越人類。根據(jù)OpenAI的說法,GPT-4 表現(xiàn)出“在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上的人類水平表現(xiàn)”。以下是詳細(xì)信息...
OpenAI推出GPT-4,這是一種深度學(xué)習(xí)模型,在考試中的表現(xiàn)優(yōu)于人類
根據(jù)OpenAI的數(shù)據(jù),GPT-4能夠在前10%的考生中通過模擬律師考試,而其前身GPT-3.5(ChatGPT的基礎(chǔ))的得分僅為倒數(shù)10%左右。GPT-4 在其他各種考試中也表現(xiàn)良好,例如 SAT 數(shù)學(xué)考試(在 700 分中得分 800 分)。然而,它在 AP 英語語言和作文考試中只得了 2 分(第 14 至 44 個(gè)百分位)。
重要的是要注意,GPT-4 是一個(gè)反芻引擎,它利用它被訓(xùn)練的材料來解決查詢。盡管它可能會回憶起考試的詳細(xì)信息,但其準(zhǔn)確性可能會有所不同。OpenAI首席執(zhí)行官Sam Altman承認(rèn),GPT-4仍然存在缺陷和局限性,并且在第一次使用時(shí)似乎比花費(fèi)更多時(shí)間后更令人印象深刻。
GPT-4 是一個(gè)大型多模態(tài)模型,旨在通過文本和圖像輸入接受查詢,并以文本形式返回答案。它最初通過候補(bǔ)名單 GPT-4 API 提供,并以純文本容量提供給 ChatGPT Plus 訂閱者,因?yàn)榛趫D像的輸入仍在完善中。盡管增加了視覺輸入機(jī)制,但OpenAI并沒有公開或提供其模型制作的可見性。該公司選擇不公布有關(guān)其規(guī)模、培訓(xùn)方式以及流程中輸入的數(shù)據(jù)的詳細(xì)信息。
在YouTube的直播中,OpenAI總裁兼聯(lián)合創(chuàng)始人Greg Brockman通過要求模型用一個(gè)句子總結(jié)OpenAI GPT-4博客文章來演示GPT-3和GPT-5.4之間的區(qū)別,其中每個(gè)單詞都以字母“G”開頭。GPT-3.5 沒有嘗試,而 GPT-4 返回“GPT-4 產(chǎn)生了突破性的、宏偉的收益,極大地激發(fā)了通用的 AI 目標(biāo)。
Brockman還讓GPT-4為Discord機(jī)器人生成Python代碼,以及發(fā)送給Discord的笑話網(wǎng)站的手繪模型的HTML和JavaScript代碼。最后,布羅克曼設(shè)置了 GPT-4 來分析 16 頁的美國稅法,以返回一對夫婦愛麗絲和鮑勃的標(biāo)準(zhǔn)扣除額,具有特定的財(cái)務(wù)狀況。OpenAI的模型給出了正確的答案和對所涉及的計(jì)算的解釋。
雖然 GPT-4 是一項(xiàng)令人印象深刻的成就,但它的發(fā)展引發(fā)了人們對 GPT-4 等大型模型缺乏透明度和潛在后果的擔(dān)憂。
免責(zé)聲明:本文為轉(zhuǎn)載,非本網(wǎng)原創(chuàng)內(nèi)容,不代表本網(wǎng)觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實(shí)相關(guān)內(nèi)容。