ChatGPT V4 er i top, SAT'er og kan identificere udnyttelser i ETH-kontrakter

GPT-4, den seneste version af Artificial Intelligence (AI) chatbot, ChatGPT, kan bestå gymnasieprøver og juraeksamener med score i 90. percentilen og har nye behandlingsmuligheder, der ikke var mulige med den tidligere version.

Tallene fra GPT-4's testresultater blev delt den 14. marts af dens skaber OpenAI, hvilket afslører, at den også kan konvertere billed-, lyd- og videoinput til tekst ud over at håndtere "meget mere nuancerede instruktioner" mere kreativt og pålideligt.

"Den består en simuleret bar-eksamen med en score omkring de øverste 10% af testdeltagere," tilføjede OpenAI. "I modsætning hertil var GPT-3.5's score omkring de nederste 10 %."

Tallene viser, at GPT-4 opnåede en score på 163 i den 88. percentil på LSAT-eksamenen - den test, universitetsstuderende skal bestå i USA for at blive optaget på jurastudiet.

*Eksamensresultater for GPT-4 og GPT-3.5 på en række nyere amerikanske eksamener. Kilde:* *OpenAI*

GPT4's score ville sætte det i en god position til at blive optaget på en top 20 juraskole og er kun et par point fra de rapporterede scorer, der er nødvendige for accept til prestigefyldte skoler som Harvard, Stanford, Princeton eller Yale.

Den tidligere version af ChatGPT scorede kun 149 på LSAT'erne, hvilket placerede den i de nederste 40%.

GPT-4 scorede også 298 ud af 400 i Uniform Bar Exam - en test udført af nyligt uddannede jurastuderende, der tillader dem at praktisere som advokat i enhver amerikansk jurisdiktion.

*UBE-resultater skulle optages til at praktisere jura i hver amerikansk jurisdiktion. Kilde:* *National konference for advokatfuldmægtige*

Den gamle version af ChatGPT kæmpede i denne test og sluttede i de nederste 10 % med en score på 213 ud af 400.

Med hensyn til SAT Evidence-Based Reading & Writing og SAT Math eksamener taget af amerikanske gymnasieelever for at måle deres college-parathed, scorede GPT-4 i henholdsvis 93. og 89. percentil.

GPT-4 udmærkede sig også inden for de "hårde" videnskaber, og udsendte langt over gennemsnittet percentilscore i AP Biology (85-100%), Kemi (71-88%) og Fysik 2 (66-84%).

Imidlertid var dens AP Calculus-score ret gennemsnitlig, rangerende i 43r til 59. percentilen.

Et andet område, hvor GPT-4 manglede, var i eksamener i engelsk litteratur, hvor der blev lagt resultater i 8. til 44. percentil på tværs af to separate test.

OpenAI sagde, at GPT-4 og GPT-3.5 tog disse tests fra øvelseseksamenerne 2022-2023, og at "ingen specifik træning" blev taget af sprogbehandlingsværktøjerne:

"Vi lavede ingen specifik træning til disse eksamener. Et mindretal af problemerne i eksamenerne blev set af modellen under træningen, men vi mener, at resultaterne er repræsentative."

Resultaterne førte også til frygt i Twitter-samfundet.

Relateret: Hvordan vil ChatGPT påvirke Web3-området? Industrien svarer

Nick Almond, grundlæggeren af FactoryDAO fortalt hans 14,300 Twitter-tilhængere den 14. marts, at GPT4 kommer til at "skræmme folk", og det vil "kollapse" det globale uddannelsessystem.

Vurderingsteori var en stor del af mit liv i flere år. Jeg tudede over denne dag, der kom for mange år siden. Jeg lød bogstaveligt talt som beboerens håndsving på det tidspunkt.
Men... det betyder egentlig, at alt andet end en tilsynsførende vurdering er forbi fra dette tidspunkt.
— drnick ️² (@DrNickA) Marts 14, 2023

Tidligere Coinbase-direktør, Conor Grogan, sagde, at han indsatte en live Ethereum smart kontrakt i GPT-4 og pegede øjeblikkeligt på flere "sikkerhedssårbarheder" og skitserede, hvordan koden kan udnyttes:

Jeg dumpede en live Ethereum-kontrakt ind i GPT-4.
På et øjeblik fremhævede den en række sikkerhedssårbarheder og pegede på overfladeområder, hvor kontrakten kunne udnyttes. Det bekræftede derefter en specifik måde, jeg kunne udnytte kontrakten på pic.twitter.com/its5puakUW
— Conor (@jconorrogan) Marts 14, 2023

Tidligere smarte kontraktrevisioner på ChatGPT viste, at dens første version også var i stand til at opdage kodefejl i en rimelig grad.

Rowan Cheung, grundlæggeren af AI-nyhedsbrevet "The Rundown" delte en video af GPT, der transskriberer en håndtegnet falsk hjemmeside på et stykke papir til kode.

Jeg har lige set GPT-4 forvandle en håndtegnet skitse til en funktionel hjemmeside.
Dette er sindssygt. pic.twitter.com/P5nSjrk7Wn
— Rowan Cheung (@rowancheung) Marts 14, 2023