ChatGPT V4 er i top, SAT'er og kan identificere udnyttelser i ETH-kontrakter

GPT-4, den seneste version af Artificial Intelligence (AI) chatbot, ChatGPT, kan bestå gymnasieprøver og juraeksamener med score i 90. percentilen og har nye behandlingsmuligheder, der ikke var mulige med den tidligere version.

Tallene fra GPT-4's testresultater blev delt den 14. marts af dens skaber OpenAI, hvilket afslører, at den også kan konvertere billed-, lyd- og videoinput til tekst ud over at håndtere "meget mere nuancerede instruktioner" mere kreativt og pålideligt.

"Den består en simuleret bar-eksamen med en score omkring de øverste 10% af testdeltagere," tilføjede OpenAI. "I modsætning hertil var GPT-3.5's score omkring de nederste 10 %."

Tallene viser, at GPT-4 opnåede en score på 163 i den 88. percentil på LSAT-eksamenen - den test, universitetsstuderende skal bestå i USA for at blive optaget på jurastudiet.

Eksamensresultater for GPT-4 og GPT-3.5 på en række nyere amerikanske eksamener. Kilde: OpenAI

GPT4's score ville sætte det i en god position til at blive optaget på en top 20 juraskole og er kun et par point fra de rapporterede scorer, der er nødvendige for accept til prestigefyldte skoler som Harvard, Stanford, Princeton eller Yale.

Den tidligere version af ChatGPT scorede kun 149 på LSAT'erne, hvilket placerede den i de nederste 40%.

GPT-4 scorede også 298 ud af 400 i Uniform Bar Exam - en test udført af nyligt uddannede jurastuderende, der tillader dem at praktisere som advokat i enhver amerikansk jurisdiktion.

UBE-resultater skulle optages til at praktisere jura i hver amerikansk jurisdiktion. Kilde: National konference for advokatfuldmægtige

Den gamle version af ChatGPT kæmpede i denne test og sluttede i de nederste 10 % med en score på 213 ud af 400.

Med hensyn til SAT Evidence-Based Reading & Writing og SAT Math eksamener taget af amerikanske gymnasieelever for at måle deres college-parathed, scorede GPT-4 i henholdsvis 93. og 89. percentil.

GPT-4 udmærkede sig også inden for de "hårde" videnskaber, og udsendte langt over gennemsnittet percentilscore i AP Biology (85-100%), Kemi (71-88%) og Fysik 2 (66-84%).

Eksamensresultater for GPT-4 og GPT-3.5 på en række nyere amerikanske eksamener. Kilde: OpenAI.

Imidlertid var dens AP Calculus-score ret gennemsnitlig, rangerende i 43r til 59. percentilen.

Et andet område, hvor GPT-4 manglede, var i eksamener i engelsk litteratur, hvor der blev lagt resultater i 8. til 44. percentil på tværs af to separate test.

OpenAI sagde, at GPT-4 og GPT-3.5 tog disse tests fra øvelseseksamenerne 2022-2023, og at "ingen specifik træning" blev taget af sprogbehandlingsværktøjerne:

"Vi lavede ingen specifik træning til disse eksamener. Et mindretal af problemerne i eksamenerne blev set af modellen under træningen, men vi mener, at resultaterne er repræsentative."

Resultaterne førte også til frygt i Twitter-samfundet.

Relateret: Hvordan vil ChatGPT påvirke Web3-området? Industrien svarer

Nick Almond, grundlæggeren af ​​FactoryDAO fortalt hans 14,300 Twitter-tilhængere den 14. marts, at GPT4 kommer til at "skræmme folk", og det vil "kollapse" det globale uddannelsessystem.

Tidligere Coinbase-direktør, Conor Grogan, sagde, at han indsatte en live Ethereum smart kontrakt i GPT-4 og pegede øjeblikkeligt på flere "sikkerhedssårbarheder" og skitserede, hvordan koden kan udnyttes:

Tidligere smarte kontraktrevisioner på ChatGPT viste, at dens første version også var i stand til at opdage kodefejl i en rimelig grad.

Rowan Cheung, grundlæggeren af ​​AI-nyhedsbrevet "The Rundown" delte en video af GPT, der transskriberer en håndtegnet falsk hjemmeside på et stykke papir til kode.