ChatGPT V4 dépasse la barre, SAT et peut identifier les exploits dans les contrats ETH

GPT-4, la dernière version du chatbot d'intelligence artificielle (IA), ChatGPT, peut réussir les tests du lycée et les examens de la faculté de droit avec des scores classés dans le 90e centile et dispose de nouvelles capacités de traitement qui n'étaient pas possibles avec la version précédente.

Les chiffres des résultats des tests de GPT-4 ont été partagés le 14 mars par son créateur OpenAI, révélant qu'il peut également convertir les entrées image, audio et vidéo en texte en plus de gérer des "instructions beaucoup plus nuancées" de manière plus créative et fiable.

"Il réussit un examen du barreau simulé avec un score autour des 10% des meilleurs candidats", a ajouté OpenAI. "En revanche, le score de GPT-3.5 se situait autour des 10 % inférieurs."

Les chiffres montrent que GPT-4 a obtenu un score de 163 dans le 88e centile à l'examen LSAT - le test que les étudiants doivent réussir aux États-Unis pour être admis à la faculté de droit.

Résultats des examens GPT-4 et GPT-3.5 sur une série d'examens américains récents. Source: OpenAI

Le score de GPT4 le placerait en bonne position pour être admis dans l'une des 20 meilleures facultés de droit et n'est qu'à quelques points des scores rapportés nécessaires pour être accepté dans des écoles prestigieuses telles que Harvard, Stanford, Princeton ou Yale.

La version précédente de ChatGPT n'a marqué que 149 sur le LSAT, ce qui la place dans les 40% inférieurs.

GPT-4 a également obtenu 298 sur 400 à l'examen uniforme du barreau - un test entrepris par des étudiants en droit récemment diplômés leur permettant d'exercer en tant qu'avocat dans n'importe quelle juridiction américaine.

Les scores UBE devaient être admis à pratiquer le droit dans chaque juridiction américaine. Source: Conférence nationale des examinateurs du barreau

L'ancienne version de ChatGPT a connu des difficultés lors de ce test, terminant dans les 10 % inférieurs avec un score de 213 sur 400.

En ce qui concerne les examens SAT Evidence-Based Reading & Writing et SAT Math passés par les lycéens américains pour mesurer leur préparation à l'université, GPT-4 a obtenu respectivement un score de 93e et 89e centile.

Le GPT-4 a également excellé dans les sciences «dures», affichant des scores centiles bien supérieurs à la moyenne en biologie AP (85-100%), chimie (71-88%) et physique 2 (66-84%).

Résultats des examens de GPT-4 et GPT-3.5 sur une gamme d'examens américains récents. Source : OpenAI.

Cependant, son score AP Calculus était assez moyen, se classant entre le 43e et le 59e centile.

Un autre domaine où GPT-4 manquait était les examens de littérature anglaise, affichant des scores entre le 8e et le 44e centile dans deux tests distincts.

OpenAI a déclaré que GPT-4 et GPT-3.5 ont passé ces tests lors des examens pratiques de 2022-2023, et qu'"aucune formation spécifique" n'a été suivie par les outils de traitement du langage :

« Nous n'avons pas suivi de formation spécifique pour ces examens. Une minorité des problèmes lors des examens ont été constatés par le modèle pendant la formation, mais nous pensons que les résultats sont représentatifs. »

Les résultats ont également suscité la peur dans la communauté Twitter.

Connexe: Comment ChatGPT affectera-t-il l'espace Web3 ? Réponses de l'industrie

Nick Almond, le fondateur de FactoryDAO dit ses 14,300 14 abonnés sur Twitter le 4 mars que GPTXNUMX va « effrayer les gens » et qu'il « effondrera » le système éducatif mondial.

L'ancien directeur de Coinbase, Conor Grogan, a déclaré avoir inséré un contrat intelligent Ethereum en direct dans GPT-4 et a instantanément signalé plusieurs « vulnérabilités de sécurité » et expliqué comment le code peut être exploité :

Des audits de contrats intelligents antérieurs sur ChatGPT ont révélé que sa première version était également capable de détecter les bogues de code dans une mesure raisonnable.

Rowan Cheung, le fondateur de la newsletter AI "The Rundown", a partagé une vidéo de GPT transcrivant un faux site Web dessiné à la main sur un morceau de papier en code.