GPT-5-Codex: OpenAI-jev agent koji programira i pregledava kod

  • GPT-5-Codex je varijanta GPT-5 optimizirana za kodiranje temeljeno na agentima u Codexu.
  • Dinamički prilagođava vrijeme razmišljanja od nekoliko sekundi do preko sedam sati, ovisno o zadatku.
  • Poboljšava pregled koda i otkrivanje kritičnih grešaka, s manje pogrešnih komentara.
  • Dostupno u verzijama Plus, Pro, Business, Edu i Enterprise; API dolazi kasnije.

Generička slika GPT-5 kodeksa

OpenAI je predstavio GPT-5-Kodeks, varijanta njegovog generalističkog modela usmjerena na zadatke programiranja temeljene na agentima unutar Codexa. Cilj je omogućiti timovima prelazak između interaktivnih sesija i dugoročnog rada u pozadini bez gubitka konteksta ili kvalitete rezultata.

Tvrtka ističe da model prilagodite vrijeme koje provodite razmišljajući na temelju složenosti: odgovara u sekundama na jednostavne zahtjeve i može uložiti sate kada zadatak to zahtijeva. Ovaj pristup, orijentiran na softversko inženjerstvo, uključuje napredne mogućnosti pregled koda i otkrivanje kritičnih grešaka.

Što je GPT-5-Codex i čemu služi?

U usporedbi s GPT-5 opće namjene, ova verzija je bila obučeni sa stvarnim scenarijima razvoja s okvirima poput PyTorch za izradu projekata od nule, dodavanje značajki i testova, otklanjanje pogrešaka, refaktoriranje i dosljedno praćenje promjena.

Prema OpenAI-ju, model je više strogo se pridržavajte smjernica za agente (AGENTS.md), stoga bolje slijedite upute, slično projektima poput OpenAssistant, i proizvodi kod više kvalitete s kratkim uputama, bez potrebe za pisanjem dugih uputa.

Osim programiranja, GPT-5-Codex može procijenite ispravnost pokretanjem koda i testovai označiti probleme s utjecajem prije nego što krenu u produkciju, što je posebno korisno za timove sa zahtjevnim pregledima.

U poslovima sučelja, tvrtka to smatra pouzdan partner za front-end zadatke i izradu desktop aplikacija, s poboljšanjima u generiranju mobilnog iskustva na temelju internih procjena ljudskih preferencija.

Sve navedeno integrirano je u uobičajeni tijek: Terminal (CLI), IDE, web, GitHub i aplikacija ChatGPT, s kontinuitetom konteksta između oblaka i lokalnog okruženja.

Performanse i prilagodljivo "vrijeme razmišljanja"

Jedan od ključeva lansiranja je njegovo upravljanje dinamičkim zaključivanjemModel sam u stvarnom vremenu odlučuje koliko "glave" će posvetiti i može produžiti izvršavanje kada otkrije da zadatak postaje sve složeniji.

OpenAI tvrdi da je primijetio samostalne sesije dulje od sedam sati u velikim refaktoriranjima, s iteracijama koje ispravljaju neuspjehe testiranja i validiraju rezultate dok se cilj ne postigne.

Ovo ponašanje je u suprotnosti sa strategijama temeljenim na usmjerivači koji unaprijed određuju resurse; ovdje model ponovno procjenjuje trud kako napreduje, kombinirajući agilni dijalog s upornim izvršenjem.

Na praktičnoj razini, to se prevodi u brzi odgovori na specifične zahtjeve i više uloženog vremena kada rad uključuje orkestriranje promjena u više modula ili rješavanje složenih ovisnosti.

Za softverske timove, pristup obećava manje nebitnih iteracija i više se usredotočiti na korake s velikim utjecajem, posebno prilikom pregleda velikih repozitorija ili rješavanja međusektorskih zadataka.

Konceptualna slika kodnog agenta

Alati i integracija: CLI, IDE, web i GitHub

Sučelje naredbenog retka Codexa je bilo redizajnirano oko tokova temeljenih na agentimaSlike se sada mogu izravno priložiti u CLI kako bi se olakšalo donošenje dizajnerskih odluka ili otkrile vizualne nedosljednosti.

Sustav može pratiti napredak pomoću popisa obaveza i integrira alate poput web pretraživanja i MCP-a, otvorenog standarda za sigurno povezivanje LLM-ova s ​​vanjskim podacima i uslužnim programima.

Sučelje također poboljšava format poziva alata i usporedbe, što pomaže u praćenju agentovog razmišljanja i jasnijem pregledu razlika.

U razvojnim okruženjima, IDE ekstenzija i integracija s GitHubom omogućuju Premještanje posla između lokalnog sustava i oblaka bez gubitka konteksta, oslanjajući se na otvoreni kod u editoru za preciznije odgovore.

OpenAI pokazuje da agent radi na kontrolirana okruženja prema zadanim postavkama i da je moguće prilagoditi dozvole kako bi se ograničile potencijalno destruktivne radnje na osjetljivim projektima.

Dostupnost i pristup

GPT-5-Codex je omogućen u ChatGPT Plus, Pro, Business, Edu i Enterprise, uz iskustva s Codexom u terminalu, webu, IDE-u i GitHubu.

Tvrtka planira to učiniti dostupnim API klijenti kasnije, iako trenutno nije detaljno opisala raspored ili specifične cijene za taj kanal.

GPT-5 Codex testovi i metrike

Prema informacijama koje je podijelio OpenAI i vanjski izvještaji, GPT-5-Codex nudi bolji rezultati od GPT-5 u scenarijima orijentiranim na agente, kao što je SWE-bench Verified benchmark.

U konkretnim brojkama, oni se spominju Poboljšanja do 74,5% u SWE-bench verificirano i skok u testovima refaktoriranja s 33,9% s GPT-5 na 51,3% s GPT-5-Codexom, što sugerira napredak u održavanju i uređivanju više datoteka.

Tvrtka također ističe da je njezina Komentari u recenzijama su manje pogrešni ili nebitni, što omogućuje usmjeravanje pažnje na kritična pitanja i smanjenje šuma u PR-ovima.

Što GPT-5 Codex znači za tehničke timove

Za developere, imati agenta koji kombinira brzu interakciju i autonomni rad otvara vrata kraćim ciklusima i učinkovitijem određivanju prioriteta složenih zadataka.

U organizacijama, sposobnost modela da provede sate na zadatku zahtijeva strategiju umjetne inteligencije poduzeća, jasne politike o troškovima i ograničenjima izvršenja te validaciju njegovih performansi na više jezika i monorepozitorija s opsežnim kontekstom.

Prakse sigurna integracija u postojeće tokove, s kontrolama dopuštenja, praćenjem odluka agenata i čitljivim razlikama za održavanje kvalitete i sljedivosti.

S fokusom na softversko inženjerstvo, GPT-5-Codex ima za cilj biti tehnički suradnik sposoban za stvaranje, pregled i održavanje složenih projekata, prilagođavanje računalnog napora stvarnoj veličini problema i podizanje ljestvice za alate za kodiranje pokretane umjetnom inteligencijom.

Red Hat
Povezani članak:
Red Hat jača svoju strategiju umjetne inteligencije za poduzeća s OpenShift AI, F5 i ekosustavom inteligentnih agenata.