ChatGPT 5.5: Ovo je OpenAI-jev novi skok u autonomiji, troškovima i profesionalnoj upotrebi

  • ChatGPT 5.5 poboljšava rasuđivanje, autonomiju i korištenje računala u usporedbi s GPT-5.4, uz održavanje slične latencije.
  • Ističe se u programiranju agenata, uredskom radu, analizi podataka i znanstvenom istraživanju, postižući vrhunske rezultate u ključnim mjerilima.
  • Cijena po tokenu raste, ali veća učinkovitost i manja potrošnja znače da efektivni trošak može biti niži kod složenih zadataka.
  • OpenAI jača sigurnost u kibernetičkoj sigurnosti i biologiji te implementira GPT-5.5 i njegovu Pro verziju za Plus, Pro, Business i Enterprise korisnike.

ChatGPT5.5

OpenAI je dao još jednu hrabru izjavu s lansiranje de GPT-5.5, model koji najnoviju generaciju ChatGPT-a postavlja na puno višu razinu autonomije i rasuđivanja Na temelju onoga što smo do sada vidjeli, tvrtka ga predstavlja kao svoj najintuitivniji i najsposobniji sustav za rješavanje složenih zadataka od početka do kraja, smanjujući potrebu za stalnim nadzorom korisnika.

Ovaj potez dolazi u trenutku utrka za vodstvo u generativnoj umjetnoj inteligencijiS obzirom na to da Anthropic i Google također ubrzavaju vlastite modele, GPT-5.5 se prvo pokreće na ChatGPT-u i Codexu za korisnike koji plaćaju, te kombinira poboljšanja u programiranju, uredskom radu, znanstvenom istraživanju i korištenju računala u stvarnom svijetu, po cijenu... Povećanje cijene koje OpenAI pokušava opravdati izvanrednom učinkovitošću korištenja tokena.

Što je GPT-5.5 i kakvu ulogu igra u strategiji OpenAI-a?

Prema OpenAI-ju, GPT-5.5 označava novi korak u održivom razmišljanju i autonomnom radu s računalom.Model je osmišljen za rješavanje dugih, višekoračnih zadataka: može primati neuredne upute, raščlaniti ih, planirati što prvo učiniti, odabrati i rukovati alatima, pregledati vlastite rezultate i nastaviti čak i ako postoje dvosmislenosti u izjavi.

Tvrtka to definira kao svoju umjetnu inteligenciju najintuitivniji do sadaUmjesto jednostavnog odgovaranja na izolirana pitanja, GPT-5.5 djeluje kao agent: održava kontekst tijekom opsežnih procesa, navigira informacijama na webu, izvršava naredbe, manipulira dokumentima i uredskim aplikacijama te vraća unaprijed strukturirane rezultate, spremne za upotrebu u profesionalnom okruženju.

Lansiranje uključuje GPT-5.5 Pro verzija, usmjerena na složenije zadatke Već ima korisnike kojima su potrebni rigorozniji odgovori u područjima kao što su pravo, poslovanje, obrazovanje ili napredna analiza podataka. ChatGPT također ima način rada GPT-5.5 razmišljanjedizajniran za posebno teške probleme u programiranju, istraživanju ili analizi informacija.

Autonomija i korištenje računala u stvarnom svijetu: od chatbota do radnog agenta

Jedan od velikih napora OpenAI-a je na sposobnost GPT-5.5 da funkcionira kao samozaposleni agent na računalu. Model može pretraživati ​​informacije, odlučivati ​​što je relevantno, kombinirati izvore, upravljati softverom i alatima u nizu te transformirati raspršene materijale u korisne rezultate, bez potrebe da korisnik detaljno specificira svaki korak.

U svakodnevnom životu to se prevodi u zadatke kao što su generiranje složenih dokumenata, proračunskih tablica ili prezentacijaPregledavanje ugovora, priprema izvješća, analiza baza podataka ili izrada opsežnih sažetaka iz više datoteka. Tvrtka tvrdi da GPT-5.5 brže razumije potrebe korisnika i samostalno obavlja veći dio posla od prethodnih verzija.

Kako bi ilustrirao ovu promjenu, OpenAI navodi interne primjere: financijski timovi koji koriste Codex i GPT-5.5 za pregled desetaka tisuća poreznih obrazaca U puno kraćem vremenu, komunikacijski odjeli automatiziraju okvire za bodovanje i procjenu rizika za velike količine zahtjeva, ili su marketinška i proizvodna područja značajno smanjila vrijeme provedeno na periodičnim izvješćima zahvaljujući automatiziranim tijekovima rada.

Performanse u agentnom programiranju i razvoju softvera

GPT-5.5 pokazuje poboljšanja u programiranju i onome što OpenAI naziva "agentskim kodiranjem" - korištenjem umjetne inteligencije kao agenta koji piše, ispravlja greške i održava kod od početka do kraja. U razvojnim okruženjima, model može upravljati velikim repozitorijima, predlagati složene refaktore, identificirati izvor pogrešaka i predvidjeti koji će dijelovi sustava biti pogođeni promjenom.

U mjerilu Terminal-Klupa 2.0, koji mjeri složene tijekove rada naredbenog retka, GPT-5.5 postiže 82,7%, što je očito bolje od GPT-5.4, a pritom troši manje tokena. SWE-Bench ProFokusiran na rješavanje stvarnih problema s GitHubom, model doseže 58,6%i u internoj evaluaciji Stručnjak-SWE, sa zadacima čije je procijenjeno ljudsko vrijeme oko 20 sati, također je iznad svog prethodnika.

Inženjeri koji su testirali rane verzije ističu da GPT-5.5 bolje razumije cjelokupnu arhitekturu složenih sustavaU internim testovima navode se slučajevi poput spajanja grana sa stotinama promjena riješenih u dvadesetak minuta, gotovo potpuni redizajni podsustava (na primjer, sustav komentara u kolaborativnom editoru) ili rano otkrivanje grešaka koje su prije zahtijevale mnogo više iteracija.

U Codexu, OpenAI-jevom softverskom inženjerskom okruženju, GPT-5.5 ima kontekstni prozor do 400.000 tokena, što mu omogućuje rad s vrlo velikim kodnim bazama. Također ima brzi način rada koji generira približno [potreban broj tokena]. 1,5 puta brže, iako s višom cijenom po tokenu, dizajniran za one kojima je prioritet brzina odgovora.

Rad sa znanjem, poslovanje i svakodnevna uredska upotreba

Osim razvoja softvera, GPT-5.5 je dizajniran kao alat za profesionalni rad u uredskom, konzultantskom ili okruženju za analizu podataka. OpenAI tvrdi da iste mogućnosti koje poboljšavaju programiranje sada omogućuju učinkovitije zadatke dokumentiranja i analize.

U mjerilu Vrijednost BDP-a, koji procjenjuje sposobnost izrade određenog stručnog rada u 44 zanimanjaGPT-5.5 dobiva 84,9% točnih odgovora ili neriješenih odgovora. U OSWorld-PotvrđenoTest osmišljen kako bi se provjerilo može li model autonomno upravljati stvarnim računalnim okruženjima, dolazi do 78,7%. U Tau2-bench Telecom, usmjeren na korisničku podršku u telekomunikacijskom sektoru, doseže 98% bez potrebe za prilagođavanjem upita, što ukazuje na visoke performanse u scenarijima podrške.

Za poslovnu upotrebu, OpenAI ističe da Preko 85% njihovog osoblja koristi Codex tjedno u područjima kao što su inženjerstvo, financije, marketing, podaci ili proizvodi. Slučajevi poput automatizacije tjednih izvješća, koja štedi između pet i deset sati po osobi tjedno, ilustriraju vrstu prednosti koje tvrtka pripisuje novom modelu kada se integrira u poslovne procese.

Znanstvena istraživanja, biologija i napredna matematika

Znanstveno istraživanje je još jedna središnja tema u prezentaciji GPT-5.5. OpenAI cilja na tijekove rada tamo gdje je potreban. istražiti hipoteze, prikupiti dokaze, testirati pretpostavke, interpretirati rezultate i odlučiti o sljedećem eksperimentu, okruženje u kojem je održivo kontekstualno razmišljanje ključno.

U testovima kao što su GeneBenchFokusiran na zadatke biologije i genetike, GPT-5.5 poboljšava rezultate GPT-5.4 i varijante GPT-5.5 Pro Postiže još više rezultate. U BixBenchFokusiran na bioinformatiku i kvantitativnu biologiju, novi model također postiže najbolje performanse među sustavima s objavljenim podacima do danas, prema informacijama koje je pružila tvrtka.

OpenAI je čak naveo primjere upotrebe u naprednoj matematici, gdje je Interna verzija GPT-5.5 surađivala je u potrazi za novim testom povezanim s izvandijagonalnim Ramseyjevim brojevima.To je naknadno provjereno korištenjem Lean formalnog asistenta. Tvrtka predstavlja ovaj slučaj kao primjer kako model ne samo generira kod ili objašnjenja, već može i doprinijeti matematičkim argumentima u složenim područjima.

U praktičnom smislu, spominju se svjedočanstva istraživača koji su koristili GPT-5.5 Pro za analizirati skupove podataka o genskoj ekspresiji s desecima tisuća varijabli i značajnim brojem uzorakadobivanje detaljnih izvješća, novih kutova analize i ključnih pitanja u vremenskom okviru koji bi, prema njihovim izračunima, bio mnogo dulji kada bi se rješavao isključivo ljudskim radom.

Latencija, vrijeme zaključivanja i učinkovitost tokena

Iza lansiranja GPT-5.5 krije se stalna poruka: Povećava inteligenciju modela bez smanjenja brzine odziva.OpenAI tvrdi da novi sustav u stvarnom svijetu postiže latenciju po tokenu GPT-5.4, unatoč tome što je sposobniji, što je neobično kod većih i složenijih modela.

Jedna od ključnih točaka je vrijeme potrebno za razmišljanje i dovršavanje složenih zadatakaRani korisnici koji su usporedili ponašanje s prethodnim verzijama izvještavaju da se procesi koji su prije zahtijevali između 20 i 40 minuta rada sada rješavaju za samo tri ili četiri minute, održavajući - pa čak i poboljšavajući - kvalitetu odgovora.

Ovaj dobitak ne dolazi samo od čiste brzine, već i od bolje upravljanje tokenimaGPT-5.5 zahtijeva manje tokena za postizanje usporedivih ili boljih rezultata od GPT-5.4, smanjujući i ukupno vrijeme obrade i troškove povezane sa svakim tijekom rada. U scenarijima s velikim volumenom upita ili intenzivnom automatizacijom, ova razlika može biti ključna.

OpenAI objašnjava da je, kako bi održao latenciju, morao redizajniranje zaključivanja kao integriranog sustavaGPT-5.5 je zajednički dizajniran, obučen i implementiran na najsuvremenijoj NVIDIA hardverskoj infrastrukturi (GB200 i GB300 NVL72), a sam GPT-5.5 i Codex korišteni su za optimizaciju heuristike uravnoteženja opterećenja i particioniranja, s povećanjem brzine generiranja tokena na njihovim sustavima za preko 20%.

Cijene, stvarni trošak i usporedba s GPT-5.4

Iako se GPT-5.5 nalazi u visoki raspon cijena po tokenuOpenAI inzistira na tome da u praksi može biti ekonomičniji od svog prethodnika i nekih konkurencije. Razlog je kombinacija veća učinkovitost tokena i manja potreba za ponovnim pokušajima ili ispravke.

U API-ju su referentne cijene prijavljene za GPT-5.5 5 USD po milijunu ulaznih tokena i 30 USD po milijunu izlaznih tokenas kontekstnim prozorom koji doseže do milijun tokena. Za GPT-5.5 Pro, stope rastu na Uneseno je 30 USD po milijunu tokena, a izašlo 180 USD po milijunu tokenajasno ciljajući upotrebe gdje dodana vrijednost odgovora nadmašuje trošak.

OpenAI također nudi načine rada kao što su Batch i Flex, s cijenama otprilike upola nižim od standardne cijene.i način rada Prioritet koji množi trošak s 2,5 u zamjenu za veći prioritet reda čekanja i kraće vrijeme odziva. Tvrtka priznaje da je GPT-5.5 nominalno skuplji od GPT-5.4, ali tvrdi da smanjenje broja tokena potrebnih po zadatku i kraće vrijeme rasuđivanja opravdavaju trošak. Mogu smanjiti ukupne troškove složenih projekata u usporedbi s drugim modelima..

Na tržištu, ova politika stavlja GPT-5.5 iznad prethodnih OpenAI modela i ispod vrhunskih alternativa koje, prema procjenama podijeljenim tijekom prezentacije, mogu biti između pet i deset puta skuplje u praktičnom smislu kada se uzme u obzir kombinacija cijene, potrošenih tokena i kvalitete rezultata.

Dugi kontekst i performanse u kriterijima zaključivanja

Još jedno vidljivo poboljšanje GPT-5.5 je njegova sposobnost da rad s vrlo opsežnim kontekstima bez gubitka vezeU testovima kao što su Graphwalks BFS 1Mmodel doseže 45,4% u usporedbi s 9,4% za GPT-5.4 i u OpenAI MRCR v2 s kontekstima između 512 tisuća i 1 milijuna tokena raste na 74,0%, u usporedbi s 36,6% u prethodnoj verziji.

U području apstraktnog zaključivanja, GPT-5.5 bilježi a 95,0% u ARC-AGI-1 i 85,0% u ARC-AGI-2, sa značajnim poboljšanjima u odnosu na GPT-5.4. U naprednim testovima znanja kao što su GPQA DijamantUsredotočen na vrlo teška pitanja, dobiva 93,6%i u procjenama kao što su Posljednji ispit čovječanstva Prelazi 50% kada je dopušteno koristiti vanjske alate.

OpenAI naglašava da su mnoge od ovih procjena provedene u istraživačka okruženja s konfiguracijama zaključivanja na vrlo visokim razinamaStoga se rezultati mogu neznatno razlikovati od onih koje korisnici ChatGPT-a percipiraju u produkciji. Unatoč tome, tvrtka želi prenijeti ideju da GPT-5.5 predstavlja Praktični skok u stvarnim zadacima, ne samo akademsko poboljšanje u tablicama s referentnim vrijednostima.

Sigurnost, kibernetička sigurnost i odgovorna upotreba

Povećanje sposobnosti podrazumijeva jačanje sigurnosne mjereOpenAI navodi da se GPT-5.5 pokreće sa svojim najnaprednijim sustavom zaštite do sada, nakon što je prošao interne i eksterne evaluacije, specifične okvire spremnosti i procese crvenog timinga sa stručnjacima za kibernetičku sigurnost i biologiju.

U okviru svog Okvir za pripravnostTvrtka klasificira mogućnosti GPT-5.5 kao Biologija, kemija i kibernetička sigurnost na "visokoj" razinibez dosezanja "kritične" razine. Unatoč tome, priznaje da je model učinkovitiji od GPT-5.4 u pronalaženju i iskorištavanju ranjivosti te je stoga implementiran stroži klasifikatori za osjetljive zahtjeve i mehanizme protiv ponovljenih rizičnih upotreba, što bi moglo biti restriktivnije za neke tehničke korisnike.

Paralelno s tim, OpenAI ima za cilj proširiti pristup naprednijim mogućnostima za provjerene obrambene upotrebe kroz programe poput Pouzdan pristup za kibernetičku sigurnostOvi alati su posebno namijenjeni organizacijama odgovornim za zaštitu kritične infrastrukture. Ideja je pružiti snažne obrambene alate bez ublažavanja kontrola protiv potencijalnih ofenzivnih upotreba.

U području bioloških istraživanja, tvrtka je pokrenula inicijative kao što su programi nagrađivanja za otkrivanje bioloških pogrešaka u ponašanju modela, s ciljem da znanstvena zajednica pomogne u identificiranju nedostataka i poboljšanju zaštitnih mjera prije šire primjene.

Dostupnost GPT-5.5 i njegova primjena u proizvodima

Implementacija GPT-5.5 je započela za Korisnici ChatGPT-a i Codex Plus, Pro, Business i Enterpriseu osobnom i korporativnom okruženju. U Codexu je model integriran u tijekove rada za razvoj softvera s proširenim kontekstnim prozorom i načinima brzog odgovora.

La GPT-5.5 Pro verzija Postupno se aktivira za Pro, Business i Enterprise korisnike kojima je potrebna dodatna razina detalja i preciznosti, posebno u reguliranim ili područjima s velikim utjecajem gdje pogreške mogu biti skupe. U ChatGPT-u korisnici također počinju vidjeti specifične opcije kao što su GPT-5.5 razmišljanje za složene istraživačke ili analitičke probleme.

Što se tiče API-ja, OpenAI radi na Uključite GPT-5.5 i GPT-5.5 Pro u svoje krajnje točke Odgovori i Dovršeci chata s kontekstnim prozorima koji dosežu milijun tokena. Tvrtka navodi da će se pristup proširiti kako se budu ispunjavali zahtjevi za unutarnju sigurnost i kapacitet infrastrukture, tako da programeri mogu integrirati model u vlastite aplikacije nakon što ova faza bude dovršena.

Dolazak GPT-5.5 učvršćuje promjenu faze u evoluciji ChatGPT-a: Fokus se prebacuje s jednostavnog generiranja teksta na sveobuhvatnu automatizaciju digitalnih zadataka, s autonomnijim modelima sposobnim za dulje razmišljanje i rad na stvarnim sustavima, po cijenu viših cijena i sve veće rasprave o sigurnosti i upravljanju.U europskom kontekstu gdje regulacija umjetne inteligencije napreduje, a tvrtke traže učinkovitost bez gubitka kontrole, način na koji organizacije, programeri i uprave usvajaju - ili ograničavaju - upotrebu GPT-5.5 može biti jednako relevantan kao i referentne brojke koje prate ovaj novi model.

Agent ChatGPT-a
Povezani članak:
ChatGPT agent: OpenAI-jev skok u autonomne agente za automatizaciju složenih zadataka