
Rat za umjetna inteligencija primijenjena na slike To više nije samo obećanje za budućnost: ovdje je i vrlo je ozbiljno. U jednom kutu ringa imamo... Slika ChatGPT-a 1.5, novi OpenAI model koji pokreće ChatGPT slike; s druge strane, Nano Banana Pro, Googleov popularni vizualni generator i uređivač integriran je u cijeli njegov ekosustav.Konkurencija je toliko žestoka da je OpenAI čak interno govorio o stanju "crvenog koda" nakon Googleovog napretka.
Ako radite s vizualnim sadržajem — bilo kao kreativni profesionalac, marketer, programer ili samo hobist— Vjerojatno se pitate koji će vam od dva modela dati bolje rezultate. Analizirajmo, mirno, ali izravno, kako se ChatGPT Image 1.5 i Nano Banana Pro uspoređuju u područjima koja su zaista važna: stil, fotorealizam, formati, rezolucija, brzina, cijena, uređivanje, reference i korisničko iskustvo.
Kontekst: Zašto je ChatGPT slika 1.5 toliko važna
Dolazak Slika ChatGPT-a 1.5 Ovo nije manja nadogradnja. OpenAI ga predstavlja kao svoj novi vodeći vizualni model, dostupan i na kartici slika ChatGPT-a i putem API-ja. Službena poruka je jasna: slike koje točnije slijede upute, finije izmjene i generiranje. do četiri puta brže od prethodne verzije.
Ovo lansiranje također dolazi u vrlo osjetljivom trenutku. Nakon Googleovog pritiska s Gemini 3 A sa svojim vodećim vizualnim generatorom - nadimkom Nano Banana - OpenAI je aktivirao svojevrsni plan za rješavanje problema. Paralelno s većim potezima poput pokretanja GPT‑5.2Tvrtka je trebala pokazati da može prednjačiti i u vizualnom području, ne samo u jezičnim modelima.
Stoga, GPT slika 1.5 nije ograničena na stvaranje slika od nule: ona postaje temelj Slike ChatGPT-anamjenska kartica unutar aplikacije i web stranice koja djeluje kao pravi „kreativni studio“ integriran u ChatGPTOdatle možete stvarati, uređivati, primjenjivati stilove, eksperimentirati s predloženim uputama, pa čak i otkrivati nove ideje zahvaljujući feedu osmišljenom za inspiraciju.
Pridržavanje stila: tko najbolje poštuje stil koji tražite
Jedan od najotkrivajućih testova za procjenu modela slika je provjera njihove sposobnosti praćenja specifičan fotografski stilJedna od najjasnijih usporedbi između dvaju modela koristila je vrlo detaljan poticaj: krajolik Los Angelesa sa skateboardingom, opisan kao dokumentarna ulična fotografija s kraja 90-ih, na 35-milimetarskom filmu, s Kodak Portra 400 paletaLeica M-tip fotoaparata, prirodno svjetlo, mekan kontrast, prigušene realistične boje, vidljiva zrnatost filma, blaga mekoća na rubovima i, vrlo važno, bez HDR-a ili modernog digitalnog oštrenja.
U tom testu, Samo ChatGPT slike 1.5 Pogodio je ključnu komponentu stila: ugrađeno filmsko zrno i organskiji optički izgled koji bi se očekivao od filmske role Kodak Portra 400. Rezultirajuća slika poštovala je meke rubove, odsutnost digitalne hiperoštrine i taj dokumentarni osjećaj tipičan za kasne 90-e.
Nano Banana Pro je, sa svoje strane, generirao vizualno privlačnu sliku, ali s očito minimalističkijom estetikom. digitalno i oštroFotografija je bila previše čista i oštra, nedostajala joj je analogna zrnatost i pomalo nesavršena tekstura koju je uputa zahtijevala. Drugim riječima, na dubljoj stilskoj razini, Googleov model odstupio je od zacrtanog cilja: bio je to više dobra moderna slika nego vjerna emulacija 35-milimetarskog filma.
Ovakav slučaj sugerira da ChatGPT Images 1.5 ima bolje pridržavanje složenih stilskih uputaTo je posebno relevantno za fotografe, art direktore ili kreatore koji žele ponovno stvoriti određena razdoblja, emulzije ili analogne tijekove rada.
Fotorealizam u mobilnoj fotografiji: test iPhonea
Drugi ključni scenarij je moderni fotorealizam, gdje je sposobnost oba modela da imitiraju stil Fotografija snimljena modernim pametnim telefonomKorišteni uputa bila je: fotorealistična slika mlade žene na mirnoj terasi u Amsterdamu, hladnog ožujskog jutra, s malom dubinom polja i snimljena iPhoneom.
U ovoj usporedbi, rezultat je očito naginjao prema strani Nano Banana ProSlika koju je generirao Googleov model doista je izgledala kao fotografija snimljena mobitelom: oštrina i zamućenje u skladu s kamerom pametnog telefona, uvjerljiva kompozicija i atmosfera koja je dobro prenijela taj hladni, kasnozimski osjećaj tražen u upitu.
Osim toga, Nano Banana je dodao detalj koji, iako nije savršen, dobro govori o njegovoj kontekstualnoj svijesti: ugradio je plakat pravog amsterdamskog kafićaTočna lokacija nije bila točna, ali je prenijela osjećaj boravka u autentičnom lokalnom gradu, pojačavajući realizam scene.
S druge strane, ChatGPT slike 1.5 generirale su sliku s više aspekta "AI"S suptilnim, ali uočljivim nedostacima za iskusno oko: određene pomalo plastične teksture, manje prirodno zamućenje i cjelokupna atmosfera koja se nije baš uklopila s pravom iPhone fotografijom. Jednostavno rečeno: Nano Banana postigao je puno uvjerljiviju estetiku pametnog telefona.
Djelomičan zaključak: ako vam je prioritet generiranje vjerodostojne fotografije mobitelom (za mreže, prototipove kampanja, makete proizvoda u kontekstu itd.), Nano Banana trenutno djeluje kao korak ispred u instant realizmu.
Omjeri stranica: fleksibilnost formata ide u korist Googlea
Osim stila, u profesionalnoj produkciji sljedeće je od velike važnosti: fleksibilnost formataOvdje se Nano Banana Pro može pohvaliti izvornom podrškom za ukupno 8 omjera slike drugačiji:
- 1:1 (kvadrat)
- 3:2 (klasični pejzaž)
- 2:3 (tipična vertikalna)
- 4:3
- 3:4
- 16:9 (standardni panoramski)
- 9:16 (vertikalno za priče i kratke filmove)
- 21:9 (ultra panoramski)
S druge strane, ChatGPT slike 1.5 nude kompatibilnost samo s 3 omjera slikeIako pokriva osnove, zaostaje u usporedbi s Nano Banana varijacijama, posebno ako vam je potreban sadržaj prilagođen više digitalnih platformi sa specifičnim zahtjevima (baneri, video snimci, prikazni oglasi, pozadine itd.).
U svakodnevnoj upotrebi, ovo ograničenje znači da ćete s ChatGPT Images 1.5 morati češće režite i prekomponirajteDok s Nano Bananom možete generirati izravno u željenom konačnom formatu, štedeći vrijeme i izbjegavajući značajne gubitke u kadriranju.
Maksimalna rezolucija: tko ide najdalje u kvaliteti ispisa
U pogledu rezolucija, Nano Banana Pro ponovno preuzima vodstvo u tehničke mogućnostiChatGPT slike 1.5 omogućuju:
- Rezolucija u vezi s 1K za kvadratni format.
- Približna rezolucija 1,5K za pejzažne ili portretne formate.
Nano Banana Pro, sa svoje strane, nosači:
- 1K baza.
- 2K kao najviša standardna radna rezolucija.
- 4K kroz procese integrirano povećanje skale, dizajniran za upotrebu gdje je potrebna veća razlučivost (ispis, veliki zasloni, agresivno obrezivanje itd.).
To znači da, po istoj cijeni u mnogim slučajevima, Nano Banana nudi Više piksela i više prostora za naknadnu obradu.Za radove koji zahtijevaju uvećanja ili ekstremno čišćenje pri zumiranju, razlika između ostajanja na 1K/1,5K ili mogućnosti povećanja na 2K/4K nije trivijalna.
Brzina generacije: OpenAI-jeva teorija u odnosu na sirove brojke
OpenAI tvrdi da je ChatGPT Images 1.5 do četiri puta brže nego njegova prethodna verzija. U praksi, u usporedbi s Nano Bananom, usporedba ovisi o rezoluciji, ali podaci u tablici su jasni.
Za polaske iz 1K:
- ChatGPT slike 1.5između 30 i 45 sekundi po slici.
- Nano Banana Pro: između 10 i 15 sekundi.
Drugim riječima, Nano Banana generira otprilike 1K tri puta brže ChatGPT slike 1.5. Dok GPT traje pola minute ili više, Googleov model daje rezultate za nešto više od 10 sekundi, što je vrlo primjetno kada ponavljate mnogo varijacija.
Ako odemo u veće rezolucije:
- ChatGPT slike 1.5do 1,5 km, s vremenima od 50 do 60 sekundi.
- Nano Banana Pro2K za 30 do 60 sekundi, a 4K za nekoliko minuta skaliranjem.
Ključno je ovdje to Nano banana doseže 2K otprilike u istom vremenu koje je potrebno GPT-u za generiranje slike od 1,5 tisuća slika. Za studije, agencije ili timove za proizvode kojima su potrebne velike količine slika, ta kombinacija Veća rezolucija i manje čekanja To je vrlo jak argument.
Cijene API-ja: tko nudi više za isti novac
Što se tiče cijene po korištenju putem API-ja, priča se ponavlja: Nano Banana nudi veća rezolucija po istoj indikativnoj cijeniPrema dostupnim usporedbama:
- u 1KChatGPT Images 1.5 i Nano Banana Pro rade u sličnom rasponu od oko 0,15-0,17 USD po slici.
- En 2KChatGPT slike 1.5 nemaju opciju, dok Nano Banana održava taj raspon 0,15–0,17 USD.
- u 4K (putem povećanja skale), Nano Banana se nalazi oko 0,26–0,28 USD po slici.
Prevedeno u praktične termine, Nano Banana API vam daje 2K po cijeni koju ChatGPT Images 1.5 nudi za 1KZbog toga je Googleovo rješenje bolja opcija za one koji generiraju mnogo slika ili im je potreban materijal za ispis ili zaslone visoke gustoće.
Mogućnosti uređivanja: preciznost i poštovanje originala
Jedna od velikih revolucija ove nove vizualne generacije od OpenAI-a je Precizno uređivanje određenih elemenataPovijesno gledano, modeli slika imali su ozbiljnih problema s modificiranjem samo dijela scene: tražili biste određenu prilagodbu, a sustav bi na kraju reinterpretirao polovicu slike.
Sa slikama ChatGPT-a 1.5ChatGPT Images obećava upravo suprotno: možete, na primjer, zatražiti "promijeni samo izraz lica" ili "mijenjaj osvjetljenje bez dodirivanja kadra" i model je u mogućnosti kako bi se očuvale značajke i sastav netaknutimaCrte lica, osvjetljenje, tonovi, kadriranje... sve se čuva osim ako u upitu ne naznačite nešto drugačije.
OpenAI naglašava da sustav sada puno bolje razumije i što želite promijeniti i što želite promijeniti. Ne bi se trebalo mijenjatiU praksi, to omogućuje tijekovi rada kao:
- Prilagođavanje izraza lica lika bez redizajniranja.
- Promijenite samo boju odjeće, znakova ili vozila.
- Promijenite cjelokupno osvjetljenje uz zadržavanje kadriranja i kompozicije.
- Pretvaranje svakodnevnih scena u filmski plakati ili ilustracije drugog stila, poštujući glavnu temu.
Sa svoje strane, Nano Banana Pro također podržava Općenito uređivanje i prilično pouzdano reagira na korisnikovu namjeruU testovima gdje je noćna fotografija automobila trebala biti transformirana u dnevnu scenu, oba modela su se dobro pokazala, iako su neki analitičari smatrali Googleov rezultat nešto superiornijim s estetskog gledišta.
U tablici usporedbe razmatraju se i GPT Image 1.5 i Nano Banana. Nude robusno uređivanje i dobro pridržavanje namjereStoga se ovaj odjeljak čini relativno ujednačenim, pri čemu GPT ima prednost u finim kontrolama unutar novog sučelja ChatGPT Images.
Korištenje referentnih slika: vjernost naspram kvantitete
Još jedno ključno područje za profesionalni rad je upravljanje referentne slikeSvaki model nudi različite prednosti.
ChatGPT slike 1.5 omogućuju rad s do pet referentnih slika i, prije svega, nudi eksplicitnu kontrolu nad razinom vjernost s kojima želite da ih model prati. To jest, možete prilagoditi želite li vrlo vjernu reprodukciju reference („visoka vjernost“) ili slobodniju interpretaciju koja uzima u obzir samo opću estetiku.
S druge strane, Nano Banana Pro ističe se svojom glasnoćom: podržava do 14 referentnih slika u jednom zahtjevu. To otvara vrata miješanju stilova, poza, lokacija i elemenata iz više izvora bez potrebe za lančanim povezivanjem toliko iteracija.
Općenito tumačenje ovih razlika je da, u vizualnoj referenci, a ravnoteža snagaGPT se ističe u kontroli vjernosti, dok Nano Banana prednjači u broju istovremenih referenci. Ovisno o tome dajete li prioritet finom podešavanju sličnosti ili kombiniranju mnogih ulaza, jedno ili drugo bi moglo biti prikladnije.
Novo sučelje ChatGPT Images: kreativni studio unutar chata
Osim mogućnosti modela, OpenAI je redefinirao način interakcije sa slikama unutar ChatGPT-a. Sada postoji posebna kartica pod nazivom Slike, dostupno i u web verziji i u mobilnoj aplikaciji, što iskustvo pretvara u nešto bliže kreativnom studiju nego jednostavnom tekstualnom okviru.
S te kartice možete:
- Počnite raditi na temelju osobne slikebilo da se radi o portretu, fotografiji proizvoda ili svakodnevnoj sceni.
- istražiti filteri i unaprijed konfigurirani stilovi da vas inspirira bez pisanja složenih uputa.
- Koristite prijedloge iz upita koje je sustav već dao, a koji djeluju kao kreativni predlošci.
- Stvarajte od nule, uređujte ono što je već generirano ili ponovno zamislite istu bazu podataka u potpuno različitim kontekstima.
Menadžeri proizvoda OpenAI-a opisuju ovaj odjeljak kao „kreativni studio“ implementiran unutar ChatGPT-aDizajniran je tako da ne morate biti dizajner ili savladati napredne naredbe. Radi se o označavanju onoga što želite vidjeti, igranju s brzim varijacijama (iskorištavajući poboljšanje brzine) i istraživanju rezultata gotovo kao da testirate različite setove u fotografiranju.
Kreativne transformacije: od običnih selfija do filmskih scena
Jedno od područja gdje ChatGPT slike s GPT slikom 1.5 žele konkurirati Nano Banani je u kreativne transformacije temeljene na stvarnim fotografijamaOva ideja je već bila jedna od snaga Googleovog modela, koji je omogućavao stvari poput pretvaranja običnih portreta u reklame, filmske scene ili stilizirane ilustracije.
S novim OpenAI modelom, sve što trebate učiniti je prenesite sliku —na primjer, portret cijelog tijela — i popratite ga relativno jednostavnim uputama kako biste postigli duboke, ali koherentne promjene. Neki primjeri iz stvarnog svijeta koji su testirani uključuju:
- Slikajte običnog čovjeka i pitajte ga: „Smjestite radnju na Times Square zimi 2025., s odjećom i okolinom uvjerljivom za to doba godine.“.
- Premjestite ga na Japanski grad u kišnoj noći s cyberpunk estetikoms neonskim svjetlima, odrazima na asfaltu i futurističkom atmosferom.
- pretvoriti ga u a Japanski samuraj s tradicionalnim oklopom i katanama, u realističnom povijesnom kontekstu bez tragova modernih elemenata.
- Generirajte a Reklama u europskom stilu iz 90-ih koristeći njezinu sliku cijelog tijela kao protagonisticu.
U svim tim slučajevima, ChatGPT Images 1.5 pokušava održati vizualni identitet osobe Dok se kontekst, kostimi i narativni ton scene drastično mijenjaju. Nešto slično događa se i s drugim primjerima koje je pokazao OpenAI, gdje se subjekti, psi i okruženja kombiniraju u kinematografskim fotografijama vjernim vrlo detaljnim uputama.
Poboljšanja u točnosti i tekstu unutar slika
Još jedno ključno poboljšanje u novom OpenAI modelu je u točnost uputaMnogi su se ljudi susreli s frustracijom tražeći određene detalje („učini majicu crvenom, kapu žutom, promijeni broj na prometnom znaku na 15…“) i dobivajući rezultate koji su ignorirali dio naredbe ili su je netočno primijenili.
OpenAI tvrdi da su s ChatGPT Images 1.5 ove vrste pogrešaka značajno smanjene. Ako pružite detaljne upute, alat bi trebao biti bolje sposoban... poštovati svaki specifični elementboje odjeće, numeriranje znakova, kombinacija nekoliko subjekata u jednom kadru sa specifičnom atmosferom itd.
Nadalje, performanse su poboljšane u jednom od područja koja su povijesno najproblematičnija za modele slika: generiranje teksta ugrađenog u slikuOvo je ključno za dizajniranje plakata, oglasa, promotivnog materijala ili kompozicija gdje je pisana poruka jednako važna kao i fotografija ili ilustracija.
Postoji i značajna estetska promjena: taj izgled „žućkasto i kremasto“ Znak da su mnoge slike generirane ranijim verzijama ChatGPT-a proizvedene znatno je smanjen. Osim ako izričito ne zatražite tu vrstu toplog tona, novi izlazi obično su neutralniji i raznolikiji, što otežava na prvi pogled prepoznavanje da dolaze iz OpenAI modela.
Dostupnost, privatnost i moderiranje
GPT slika 1.5 se implementira za sve ChatGPT korisnike, uključujući besplatni planI na webu i u mobilnoj aplikaciji. Ako koristite aplikaciju, najvjerojatnije ćete vidjeti upit koji vas poziva da počnete stvarati slike čim je otvorite, zajedno s novim odjeljkom Slike u bočnoj traci.
Ovaj odjeljak ne samo da grupira sve slike koje generirate, već uključuje i stilski prijedlozi i primjeri Za početak bez potrebe za dizajniranjem upita od nule. Možete odabrati vizualni stil koji vam se sviđa, prenijeti sliku ili snimiti selfie i pustiti sustav da obavi ostalo, a sve što vam se ne sviđa prilagodit će kasnije.
Što se tiče obrade podataka, OpenAI navodi da se uređivanje vrši isključivo s slike koje prenesete i tekstovi koje dostaviteNe koristi vanjske izvore bez vašeg dopuštenja za te specifične operacije. Tvrtka održava svoj sigurnosni sloj u funkciji. moderiranje sadržaja i tehnička ograničenjaMeđutim, ne specificira precizno skupove podataka koji se koriste za treniranje vizualnog modela.
Nano banana u Googleovom ekosustavu: integracija i upotreba u stvarnom svijetu
U međuvremenu Nano banana —popularan nadimak za Gemini 2.5 Flash Image — stekao je slavu kao generator i urednik brz i jednostavan za korištenjeGoogle ga postupno integrira u proizvode poput Geminija, Google fotografija, samog pretraživanja i poruka, čineći ga prirodnim dijelom svakodnevnog korisničkog iskustva.
Posljedica je da Nano Banana ne funkcionira samo kao samostalni alat, već i kao međusektorski dio unutar Googleovog ekosustavaRetuširanje mobilnih fotografija, generiranje resursa za Workspace dokumente ili izrada slika za web sadržaj postaje vrlo dostupno milijunima korisnika koji možda nikada neće izravno pristupiti stranici AI "laboratorija".
U javnim mjerilima, kao što su Rangiranje LMArena pretvaranja teksta u slikuNano Banana Pro je kratko bio na vrhu ljestvice sve dok GPT Image 1.5 nije zauzeo prvo mjesto u roku od nekoliko minuta od izlaska. Međutim, u praktičnim primjerima koje su podijelili korisnici i mediji, stvarni rezultati su nijansiraniji: postoje slučajevi gdje Nano Banana i dalje izgleda superiornije, posebno u neposrednom fotorealizmu, i drugi gdje GPT pokazuje veću kontrolu ili stilsko bogatstvo.
S obzirom na ovaj scenarij, nastaje vrlo tijesna konkurencija: GPT Image 1.5 ističe se finom kontrolom, pridržavanjem složenog stila i integriranim kreativnim studijemDok Nano Banana Pro blista brzinom, rezolucijom, raznolikošću formata i realizmom nalik onom na pametnim telefonima.Odabir jednog ili drugog ovisit će o tome cijenite li više tehničku fleksibilnost i integraciju s Googleom ili ChatGPT ekosustav, nove napredne opcije uređivanja i razinu kontrole koju nudi OpenAI-jev prijedlog.
