DeepSeek V4 mijenja utrku umjetne inteligencije otvorenim kodom i padom cijena

  • DeepSeek V4 dolazi u otvorenom formatu s Pro i Flash varijantama i kontekstnim prozorom do milijun tokena.
  • Model se može pohvaliti mogućnostima rasuđivanja i agentima na razini velikih zatvorenih sustava, ali s vrlo niskim računalnim troškovima.
  • Savez s Huaweijem i optimizacija za Ascend 950PR čipove imaju za cilj smanjiti ovisnost o NVIDIA-i i zapadnim dobavljačima.
  • Za Europu i Španjolsku to otvara jeftinije i lokalno primjenjive opcije, iako postoje sumnje u španjolsku podršku i zrelost ekosustava.

DeepSeek V4

Nova generacija jezičnih modela tvrtke DeepSeek, kineskog startupa sa sjedištem u Hangzhouu, postala je jedan od najkomentiranijih dostignuća u području umjetne inteligencije. Njihova serija DeepSeek V4 provaljuje U vrijeme zasićenja ponudama i obećanjima, ali s vrlo jasnom porukom: ponuditi vrhunske mogućnosti u zaključivanju i agentima, s gigantskim kontekstnim prozorom i, prije svega, s puno nižim troškovima korištenja od američkih konkurenata.

Ovo lansiranje nije izolirani događaj. Dolazi samo nekoliko dana nakon nove verzije ChatGPT i drugi zatvoreni modeliI usred kineskih kontinuiranih napora da smanji svoju tehnološku ovisnost o Zapadu, DeepSeek V4 kombinira... strategija otvorenog kodaAgresivno određivanje cijena i bliski savez s Huaweijem u području hardvera mogli bi promijeniti ravnotežu snaga za europske tvrtke koje traže jeftinije i kontroliranije alternative.

Što je DeepSeek V4 i kako je izgrađen?

Obitelj DeepSeek V4 sastoji se od Jezični modeli mješavine stručnjaka (MoE) dizajniran da bude visoko učinkovit u dugoročnim kontekstima. Tvrtka govori o glavnom modelu s oko 1 bilijun ukupnih parametaragdje se u svakom tokenu aktivira samo dio, i još ambicioznija verzija, V4-Pro, koja doseže 1,6 bilijuna parametara, s otprilike 49.000 milijardi imovine po upitu.

Ključ DeepSeekovog MoE pristupa je da, iako je ukupan broj parametara ogroman, u svakom koraku zaključivanja aktiviraju se samo deseci milijardi. To omogućuje drastično smanjiti troškove računanja i memorije u usporedbi s gustim modelima slične veličine. Neki tehnički materijali spominju otprilike 37.000 milijardi aktivnih parametara po tokenu U jednoj od varijanti, ovo se uklapa u ideju ekstremne učinkovitosti bez žrtvovanja performansi.

Dvije varijante: V4-Pro i V4-Flash za različite potrebe

DeepSeek je svoju ponudu podijelio u dva glavna modela: V4-Pro i V4-FlashV4-Pro je vodeći model, s prethodno spomenutih 1,6 bilijuna parametara i fokusom na duboko razmišljanje, globalno znanje i agentske sposobnostiposebno u programiranju i složenim analitičkim zadacima.

Sa svoje strane, V4-Flash je predstavljen kao lagana i brza verzijaIma približno 284.000 milijarde ukupnih parametara i oko 13.000 milijardi aktivnih, a također održava kontekstualni prozor do milijun tokenaDizajniran je za masovna implementacije, gdje su cijena po tokenu, latencija i skalabilnost važniji od istiskivanja svake desetine iz benchmarkova.

Ova dualnost Pro/Flash ima više od komercijalna strategija koja nadilazi jednostavnu tehničku diferencijacijuV4-Pro je namijenjen velikim korporacijama, laboratorijima i slučajevima upotrebe gdje su potrebne najviše moguće performanse; s druge strane, V4-Flash ima za cilj biti "radni konj" za mala i srednja poduzeća, startupove i usluge velikog obujma kojima je potrebna kompetentna i jeftina umjetna inteligencija.

Kontekst milijun tokena: što se mijenja u stvarnoj upotrebi

Jedna od najupečatljivijih značajki DeepSeek V4 je njegova ultra dugi kontekstni prozor do milijun tokenaTo je znatno više od 128 000 tokena tipičnih za mnoge trenutne poslovne modele. U praksi, to znači da se može raditi s stotine tisuća riječi u jednom upitu: cjeloviti tehnički priručnici, veliki repozitoriji koda, pravni ili povijesni zapisi korisničke službe bez potrebe za njihovom fragmentacijom.

Osim slike, ovaj široki kontekst može smanjiti troškove i pogreške nastale dijeljenjem dokumenataPotrebno je manje API poziva, manji je rizik od gubitka informacija između skeniranja, a dizajn proizvoda koji se oslanjaju na velike količine teksta uvelike je pojednostavljen. DeepSeek predstavlja model ne toliko kao jednostavnog chatbota, već kao asistent na projektu ili agent sposoban za planiranje i redoslijed zadataka na velikim skupovima podataka.

U Europi i Španjolskoj, ova vrsta konteksta posebno je zanimljiva za sektore kao što su pravni, financijski, konzultantski, javno-upravni ili zdravstvenigdje je uobičajeno rukovati vrlo opsežnom dokumentacijom. Izazov će biti provjeriti održava li model taj kapacitet s razumne latencije i zaista konkurentna cijena po milijun tokena u produkcijskim okruženjima.

Sposobnosti rasuđivanja i agenti: oklada za natjecanje sa zatvorenim sustavima

DeepSeek tvrdi da V4-Pro Nadmašuje većinu trenutnih modela s otvorenim krovom. U testovima globalnog znanja i zaključivanja, samo neznatno zaostaje za nekim od najboljih modela zatvorenog koda, poput najnovijih iteracija Geminija. U naprednom zaključivanju, tvrtka tvrdi da je u rangu s premium rješenjima OpenAI-a i Anthropica.

U polju agenti i povezani zadaciDeepSeek V4 je dizajniran da funkcionira kao više od pukog generatora teksta. Tvrtka već interno koristi V4-Pro za računalno potpomognuto programiranje, automatizacija tijeka rada i složena analiza, s idejom da model može planirati, izvršavati i provjeravati podzadatke na relativno autonoman način.

Za španjolske tvrtke koje rade s automatizacijom procesa, razvojem softvera ili pozadinski ured s puno podatakaKombinacija snažnog obrazloženja, dugog konteksta i niskih troškova može biti privlačna. Međutim, stvarna razina zrelosti agenata V4 i njihovih robusnost na španjolskom To su još uvijek aspekti koje treba procijeniti u neovisnim testovima.

Otvoreni kod nasuprot zatvorenim modelima: utjecaj na Europu

Serija V4 predstavljena je kao otvoreni model s ranim pristupomDeepSeek je objavio V4-Pro i V4-Flash na platformama poput Hugging Face u načinu pregleda, omogućujući testiranje i u vlastitom chatu i putem API-ja. Neke varijante spominju MIT-tip licence što bi otvorilo vrata lokalnim preuzimanjima i implementacijama bez uobičajenih ograničenja mnogih poslovnih modela.

Ovaj pristup izravno se suočava sa strategijom zatvoreni modeli Silicijske dolineA s obzirom na tekuće rasprave o tome kako zatvoriti otvoreni kod, gdje je pristup često vezan uz API ugovore, specifične pružatelje usluga u oblaku i više cijene, ako DeepSeek V4 potvrdi da se jaz u performansama između otvorenog i zatvorenog koda smanjio gotovo na nulu, mnoge europske tvrtke mogle bi preispitati svoje oslanjanje na američke dobavljače.

U regulatornom kontekstu EU, obilježenom Zakon o umjetnoj inteligenciji i strogi zahtjevi u vezi s suverenitetom podatakaPosjedovanje moćnih modela koji mogu raditi lokalno ili u europskim oblacima bez gubitka kontrole nad informacijama postaje ključni faktor. Međutim, kineski otvoreni kod također postavlja politička pitanja i pitanja povjerenja koja će vlade i velike korporacije morati pažljivo razmotriti.

Savez s Huaweijem i alternativni hardver za NVIDIA-u

Jedan od najosjetljivijih elemenata DeepSeek V4 je promjena u hardverskoj baziNakon kontroverzi oko korištenja NVIDIA H800 GPU-a, pa čak i optužbi o korištenju zabranjenih Blackwell čipova, tvrtka je ojačala veze s Huaweijem kako bi smanjila svoju izloženost američkim sankcijama.

Ubrzo nakon najave V4, Huawei je službeno objavio da će pružiti svoje Ascend čipovi i supernode sustavi za izvršavanje DeepSeekovih zadataka zaključivanja. Među njima se ističu akceleratori. Atlas 350 s Ascend 950PR procesorimakoji su posebno optimizirani za ovu vrstu MoE modela i već se prodaju kao lokalna alternativa infrastrukturi temeljenoj na NVIDIA-i.

Tehnička dokumentacija V4 spominje razvoj kerneli prilagođeni i za Huaweijev hardver i za NVIDIA GPU-eOva dvostruka kompatibilnost omogućila bi tvrtki da preživi potencijalne zapadne blokade, a istovremeno iskoristi snagu kineskog ekosustava čipova. Za Europu, ovaj potez otvara vrata snažnoj ponudi umjetne inteligencije koja nije u potpunosti vezana za sjevernoamerički lanac opskrbe, iako će se korištenje hardvera iz Kine također ispitati iz perspektive... kibersigurnost i strateška ovisnost.

Strategija određivanja cijena: udar na troškove po milijunu tokena

DeepSeek se dugo pozicionirao kao opcija "jeftinog razmišljanja"To je već učinila sa svojim R1 modelom, a sada pojačava tu predanost s V4. Prema procjenama same tvrtke i pružatelja API-ja koji već testiraju model, trošak zaključivanja mogao bi biti oko 0,30 dolara po milijunu tokena, znatno ispod onoga što naplaćuju mnoge premium zapadne usluge.

Nadalje, DeepSeek tvrdi da, za Flash varijantu, Održat će slične stope kao i model V2. Pokrenut 2024. godine, čak je nagovijestio da bi cijene mogle još više pasti u drugoj polovici 2026....kako se Huaweijevi superčvorovi Ascend 950PR raspoređuju u velikim razmjerima. Ova objava imala je neposredne učinke na Kinesko tržište dionica potiče lokalne tvrtke za poluvodiče.

U praksi, za španjolsku tvrtku koja obrađuje duge pravne dokumente, financijske povijesti ili velike količine interakcija s klijentima, ova cjenovna struktura omogućuje joj poslovanje s puno veće marže onima dobivenim skupljim API-jima. Međutim, ostaje za vidjeti hoće li se te stope zadržati nakon što V4 izađe iz načina pregleda i hoće li neke od ušteda biti nadoknađene veća složenost implementacije u usporedbi sa zrelijim uslugama.

Dostupnost, status razvoja i pristup iz Europe

DeepSeek V4 je, prema riječima same tvrtke, u način rada "pregled" ili rani pristupVarijanta V4-Pro i njezina lakša verzija već se mogu testirati putem službenog DeepSeek chata i putem API-ja, dok neki pružatelji usluga trećih strana, poput platforme trećih strana koje nude testne čvorovePočeli su davati ograničen pristup programerima.

Plan puta tvrtke je pretrpio određene promjene kašnjenja u usporedbi s prvobitno procurilim datumimašto je ukazivalo na potpuna izdanja tijekom prve polovice 2026. Unatoč tome, u praksi već postoje V4 modeli objavljeni u javnim repozitorijima, spremni za testiranje i primjenu u laboratorijskim okruženjima.

Za europske i španjolske organizacije pristup je trenutno usmjeren na Javni API-ji, preuzimanja iz repozitorija otvorenog koda i testiranje na međunarodnim oblacimaImplementacija na internoj infrastrukturi ovisit će o mogućnosti posjedovanja kompatibilnih grafičkih procesora ili, ako je potrebno, odobrenog kineskog hardvera, što može biti u sukobu s internim sigurnosnim zahtjevima i zahtjevima za usklađenost s propisima.

Implikacije za startupove i tvrtke u Španjolskoj i Europi

Za poduzetničku strukturu Španjolske i drugih zemalja EU, DeepSeek V4 predstavlja moguća demokratizacija pristupa modelima "poduzeća" u mjeriluS puno nižim troškovima po milijun tokena i mogućnošću lokalnog izvršenja, projekti koji su prije trebali znatne runde financiranja za pokrivanje troškova API-ja i GPU-a sada mogu razmotriti prototipove visoke razine s ograničenijim resursima.

U sektorima kao što su fintech, pravna tehnologija, digitalno zdravlje ili analiza podatakaSposobnost obrade ogromnih konteksta i održavanja podataka unutar infrastrukture kojom upravlja sama tvrtka može napraviti veliku razliku kada je u pitanju ispunjavanje Europski propisi o zaštiti podatakaMeđutim, prevlast engleskog i kineskog jezika u službenoj dokumentaciji, kao i prioritet koji se daje tim jezicima u obuci, sugerira da je Španjolski jezik zahtijeva dodatno usavršavanje postići istinski konkurentne rezultate.

Drugo pitanje je zrelost ekosustava alata oko DeepSeek V4. Za razliku od modela poput Llama ili GPT, koji imaju okviri otvorenog kodaVerzija 4 započinje s manje gotove podrške. Tvrtke s malim tehničkim timovima morat će procijeniti mogu li se nositi s tom krivuljom integracije ili radije čekaju da se okruženje bolje uspostavi.

Geopolitička i regulatorna dimenzija: umjetna inteligencija kao novo polje trenja

Pojava V4 događa se u kontekstu u kojem Umjetna inteligencija je vektor ekonomske i strateške moći.Otvoreni i konkurentni kineski model vrši pritisak na zapadni narativ o tehnološkom vodstvu i dodaje napetost raspravi o tehnološke ovisnosti i globalni standardi.

Dok Kina odgovara na izazov s ponuda industrijskih kapaciteta, vlasnički čipovi i brzo raspoređivanjeEuropa teži jačanju regulatorne komponente i zahtjeva za transparentnošću, sigurnošću i etikom. Mogućnost da otvoreni modeli kineskog podrijetla postanu globalni kriteriji mogla bi potaknuti europske vlade da podići regulatorne zaštitne zidoveNa primjer, u javnoj nabavi ili kritičnim sektorima.

To bi moglo dovesti do Tržište umjetne inteligencije fragmentirano po blokovimaU tom kontekstu, španjolske i europske tvrtke moraju birati između američkih modela koji su uvelike ograničeni vlastitim pravilima korištenja, europskih rješenja koja su još u razvoju i snažnih kineskih prijedloga sa složenom geopolitičkom komponentom. DeepSeek V4, sa svojom kombinacijom otvorenog koda, niske cijene i Huaweijeve podrške, nalazi se u samom središtu ove rasprave.

Sveukupno, DeepSeek V4 se oblikuje kao jedan od najozbiljnijih kandidata za... uvođenje modela visokorazinskih jezika u područje otvorenog koda i agresivnog određivanja cijenaNjegov ogroman kontekstni prozor, savez s alternativnim hardverom za NVIDIA-u i fokus na agente i logičko zaključivanje čine ga opcijom za pažljivo praćenje iz Španjolske i ostatka Europe; stvarni utjecaj ovisit će o tome kako će se pokazati u produkciji, stvarnoj podršci na španjolskom jeziku i u kojoj mjeri su tvrtke spremne uključiti ključni dio svoje AI infrastrukture iz kineskog tehnološkog ekosustava.

Grok 2.5 otvorenog koda
Povezani članak:
xAI objavljuje Grok 2.5 kao otvoreni kod: licenca, detalji i zahtjevi