Digitalna Srpska

Štreber uzdrmao temelje Silicijumske doline: Dipsikova revolucija u vještačkoj inteligenciji ili nešto drugo

Najjači pojedinačni udarac u trgovinsko-finansijsko-carinskom boks meču između SAD i Kine za sada nisu zadali ni stanar Bijele kuće u Vašingtonu niti predsjedničke rezidencije Žongnanhaj u Pekingu, već jedan „štreber“ (kako ga opisuju oni koji ga poznaju) iz kineske provincije Gunadung, nekada poznate kao Kanton.

FOTO: SALVATORE DI NOLFI/EPA

Taj udarac, u scenariju dostojnom hladnoratovsko-špijunskih romana Džona Le Karea, napravio je pometnju na američkim berzama, potopio vrijednost dionica moćnih tehnoloških kompanija u SAD za stotine milijardi dolara, i što je još važnije, doveo u pitanje funkcionisanje cjelokupne američke tehnološke industrije u oblasti vještačke inteligencije.

Taj štreber je Liang Venfeng, čovjek koji stoji iza aplikacije i startap kompanije Dipsik. Krajem januara, bum koji je izazvala njegova aplikacija doveo je do toga da samo oni najbogatiji vlasnici kompanija iz tehnološkog sektora, koji se nalaze na listama milijardera, u jednom danu izgube više od 80 milijardi dolara vrijednosti svoje imovine!

Koliki je udarac zadao Dipsik govori i to što je vrijednost akcija američkog proizvođača čipova, kompanije Envidija, pala za 17 odsto, što je oko 600 milijardi dolara, odnosno najveći dnevni pad vrijednosti jedne kompanije u istoriji!

Kineska kompanija je izazvala zemljotres tako što je objavila naučni rad u kom objašnjava da je njihov model vještačke inteligencije treniran uz troškove od samo šest miliona dolara i na starijoj verziji čipova kompanije Envidija, budući da je Vašington zabranio izvoz novijih verzija čipova te američke kompanije u Kinu. Sa druge strane, američke tehnološke kompanije potrošile su ogroman novac na to, na stotine miliona dolara. Tako je Sem Altman, izvršni direktor kompanije OpenAI, koja je razvila popularni ČetGPT, rekao da je su troškovi obuke tog modela veći od sto miliona dolara. Ti troškovi progresivno su rasli, pa su oni bili daleko niži za ranije verzije tog modela i bili su uporedivi sa onim koje su sada Kinezi objavili.

kompanija Nvidia — FOTO: JOHN G. MABANGLO/EPA

Otvoreni model Dipsika R1 izazvao je veliku zabrinutost među investitorima, jer je Dipsik u nekim parametrima ocijenjen boljim nego ČetGPT, za njegov razvoj su korišćeni manje napredni čipovi, a cijena je bila neuporedivo manja. Zbog toga je došlo do masovne prodaje akcija američkih tehnoloških kompanija i pada njihove vrijednosti.

Iako je američki predsjednik Donald Tramp rekao da „tehnologija Dipsika treba da posluži kao podsticaj za američke kompanije“ i da je „dobro što su kineske firme razvile jeftiniju i bržu metodu za vještačku inteligenciju“ kao signal da američke kompanije „moraju da budu fokusirane na konkurenciju i pobjedu“, udarac na američke kompanije je ogroman.

– Uvijek imamo ideje. Uvijek smo prvi. Smatram da je to pozitivno. Tako umjesto što trošite milijarde i milijarde, trošićete manje i dobićete, nadamo se, isti rezultat – rekao je Tramp.

Upravo te potrošene milijarde i jesu problem, a pojava kineske alternative modelima vještačke inteligencije američkih tehnoloških giganata uzdrmala je temelje Silicijumske doline. I to tako što su dovele u pitanje na šta je potrošen toliki novac, koliko zaista vrijede američke AI kompanije i da li su SAD zaista lider u segmentu vještačke inteligencije ako jedna kineska startap kompanija može da im uputi takav izazov i to za „tričavih“ 5,6 miliona dolara.

Međutim, stručnjaci dovode u pitanje Dipsikove tvrdnje, smatrajući da su troškovi razvoja njihovog modela zapravo viši nego što kompanija navodi i da ne pokrivaju ni troškove utrošene energije.

Open AI je reagovao tvrdnjom da je kineski startap prekršio njihova pravila upotrebe i da je zloupotrijebio tzv. tehniku destilacije, u kojoj jedan AI model postavlja veliki broj pitanja drugom modelu kako bi naučio njegove obrasce i „iscijedio“ njegovo znanje.

aplikacija chatgpt — FOTO: FILIP SINGER/EPA

Kada su u pitanju optužbe Open AI da je Dipsik prekršio njihove uslove korišćenja primjenom „destilovanja“ i da se time ruše prava na intelektualnu svojinu, Zoran Ševarac, profesor na Katedri za softversko inženjerstvo beogradskog Fakulteta organizacionih nauka i konsultant za vještačku inteligenciju, kaže za NIN da se to može smatrati ironičnim, budući da je sam Open AI iskoristio nedefinisani prostor i materijale, kakvi su na primjer oni iz velikih medija, za obučavanje svojih modela bez naknade, zbog čega ih je, na primjer, tužio Njujork tajms.

Pročitajte još

Ševarac dodaje da u vezi sa Dipsikom ima puno spekulacija, pa se o njemu može govoriti sa rezervom, samo na osnovu onoga što je dostupno u javnosti.

– Tehnologija je u suštini ista, to su veliki jezički modeli, takozvani generativni AI, transformers modeli i oni su koristili „open sors“ javno dostupne modele – kaže Ševarac.

On objašnjava da noviji Dži-Pi-Ti modeli nisu javno dostupni.

– Ima nekih informacija o njima, ali nisu javno dostupni. Sa druge strane, modeli koje razvija Meta ili ono što radi profesor Jan Lekun, to su javno dostupni „open sors“ modeli. I tu onda nije bitka između Čet Dži-Pi-Ti-ja i Dipsika, nego „open sors“ modela protiv zatvorenih modela – objašnjava Ševarac.

Zoran Ševarac — FOTO: K1 TELEVIZIJA/YOUTUBE/SCREENSHOT

On navodi da kompanija Open AI daje neke modele kao „open sors“, ali ono što je najnaprednije prodaje kao svoje projekte.

– Ono što je Dipsik uradio jeste da su uzeli tehnologiju „open sors“ modela i koristili nešto što se zove „tehnika destilovanja znanja“. Uzima se istrenirani model i onda se pravi manji model koristeći znanje tog istreniranog modela. Što se tiče same tehnologije, to je sve poznato, ali oni su uspjeli da primjene to i da naprave jedan značajni korak, gdje mnogo manji model radi isto kao i mnogo veći. Sam metod nije nepoznat, ali oni su primjenili taj metod i napravili dosta dobar rezultat – precizira Ševarac.

Mark Finlajson, profesor Florida međunarodnog univerziteta i programski direktor Knight Fundation škole za programiranje i informatičke nauke tog univerziteta, nedavni dobitnik predsjedničke nagrade SAD za perspektivne naučnike (PECASE), kaže za NIN da ga je malo zbunio toliki odjek Dipsika.

– Njihov model je u suštini isti kao i ostali dostupni modeli. Neznatno je bolji u određenim stvarima. Glavne razlike koje mogu da uočim su u tome što je veoma jeftin, u odnosu na Open AI, i pokazuje svoje korake rasuđivanja, što Open AI ne čini. Dipsik tvrdi da su koristili starije čipove za obuku, ali to tek treba da bude potvrđeno. U svakom slučaju, i dalje se radi o Envidija čipovima. Vjerovatno su njihovi troškovi subvencionisani, kao u mnogim startap modelima, kao način da se osvoji tržišni udio – objašnjava Finlajson.

On smatra da je vrijednost dionica kompanija vještačke inteligencije u SAD bila malo „naduvana“ zbog hajpa, odnosno pompe koja vlada o njoj u javnosti, zbog mogućnosti koje vještačka inteligencija donosi.

– Dipsik je podsjetio ljude da i drugi mogu da inoviraju, što je možda malo smanjilo taj balon – kaže Finlajson.

Ševarac dodaje da sa rezervom treba uzeti i informacije kako je Dipsik koristio stare verzije čipova, jer se govori i o tome kako su imali nekih 50.000 najnovijih kartica koje su kupili na crnom tržištu.

I on i Finlajson se slažu da u odnosu sa kineskim startapom koji ih je uzdrmao, američke kompanije pate od problema „prvih pokretača“.

– Kada je Open AI izašao sa ČetGPT, znali smo samo kako da te modele obučimo na relativno neefikasan način. U proteklih nekoliko godina opisano je mnogo tehnika za efikasniju obuku, koje je Dipsik integrisao (djelimično iz nužde, jer im je bio uskraćen pristup najnaprednijim čipovima). Dakle, zabrana kupovine čipova ih je primorala da iskoriste sve dostupne optimizacije i vjerovatno naprave neke od svojih inovacija. Takođe su primjenjivali mnogo više podržanog učenja iz ljudskih povratnih informacija (RLHF, vrsta mašinskog učenja kod vještačke inteligencije), što im omogućava da koriste manje treninga. Još jedna stvar koju treba primjetiti je da oni vjerovatno navode samo cijenu električne energije za obuku posljednje verzije modela, a ne cijenu hardvera, cijenu obuke preliminarnih verzija, cijenu obuke ranijih modela na kojima se zasniva novi model, cijenu podataka, cijenu rada itd. Takođe, Open AI je imao malo monopolsku poziciju i nije bio pod pritiskom da radi stvari efikasnije – objašnjava Finlajson.

Ševarac dodaje da je Open AI puno tragao i eksperimentisao, pokušavao i tražio, piše NIN.

– Kad neko to prvi uradi, onda je drugom mnogo lakše da to replicira. Drugi moment je taj što cijela tehnika zahtijeva obučavanje ljudi. Open AI je za svoje modele koristio „Reinforcement learning with human feedback“. To znači da su gledali kakav fidbek dobijaju, lajkove i odgovore, pitajući se kako može da se poboljša. Dipsik nije morao da plaća te ljude, nego su već koristili istrenirani model. Umjesto da plaćaju par hiljada ljudi da koriste model, oni su uzeli gotov model – kaže on.

Finlajson se, međutim, unekoliko slaže s američkim predsjednikom Donaldom Trampom i vjeruje da će Dipsik na kraju podstaći Open AI da bude otvoreniji i da agresivnije integriše efikasne metode obuke vještačke inteligencije.

DipSik vještačka inteligencija

Najnovije vijesti Srpskainfo i na Viberu