Švajcarska izmislila novi model za veštačku inteligenciju: besplatan i namenjen celom čovečanstvu

N.J.

Novi model generativne veštačke inteligencije, koji su razvila dva ugledna švajcarska univerziteta, trebalo bi da bude dostupan široj javnosti ovog leta. Za razliku od američkih ili kineskih konkurenata, biće besplatan, nudiće potpunu transparentnost podataka o obuci i obrađivaće 1.500 jezika – piše ženevski dnevnik LE TEMPS
(ilustracija, švajcarski list Temps)

ChatGPT, Meta AI, DeepSeek, Claude, pa čak i Google-ov Gemini uskoro će se suočiti sa novim, po mnogo čemu izuzetnim konkurentom: 100% švajcarskim jezičkim modelom, koji su razvili EPFL (Švajcarski federalni institut za tehnologiju u Lozani) i ETH Zurich (Švajcarski federalni institut za tehnologiju u Cirihu).

U sredu (16. jula), dve institucije su objavile detalje o napretku svog velikog projekta veštačke inteligencije (VI). Za nekoliko nedelja, njihov model će biti lansiran na tržište, nudeći pažnje vrednu alternativu korisnicima interneta, programerima, preduzećima i javnim institucijama. Šta o tome treba da znate, stručno objašnjava Martin Jagi iz EPFL AI centra.

Veštačka inteligencija – opšte dobro

Zašto kreirati jezički model?

Trenutno na tržištu postoje desetine, ako ne i stotine, jezičkih modela, koje su prvenstveno razvili američki ili kineski industrijski giganti. Zašto lansirati novi švajcarski model?

„Velika većina ovih modela je komercijalno orijentisana; često su ih u tajnosti dizajnirali tehnološki giganti. Veoma malo znamo o njima, na primer, podatke na kojima su obučeni“, odgovara Martin Jagi. „Sve ovo stvara rizike za korisnike. Takođe, verujemo da je veoma važno ponuditi potpuno otvoren model, koji će biti otvorenog koda i čije će težine – parametri naučeni tokom obuke – biti javne.“

Neki modeli, poput onih iz Mete, tvrde da su otvorenog koda [kod iza programa je dostupan], ali ne nude transparentnost u pogledu podataka za obuku programa.

Ideja je takođe da se teži određenoj univerzalnosti. Budući model će savladati više od 1.500 jezika, prema najavi iz dva instituta.

„Verovatno nećemo biti tako dobri kao modeli američkih giganata na engleskom jeziku. Ali za veliku većinu jezika, naš model će biti izuzetno konkurentan“, dodaje Jagi. Model je obučen na podacima koji su 60% bili na engleskom i 40% na drugim jezicima. Njegovi podaci za obuku biće poznati.

Dva instituta naglašavaju pojam „opšteg dobra“, sa transparentnim, otvorenim modelom koji svi mogu da koriste. Nijedan američki, kineski, pa čak ni evropski model trenutno ne ispunjava ove kriterijume.

Program razvijen na superkompjuteru Alps

Kako je kreiran? Korišćeno je nekoliko sastojaka. Prvo, stručnost inženjera iz dva instituta. Zatim, tu su podaci: inženjeri su se oslanjali samo na elemente koji nisu zaštićeni autorskim pravima (odstupanje od prakse giganata iz Silicijumske doline, koji se suočavaju sa tužbama zbog kršenja autorskih prava), a da to nije uticalo na kvalitet modela, kažu oni. Obuka je sprovedena na više od 15 triliona takozvanih tokena, jedinica koje predstavljaju reč ili deo reči.

I konačno, tu je računarska snaga. Model je treniran na superkompjuteru Alps u Švajcarskom centru za naučno računarstvo u Luganu, jednoj od najnaprednijih platformi za veštačku inteligenciju na svetu, opremljenoj sa više od 10.000 superčipova Grejs Hoper američkog giganta Nvidije.

„Sigurno je da bez ovog superkompjutera, najmoćnijeg u Evropi do sada, ne bismo bili u mogućnosti da razvijemo takav jezički model“, kaže Martin Jagi. Alps je otvoren u jesen 2024. godine, a njegov razvoj je koštao oko 80 miliona franaka (približno 86 miliona evra).

I to nije sve. Profesor EPFL-a dodaje:

„Verujemo da je naš model u rangu sa komercijalnim modelima dostupnim na tržištu. I već planiramo da ga redovno ažuriramo kako bismo ostali konkurentni“

Dostupno svima, besplatno

Kome će program biti namenjen?

Odgovor je jednostavan: svima i besplatno.

„Svako će moći da ga koristi, čak i oni koji nemaju nikakve veze sa Švajcarskom. Zaista je namenjen svima“, kaže Martin Jagi. Svi su takođe slobodni da ga slobodno modifikuju. Možemo zamisliti da će ga američki, kineski, pa čak i evropski tehnološki giganti pažljivo analizirati.

Biće moguće preuzeti ga da bi se pokrenuo lokalno na računaru, kao što je već slučaj sa relativno lakim modelima. I svaki korisnik interneta moći će da uradi isto.

Međutim, neće postojati interfejs sličan ChatGPT-u da bi se koristio od samog početka. Ali kompanije ili javne vlasti moći će veoma brzo da kreiraju ove interfejse kako bi ga učinile šire dostupnim.

Model će biti objavljen krajem ovog leta - nije dat precizan datum. Biće dostupne dve veličine (8 milijardi i 70 milijardi parametara). Verzija sa 70 milijardi parametara „trebalo bi da bude među najmoćnijim potpuno otvorenim modelima na svetu“.

 


Molimo Vas da pročitate sledeća pravila pre komentarisanja:

Komentari koji sadrže uvrede, omalovažavanje, nepristojan govor, pretnje, rasističke ili šovinističke poruke neće biti objavljeni. Nije dozvoljeno lažno predstavljanje, ostavljanje lažnih podataka u poljima za slanje komentara. Zadržavamo pravo izbora ili skraćivanja komentara koji će biti objavljeni. Web časopis BalkanMagazin ne odgovara za sadržaj objavljenih komentara. Sva mišljenja, sugestije, kritike i drugi stavovi izneseni u komentarima su isključivo lični stavovi autora komentara i ne predstavljaju stavove redakcije Web časopisa BalkanMagazin.

captcha image
Reload Captcha Image...