Softver
Vesti
Phi-3 pokazuje iznenađujuću moć lokalnih jezičkih modela
Mali, a rečit!
Ivan JAKIĆ
24. april 2024.

Kompanija Microsoft je objavila novi, besplatni jezički model pod imenom Phi-3-mini, koji je jednostavniji i jeftiniji za „održavanje” i upotrebu od tradicionalnih velikih jezičkih modela, poput GPT-4 Turbo. Kompaktna veličina je idealna za lokalno pokretanje, što bi moglo da imitira sposobnosti besplatne verzije jezičkog modela kompanije OpenAI ,ChatGPT, ali ne zahtevajući aktivnu internet konekciju.



Glavna „merna jedinica” za veličinu u polju veštačke inteligencije jeste broj parametara. Parametri su numeričke vrednosti u neuronskoj mreži, koje određuju način na koji jezički model obrađuje i generiše tekst. Veliki skupovi podataka se koriste u toku treniranja jezičkih modela, koji se eksponencijalnim enkodiranjem predstavljaju kao znanje. Veći broj parametara omogućava modelu da obradi više kompleksnih slojeva generisanja jezika, ali istovremeno zahteva proporcijalno više računarskih resursa za pokretanje. 



Najveći jezički modeli današnjice, poput PaLM 2 kompanije Alphabet, poseduju na stotine milijardi parametara. Pretpostavlja se da GPT-4 raspolaže sa preko bilion parametara raspoređenih u osam modela sa po 220 milijardi. Oba modela zahtevaju moćne grafičke čipove smeštene u data centre kako bi se pravilno pokretali. 



Kontrastno trendu, Microsoft je odlučio da „cilja” na manje dimenzije sa Phi-3-mini, koji sadrži samo 3.8 milijardi parametara treniranih na 3.3 billiona tokena. Takve karakterisitke ga čine idealnim za pokretanje na komercijalnim grafičkim karticama ili hardveru posvećenom veštačkoj inteligenciji, koji poseduju mobilni uređaji novije generacije. Phi-3 je prirodna evolucija prethodna dva „mala” jezička modela kompanije Microsoft — Phi-2, objavljenog u decembru i Phi-1, objavljenog u junu 2023. godine. Pored standardne Phi-3-mini verzije, predstavljena je i jača, Phi-3-mini-128K, koja shodno nazivu poseduje 128 hiljada tokena, čineći ga trideset i dva puta „elokventnijim” od originala. Kreirane su i verzije sa sedam i četrnaest milijardi parametara, za koje softverski gigant tvrdi da su značajno sposobnije. 



Phi-3 bi trebalo da poseduje ukupne performanse konkurentne modelima Mixtral 8x7B i GPT-3.5, sudeći po dokumentovanoj mašti Microsoft inženjera pod nazivom „Tehnički izveštaji o Phi-3: Visoko sposoban jezički model na vašem telefonu”. Zahtevajući manje od osam gigabajta RAM, Phi-3 može da generiše tokene podnošljivom brzinom i na običnom procesoru. Pošto je pod MIT licencom, moći će da se ugodno pokrene i na uređajima popu Raspberry Pi, dok bi kvalitet rezultata trebalo da parira četiri puta većim modelima. Ukoliko se ovaj mališan pokaže uspešno na testovima, mogao bi da predstavlja vodiča koji će da obesmisli potrebu za velikim modelima iz data centara, barem za svakodnevne zadatke običnih korisnika.



Interakcija sa Phi-3 je dostupna na Azure platformi, kao i putem partnerskih platformi za modele mašinskog učenja, Hugging Face i Ollama — framework koji omogućava lokalno izvršavanje Phi-3 na računarima.  

Microsoft
Phi-3-mini
LLM
AI
PRETHODNI TEKST
SLEDEĆI TEKST
Najčitanije
Igre
Telefoni
Hardver
Softver
Nauka
Aktuelno štampano izdanje
JUL 2024
Elden Ring: Shadow of the Erdtree
Najkvalitetniji element ove ekspanzije je njena vizuelna komponenta...
Qualcomm, ASML, Intel, TSMC, Samsung...
Sa čipovima nema stajanja
Qualcomm je sa Snapdragon X procesorom stvorio talas kojim želi da promeni lice industrije...
Radia Windrunner i vetrenjače
Rekorder i eko-isplativost
Da li je veće uvek bolje? Istorija raznih delatnosti uči nas da se odgovor razlikuje od jednog specifičnog slučaja do drugog, ali ljudima su napro...
LG UltraGear 34GS95QE
Odlično okruženi zabavom
Vrhunska demonstracija toga gde se trenutno nalazi tehnologija kada su u pitanju monitori...
Sony ULT Wear (WH-ULT900N)
Grmljavina u tišini
Nova serija uređaja japanskog proizvođača sadrži modele koji imaju jednu zajedničku osobinu - grmljavinu...
Asus ROG Maximus Z790 Apex Encore
Za ljubitelje ekstremnog
Ploča koj spada među najbolje modele Asusovog asortimana i donosi sve „po poslednjoj modi”...
Autodesk Inventor 2025
Inženjering digitalnog prototipa
Inventor služi za izradu preciznog i detaljnog digitalnog 3D modela bilo kog sklopa ili proizvoda...
TCL 505
Giga povoljni startfon
Izuzetno povoljan i upotrebljiv telefon...
Songs of Conquest
Prelep, pažljivo poliran dragulj igračke scene, omaž vanvremenskim klasicima iz devedesetih godina prošlog veka, ali i dalje ima vlastiti identite...
WARNO
Kulminacija svega što je Eugen systems radio proteklih godina i ujedno njihova najbolja igra...
Hades II
Iako u prvi mah veoma podseća na slavnog prethodnika, Hades II veoma brzo otkriva svoje pravo, novo lice...
© 2024 Svet kompjutera. Sva prava zadrzana.
Novi broj - Arhiva - Forum - O nama