![]() | ![]() |
![]() |
| ![]() |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||
Mikroprocesorska arhitektura ARM (2): Cortex-A
Način na koji ARM označava svoje proizvode je doveo do toga da se kod prosečnog korisnika javlja zbrka po pitanju prepoznavanja pojedinih modela
Pregled „klasične ARM ere” u prošlom broju završili smo sa predstavnicima generacije ARM11, odnosno uređajima koji su građeni na osnovu arhitekture ARMv6. Počevši od arhitekture ARMv7 (videćemo posle i to da je ARMv6 i dalje živ), završava se označavanje generacija mikroprocesora uvećavanjem broja za jedan i uvodi se sasvim novi sistem koji podrazumeva podelu na tri takozvana profila: A – Application R – Real-time M – Microcontrollers
Mikroprocesori profila „R” nisu naročito poznati široj javnosti, ali to ne znači da su slabo zastupljeni. Reč je o uređajima koji poseduju određena poboljšanja važna za rad na zadacima gde je važna pouzdanost u eksploataciji. Primeri takvih okruženja su zahtevni tehnološki procesi, medicinska aparatura, robotika, avio i automobilska industrija, ali se sreću i kao važni delovi SSD uređaja, komunikacione opreme ili 5G modema u okviru mobilnih telefona. Po brzinama rada se nalaze negde između uređaja sa jezgrima Cortex-M i Cortex-A, ali imajuju neke karakteristike u kojima nadmašuju svoje rođake, kao što je, recimo, brza obrada hardverskih prekida ili zaštita od grešaka tokom rada. Treća kategorija, profil „M”, odnosi se na mikrokontrolere. Oni predstavljaju kvantitativno najrasprostranjenije oblike mikroprocesorske tehnike, sa godišnjim obimima proizvodnje koji se broje u desetinama milijardi. Upravo je ARM arhitektura, zbog skromnih zahteva prema potrošnji električne energije, širokoj lepezi ponude, savremenim dizajnom, dobrim radnim performansama, niskoj ceni i povoljnim uslovima licenciranja – postala najraširenija 32-bitna arhitektura u ovom segmentu tržišta. Preko dve stotine kompanija je otkupilo licencu za proizvodnju ARM mikrokontrolera, dok je broj modela davno premašio cifru od tri hiljade. Iako dele mnoštvo karakteristika svoje snažnije braće, ARM mikrokontroleri, zbog potrebe za minijaturizacijom i smanjenjem potrošnje energije, rade na manjim brzinama, ali su i dalje po tom pitanju ispred konkurencije. Oznaka ARMv7-M označava sedmu generaciju ARM arhitekture namenjene mikrokontrolerima. Cortex-A8
Glavni „krivac” za povećanje performansi je bio novi dualni 13-stepeni skalarni dizajn instrukcijskog cevovoda (pipeline), koji je omogućavao izvršavanje dva DMIPS (Dhrystone MIPS) po megahercu (DMIPS/MHz). Keš prvog nivoa je podeljen na blok za podatke i instrukcije veličine po 32 kilobajta, dok se kapacitet keša drugog nivoa kreće u opsegu 64-512 kilobajta. Ne postoji podrška za out-of-order izvršavanje instrukcija. Brzine radnog takta se kreću od 300 megaherca do 1,3 gigaherca, uz potrošnju energije do 300 milivata. Ova generacija ne predviđa mogućnost rada sa više procesorskih jezgara. Na kristalu se našlo mesta za mnoštvo ekstenzija sa prethodnih generacija, kao što su Thumb-2 set instrukcija, Jazelle ili sistem povišene bezbednosti ThrustZone, ali i novi SIMD (Single Instruction Multiple Data) set instrukcija za paralelnu obradu podataka, sposoban da tokom izvođenja jedne mašinske naredbe obradi više linija sa podacima. U konkretnom slučaju, reč je o protočnom cevovodu širine deset linija, a programerima su na raspolaganje stavljena 32 64-bitna registra, koji se po potrebi mogu transformisati u 16 128-bitnih ekvivalenata. Ova tehnologija se kod ARM Cortex procesora naziva NEON i posebno je korisna pri obradi multimedijalnih sadržaja. Cortex-A9
Matematički koprocesor VFPv3 i SIMD set instrukcija se nude kao opcija. Sve nabrojeno je imalo za posledicu da Cortex-A9 postiže 50 odsto bolje rezultate od svog prethodnika, u radu na istom taktu i sa jednim jezgrom. Imajući u vidu brzinu od 2,5 DMIPS/MHz i radne frekvencije od 800 megaherca do dva gigaherca, reč je o generaciji koja i dan danas „nije za bacanje”. Dvojezgarni Appleov čip A5, zasnovan na Cortex-A8, ugrađivao se u iPhone 4S, iPad 2 i iPad Mini, a ova jezgra su korišćena i za izgradnju SoC Nvidia Tegra druge i treće generacije, kao i za Samsung Exynos 4, koji je ugrađivan u Galaxy S3 i (prvi) Galaxy Note. Cortex-A5
Procesori ove generacije nasleđuju mogućnosti od svog prethodnika, ali uz brojne kompromise. Širina istovremenog dekodiranja je smanjena sa dve na jednu instrukciju, dok je broj protočnih linija instrukcijskog cevovoda ostao isti (osam), ali bez podrške za out-of-order izvršavanje mašinskih naredbi. Opciono je na raspolaganju novi, malo poboljšani VFPv4-D16 matematički koprocesor, koji ima šesnaest 64-bitnih FPU registara (umesto prethodnih 32). Sve to je dovelo do smanjenja brzine na 1,57 DMIPS/MHz, ali uz potrošnju manju za 50 odsto u odnosu na Cortex-A9. Veličina keša za instrukcije i podatke se kreće od četiri do 64 kilobajta (za svaki), dok je opciono moguće dodati unificirani keš drugog nivoa. Postoje varijante sa jednim jezgrom (UP), kao i one sa više njih (MP), maksimalno četiri. Cortex-A15 Naredne godine (2010.) predstavljena je generacija A15, ali su se prvi predstavnici na tržištu pojavili sa više od dve godine zakašnjenja. Reč je o evoluciji Cortex-A9 jezgara koja sada poseduju 15 linija superskalarnog cevovoda za cele brojeve i 17-25 linija za brojeve sa pokretnim zarezom. Sve to ide uz širinu dekodiranja od tri instrukcije i podršku za spekulativno i out-of-order izvršavanje kôda. Uvedena je opcija klasterizacije, pa je moguće podići broj mikroprocesorskih jezgara do osam, i to tako da budu podeljena na dva bloka od po četiri jezgra. Dizajn podrazumeva po 32 kilobajta keša prvog nivoa za podatke i instrukcije, što se odnosi na svako pojedinačno jezgro. Brzi kontroler keša drugog nivoa obezbeđuje priključivanje do četiri megabajta ove memorije. SIMD instrukcije poznatije pod nayivom NEON dobijaju standardnu mogućnost rada sa podacima dužine 128 bita, dok koprocesor VFPv4 ima 32 registra veličine 64 bita. Adresni prostor se povećava na 40 bita, tako da je sada moguće adresirati do jednog terabajta memorije. Uvodi se i hardverska virtualizacija. Po rečima proizvođača, ova generacija u istim okolnostima postiže 40 odsto bolje rezultate od Cortex-A9. U zavisnosti od implementacije, A15 razvija brzinu od 3,5 do 4,1 DMIPS/MHz, što uz višeprocesorski dizajn i radne taktove do 2,5 gigaherca donosi lepe zalihe procesorske snage. Najpoznatiji predstavnici su Nvidia Tegra 4 i Samsung Exynos 5, koji je korišćen u većem broju njihovih telefona iz klase Galaxy S i Note, kao i za Chromebook računare. Cortex-A7 Slično kao kod generacije Cortex-A5, razvojni tim kompanije ARM rešava da tržištu ponudi mikroprocesore kojima osnovni cilj neće biti podizanje brzinske lestvice, već smanjenje potrošnje energije, veličine i cene proizvodnje. Tako je Cortex-A7 dobio ulogu zamenika generacije Cortex-A8 sa dodatnom funkcijom da posluži kao „LITTLE” deo „big.LITTLE” arhitekture, u kombinaciji sa bržim Cortex-A15 jezgrima. Ukratko, „big.LITTLE” predstavlja dizajn u kome se istovremeno koriste snažnija jezgra sa većom potrošnjom i sporija jezgra sa manjom potrošnjom. Poslove uglavnom obavlja „LITTLE” deo, dok se u slučaju potrebe za procesorskom snagom uključuju „big” komponente. Dizajn karakteriše osmostepeni delimično superskalarni protočni cevovod sa širinom dekodiranja od dve in-order instrukcije i sa dinamičkom predikcijom grananja. Za razliku od A8, koristi koprocesor VFPv4, ali ima i dvostruko manji broj FPU registara (16). Veličina keša prvog nivoa je od osam pa do 64 kilobajta, odvojeno za podatke i instrukcije, dok se keš drugog nivoa kreće u opsegu 0-1024 kilobajta. Moguće je koristiti do osam jezgara na jednom čipu, podržana je hardverska virtualizacija. Ova generacija razvija brzinu od 1,9 DMIPS/MHz, što je mala degradacija u odnosu na A8, ali imajući u vidu da veličina kristala ovog procesora iznosi pola kvadratnog milimetra, oni se mogu posmatrati i kao brzinski unapređena varijanta generacije A5. Cortex-A53 i Cortex-A57
Superskalarni cevovod ima osam nivoa sa širinom dekodiranja od dve in-order instrukcije, uz podršku uslovnoj i indirektnoj predikciji grananja. Ovo je slično modelu A7, pa je za napredak u performansama postignut sa novim dual-issue dizajnom (istovremena obrada dve instrukcije) i kvalitetnijim sistemom predviđanja grananja. Keš prvog nivoa se kreće u granicama od osam do 64 kilobajta, odvojeno za podatke i instrukcije, dok keš drugog nivoa ima ECC podršku i kreće se u opsegu od 128 kilobajta do dva megabajta. Cortex-A53 jezgra je moguće koristiti kako u „big” ulozi, tako i kao „LITTLE” pomoćnika. Moguće je povezivanje više istorodnih klastera, pa tako imamo SoC modele sa osam, 16 i 24 A53 jezgra. Procesori ovog tipa ostvaruju brzinu od oko 2,3 DMIPS/MHz.
Cortex-A12 i Cortex-A17 Ove dve generacije predstavljamo zajedno iz prostog razloga što je i sam ARM naknadno odlučio da ukine generaciju A12 i označava je kao A17. Glavni cilj je bio da se obezbedi naslednik serije A9, što je ovaj model i postigao uz dobitak u brzini od 40 odsto. Iako je ARM sa prethodne dve serije uveo 64-bitnu arhitekturu, nije se odustalo ni od razvoja modela sa ARMv7-A arhitekturom. Ovo jezgro nudi vanredno spekulativno superskalarno izvršenje instrukcija, uz jedanaest protočnih linija. Poseduje 32-64 kilobajta koherentnog keša prvog nivoa za instrukcije i 32 kilobajta za podatke. Keš drugog nivoa se kreće od 256 kilobajta pa do celih osam megabajta. Godinu kasnije na tržištu se pojavljuje Cortex-A17 koji predstavlja nadogradnju serije A12. Tačnije, druga revizija arhitekture A12 je preimenovana u A17. Sve rečeno za A12 važi i ovde (kao što važe i standardna svojstva prethodnih modela koja ne pominjemo), samo je povećana dubina instrukcijskog cevovoda. Po rečima proizvođača, ova generacija je za 60 odsto brža od Cortex-A9, troši 20 odsto manje energije i zauzima manje prostora. Cortex-A17 jezgra imaju ulogu „big” dela u „big.LITTLE” konfiguracijama sa parnjakom Cortex-A7. Najčešće se koristi u uređajima srednje klase, a najpoznatiji SoC-ovi bazirani na ovoj platformi su Mediatek MT6595 i Rockchip RK3288. Cortex-A35
Može se koristiti kao „LITTLE” deo u kombinaciji sa jezgrima A73, ali i sa A53 koji i sami imaju „LITTLE” ulogu u kombinaciji sa jačim modelima. Postoje i varijante SoC koje kombinuju sve tri pomenute arhitekture, pa tako MediaTek Helio X30 dolazi u konfiguraciji 2 × A73, 4 × A53 i 4 × A35. Slično prethodnicima kao što su A7 i A53, A35 koristi redni instrukcijski cevovod sa osam nivoa sa širinom od dve instrukcije. Keš prvog nivoa se kreće između osam i 64 kilobajta, dok su te vrednosti za L2 između 128 kilobajta i jednog megabajta. Iako dosta sporiji od A53, smanjena potrošnja, veće radne frekvencije i poboljšan blok za obradu NEON instrukcija bi ga trebalo učiniti dovoljno konkurentnim na polju najjeftinijih uređaja. Cortex-A72 Ova varijanta arhitekture je planirana kao naslednica generacije A57, za koju smo već rekli da je imala problema sa potrošnjom energije i grejanjem. Iako se očekivalo da će nositi oznaku Cortex-A59, serija je iz marketinških razloga preimenovana u A72, da bi se naglasilo ozbiljno poboljšanje performansi. Kao i kod prethodnika, imamo posla sa dubokim vanrednim superskalarnim jezgrom širine tri instrukcije. Pri tome je protočna linija skraćena sa 19 na 16 nivoa. Napredak je većinom postignut upotrebom novih algoritama za predviđanje grananja i spekulativnog izvršavanja instrukcija. Brzini su doprinela i unapređenja u dizajnu bloka za obradu SIMD instrukcija i brojeva u formatu pokretnog zareza, kao i u razmeni podataka između L1 i L2 keša. Veličina keša za instrukcije iznosi 48 kilobajta, dok je veličina keša za podatke 32 kilobajta. Keš drugog nivoa može imati veličinu od 512 kilobajta pa do četiri megabajta. Procesor, po tvrdnjama proizvođača, ima 20 odsto manju potrošnju od A57 i 90 odsto bolje performanse, dok je površina kristala smanjena za deset odsto. U poređenju sa A15, troši 75 odsto manje energije za izvršenje istog posla, odnosno ima 3,5 puta bolje performanse. Upotreba 16-nanometarskog FinFET tehnološkog procesa omogućava brzine do 2,5 gigaherca za upotrebu u mobilnim uređajima, i još više od toga kada se radi o desktop konfiguracijama. Cortex-A73 Iz naziva se može naslutiti da je u pitanju evolutivni naslednik generacije Cortex-A72. Po rečima proizvođača, dizajn u odnosu na prethodnika nudi povećanje performansi za 30 odsto i istu toliku energetsku efikasnost. Ono što smo mogli da pronađemo po pitanju podataka na temu performansi govori da se one kreću u opsegu od 4,8 do 6,35 DMIPS/MHz. Druga vrednost je u skladu sa pomenutih 30 odsto, ali je pitanje na koji način se došlo do pomenute brojke. Instrukcijski keš prvog nivoa je četverosmernog tipa i ima veličinu od 64 kilobajta po jezgru, dok keš za podatke varira od 32 do 64 kilobajta. Keš drugog nivoa (sa opcionim ECC) se kreće od 256 kilobajta od osam megabajta i deli se među svim jezgrima. Superskalarni dizajn omogućava vanredno izvršenje instrukcija i za tu namenu procesor ima četiri bloka (dvostruko više u odnosu na A72) load/store jedinica, uz optimizovani rad sa memorijom. Tu je i novi blok za predikciju grananja sa velikim kešom adresa grananja (BTAC). Zanimljiva dizajnerska karakteristika ove serije odnosi se na smanjenje širine obrade instrukcija sa tri na dve. To i ostala inženjerska rešenja su doveli do smanjenja dimenzija, pa tako kristal A73 ima površinu od samo 0,65 kvadratnih milimetara, što je neobična pojava u premijum klasi ARM mikroprocesora. Glavni dobitak ove generacije se odnosi na njenu energetsku efikasnost uz zadržavanje performansi, što uz male dimenzije omogućava upotrebu većeg broja jezgara i kreiranje SoC sa dobrim performansama. Cortex-A55 i Cortex-A75
Trenutna perjanica ARM ponude su mikroprocesori sa jezgrom Cortex-A75. Oni dele mnoštvo karakteristika koje smo pomenuli za seriju A55. Osnovna razlika je, naravno, u dizajnu bloka za obradu naredbi, pa ovde imamo primenjene napredne tehnike superskalarnog vanrednog dizajna praćene sa naprednim sistemima za predviđanje grananja i upotrebom keš memorije. Zanimljivo je da marketing kompanije ARM prvi put ističe veliko poboljšanje performansi na planu veštačke inteligencije i mašinskog učenja. Međutim, veštačka inteligencija i neuronske mreže se sada upotrebljavaju i u samom jezgru procesora za bolje predviđanje grananja. Jedna od važnih arhitekturnih karakteristika klase A75 jeste mogućnost kreiranja različitih termalnih profila koji po potrebi favorizuju performanse ili uštedu energije, pa je moguće ubrzanje na račun veće disipacije toplote koja može ići do dva vata. Proizvođač tvrdi da su jezgra ove generacije za 22 odsto brža od prethodnika, dok je propusna moć memorije povećana za 16 odsto. Dobre performanse su imale i svoju cenu, pa su jezgra A75 za 2,5 puta većeg obima od onih kod A55. Cortex-A76
Prvi put se u okviru standardnog ARM dizajna koristi dekodiranje širine od četiri instrukcije, uz dubinu cevovoda od 11 do 13 etapa. Keš prvog nivoa će imati 64 kilobajta četvorosmernog keša za instrukcije i isto toliko za podatke. Keš drugog nivoa će biti petosmernog separatnog tipa sa 1280 ulaza i veličine 256 do 512 kilobajta, dok ćemo na trećem nivou imati do četiri megabajta brze memorije zajedničke za sva jezgra. Ovo je generacija čipova za koju se govori da spada u „laptop klasu”, što se jasno nadovezuje na pojavu „pravog” Windowsa za ARM platformu, sa emulacijom izvršenja x86 instrukcija i predstavlja pokušaj da se prodre na tržišta gde suvereno vlada Intelova arhitektura. Glavni adut A76 je mala potrošnja energije, dok su performanse i dalje na strani Intela. • • •
Nadamo se da smo ovim tekstom bar malo pomogli u demistifikaciji procesora sa ARM jezgrima. U sledećem nastavku obrađujemo ništa manje zanimljive generacije koji pripadaju profilima „M” i „R”. Igor S. RUŽIĆ |
![]()
![]()
![]()
![]()
![]()
![]()
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() | |
![]() | ![]() |
Home / Novi broj | Arhiva • Opšte teme | Internet | Test drive | Test run | PD kutak | CeDeteka | WWW vodič • Svet igara Svet kompjutera Copyright © 1984-2018. Politika a.d. • Redakcija | Kontakt | Saradnja | Oglasi | Pretplata • Help • English | |
SKWeb 3.22 |