Celula (procesor)

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Cell este un tip de procesor dezvoltat de Sony în cooperare cu IBM și Toshiba .

Familia de procesoare Cell este dezvoltată pentru a permite o utilizare aproape universală, de fapt aceste procesoare au fost concepute pentru a putea acoperi piețe, de la aplicații dedicate ( încorporate ) până la piața mainframe . Acestea sunt procesoare concepute pentru a utiliza calculul paralel, iar Sony le-a folosit și pentru consola sa PlayStation 3 .

Caracteristici tehnice

Arhitectura procesorului
Diagrama unității EIP

Deși celula poate avea multe configurații, versiunea de bază include o unitate numită Element de procesare a energiei ( PPE ) și 8 unități „Element de procesare sinergică” („SPE”). Unitatea PPE nu este procesorul principal, de fapt sarcina sa este de a controla și sincroniza unitățile SPE care vor trebui să efectueze majoritatea calculelor.

PPE este un set de cipuri care include un PXU care este o unitate logică de procesare pentru puncte fixe și flotante și în plus registrele SIMD (în total are 32 de registre la 128 biți), 2 cache L1 ambele de 32Kb, dar unul pentru date iar cealaltă pentru cod și, de asemenea, un cache unificat de 512 KB pentru date și cod L2. Poate accesa direct memoria principală prin apel DMA . Această unitate poate procesa, de asemenea, 2 fire simultan (setul dintre memoria cache PXU și L1 este PPU). SPE este un set de cipuri care include o SXU care este o unitate logică formată din două conducte simultane , una pentru preîncărcarea datelor și cealaltă pentru procesarea în punct fix și flotant, totuși au doar registre SIMD unificate (128 128 biți). De asemenea, are o memorie locală de mare viteză LS sau 256Kb și este singura memorie pe care SXU o poate accesa, de fapt, dacă are nevoie de informații din memoria principală, intervine un alt cip conținut în SPE care se numește MCF (Memory Flow Controller) și care are sarcina de a transporta informațiile către LS-ul său din memoria principală (prin apeluri DMA) sau eventual și din celelalte LS-uri. (Setul dintre SXU și LS este SPU), de asemenea, SPE procesează un singur fir, dar mult mai rapid decât PPE normal.

Procesoarele comunică între ele prin intermediul EIB (Element Interconnect Bus), care funcționează la jumătate din frecvența procesorului și comunică cu exteriorul cu magistrala FlexIO la 6,4 GHz (dar frecvența este variabilă, de exemplu, cea a celula integrată în Playstation 3 funcționează la 5 GHz) și cu memoria printr-o magistrală XDR ( Extreme Data Rate ) la 3,2 GHz: Atât FlexIO, cât și XDR se bazează pe tehnologiile Rambus și sunt gestionate de controlere integrate în cip. Datorită unui acord semnat cu Rambus în 2003 , amintirile XDR DRAM care echipează dispozitivele bazate pe celule sunt produse direct de Sony și Toshiba.

În arhitecturile produse până acum, SPE-urile sunt optimizate pentru calculul cu o singură precizie; fiecare SPE este echipat cu 4 ALU - uri în 2 trepte pentru date de o singură precizie și, prin urmare, poate efectua până la 8 operații simultan. SPE acceptă, de asemenea, calcularea datelor cu precizie dublă, dar nu au unități specializate, astfel de calcule sunt efectuate de cei pentru o precizie simplă, cu performanțe de aproximativ 1/8 din cele cu precizie simplă. Cu toate acestea, sunt avute în vedere implementări ulterioare ale arhitecturii care să susțină dubla precizie pentru hardware, neplătind astfel aceste penalități.

Toshiba a dezvoltat un coprocesor cu 4 SPE, dar fără PPE, numit SpursEngine și conceput pentru a accelera efectele 3D și speciale ale filmelor din produsele electronice de masă (de exemplu, PlayStation 3 ).

Considerații arhitecturale

În multe privințe, Cell seamănă cu arhitectura dezvoltată de Seymour Cray , când era încă designer la CDC , dar în sens invers. În timp ce în CDC 6600 exista o unitate de calcul foarte rapidă și un grup de unități mai lente dedicate gestionării și stocării datelor, în arhitectura Cell abordarea este opusă. În celulă există o unitate de management și un grup de unități de mare viteză dedicate procesării datelor. Această arhitectură consideră că procesarea datelor este problematică și nu recuperarea lor din memoria principală.

Privind arhitectura dintr-un alt punct de vedere, Cell seamănă cu un computer desktop modern cu un singur procesor. Plăcile grafice moderne sunt echipate cu o unitate de procesare și multe unități dedicate gestionării graficelor poligonale. Aceste unități au acces foarte rapid la memorie și sunt deseori capabile să partajeze zone de memorie. Cell extinde această arhitectură, unitățile SPE sunt de fapt mai flexibile decât unitățile dedicate pentru plăci grafice.

Arhitectura celulei prevede încorporarea mai multor elemente de bază (1 PPE plus 8 SPE) într-un singur cip. IBM a depus un brevet pentru o unitate formată din patru unități de bază capabile să dezvolte teoretic 1 teraFLOPS .

Performanţă

Având în principal sarcina de a gestiona celelalte unități, EIP își mărește performanța și exploatarea resurselor cu multithreading , granulația calculului nu este, prin urmare, deosebit de mare, dar o bună gestionare a firelor și proceselor devine importantă.

În ceea ce privește SPE-urile, este adevărat opusul, sunt specializate în calcul, au un spațiu de memorie (relativ) mare pe cip și lucrează doar la asta; munca optimă a acestor unități este deci calculul pe vectori de date din aceleași operații.

Atât PPE cât și SPE acceptă calculul vectorial , instrucțiuni despre o serie de date structurate într-o matrice unidimensională. Aceste elemente pot fi întregi sau virgule mobile. În acest fel, fiecare SPE este capabil să efectueze simultan aceeași operație pe 8 valori diferite (lucrând într-o singură precizie). Datorită acestui mecanism, performanța sa atinge aproximativ 32 gigaFLOPS , astfel încât, teoretic, lucrând la o singură precizie, fiecare nucleu are potențial de aproximativ 8 ori mai mare decât cel al unui Pentium 4 cu același ceas, cu o precizie dublă, performanța devine echivalentă. Teoretic, celula poate atinge, prin urmare, până la 250 gigaFLOPS funcționând cu precizie simplă și 30 GigaFLOPS cu precizie dublă, respectiv de 64 și de 8 ori mai mari decât cele ale unui Pentium IV cu același ceas.

Acest lucru face celula foarte interesantă pentru calculul în domeniul științific; deși arhitectura sa nu este optimizată pentru calcul cu precizie dublă, performanțele sunt încă remarcabile, iar faptul că acest procesor este conceput pentru o consolă afectează costurile procesorului în sine, care fiind produs pe scară largă este considerabil mai ieftin decât un procesor „nișă” special concepută pentru calcul științific. Cu toate acestea, Cell, în ciuda faptului că este un procesor excelent în domeniul științific, este mai complex de exploatat în domeniul jocurilor video, dar rămâne la fel de puternic și excelent pentru decodarea și transcodarea fluxurilor audio / video, grafica 3D (vârf, pixeli , texturi ), simulare avansată a fizicii în timp real și a trasării razelor .

Cu Yellow Dog Linux 6.1, Fedora 9 sau 10 și RHEL 5.2 sau o versiune ulterioară, puteți scrie aplicații pentru celulă prin intermediul kitului de dezvoltare IBM (versiunea actuală este 3.0).

Celulă și pentru servere

Primele versiuni de Cell pentru serverele blade au fost distribuite la începutul anului 2006, cu un ceas de 2,4 GHz, deși inițial IBM a emis ipoteza unei vânzări inițiale de versiuni cu un ceas mult mai mare, pe 4 sau 5 GHz, asta pentru că în laboratoare cercetătorii au reușit să împingă această arhitectură până la 5,2 GHz, deși se pare că randamentele de producție ale acestui cip nu permit comercializarea la aceste frecvențe din cauza disipării ineficiente a căldurii cipului însuși la aceste frecvențe.

De-a lungul anilor, Sony a rafinat procesul de producție al Cell. La debutul său în 2006, în prima versiune a PlayStation 3, Cell a fost produsă la 90nm, ulterior redusă la 65nm și cu debutul Playstation 3 Slim a fost redus la 45nm . Cea mai recentă versiune implementată în Playstation 3 Super Slim are 32nm. Aceeași procedură s-a întâmplat și pentru componenta GPU a consolei și acest lucru a permis reducerea consumului de la vârful de 200 de wați al primei versiuni a Playstation 3 la 70 de wați ai Playstation 3 Super Slim.

Multe variante ale celulei vor fi disponibile, care vor avea un număr diferit de unități interne pentru a satisface diferitele nevoi ale pieței. Companiile au dezvoltat Cell, astfel încât mai multe unități să poată fi integrate într-un singur cip în mod rentabil și, dacă este necesar, Cell poate fi extins în continuare folosind rețele rapide care conectează mai multe cipuri pentru a crește puterea de calcul disponibilă.

Proiecte similare bazate pe mai multe nuclee sunt dezvoltate de multe companii, cum ar fi Sun Microsystems, care, împreună cu proiectul MAJC (pronunțat „magie”) dezvoltă o alternativă la Cell. Primul cip MAJC a fost conceput inițial pentru procesarea multimedia, dar mai târziu Sun a decis să utilizeze MAJC ca bază pentru plăcile sale grafice de înaltă performanță pentru stațiile sale de lucru . Acțiunile Imagine Stream Processor de la Universitatea Stanford sunt, de asemenea, similare din punct de vedere conceptual cu Cell și MAJC.

Celulă din supercomputere

Pictogramă lupă mgx2.svg Același subiect în detaliu: IBM Roadrunner .

IBM, în septembrie 2006, a anunțat construirea unui nou supercomputer, destinat Laboratorului Național Los Alamos din New Mexico , pentru Departamentul de Energie al SUA.

Roadrunner (acesta este numele său), a intrat în funcțiune în 2008 și a devenit imediat cel mai rapid calculator realizat vreodată, depășit în 2009 de Cray Jaguar . De îndată ce a intrat în funcțiune, Roadrunner a fost de 4 ori mai puternic decât liderul de atunci în clasament, și anume sistemul BlueGene / L , depășind pentru prima dată pragul istoric al unui PetaFLOPS și atingând 1,6 PetaFLOPS: 1 600 miliarde (1,6 x 10 15 ) de operații pe secundă [1] .

În realitate, acest sistem nu a fost creat folosind doar procesorul Cell; nodurile de calcul sunt de fapt compuse din procesoare AMD Opteron , care sunt flancate de procesoarele Cell, utilizate pentru a accelera calculele în virgulă mobilă. În general, există un raport 1: 1 (relativ la nodurile de calcul) între numărul de nuclee Opteron și numărul de nuclee de celule. În special, IBM a ales să utilizeze procesorul PowerXCell 8i, deoarece a furnizat instrucțiuni SIMD care vă permit să executați patru operații în virgulă mobilă pe ciclu de ceas . De asemenea, este capabil să efectueze calcule cu virgulă mobilă de precizie dublă de cinci ori mai rapid decât generația anterioară de procesoare Cell / BE.

În total, Roadrunner include 12960 procesoare de celule.

Notă

Alte proiecte

linkuri externe

Informatică Portal IT : accesați intrările Wikipedia care se ocupă cu IT