AMD Fusion e APU A-Series
Il concetto di AMD Fusion dovrebbe essere ormai chiaro. Lo scopo di AMD è di “fondere” CPU, GPU e Northbridge in un unico chip al fine di ridurre i consumi energetici e i costi di produzione cercando allo stesso tempo di massimizzarne le prestazioni per un target piuttosto ampio di utenza.
Questo target è incentrato sulla visualizzazione delle informazioni in forma grafica, che rappresentano il futuro del mondo IT. AMD si impegna quindi a fornire prestazioni senza paragoni in questo settore, consentendo agli utenti di beneficiare di una piattaforma versatile e in grado di soddisfare una vasta gamma di utilizzi.
La slide che ci illustra il processo di “fusione” ci lascia senza dubbio sbalorditi. AMD ha integrato un chip di 66 mm2 (il northbridge), uno di 200 mm2 (la CPU quad core) e uno di 108 mm2 (una GPU DX11 con 400 stream processor) in un'area di silicio di soli 228 mm2. L'alchimia AMD continua in termini di bilancio energetico e di TDP, dove le APU Llano conservano il TDP delle CPU quad core di precedente generazione, nonostante l'integrazione delle unità grafiche di elaborazione.
Dal momento che la matematica non è un'opinione proviamo a spiegare il “miracolo” AMD Fusion. Innanzitutto il principale fattore che ha permesso di ridurre l'area di silicio occupata, nonché i consumi, è l'introduzione del processo produttivo a 32nm SOI. E' un'importante passo per AMD che finalmente riesce a colmare questo gap tecnologico nei confronti di Intel.
I benefici del passaggio al nuovo processo produttivo sono evidenti. Finora le CPU desktop e mobile AMD utilizzavano il processo a 45nm, mentre le GPU utilizzano un processo a 40nm. Integrare il tutto su un chip a 32nm ci aiuta a capire la veridicità della somma presente nella slide AMD. I miglioramenti di efficienza sono consistenti anche in rapporto alle precedenti APU Zacate ed Ontario serie E, le quali adottano un processo produttivo a 40nm, derivato direttamente dalle GPU. Inoltre i core sono stati completamente ridisegnati in ottica di risparmio energetico, spegnendo le parti non utilizzate in ogni istante, ottimizzando la disposizione dei circuiti di clock e implementando degli stati di spegnimento profondo dei vari core. Tutto ciò esteso anche ad altre parti del chip, come la GPU, il northbridge e l’unità UVD.
Ovviamente c'è dell'altro. Comparando una APU Llano ad una CPU Intel Sandy Bridge Quad core non possiamo fare a meno di notare l'assenza di Cache L3, cuore portante dell'architettura Sandy Bridge. AMD ha scelto di aumentare la Cache L2 fino a 1MB contro i soli 256KB di Intel. Per contro non c'è una Cache condivisa tra i core e l'IGP. L'eliminazione della Cache L3 porta ad un notevole risparmio di area e la possibilità di implementare stati di risparmio energetico avanzato, che con l’architettura esclusiva delle cache di AMD sarebbe stato oneroso e inefficiente implementare, a beneficio delle unità grafiche di elaborazione.
Analizzando la percentuale in cui sono suddivise le due CPU (APU e SB) salta subito all'occhio quanto silicio è stato destinato alla unità grafica nell'APU di AMD. Quasi il doppio di utilizzato da Intel, arrivando ad occupare quasi un terzo dell'intero die. Nell'immagine notiamo distintamente 5 SIMD Engine nella parte alta del die, mentre in basso sono presenti i 4 core x86 con relativa Cache L2.
I 5 SIMD Engine sono dotati di 80 stream processor ognuno, per un totale di 400 stream processor. E' un numero davvero elevato, superiore anche alla GPU Caicos che equipaggia la HD 6450, entry level nel mercato desktop. E' infatti molto vicino al numero di stream processor presente in una HD 6570 o in una HD 6670 che integrano 6 SIMD Engine invece dei 5 presenti nelle APU Llano.
Ovviamente l'IGP presenta almeno uno svantaggio rispetto a una scheda video discreta: la mancanza di memoria dedicata. I core grafici delle APU Llano devono infatti accedere alla memoria RAM di sistema, la stessa a cui deve accedere la CPU. Questo comporta dei rallentamenti di accesso rispetto ad una memoria onboard, soprattutto per la mancanza di una cache L3 che possa fungere da buffer comune. AMD ha cercato di bilanciare questo svantaggio cercando di supportare memorie a frequenze maggiori rispetto ad esempio alle APU Zacate, innalzando il clock supportato fino a DDR3-1866.
Ma una caratteristica interessante dell’APU Llano è il Dual Graphics, miglioramento della tecnologia CrossFire, che tiene conto anche della potenza relativa delle GPU. Inoltre i driver sono ottimizzati anche per l’OpenCL, usando la GPU integrata per calcoli meno gravosi, qualora quella discreta stia elaborando carichi 3D pesanti. In alternativa al DualGraphics, i link PCI Express possono essere configurati come uscite video supplementari, per implementare la tecnologia EyeFinity in modo più avanzato.