I moduli Gcn Compute Unit sono organizzati in blocchi logici e funzionali denominati Shader Engine (SE), in modo simile ai blocchi Smx dell’architettura Nvidia; a monte di ciascuno di questi ultimi sono presenti un motore geometrico dedicato e un’unità di rasterizzazione; anche le unità Rop, da una a quattro in base alle differenti versioni dell’architettura, risultano associate ai blocchi Shader Engine. Nel caso del chip Hawaii XT sono presenti 44 moduli Gcn Compute Unit suddivisi a gruppi di 11 all’interno di 4 blocchi SE; nel complesso l’architettura dispone di 2.816 stream processor.
I blocchi SE sono controllati dal Command Processor che gestisce e instrada il carico di lavoro ai motori geometrici. A fianco del Command Processor sono presenti le unità Ace (Asynchronous Compute Engine) che servono a gestire le code di elaborazione per calcoli generici. Nelle Gpu Hawaii XT il numero delle unità è pari a 8 e ciascuna unità è in grado di gestire 8 code simultanee; a titolo di confronto ricordiamo che l’architettura Southern Island impiegata per Tahiti permetteva la gestione di due sole code di elaborazione.
Lo scambio delle informazioni tra i diversi blocchi SE è assicurato dalla memoria di tipo condiviso Global Data Share, alla quale si aggiunge la cache di secondo livello (L2) con capacità complessiva di 1 Mbyte (33% in più rispetto alla precedente generazione).
A fianco del nucleo di calcolo di Hawaii sono presenti il controller di memoria e il blocco relativo alle funzioni multimediali e di gestione delle uscite video. Per garantire un flusso di informazioni sufficiente a non costituire un collo di bottiglia per l’architettura, il controller di memoria ha un’ampiezza di 512 bit – otto canali da 64 bit – che permette di ottenere una banda di trasferimento dati massima teorica pari a 320 Gbyte al secondo da e verso i 4 Gbyte di memoria Gddr5 che operano alla frequenza equivalente di 5 GHz come avviene sui modelli di fascia alta a singola Gpu.
Combinando i dati di targa di due Gpu Hawaii XT si ottiene un’architettura che conta circa 12,4 miliardi di transistor, 5.632 stream processor, 352 unità di texture, 128 unità Rop per una potenza di calcolo complessiva in singola precisione pari a 11.500 GFlops.
Come tutte le schede grafiche che utilizzano chip di classe Hawaii e Bonaire, anche la Radeon R9 295X2 dispone della tecnologia TrueAudio insiste nell’integrazione all’interno del die della Gpu di core Tensilica Xtensa Hifi EP e Xtensa Hifi 2 EP. In particolare il silicio Hawaii integra al suo interno tre Dps Tensilica e questi ultimi, grazie anche all’elevata banda di trasmissione dati tra la memoria locale e la Gpu, sono in grado di eseguire il 100% dell’elaborazione di effetti audio complessi senza richiedere in ogni caso potenza di calcolo Gpu.
Alla tecnologia TrueAudio si affianca quella ormai collaudata delle unità di accelerazione multimediale: il motore Vce (Video Compression Engine), quello Uvd (Unified Video Decoder). Il motore di accelerazione Vce combina i punti i forza dei moduli di calcolo multimediale con funzioni fisse non programmabili con l’elevata potenza di calcolo offerta dall’architettura Graphics Core Next per eseguire i diversi passi necessari alla codifica video. Il motore Uvd (Unified Video Decoder) 3.0 permette di accelerare in hardware la decodifica del formato H.264, ma anche di quelli Avchd, Vc-1, Wmv (profilo D) e Mpeg-2. A questi si aggiunge il supporto ai formati Mvc (Multi View Codec), specifico per i contenuti con più flussi video integrati, Mpeg-4 e Divx. Grazie al supporto per la decodifica del formato H.265/Hvec (High Efficiency Video Coding), sarà possibile disporre dell’accelerazione audio anche durante la visione di contenuti video in formato Ultra Hd.
> Continua a leggere: test Radeon R9 295X2