Il primo stadio vero e proprio della Gpu è costituito dal Giga Thread Engine che si occupa di ricevere le istruzioni e di distribuire il carico di lavoro sui quattro blocchi di calcolo Gpc presenti nel processore grafico GM204. Ogni blocco o cluster Gpc contiene un motore di rasterizzazione dedicato che genera le primitive della scena 3D e ripartisce il carico computazionale sui quattro moduli SMM di propria competenza. Nvidia ha riorganizzato la struttura interna delle unità di calcolo e con la seconda generazione dell’architettura – la prima è quella utilizzata per il GeForce GTX 750 Ti – ha apportato migliorie in termini di prestazioni ed efficienza. In ogni modulo SMM sono presenti un PolyMorph Engine 3.0, un totale di quattro warp schedule, 128 Cuda Core, 32 unità di Load/Store, 32 unità per funzioni speciali, otto unità di texture, una cache per le istruzioni una cache di primo livello (L1) e 96 Kbyte di memoria condivisa.
Il Polymorph Engine 3.0 è un’evoluzione diretta della versione 2.0 presente in Kepler, ma senza sostanziali modifiche a livello logico e funzionale. Alle unità che servono per l’acquisizione delle informazioni relative ai vertici della struttura geometrica da elaborare e quella per le operazioni di tessellation, sono state aggiunte le funzioni che servono a fornire pieno supporto alle librerie DirectX 11.2 e alle prossime DirectX 12 attraverso i moduli Direct3D. Scendendo nella struttura dei moduli SMM troviamo i warp scheduler e i Cuda Core. Questi sono i mattoni fondamentali dell’architettura in quanto le unità di calcolo elementari servono a costruire il complesso motore adatto sia alla grafica, sia alle applicazioni Gpgpu proprio attraverso la tecnologia Cuda. Sebbene il numero dei warp scheduler sia rimasto invariato rispetto ai quattro presenti in Kepler, all’interno di Maxwell ciascuno di questi gestisce in modo indipendente e dedicato un blocco di 32 Cuda Core, 8 unità di Load/Store e 8 unità per funzioni speciali. In Kepler gli scheduler condividevano tra loro tutti e 192 i Cuda Core e le altre risorse. All’interno di un modulo SMM le uniche risorse a essere rimaste condivise sono le unità Cuda Core in doppia precisione (FP64) e le unità di texture. Nel processore GM204 le unità in doppia precisione sono in rapporto 1:32 con quelle a singola precisione, per un totale di 64 Cuda Core di classe FP64.
Le innovazioni introdotte da Nvidia con Maxwell riguardano inoltre il supporto a nuovi algoritmi di calcolo per l’illuminazione e per i filtri di qualità antialiasing. Sul fronte dell’accelerazione video il motore Nvec di nuova generazione offre il supporto alla codifica e decodifica in standard Hecv (High Efficiency Video Codec), noto anche come standard H.265. Questo codec non è ancora diffuso, soprattutto non è supportato dai lettori multimediali di largo consumo, ma rappresenta senza dubbio il futuro per la codifica video di contenuti in alta e altissima definizione.
Se la GeForce GTX 980 è già in partenza un prodotto destinato a chi ricerca il massimo delle prestazioni, la versione Poseidon Platinum è indirizzata agli utenti che non si accontentano della dotazione standard dei prodotti di fascia alta.
All’atto pratico le prestazioni in configurazione standard della Poseidon Platinum non si discostano molto da quelle fatte segnare dalla GeForce GTX 980 in versione di riferimento. Questo modello offre il meglio in overclock, soprattutto se installato su una scheda madre Asus di classe Rog.
Michele Braga
Asus Poseidon Platinum GTX 980
Euro 789 Iva inclusa
+ PRO
Ottime possibilità di overclock
Raffreddamento ibrido aria/liquido
– CONTRO
Prezzo elevato
Produttore: Asus, www.asus.it