Dopo mesi di indiscrezioni, speculazioni e ipotesi, NVIDIA ha finalmente svelato i dettagli della sua architettura di GPU di nuova generazione. Come previsto, Ampere sarà impiegata prima di tutto nel calcolo professionale, nei server e nel settore HPC (High-Performance Computing), e introdurrà tutta una serie di tecnologie pensate per ottimizzare e velocizzare in maniera significativa i carichi di lavoro per la ricerca scientifica e non.
A dare il là alla presentazione ufficiale di Ampere è stato il CEO di NVIDIA Jensen Huang nel suo keynote introduttivo del GTC Digital 2020, mentre sul blog aziendale è già disponibile un approfondimento dedicato alla nuova architettura e alla GPU A100 che per prima implementerà la tecnologia.
Ampere A100 è il più grande “balzo generazionale” mai sperimentato dalle GPU NVIDIA, ha spiegato Huang, un’unità acceleratrice realizzata su un nodo produttivo a 7nm e contenente la bellezza di 54 miliardi di transistor. Tale massiccia circuiteria integrata è organizzata in 6.912 CUDA Core, 432 Tensor Core di nuova generazione, 108 Streaming Multiprocessor. La VRAM (HMB2e) è pari a 40GB con una banda totale di 1,6TB/sec., mentre la potenza computazionale nei calcoli in virgola mobile a precisione singola a 32-bit (FP32) arriva a 19,5 teraFLOPS contro i 16,4 teraFLOPS delle GPU Tesla V100.
NVIDIA A100 è una GPU in grado di garantire un’accelerazione di 20x nei calcoli a base di intelligenza artificiale, sostiene il CEO di NVIDIA, e include una soluzione (Multi-instance GPU) in grado di suddividere la potenza di calcolo della GPU in sette diverse istanze indipendenti. Ampere sarà anche alla base del supercomputer per la IA di NVIDIA noto come DGX, un “mostro” in grado di ospitare 8 diverse GPU A100 per una potenza di 5 petaFLOPS. La “più grande GPU del mondo” estratta da Huang dal suo forno di casa era appunto una nuova unità DGX a base di GPU A100.
Ampere include tutte le caratteristiche necessarie a velocizzare i calcoli HPC e gli algoritmi di intelligenza artificiale, la ricerca scientifica e ogni sorta di applicazione professionale nei server, i data center e i supercomputer del prossimo futuro. Per conoscere i primi dettagli sulle GPU consumer della linea GeForce, invece, occorrerà attendere i prossimi mesi ma una cosa appare già certa: l’incredibile potenza dell’Unreal Engine 5 avrà bisogno di qualcosa di più di una “banale” console dedicata per esprimersi al meglio. Qualcosa come una GPU Ampere, appunto.