Durante i giorni della International Supercomputing Conference, la fiera che si tiene a Francoforte (questo anno dal 19 al 23 giugno) e meglio conosciuta come ISC, Nvidia ha presentato la versione Pci Express dell’acceleratore Tesla P100 dedicato al mondo delle applicazioni HPC (High Performance Computing), alle elaborazioni complesse in ambito industriale, scientifico e alle prossime generazioni di data center.
Dopo l’introduzione del modello su modulo con connettore proprietario, sono ora disponibili anche le versioni dedicate ai sistemi di calcolo con connettori Pci Express. I modelli di questa nuova serie sono due e differiscono per quantità di memoria installata e per potenza di calcolo fornita. Rispetto al modello top di gamma che consuma 300 watt e che abbiamo trattato in questo post, i nuovi modelli Pci Express hanno un consumo massimo di 250 watt per rientrare nelle specifiche degli acceleratori che è possibile installare sul bus Pci Express.
Nella tabella abbiamo riportato le principali caratteristiche tecniche dei modelli Tesla P100 attualmente disponibili e di quelli di generazione precedente.
Come è fatta la Gpu Pascal del Tesla P100
L’acceleratore Tesla P100 è costruito attorno alla Gpu GP100 con architettura Pascal che rimpiazzerà progressivamente quella Maxwell 2 dopo poco più di due anni di onorato servizio.
I numeri della Gpu GP100 sono impressionanti. Il die del processore è realizzato negli stabilimenti TSMC (Taiwan Semiconductor Manufacturing Company) con tecnologia FinFET a 16 nanometri con lo scopo di aumentare la densità di transistor per millimetro quadrato, le prestazioni pure e l’efficienza energetica. Sebbene sia realizzato con un processo produttivo che permette di ridurre le dimensioni, il die della Gpu GP100 misura 610 millimetri quadrati per ospitare l’esorbitante numero di 15,3 miliardi di transistor.
Oltre alle sue dimensioni eccezionali, l’architettura Pascal del Tesla P100 ha introdotto cache più ampie, sistemi di gestione per la priorità di esecuzione a livello delle istruzioni e doppia velocità di elaborazione in modalità FP16 (con istruzioni pacchettizzate).