NVIDIA étoffe son offre de GPU pour serveurs avec l’A2 Tensor Core, présentée par l’entreprise comme une solution d’entrée de gamme polyvalente. Elle embarque un GPU Ampere GA107 gravé en 8 nm ; possède 1280 cœurs CUDA et 40 cœurs Tensor ; 16 Go de GDDR6 sur un bus de 128 bits, pour une bande passante mémoire de 200 Go/s. Cet A2 Tensor Core utilise une interface PCIe Gen4 x8 et a un TDP configurable entre 40 W et 60 W.
Voici comment NVIDIA présente ce GPU A2 Tensor Core : « Le GPU d’entrée de gamme NVIDIA A2 Tensor Core facilite la mise en œuvre des workflows d’inférence grâce à une conception compacte à hautes performances et à faible consommation pour les applications d’IA à l’Edge. Le GPU A2, qui se distingue par une configuration PCIe Gen4 compacte et une enveloppe thermique (TDP) configurable de 40 à 60 Watts, permet d’accélérer les workflows d’inférence de manière versatile sur n’importe quel serveur pour un déploiement à l’échelle. »
Le tableau ci-dessous, élaboré par NVIDIA, rassemble les spécifications techniques et les performances. Un autre tableau, proposé par VideoCardz, compare ce GPU A2 Tensor Core aux autres références pour centres de données de NVIDIA ; il se positionne effectivement tout en queue d’un peloton dominé par l’A100.
Peak FP32
4,5 TF
TF32 Tensor Core
9 TF | 18 TF¹
BFLOAT16 Tensor Core
18 TF | 36 TF¹
Peak FP16 Tensor Core
18 TF | 36 TF¹
Peak INT8 Tensor Core
36 TOPS | 72 TOPS¹
Peak INT4 Tensor Core
72 TOPS | 144 TOPS¹
RT Cores
10
Media engines
1 video encoder / 2 video decoders (includes AV1 decode)
Mémoire GPU
16 Go GDDR6
Bande passante mémoire
200 Go/s
Interface
PCIe Gen4 x8
Facteur de forme
1-slot, low-profile PCIe
Max thermal design power (TDP)
40–60W (configurable)
Virtual GPU (vGPU) software support²
NVIDIA Virtual PC (vPC), NVIDIA Virtual Applications (vApps), NVIDIA RTX Virtual Workstation (vWS), NVIDIA AI Enterprise, NVIDIA Virtual Compute Server (vCS)