Qu'est-ce que Nvidia Ampère?

En matière de GPU, Nvidia est un expert de premier plan. Étant dans l'entreprise depuis 1993, Nvidia a produit une large gamme de GPU professionnels et grand public de haute qualité. Les architectures estimées de leurs processeurs sont à l'origine du succès de leur produit, en particulier de leur ligne principale, les GeForce. Les GPU de Nvidia sont allés au-delà de l'espace de jeu, élargissant leur présence dans l'apprentissage en profondeur, l'IA (intelligence artificielle) et l'analyse accélérée. Nvidia a infiltré le marché des datacenters il y a une dizaine d'années, à commencer par les puces Fermi. Des itérations ultérieures ont été effectuées et la société a continuellement publié des GPU qui répondent à la demande insatiable d'une vitesse de traitement plus rapide dans les centres de données. Les GPU de Nvidia ont évolué au fil des ans, et les conceptions d'architecture entraînent principalement l'évolution.

L'architecture Ampère de Nvidia

La concurrence est très serrée parmi les fabricants de GPU, mais Nvidia ne retient rien pour prendre la première place. En fait, Nvidia a dominé le marché de l'IA au cours de la dernière décennie. En 2020, l'annonce du premier GPU 7 nm (8 nm pour les pièces grand public) de Nvidia avec 54 milliards de transistors compressés dans une si petite puce a fait le buzz. Nom de code Ampère d'après le mathématicien français André-Marie Ampère, L'architecture du processeur de Nvidia offre une amélioration considérable par rapport à ses prédécesseurs, Turing et Volta, promettant plus de fonctionnalités, une meilleure efficacité et des performances supérieures à des niveaux de puissance inférieurs. Ampere est à l'origine de la deuxième génération de GPU RTX de Nvidia, la série RTX 30, et serait deux fois plus rapide que leurs homologues de la série RTX 20. L'architecture Ampere est également la force derrière les GPU des centres de données Nvidia A100.

Spécifications d'Ampère

Ampere est le premier GPU 7 nm/8 nm de Nvidia, la deuxième génération de lancer de rayons grand public et la troisième génération de cœurs tenseurs. Ampere est l'architecture sous-jacente des GPU GA100, GA102 et GA104 qui sont intégrés dans les GeForce RTX 3090, RTX 3080, RTX 3070 et, plus récemment, le RTX 3060. Nvidia devrait également sortir le RTX 3050 dans les mois à venir. Pendant ce temps, le GPU GA100 d'entreprise fournit 20 fois plus de puissance de calcul que les générations précédentes de GPU de centre de données. Voici un aperçu des GPU professionnels et grand public basés sur Ampere de Nvidia [1] :

GPU	GA100	GA102	GA102	GA104
Carte graphique	Nvidia A100	GeForce RTX 3090	GeForce RTX 3080	GeForce RTX 3070
Processus (nm)	TSMC N7	Samsung 8N	Samsung 8N	Samsung 8N
Transistors (milliards)	54	28.3	28.3	17.4
Taille de matrice (mm^2)	826	628.4	628.4	392.5
Configuration GPC	8×16	7×12	6×12	6×8
SMS	108	82	68	46
Noyaux CUDA	6912	10496	8704	5888
RT Noyaux	Rien	82	68	46
Noyaux tenseurs	432	328	272	184
Boost d'horloge (MHz)	1410	1700	1710	1730
Vitesse VRAM (Gbit/s)	2.43	19.5 (GDDR6X)	19 (GDDR6X)	14 (GDDR6)
VRAM (Go)	40 (48 maximum)	24	dix	8
Largeur de l'autobus	5120 (6144 maximum)	384	320	256
POR	128	112	96	96
UGT	864	656	544	368
GFLOPS FP32	19492	35686	29768	20372
RT TFLOPS	N / A	69	58	40
Tenseur TFLOPS FP16 (pauvreté)	312 (628)	143 (285)	119 (238)	81 (163)
Bande passante (Go/s)	1555	936	760	448
TBP (watts)	400 (250 PCIe)	350	320	220

Nvidia A100

Le Nvidia A100 est le premier GPU qui utilise l'architecture Ampere. La puce d'entreprise est destinée aux centres de données et conçue pour les tâches gourmandes en GPU telles que l'apprentissage en profondeur et l'IA. Construit à l'aide du processus 7 nm de TSMC, il abrite une énorme quantité de 54 milliards de transistors. Il a surpassé les générations précédentes de GPU d'entreprise avec une augmentation de 20 fois des performances avec 6 912 cœurs CUDA, 432 unités de mappage de texture, 160 ROP, des cœurs Tensor de troisième génération et une VRAM de 40 Go avec une bande passante mémoire qui atteint 1.6 To/s. DGX A100 est le premier système d'IA au monde avec un groupe de huit A100 et un prix élevé de 199 000 $.

Série GeForce RTX 30

En plus de dominer le marché des entreprises, Nvidia a toujours à l'esprit les consommateurs, en particulier les joueurs et les créateurs. L'architecture Ampere est également adoptée dans les cartes graphiques grand public de Nvidia. La deuxième génération de GeForce RTX embarque les GPU à base d'Ampère augmentant les performances à deux fois plus que la génération précédente.

Dans la plupart des aspects, Ampere a plus de deux fois la puissance de traitement de Turing. Il a doublé les performances du shader de Turing avec deux fois plus de cœurs FP32 CUDA. Plus précisément, il a 30 Shader-TFLOPS, 2.7x plus que celui de Turing qui n'est que de 11 Shader-TFLOPS. De même, le Tensor Core de Turing mesure à 89 Tensor-TFLOPS, mais Ampere a plus que doublé ce taux avec ses 238 Tensor-TFLOPS. Sans oublier ses taux Ray Tracing Core, qui est de 58 RT-TFLOPS, 1.7 fois plus rapide que les 34 RT-TFLOPS de Turing, et pour que les GPU fonctionnent encore plus rapidement, la puce Ampere se connecte à la mémoire la plus rapide au monde, le Micron G6X.

La série RTX 30 est fabriquée à l'aide du processus personnalisé Samsung 8N Nvidia avec 28 milliards de transistors pour le GA102 et 17 milliards de transistors pour le GA104. La classe Titan RTX 3090 est alimentée par le GPU GA102 et offre des performances de carte grand public extrêmement puissantes. Contrairement aux générations précédentes, RTX 3090 est ouvert aux tiers pour une conception personnalisée.

Le RTX 3080 utilise également un GPU GA102, offrant deux fois les performances du RTX 2080 et des prouesses de jeu 4K impressionnantes. Le RTX 3070, alimenté par le GPU GA104, est comparable au RTX 2080 Ti à moitié prix. Le RTX 3060 récemment publié ne manque pas non plus d'impressionner par ses performances stupéfiantes grâce à des cœurs de traçage de rayons améliorés, des cœurs Tensor, de nouveaux multiprocesseurs de streaming et une mémoire G6 haute vitesse.

Malgré l'augmentation massive des performances, les nouveaux GPU RTX ne pèsent pas lourd sur la poche. Les cartes graphiques beaucoup plus rapides sont facilement accessibles en termes de prix. Le produit phare de Nvidia GeForce, RTX 3080, commence à 699 $, le RTX 3070 se vend à 499 $ et le RTX 3060 a un prix de 329 $. Le RTX 3090 haut de gamme coûte 1 499 $; toujours considérablement à faible coût compte tenu de ses performances de niveau Titan.

Quelques mois seulement après sa sortie, il y aurait eu une pénurie de cartes graphiques à base d'Ampère, et ce n'est pas une surprise avec les performances étonnantes d'Ampère à un prix raisonnable. Pour ceux qui envisagent une mise à niveau du GPU, c'est le meilleur moment pour mettre la main sur les GPU basés sur Ampere de Nvidia.

Sources

[1] Walton, Jarred. « Plongée approfondie de l'architecture d'ampères Nvidia RTX série 30 : tout ce que nous savons ». https://www.tomshardware.com/features/nvidia-ampère-architecture-deep-dive. 13 octobre 2020.