Con l’introduzione della serie RX 6000, l’architettura viene rivista ulteriormente rispetto alle prime GPU basate sul design Navi, che pone le fondamenta sul processo produttivo di TSMC N7 (a 7 nm).
Cominciamo col dire che RDNA 2 presenta il maggior numero di cambiamenti rispetto alla generazione precedente di qualsiasi altra architettura mai creata da AMD:
Ci sarebbe molto da dire su questa nuova µArch, ma per evitare di rendere ancora più tediosa questa review (che conta più di 20 pagine), semplificheremo il tutto affermando che la modifica delle pipeline degli Stream Processors (che incrementano esponenzialmente la parallelizzazione dei workloads), le Compute Units (CU) migliorate e l’Infinity Cache permettono di ottenere un boost prestazionale per Watt del 54% ed un incremento della frequenza del 30% a parità di corrente consumata.
Ray Accelerators
Forse la più importante miglioria apportata dall’architettura RDNA 2 è l’introduzione nelle pipeline di unità dedicate al Ray Tracing denominate Ray Accelerators. Sebbene al di sotto delle prestazioni mostrate dai prodotti NVIDIA, siamo contenti nel vedere una soluzione dedicata alla nuova tecnologia di rendering anche sulle GPU di Sunnyvale.
Ogni Ray Accelerator può calcolare 4 intersezioni ray/box ed 1 intersezione ray/triangolo ad ogni ciclo di clock, ed ogni CU è dotata del suo RA dedicato. Almeno sulla carta, le prestazioni in Ray Tracing delle schede video AMD dovrebbero essere leggermente superiori a quelle della prima generazione di NVIDIA RTX.
Infinity Cache
L’Infinity Cache (che sulla RX 6700 XT è di 96 MB) fornisce alla GPU una piccola regione buffer di memoria dall’elevatissima bandwidth, inserendosi nella gerarchia di memoria della scheda video e facendo da ponte tra la GPU e la RAM video. Ciò consente alle schede AMD di utilizzare un bus dati più piccolo (con un notevole guadagno in efficienza energetica) senza però perdere prestazioni anche alle risoluzioni più alte. Un approccio decisamente diverso rispetto a quello di NVIDIA che ha preferito, nelle ultime 3 generazioni di schede video, ottimizzare l’algoritmo di compressione DSC con cui sfrutta al massimo i bus di memoria anche più ristretti.
Discussione su post