• About Us
  • Contact us
lunedì 16 Giugno 2025
ReHWolution
  • Reviews
  • News
  • Videogiochi
  • Fotografia
  • Guide
  • Droni
  • Mobile
  • Editoriali
  • Articles
Nessun risultato
Visualizza tutti i risultati
ReHWolution
  • Reviews
  • News
  • Videogiochi
  • Fotografia
  • Guide
  • Droni
  • Mobile
  • Editoriali
  • Articles
Nessun risultato
Visualizza tutti i risultati
ReHWolution
Nessun risultato
Visualizza tutti i risultati

NVIDIA GeForce GTX 1080 8GB Founders Edition

Ciro Sdino di Ciro Sdino
11 Novembre 2016
in Schede Video
0
Home Reviews Schede Video
1.1k
Visualizzazioni
Jump to section

5. Pascal: compressione di memoria portata all’estremo

  • 1. Introduzione: NVIDIA e Pascal
  • 2. Con l’introduzione della serie GTX 900, NVIDIA ha creato un distacco con AMD di non poco conto, lievemente colmato in performance dalla seconda (ma risaputamente non in efficienza) con la serie “Fury”. Con il cambio di processo produttivo alle porte però, l’azienda di Santa Clara ha fatto le cose in grande, lanciando così la serie GeForce GTX 10 series, di cui la GTX 1080 (ignorando la bestia che è la Titan X “P”) è il modello di punta.
  • 3. NVIDIA GeForce GTX 1080: specifiche tecniche
  • 4. Pascal GP104: una nuova architettura
  • 5. Pascal: compressione di memoria portata all’estremo
  • 6. Configurazione di prova e metodologia di test
  • 7. Test sintetici: Unigine Heaven 4.0 (DirectX 11)
  • 8. Test sintetici: FutureMark 3DMark Fire Strike (DirectX 11) e Time Spy (DirectX 12)
  • 9. Test sui giochi: Bioshock Infinite (DirectX 11)
  • 10. Test sui giochi: Metro Last Light (DirectX 11)
  • 11. Test sui giochi: Middle Earth: Shadow of Mordor (DirectX 11)
  • 12. Test sui giochi: Grand Theft Auto V (DirectX 11)
  • 13. Test sui giochi: Rise of the Tomb Raider (DirectX 12)
  • 14. Test sui giochi: Hitman (2016) (DirectX 12)
  • 15. Test sui giochi: Doom (2016) (Vulkan)
  • 16. Test sui giochi: Ashes of the singularity (DirectX 12)
  • 17. Considerazioni finali

Fin da Fermi, ogni architettura di NVIDIA ha avuto qualche sorta di delta color compression di tipo lossless per ottimizzare la bandwidth di memoria. I benefici della compressione sono molteplici: riduce l’ammontare di informazioni trasferite tra i client on-die (TMU, Frame Buffer), semplifica l’utilizzo della cache L2 e minimizza quanti dati vengono scritti nella memoria.

2-1

Mentre Maxwell ha sorpassato il suo predecessore con un rapporto di compressione di 2:1, Pascal va persino oltre. NVIDIA ha pensato bene non solo di aumentare la bandwidth con le GDDR5X ma anche di migliorare le ottimizzazioni integrate nell’architettura.

Pascal, ancora una volta, ha un rapporto di compressione di 2:1, ma nel caso i giochi lo supportino, ci sono due rapporti di compressioni ulteriori (4:1 e 8:1) che migliorano ulteriormente la situazione.

2-2

Nell’esempio qui sopra, Project Cars è utilizzato per dimostrare come Maxwell era efficiente nel comprimere molto della scena (le aree in viola), i nuovi algoritmi di Pascal portano le cose al livello successivo senza compromettere la qualità dell’immagine.

2-3

Combinata con la bandwidth addizionale garantita dalle memorie G5X, l’efficienza totale della bandwidth della GTX 1080 è praticamente duplicata rispetto alla generazione precedente. Più importante, gli algoritmi di compressione colore permettono di ridurre la quantità netta di bandwidth richiesta dai giochi, lasciando più spazio a situazioni inaspettate e persino a workload di calcolo.

Pascal: Async Computing rielaborato

Con le DX12 all’orizzonte una delle maggiori critiche contro Maxwell erano le performance scadenti in alcune situazioni che richiedessero alla GPU workloads multipli indipendenti (o asincroni). Cose come la fisica, l’audio, l’AI, la VR e il post processing possono essere considerate tra essi. Nonostante avesse schedulers di tipo hardware (NVIDIA non utilizzava una soluzione software-oriented), essi non erano particolarmente efficienti in alcuni scenari chiavi, come evidenziato dai workload compute+graphics presenti in Ashes of the Singularity. Non è solo questo gioco, comunque, ad aver preoccupato NVIDIA, visto che le DX12 spingono gli sviluppatori ad utilizzare la natura altamente parallela delle GPU, permettendo loro di raggiungere boost prestazionali quando processi asincroni sono propriamente implementati.

3-1

Pascal cambia le cose in svariati modi. Innanzitutto, gli scheduler hardware sono stati aggiornati in modo da reindirizzare le richieste ad una velocità maggiore. Essi inoltre hanno una certa quantità di “Forward Branch Prediction” (previsione del prossimo calcolo, in pratica) integrata nel loro framework, in modo che ogni volta che le risorse on-die sono disponibili, ci siano dati inseriti nella pipeline.

Un’altra feature aggiunta è il Dynamic Load Balancing. Con il partizionamento statico delle GPU di Maxwell, i workload grafici e di calcolo erano eseguiti su partizioni dedicate separate. Tuttavia, entrambi i workloads dovevano essere completati allo stesso tempo per rendere questo metodo efficiente, altrimenti se uno dei due avesse finito prima, una porzione della GPU avrebbe “preso polvere”. Questi cicli di inattività si sarebbero accumulati per poi negare qualsiasi beneficio in performance derivante dall’eseguire operazioni in parallelo. Il DLB hardware-based di Pascal ingaggia ulteriormente questi scheduler in modo da avere un approccio ibrido al bilanciamento del carico. In questo modo tali partizioni possono essere utilizzate dinamicamente sia per workloads grafici che di calcolo, eliminando inattività e migliorando le prestazioni.

3-2

Eseguire operazioni in asincrono va ben oltre il partizionamento, visto che in ognuna di queste situazioni finora descritte ci sono migliaia, milioni di operazioni e workload in esecuzione, alcuni dei quali più critici di altri. In realtà determinare quali sono prioritari e hanno bisogno di essere eseguiti più velocemente è particolarmente difficoltoso. NVIDIA ha dato un buon esempio sulla cosa durante i briefing affermando che potrebbe un’operazione asincrona che talvolta è richiesta per far sì che riparta una scansione o che un frame venga generato.

Una volta completata la “preemption” ad alto livello nella pipeline grafica, c’era la possibilità di creare un overflow ai livelli inferiori di calcolo. Per riconoscere, razionalizzare e dare priorità ai pacchetti dati e di operazioni, NVIDIA ha implementato diversi livelli di preemption. Pixel Level Preemption è una novità per le GPU moderne e permette ad ogni GPC di registrare i progressi in un determinato compito, così che se una previsione è richiesta, essa può salvare le context information, processare le info critiche e ripartire dal punto in cui il compito precedente era stato interrotto. Tutto ciò, in tempi pari a 100 microsecondi.

Anche la Compute Preemption è stata aggiunta e funziona in modo simile alla PLP, ma invece di agire sui singoli pixel, essa agisce sui workloads a livello di processo. Combinata con la PLP, questa feature permette a Pascal di cambiare tipo di workload ad una velocità ridicolmente elevata ed aumentare le prestazioni in situazioni dove l’adattabilità parallela asincrona è richiesta.

3-3

In aggiunta alla tradizionale Compute Preemption eseguita a livello di thread, Pascal aggiunge un altro filo alla matassa essendo la prima architettura a implementare un Instruction Level Preemption nel Compute Preemption. Sebbene essa possa essere utilizzata solo per compiti basati su CUDA, come PhysX, VR e altri miglioramenti GameWorks, i suoi benefici sono ben maggiori. NVIDIA la mette così: in questa modalità di operazione, quando una richiesta di preemption viene ricevuta, tutti i calcoli dei processi si interrompono all’istruzione corrente e lo stato viene cambiato immediatamente. Tale modalità coinvolge sostanzialmente più informazioni sullo stato dei tasks, visto che tutti i registri di tutti i processi in esecuzione vanno salvati, ma questo è l’approccio più robusto per calcoli di tipo generico in esecuzione nella GPU.

Pascal: Simultaneous Multi Projection: una rivoluzione nel multimonitor

In un mondo di standard per display in continua evoluzione e modi diversi di mostrare agli spettatori “nuovi mondi”, i tradizionali display piatti vengono integrati da tecnologie più recenti che richiedono alcuni aggiornamenti nel modo in cui le GPU gestiscono i workloads.

4-1

Mentre molte architetture GPU moderne come Maxwell supportano cose come VR, AR, surround, pannelli curvi e altri scenari, il modo in cui gli algoritmi di rendering sono strutturati causa svariate inefficienze. Questo si aggiunge ai frame times e potrebbe portare ad un esperienza non ottimale per gli utenti. In alcuni casi, questa semi-compatibilità potrebbe richiedere molteplici passaggi di rendering. o renderizzare più volte le stesse immagini, causando distorsioni o tearing, o entrambe le cose.

4-2

Pascal cambia questa equazione in maniera importante con l’aggiunta di un blocco funzionale Simultaneous Multi-Projection Engine nella struttura del PolyMorph Engine. Laddove Maxwell aveva capacità limitate nel multi-resolution che poteva portare a distorsioni delle direzioni di proiezione, l’SMP engine in Pascal può gestire individualmente la geometria richiesta per fino a 32 proiezioni concorrenti. Tutto ciò, senza overhead da parte dell’applicazione.

Una delle considerazioni chiave del design degli SMP Engine è stata il suo posizionamento nel tipico ambiente di workflow di Pascal. Visto che la sua funzionalità è posizionata subito dopo le pipeline geometriche l’applicazione esegue a questo stadio tutto il lavoro che altrimenti verrebbe eseguito a stadi superiori di elaborazione. In aggiunta, essendo basato su un motore completamente hardware, esso può duplicare gli stream di dati elaborati, visto che essi non lasciano mai la GPU, aumentando massivamente l’efficienza per i calcoli geometrici ad alto livello (come la tassellazione) in un ambiente di proiezioni.

4-3

In termini puramente pratici, l’engine che gestisce l’SMP può portare enormi miglioramenti nel campo della VR. In questi scenari, la GPU è forzata a processare 2 proiezioni concorrenti a bassa latenza verso gli occhi. In questo modo, ciò raddoppia la potenza elaborativa richiesta rispetto al solito, ma il nuovo blocco funzionale di Pascal può processare gli iniziali workload geometrici al doppio della velocità, avendo anche un effetto positivo sul rendering dei pixel.

4-4

Un’applicazione pratica dell’SMP è il supporto ottimale per i sistemi surround. Di solito, i pannelli destro e sinistro sono leggermente inclinati, creando un ambiente completamente avvolgente, ma in ogni caso ciò causa image warping (distorsione dell’immagine). Il modo giusto di renderizzare su un display surround è attraverso una diversa proiezione per ognuno dei tre display, facendo corrispondere l’angolo del display ed eliminando l’effetto “fish-eye” a cui il surround è associato di solito.

L’engine SMP di Pascal può lavorare per l’eliminazione del problema specificando 3 proiezioni concorrenti ma separate, ognuna corrispondente ad un display orientato diversamente. Ora, sarete capaci di modificare completamente l’angolo in cui i motiro destro e sinistro visualizzano l’immagine e vedrete la grafica renderizzata in prospettiva geometricamente corretta, con un angolo di visuale maggiore. Detto ciò, un’applicazione che usa l’SMP deve supportare un FOV ampio, ed avere il supporto alle API dell’SMP in modo da attivare un FOV maggiore.

In soldoni, ciò significa che gli sviluppatori, oltre a supportare a livello driver tale impostazioni, dovranno implementare tale funzionalità nei propri giochi.

Jump to section

5. Pascal: compressione di memoria portata all’estremo

  • 1. Introduzione: NVIDIA e Pascal
  • 2. Con l’introduzione della serie GTX 900, NVIDIA ha creato un distacco con AMD di non poco conto, lievemente colmato in performance dalla seconda (ma risaputamente non in efficienza) con la serie “Fury”. Con il cambio di processo produttivo alle porte però, l’azienda di Santa Clara ha fatto le cose in grande, lanciando così la serie GeForce GTX 10 series, di cui la GTX 1080 (ignorando la bestia che è la Titan X “P”) è il modello di punta.
  • 3. NVIDIA GeForce GTX 1080: specifiche tecniche
  • 4. Pascal GP104: una nuova architettura
  • 5. Pascal: compressione di memoria portata all’estremo
  • 6. Configurazione di prova e metodologia di test
  • 7. Test sintetici: Unigine Heaven 4.0 (DirectX 11)
  • 8. Test sintetici: FutureMark 3DMark Fire Strike (DirectX 11) e Time Spy (DirectX 12)
  • 9. Test sui giochi: Bioshock Infinite (DirectX 11)
  • 10. Test sui giochi: Metro Last Light (DirectX 11)
  • 11. Test sui giochi: Middle Earth: Shadow of Mordor (DirectX 11)
  • 12. Test sui giochi: Grand Theft Auto V (DirectX 11)
  • 13. Test sui giochi: Rise of the Tomb Raider (DirectX 12)
  • 14. Test sui giochi: Hitman (2016) (DirectX 12)
  • 15. Test sui giochi: Doom (2016) (Vulkan)
  • 16. Test sui giochi: Ashes of the singularity (DirectX 12)
  • 17. Considerazioni finali
Pagina 5 di 17
Precedente 1234567891011121314151617 Pros
Post precedente

The Last Guardian, disponibile un nuovo video gameplay inedito di ben 16 minuti

Post successivo

GTA Online: Deadline l’aggiornamento a tema Tron

Ciro Sdino

Ciro Sdino

Direttore responsabile di ReHWolution, con la passione per qualsiasi cosa funzioni con un processore fin dal lontano 1995, anno in cui "misteriosamente" la sua CPU avviò un processo di fusione nucleare nel case. Da allora, con impegno e imparzialità analizza hardware e software di ogni tipo, con un occhio di riguardo per l'overclock.

Altri Articoli

Razer Cobra Gaming Mouse – Recensione
Periferiche

Razer Cobra Gaming Mouse – Recensione

COMPUTEX 2025 | Noctua e tutte le novità di quest’anno
Hardware

COMPUTEX 2025 | Noctua e tutte le novità di quest’anno

30 Maggio 2025
253
COMPUTEX 2025 | TRYX si fa notare a Taipei con un restyling rivoluzionario
Hardware

COMPUTEX 2025 | TRYX si fa notare a Taipei con un restyling rivoluzionario

28 Maggio 2025
251
Computex 2025 | Exceleram presenta la nuova serie di RAM Aurum
Hardware

Computex 2025 | Exceleram presenta la nuova serie di RAM Aurum

20 Maggio 2025
268
Computex 2025 | Le novità di be quiet! tra raffreddamento, alimentazione e periferiche di nuova generazione
Hardware

Computex 2025 | Le novità di be quiet! tra raffreddamento, alimentazione e periferiche di nuova generazione

20 Maggio 2025
254
MSI MPG X870E EDGE TI WIFI – Recensione
Reviews

MSI MPG X870E EDGE TI WIFI – Recensione

Discussione su post

ReHWolution

ReHWolution Media © 2013-2024

Link importanti

  • Privacy & GDPR Policy
  • Contact Us
  • About Us

Seguici sui nostri social

Nessun risultato
Visualizza tutti i risultati
  • Reviews
  • News
  • Videogiochi
  • Fotografia
  • Guide
  • Droni
  • Mobile
  • Editoriali
  • Articles

ReHWolution Media © 2013-2024

Questo sito utilizza cookies. Continuando a visitarlo stai acconsentendo all'utilizzo di tali cookies. Per maggiori informazioni visita la nostra pagina di Policy Privacy e Cookies.