L'architettura delle GPU NVIDIA NV40, di cui abbiamo ampiamente discusso in
questo articolo, presenta una
struttura composta da 6 unità di vertex shading e 16 pipeline di rendering.
Ognuna di queste è dotata di una unità di pixel shading e di una unità di ROP (Raster
Operation Pipes) che concludono il ciclo di creazione dell'immagine. La presenza
di 16 unità di ROP nelle schede GeForce 6800 non deve stupire anche se queste
permettono di ottenere prestazioni elevate solo in teoria: nella pratica reale
della costruzione di un'immagine 3D, le unità ROP vengono sfruttate tutte solo
in particolari casi favorevoli; mediamente possiamo ritenere che solo metà di
esse o anche meno della metà vengano utilizzate contemporaneamente.
Nella progettazione di un chip di fascia bassa o medio bassa dove i costi e,
dunque, il prezzo del prodotto è un parametro con sensibilità decisamente più
elevate per il consumatore finale, "sprechi" di questo genere non possono non
essere tenuti in seria considerazione.
Per questo motivo già i chip NV43 che costituiscono la base delle schede
GeForce 6600 e GeForce 6600GT, abbinano solo 4 ROP alle otto pipeline di
rendering, situazione mediamente più ottimizzata nel rapporto prezzo -
prestazioni di quella dei chip NV40. In soldoni questa situazione implica che
dal chip NV43 non potranno mai essere disponibili più di 4 pixel per ciclo di
clock, limite mitigato comunque dalla presenza di una Fragment Crossbar che
permette di bilanciare al meglio il carico di lavoro. Il chip NV43-V, su cui
sono basate le soluzioni GeForce 6200 "normali" deriva dal chip NV43 al quale
sono state "tagliate" diverse features legate al calcolo computazionale.
Diagramma a blocchi GeForce 6200 (NV43-V)
Il chip NV44 presenta alcune limitazioni, se comparato al chip NV43, in modo
simile a quanto accade con i chip NV43-V e principalmente mirate a ridurre i
costi produttivi. Il numero di pipelines registra un dimezzamento calando da 8 a
4 come anche il numero di ROP che nel chip NV44 sono 2. Restano invece a 3 le
unità di vertex shader. Ed è proprio su questo chip che NVIDIA ha basato il suo
progetto TurboCache.
Da queste caratteristiche si comprende come il massimo numero di pixel
visualizzati a schermo dal chip NV44 è pari a 2: la semplificazione introdotta
da NVIDIA per detto chip sta soprattutto nelle unità ROP e non solo nel loro
numero. Il chip non offre nessuna possibilità di compressione dello z-buffer e
del colore, mentre le operazioni di blending e filtering sono supportate ma
con una precisione minore.
Diagramma a blocchi GeForce 6200TC (NV44)
Se confrontiamo il diagramma a blocchi della 6200TC con quello della stessa
non TurboCache notiamo che è stata aggiunta una unità MMU, come precedentemente
detto, e che sono state evidenziate alcune zone in giallo. Tali zone sono quelle
ottimizzate al fine di funzionare al meglio con la memoria di sistema.
L'architettura semplificata unita al processo produttivo avanzato a 0.11
micron permettono di realizzare un core con pochi transistor e dalle dimensioni
e consumi molto ridotti, vantaggi che si ripercuotono immediatamente (e
beneficamente) sui costi. Allo stesso modo, però, questi vantaggi permettono di
raggiungere frequenze di funzionamento più elevate: il chip NV44 funziona a
350MHz contro i 300MHz delle schede GeForce 6200 non TC.
Resta inteso che tutte le altre features legate al marchio NV40, sono
presenti anche in NV44: fra queste ricordiamo pixel e vertex shader 3.0,
antialiasing e filtro anisotropico.