Bevezető
Talán egy GPU-val sem foglalkoztunk site-unk története során, mint a GF104-gyel - nem kevesebb,
mint 6 cikkben volt eddig főszereplő a rá építő valamelyik VGA, és még további cikkekben is felbukkant
kisebb-nagyobb mellékszerepekben. Nem ok nélkül övezi a chipet ekkora figyelem - egyfelől a GTX460-tól
azt vártuk, hogy megismételje a korábbi, mára már legendás státuszba emelkedett középkategóriás
nVidia kártyák (6600GT, 7600GT, 9600GT) sikerét, másrészt a GPU rögtön két verzióban került a piacra,
amelyek műszaki elemzésekhez is kitűnő eszközöket adtak a kezünkbe.
A GTX460SE videokártya a GF104-es GPU egy harmadik változatával van szerelve. Míg a VGA teljesítmény terén igencsak
csalódást keltően szerepelt (ld. korábbi tesztünkben), a felépítése
olyanra sikerült, amely technológiai vizsgálódásainknak igencsak fekszik - ezért, ahogy ígértük, még egyszer
visszatérünk rá, és ezzel teljessé tesszük a GF104-ről alkotott képünket. Lássuk akkor!
A GF104 chip három változata
Felépítés, előzetes elemzés
Azonos órajelek mellett így tagozódik be a GF104 három változata:
VGA neve | GTX460SE OC | GTX460 768MB | GTX460 1GB | 460-768MB vs 460SE |
460-1GB vs 460SE |
Core órajel | 675 MHz | 675 MHz | 675 MHz | 0% | 0% |
Shader órajel | 1350 MHz | 1350 MHz | 1350 MHz | 0% | 0% |
Memória-órajel | 900 MHz | 900 MHz | 900 MHz | 0% | 0% |
Memória mennyisége | 1024 MB | 1024 MB | 1024 MB | ||
Tranzisztorok száma | 1950M | 1950M | 1950M | ||
Gyártástechnológia | 40nm (TSMC) | 40nm (TSMC) | 40nm (TSMC) | ||
Geometriai egységek | 2 | 2 | 2 | 0% | 0% |
Scanline konverzió | 16 Pix/clock | 16 Pix/clock | 16 Pix/clock | 0% | 0% |
ALU egységek (SP-k) | 192/288 | 224/336 | 224/336 | 16.7% | 16.7% |
Textúrázó egységek | 48 | 56 | 56 | 16.7% | 16.7% |
ROP egységek | 32 | 24 | 32 | -33.3% | 0% |
Memóriabusz és típus | 256-bit gDDR5 | 192-bit gDDR5 | 256-bit gDDR5 | -33.3% | 0% |
Triangle setup | 1350 Mtri/sec | 1350 Mtri/sec | 1350 Mtri/sec | 0% | 0% |
Scanline konverzió | 10.8 GPix/sec | 10.8 GPix/sec | 10.8 GPix/sec | 0% | 0% |
Számítási teljesítmény | 519/778 GFlops | 605/907 GFlops | 605/907 GFlops | 16.7% | 16.7% |
Texel fillrate, 32-bit (FP10) | 32.4 GTex/sec | 37.8 GTex/sec | 37.8 GTex/sec | 16.7% | 16.7% |
Pixel fillrate | 21.6 GPix/sec | 16.2 GPix/sec | 21.6 GPix/sec | -25.0% | 0% |
Z-only fillrate | 86.4 GPix/sec | 64.8 GPix/sec | 86.4 GPix/sec | -25.0% | 0% |
Memória-sávszélesség | 115.2 GB/sec | 86.4 GB/sec | 115.2 GB/sec | -25.0% | 0% |
Összefoglalva a különbségeket:
- Ütemezés, setup és raszterizálás terén egyforma a három GPU, mindegyik chip a teljes GF104 frontenddel rendelkezik
- Számítási kapacitásban az SE chip gyengébb a másik két verziónál - miután már az eredeti GTX460-ak is kasztráltak ezen a téren, és a teljes GF104-es chip sem igazán combos számításban az idétlen ütemezési megoldás miatt, ez könnyen lehet döntő faktor a három versenyző teljesítményében
- Bár elvi síkon a textúrázókra is ugyanaz igaz lenne, mint az ALU-kra (a GTX460 SE itt is duplán csonkított), a GF104-es GPU ezen a téren korántsem gyenge, így ez a tényező kevésbé tűnik aggasztónak
- Végül backendben a GTX460-1GB és a GTX460SE egyforma, a teljes 32 ROP-pal és 256-bites memóriavezérlővel rendelkeznek - itt a GTX460-768MB van hátrányban, azt pedig a korábbi tesztekből (pl. itt) láthattuk, hogy ez a különbség azonos órajel mellett 5-10% differenciát jelent a GTX460-1GB-tal szemben.
Ha ezeket a differenciákat "betápláljuk" teljesítmény-becslő modellünkbe, amely
kiegyensúlyozott GPU-k esetén igen pontosan megmondja a különbséget, azt kapjuk, hogy azonos órajelek mellett
a GTX460-1GB 9-10%-kal várható gyorsabbnak a GTX460SE-nél, a GTX460-768MB-os verziója pedig ugyanúgy fog
teljesíteni, mint az újabb versenyző. A GTX460SE tesztből viszont
rögtön kiderül, hogy ez a becslés nem jó - ha azonos órajelek mellett egyforma lenne a két kártya, akkor
a gyári órajeleken kb. 5%-kal lenne gyorsabb a 768MB-os változat, nem pedig közel 10%-kal. Ez megerősíteni
látszik eddigi gyanúnkat, miszerint az effektív ALU-teljesítményben eddig is túlzottan vékony GTX460-asok
esetében nem volt szerencsés a számítási kapacitást tovább csökkenteni. Ezért a mérések elemzésekor legtöbb
figyelmet a GTX460-1GB és a GTX460SE összevetésére fogjuk fordítani - ha igaz a feltételezésünk a nagyon
erős ALU-limitációval kapcsolatban, akkor 1-2 játékban az SE chip hátránya akár a 16.7%-os elméleti
maximumot is megközelítheti.
Tesztkörnyezet
A konfiguráció elemei | |
Alaplap | Gigabyte P45-DS3R, FSB @400MHz |
CPU és órajel | Intel Q9550 @Q9770 (3.2GHz, 8x400) |
CPU hűtés | Cooler Master HyperTX3 |
Memória | 4x1GB Geil Ultra DDR2-8500 |
Memória beállítások | 1066MHz (2.66x400), 5-5-5-15, tRD: 8 |
Tápegység | Corsair TX650 |
Operációs rendszer | Windows 7 x64 |
VGA | Core clock | Shader clock | Memory clock | Driver |
GeForce GTX460SE 1GB | 675 MHz | 1350 MHz | 900 MHz | ForceWare 263.09 WHQL |
GeForce GTX460 768MB | 675 MHz | 1350 MHz | 900 MHz | ForceWare 260.99 WHQL |
GeForce GTX460 1GB | 675 MHz | 1350 MHz | 900 MHz | ForceWare 260.99 WHQL |
A konfigurációból egyedül az érdemel említést, hogy nem egyforma driverrel
szerepel a három kártya - mivel a 263.09 volt az első meghajtó, ami támogatta a GTX460SE-t, viszont ez a driver
nem támogatta a másik két 460-ast, nem volt lehetőség arra, hogy 100%-ig azonos körülményeket teremtsünk.
Mivel azonban a 263.09-es driverben az nVidia szerint nincsenek performanciális javítások, ezért nem
gondoljuk, hogy a GTX460SE unfair előnyhöz jutna.
A tesztben résztvevő játékok
- Battlefield: Bad Company 2
- Crysis Warhead
- F1 2010
- Just Cause 2
- Lost Planet 2
- Mafia II
- METRO 2033
- STALKER: Call of Pripyat
- Unigine Heaven 2.1