GF104 utoljára

Elemzés - 2011/01/23

Oldalak:     
Fórum
Bevezető
Talán egy GPU-val sem foglalkoztunk site-unk története során, mint a GF104-gyel - nem kevesebb, mint 6 cikkben volt eddig főszereplő a rá építő valamelyik VGA, és még további cikkekben is felbukkant kisebb-nagyobb mellékszerepekben. Nem ok nélkül övezi a chipet ekkora figyelem - egyfelől a GTX460-tól azt vártuk, hogy megismételje a korábbi, mára már legendás státuszba emelkedett középkategóriás nVidia kártyák (6600GT, 7600GT, 9600GT) sikerét, másrészt a GPU rögtön két verzióban került a piacra, amelyek műszaki elemzésekhez is kitűnő eszközöket adtak a kezünkbe.
A GTX460SE videokártya a GF104-es GPU egy harmadik változatával van szerelve. Míg a VGA teljesítmény terén igencsak csalódást keltően szerepelt (ld. korábbi tesztünkben), a felépítése olyanra sikerült, amely technológiai vizsgálódásainknak igencsak fekszik - ezért, ahogy ígértük, még egyszer visszatérünk rá, és ezzel teljessé tesszük a GF104-ről alkotott képünket. Lássuk akkor!

A GF104 chip három változata
Felépítés, előzetes elemzés
Azonos órajelek mellett így tagozódik be a GF104 három változata:
VGA neve GTX460SE OC GTX460 768MB GTX460 1GB 460-768MB
vs 460SE
460-1GB
vs 460SE
Core órajel 675 MHz 675 MHz 675 MHz 0% 0%
Shader órajel 1350 MHz 1350 MHz 1350 MHz 0% 0%
Memória-órajel 900 MHz 900 MHz 900 MHz 0% 0%
Memória mennyisége 1024 MB 1024 MB 1024 MB
Tranzisztorok száma 1950M 1950M 1950M
Gyártástechnológia 40nm (TSMC) 40nm (TSMC) 40nm (TSMC)
Geometriai egységek 2 2 2 0% 0%
Scanline konverzió 16 Pix/clock 16 Pix/clock 16 Pix/clock 0% 0%
ALU egységek (SP-k) 192/288 224/336 224/336 16.7% 16.7%
Textúrázó egységek 48 56 56 16.7% 16.7%
ROP egységek 32 24 32 -33.3% 0%
Memóriabusz és típus 256-bit gDDR5 192-bit gDDR5 256-bit gDDR5 -33.3% 0%
Triangle setup 1350 Mtri/sec 1350 Mtri/sec 1350 Mtri/sec 0% 0%
Scanline konverzió 10.8 GPix/sec 10.8 GPix/sec 10.8 GPix/sec 0% 0%
Számítási teljesítmény 519/778 GFlops 605/907 GFlops 605/907 GFlops 16.7% 16.7%
Texel fillrate, 32-bit (FP10) 32.4 GTex/sec 37.8 GTex/sec 37.8 GTex/sec 16.7% 16.7%
Pixel fillrate 21.6 GPix/sec 16.2 GPix/sec 21.6 GPix/sec -25.0% 0%
Z-only fillrate 86.4 GPix/sec 64.8 GPix/sec 86.4 GPix/sec -25.0% 0%
Memória-sávszélesség 115.2 GB/sec 86.4 GB/sec 115.2 GB/sec -25.0% 0%
Összefoglalva a különbségeket:
  • Ütemezés, setup és raszterizálás terén egyforma a három GPU, mindegyik chip a teljes GF104 frontenddel rendelkezik
  • Számítási kapacitásban az SE chip gyengébb a másik két verziónál - miután már az eredeti GTX460-ak is kasztráltak ezen a téren, és a teljes GF104-es chip sem igazán combos számításban az idétlen ütemezési megoldás miatt, ez könnyen lehet döntő faktor a három versenyző teljesítményében
  • Bár elvi síkon a textúrázókra is ugyanaz igaz lenne, mint az ALU-kra (a GTX460 SE itt is duplán csonkított), a GF104-es GPU ezen a téren korántsem gyenge, így ez a tényező kevésbé tűnik aggasztónak
  • Végül backendben a GTX460-1GB és a GTX460SE egyforma, a teljes 32 ROP-pal és 256-bites memóriavezérlővel rendelkeznek - itt a GTX460-768MB van hátrányban, azt pedig a korábbi tesztekből (pl. itt) láthattuk, hogy ez a különbség azonos órajel mellett 5-10% differenciát jelent a GTX460-1GB-tal szemben.
Ha ezeket a differenciákat "betápláljuk" teljesítmény-becslő modellünkbe, amely kiegyensúlyozott GPU-k esetén igen pontosan megmondja a különbséget, azt kapjuk, hogy azonos órajelek mellett a GTX460-1GB 9-10%-kal várható gyorsabbnak a GTX460SE-nél, a GTX460-768MB-os verziója pedig ugyanúgy fog teljesíteni, mint az újabb versenyző. A GTX460SE tesztből viszont rögtön kiderül, hogy ez a becslés nem jó - ha azonos órajelek mellett egyforma lenne a két kártya, akkor a gyári órajeleken kb. 5%-kal lenne gyorsabb a 768MB-os változat, nem pedig közel 10%-kal. Ez megerősíteni látszik eddigi gyanúnkat, miszerint az effektív ALU-teljesítményben eddig is túlzottan vékony GTX460-asok esetében nem volt szerencsés a számítási kapacitást tovább csökkenteni. Ezért a mérések elemzésekor legtöbb figyelmet a GTX460-1GB és a GTX460SE összevetésére fogjuk fordítani - ha igaz a feltételezésünk a nagyon erős ALU-limitációval kapcsolatban, akkor 1-2 játékban az SE chip hátránya akár a 16.7%-os elméleti maximumot is megközelítheti.
Tesztkörnyezet
A konfiguráció elemei
Alaplap Gigabyte P45-DS3R, FSB @400MHz
CPU és órajel Intel Q9550 @Q9770 (3.2GHz, 8x400)
CPU hűtés Cooler Master HyperTX3
Memória 4x1GB Geil Ultra DDR2-8500
Memória beállítások 1066MHz (2.66x400), 5-5-5-15, tRD: 8
Tápegység Corsair TX650
Operációs rendszer Windows 7 x64
VGA Core clock Shader clock Memory clock Driver
GeForce GTX460SE 1GB 675 MHz 1350 MHz 900 MHz ForceWare 263.09 WHQL
GeForce GTX460 768MB 675 MHz 1350 MHz 900 MHz ForceWare 260.99 WHQL
GeForce GTX460 1GB 675 MHz 1350 MHz 900 MHz ForceWare 260.99 WHQL
A konfigurációból egyedül az érdemel említést, hogy nem egyforma driverrel szerepel a három kártya - mivel a 263.09 volt az első meghajtó, ami támogatta a GTX460SE-t, viszont ez a driver nem támogatta a másik két 460-ast, nem volt lehetőség arra, hogy 100%-ig azonos körülményeket teremtsünk. Mivel azonban a 263.09-es driverben az nVidia szerint nincsenek performanciális javítások, ezért nem gondoljuk, hogy a GTX460SE unfair előnyhöz jutna.
A tesztben résztvevő játékok
  • Battlefield: Bad Company 2
  • Crysis Warhead
  • F1 2010
  • Just Cause 2
  • Lost Planet 2
  • Mafia II
  • METRO 2033
  • STALKER: Call of Pripyat
  • Unigine Heaven 2.1
Oldalak:     
Fórum