Generációváltás - GTX400 vs GTX200

Elemzés - 2010/07/24

Oldalak:     
Fórum
Bevezető
Azon Olvasóink, akik régebb óta követik oldalunk ténykedését, tudják, hogy vannak kimondott kedvenc témáink, amikhez időről-időre visszatérünk, lényegében amint a VGA-piac lehetőséget ad rá. Az egyik ilyen a videokártya-generációk közötti differencia - előszeretettel vizsgálgatjuk, hogy a piac által elvárt "kétszeres fps / új generáció" képlettel hogyan birkóznak meg a GPU-gyártók. Míg a Radeonok esetében az utolsó két generáció kellően erős gép mellett 70-80%-os növekedést hozott (sőt, 4xAA vagy 8xAA mellett a 4870 számos esetben a 3870 megduplázásának közelébe került), a GeForce termékek lényegesen gyengébben muzsikáltak - még ha a G92-t a G80 "költséghatékonyításaként" fogjuk is fel, és nem rójuk meg az nVidiát azért, mert a 9800GTX nemigen volt gyorsabb a 8800GTX-nél, a GTX280 alig 50%-os előnye a 9800GTX-hez képest már semmiképpen nem nevezhető egetrengető eredménynek. Ezek után érthető, hogy az új generációs Fermi chipet óriási várakozás előzte meg - különös tekintettel arra, hogy a HD5000-es széria meglehetősen jól sikerült teljesítmény-szempontból.
A megjelenés előtti hónapokban elindult egy pletyka, miszerint a GTX480 a GTX285-nél játéktól függően 50-110%-kal gyorsabb, ami roppant biztatóan hangzott - sajnos az első hivatalos tesztek rögtön megmutatták, hogy ezek a számok legjobb indulattal is légbőlkapott hülyeségnek minősíthetők. Jelen cikkünkkel szeretnénk tiszta vizet önteni a pohárba - nem a GTX285-tel, hanem a GTX280-nal mérjük össze a GTX480-at, és így derítjük ki, mennyire volt sikeres az nVidia generáció-váltása.

Felépítés, várható teljesítmény
A lenti táblázat korábbi cikkeinkből már minden bizonnyal ismerős, maximum annyi meglepő lehet benne, hogy szerepel benne a 9800GTX is. Ennek oka roppant egyszerű - miután a 9800GTX-ről a GTX480-ra ugorva kb. +50% teljesítményt nyertünk, és a GTX280 -> GTX480 ugrásnál sem számítunk duplázásra, elkezdte fúrni az oldalunkat a kíváncsiság, hogy vajon két generációnyi ugrás mekkora teljesítmény-növekedést hozott a GeForce vonalon. Így a tesztben nem csak a GTX280 és a GTX480 viszonyára figyelünk majd, hanem a 9800GTX és a GTX480 közötti különbségre is.
VGA neve 9800GTX GTX280 GTX480 GTX480 vs
9800GTX
GTX480 vs
GTX280
Core órajel 675 MHz 602 MHz 700 MHz 3.7% 16.3%
Shader órajel 1674 MHz 1296 MHz 1400 MHz -19.6% 8.0%
Memória-órajel 1100 MHz 1107 MHz 924 MHz -19.0% -19.8%
Memória mennyisége 512 / 1024 MB 1024 MB 1536 MB
Geometriai egységek 1 1 4 300% 300%
Scanline konverzió 16 Pix/clock 16 Pix/clock 64 Pix/clock 300% 300%
ALU egységek (SP-k) 128 (scalar) 240 (scalar) 480 (scalar) 275% 100%
Textúrázó egységek * 64 80 60 -6.7% -33.3%
ROP egységek 16 32 48 200% 50%
Memóriabusz és típus ** 256-bit gDDR3 512-bit gDDR3 384-bit gDDR5 200% 50%
Triangle setup 675 Mtri/sec 602 Mtri/sec 2800 Mtri/sec 314.8% 365.1%
Scanline konverzió 10.8 GPix/sec 38.8 GPix/sec 44.8 GPix/sec 314.8% 365.1%
Számítási teljesítmény *** 429 / 643 GFlops 622 / 933 GFlops 1344 GFlops 213.3% 116.1%
Texel fillrate, 32-bit (FP10) * 43.2 GTex/sec 48.2 GTex/sec 42.0 GTex/sec -2.9% -14.8%
Pixel fillrate 10.8 GPix/sec 19.3 GPix/sec 33.6 GPix/sec 211.1% 74.1%
Z-only fillrate 43.2 GPix/sec 77.1 GPix/sec 134.4 GPix/sec 211.1% 74.1%
Memória-sávszélesség ** 70.4 GB/sec 141.7 GB/sec 177.4 GB/sec 152.0% 25.2%
*: a GF100-as chip textúrázóinak memória-elérése jelentős optimalizáción esett át, ezért a 60 textúrázó egység akár erősebb is lehet, mint a GT200 80 unitja - de ez meglehetősen nehezen számszerűsíthető.
**: bár névlegesen egy 256-bit + gDDR5 kombináció egyforma órajel mellett ugyanakkora sávszélességet biztosít, mint egy 512-bit + gDDR3, a gyakorlatban azt tapasztaltuk, hogy az előbbi megoldásnak kb. 15%-kal magasabb órajelre van szüksége ahhoz, hogy megegyező teljesítményt nyújtson - ennek oka a gDDR5 memóriák magasabb késleltetése.
***: a G92 és a GT200 chipek jellemzője a rejtélyes extra MUL utasítás, amelyet elvileg az ALU-k minden ciklusban végre tudnak hajtani - a tesztek azonban ezt nem erősítik meg, ezért mi az extra MUL-t nem tartalmazó első számítási kapacitással (429, ill. 622 GFlops) dolgozunk.
Már az órajelek és az egységek számának alakulása is igen érdekes - lássuk, mit mondanak az ezekből származó, a táblázat alsó harmadában látható kapacitás-adatok:
  • Ahogy korábban is láttuk, a GF100 geometriai teljesítménye igen impresszív - a G92-nél 4-szer, az alacsonyabb core órajellel üzemelő GT200-nál pedig közel 5-ször magasabb. Ez a gyakorlatban kiugró különbséget nem fog jelenteni, de mindenesetre mostantól a frontend rész szűkössége nem lesz gátja az fps-ek növekedésének.
  • ALU-teljesítményben a megelőző generációk tripláját, ill. dupláját hozza a GTX480 - a duplázás a GTX280-nal szemben megfelelőnek tűnik, és tekintettel arra, hogy a GTX280 csak kb. 50%-kal gyorsabb a 9800GTX-nél, a G92-re való rátriplázás is rendben lehet.
  • Függetlenül attól, hogy milyen újításokat hozott az nVidia a textúrázók környékére, azt nyilván senki nem gondolja komolyan, hogy a textúrázási kapacitás csökkenésének nem lesz meg a szomorú következménye. A 3 kártya ezen a téren közel egyforma - ez 1-2 játéknál nagyon szépen ki is fog jönni.
  • Látván a mai játékokban egyre jobban elharapódzó post processing effekteket, nem meglepő, hogy a backend téren kissé gyengécske G92 után az nVidia a GT200-zal majdnem duplázta, majd a GF100-ban további 75%-kal növelte a ROP-ok kapacitását ...
  • ... viszont annál meglepőbb, hogy míg a GT200 memória-sávszélesség terén is közel rádupláz a G92-re, a GF100-as chip az órajelek alakulása miatt alig 25%-kal van előrébb, mint az elődje - ezt a különbséget pedig majdnem lenullázza a gDDR5 memóriák magasabb késleltetése. Bár azt tudjuk, hogy a GTX280 memória-sávszélessége rettentő overkill volt, a GTX480-ban az egységnyi ROP-kapacitásra jut sávszélesség közel harmadával csökkent - ez azért helyenként már megárthat a teljesítménynek.
Úgy gondoljuk, hogy az komolyabb elemzés nélkül is látszik, hogy a GTX480 közelében sem lesz annak, hogy a GTX280 sebességének a dupláját hozza - többnyire 50-60%-kal várjuk az új nVidia zászlóshajót gyorsabbnak, ami azt is jelenti, hogy a 9800GTX-nél mindössze 2.2-2.5-ször lesz erősebb - két generáció alatt, négyszerannyi tranzisztor felhasználásával ez bizony nem túl biztató.
A szokásos információk után akkor lássuk a számokat!
Tesztkörnyezet
A konfiguráció elemei
Alaplap Gigabyte P45-DS3R, FSB @400MHz
CPU és órajel Intel Q9550 @Q9770 (3.2GHz, 8x400)
CPU hűtés Cooler Master HyperTX2
Memória 4x1GB Geil Ultra DDR2-8500
Memória beállítások 1066MHz (2.66x400), 5-5-5-15, tRD: 8
Tápegység Corsair TX650
Operációs rendszer Windows 7 x64
VGA Core clock Shader clock Memory clock Driver
GeForce 9800GTX 1GB 675 MHz 1674 MHz 1100 MHz ForceWare 257.15 beta
GeForce GTX280 602 MHz 1296 MHz 1107 MHz ForceWare 257.15 beta
GeForce GTX480 700 MHz 1400 MHz 924 MHz ForceWare 257.15 beta
A kártyák terén a fentebb leírtakon túl csak annyit fűznénk hozzá, hogy miután az első két kártya nem DirectX 11-képes, a tesztben ezúttal csak a DirectX 10-es eredmények szerepelnek. Ahol van relevanciája a GTX480 DirectX 11-es teljesítményének, ott erre külön kitérünk.
A tesztben résztvevő játékok
  • Aliens VS Predator
  • Battlefield: Bad Company 2
  • Crysis Warhead
  • Far Cry 2
  • Just Cause 2
  • METRO 2033
  • STALKER: Call of Pripyat
  • Unigine Heaven 2.0
Oldalak:     
Fórum