Bevezető
Azon Olvasóink, akik régebb óta követik oldalunk ténykedését, tudják, hogy vannak kimondott kedvenc
témáink, amikhez időről-időre visszatérünk, lényegében amint a VGA-piac lehetőséget ad rá. Az egyik ilyen
a videokártya-generációk közötti differencia - előszeretettel vizsgálgatjuk, hogy a piac által elvárt
"kétszeres fps / új generáció" képlettel hogyan birkóznak meg a GPU-gyártók. Míg a Radeonok esetében az
utolsó két generáció kellően erős gép mellett 70-80%-os növekedést hozott (sőt, 4xAA vagy 8xAA mellett
a 4870 számos esetben a 3870 megduplázásának közelébe került), a GeForce termékek lényegesen gyengébben
muzsikáltak - még ha a G92-t a G80 "költséghatékonyításaként" fogjuk is fel, és nem rójuk meg az nVidiát
azért, mert a 9800GTX nemigen volt gyorsabb a 8800GTX-nél, a
GTX280 alig 50%-os előnye a 9800GTX-hez képest már semmiképpen nem
nevezhető egetrengető eredménynek. Ezek után érthető, hogy az új generációs Fermi chipet óriási várakozás
előzte meg - különös tekintettel arra, hogy a HD5000-es széria meglehetősen jól sikerült teljesítmény-szempontból.
A megjelenés előtti hónapokban elindult egy pletyka, miszerint a GTX480 a GTX285-nél játéktól függően
50-110%-kal gyorsabb, ami roppant biztatóan hangzott - sajnos az első hivatalos tesztek rögtön megmutatták,
hogy ezek a számok legjobb indulattal is légbőlkapott hülyeségnek minősíthetők. Jelen cikkünkkel szeretnénk
tiszta vizet önteni a pohárba - nem a GTX285-tel, hanem a GTX280-nal mérjük össze a GTX480-at, és így derítjük
ki, mennyire volt sikeres az nVidia generáció-váltása.
Felépítés, várható teljesítmény
A lenti táblázat korábbi cikkeinkből már minden bizonnyal ismerős, maximum annyi meglepő lehet benne,
hogy szerepel benne
a 9800GTX is. Ennek oka roppant egyszerű - miután a 9800GTX-ről a GTX480-ra ugorva kb. +50% teljesítményt
nyertünk, és a GTX280 -> GTX480 ugrásnál sem számítunk duplázásra, elkezdte fúrni az oldalunkat a kíváncsiság,
hogy vajon két generációnyi ugrás mekkora teljesítmény-növekedést hozott a GeForce vonalon. Így a tesztben nem
csak a GTX280 és a GTX480 viszonyára figyelünk majd, hanem a 9800GTX és a GTX480 közötti különbségre is.
VGA neve | 9800GTX | GTX280 | GTX480 | GTX480 vs 9800GTX |
GTX480 vs GTX280 |
Core órajel | 675 MHz | 602 MHz | 700 MHz | 3.7% | 16.3% |
Shader órajel | 1674 MHz | 1296 MHz | 1400 MHz | -19.6% | 8.0% |
Memória-órajel | 1100 MHz | 1107 MHz | 924 MHz | -19.0% | -19.8% |
Memória mennyisége | 512 / 1024 MB | 1024 MB | 1536 MB | ||
Geometriai egységek | 1 | 1 | 4 | 300% | 300% |
Scanline konverzió | 16 Pix/clock | 16 Pix/clock | 64 Pix/clock | 300% | 300% |
ALU egységek (SP-k) | 128 (scalar) | 240 (scalar) | 480 (scalar) | 275% | 100% |
Textúrázó egységek * | 64 | 80 | 60 | -6.7% | -33.3% |
ROP egységek | 16 | 32 | 48 | 200% | 50% |
Memóriabusz és típus ** | 256-bit gDDR3 | 512-bit gDDR3 | 384-bit gDDR5 | 200% | 50% |
Triangle setup | 675 Mtri/sec | 602 Mtri/sec | 2800 Mtri/sec | 314.8% | 365.1% |
Scanline konverzió | 10.8 GPix/sec | 38.8 GPix/sec | 44.8 GPix/sec | 314.8% | 365.1% |
Számítási teljesítmény *** | 429 / 643 GFlops | 622 / 933 GFlops | 1344 GFlops | 213.3% | 116.1% |
Texel fillrate, 32-bit (FP10) * | 43.2 GTex/sec | 48.2 GTex/sec | 42.0 GTex/sec | -2.9% | -14.8% |
Pixel fillrate | 10.8 GPix/sec | 19.3 GPix/sec | 33.6 GPix/sec | 211.1% | 74.1% |
Z-only fillrate | 43.2 GPix/sec | 77.1 GPix/sec | 134.4 GPix/sec | 211.1% | 74.1% |
Memória-sávszélesség ** | 70.4 GB/sec | 141.7 GB/sec | 177.4 GB/sec | 152.0% | 25.2% |
*: a GF100-as chip textúrázóinak memória-elérése jelentős
optimalizáción esett át, ezért a 60 textúrázó egység akár erősebb is lehet, mint a GT200 80 unitja - de ez
meglehetősen nehezen számszerűsíthető.
**: bár névlegesen egy 256-bit + gDDR5 kombináció egyforma órajel mellett ugyanakkora
sávszélességet biztosít, mint egy 512-bit + gDDR3, a gyakorlatban azt tapasztaltuk, hogy az előbbi megoldásnak
kb. 15%-kal magasabb órajelre van szüksége ahhoz, hogy megegyező teljesítményt nyújtson - ennek oka a gDDR5
memóriák magasabb késleltetése.
***: a G92 és a GT200 chipek jellemzője a rejtélyes extra MUL
utasítás, amelyet elvileg az ALU-k minden ciklusban végre tudnak hajtani - a tesztek azonban ezt nem erősítik
meg, ezért mi az extra MUL-t nem tartalmazó első számítási kapacitással (429, ill. 622 GFlops) dolgozunk.
Már az órajelek és az egységek számának alakulása is igen érdekes - lássuk, mit
mondanak az ezekből származó, a táblázat alsó harmadában látható kapacitás-adatok:
- Ahogy korábban is láttuk, a GF100 geometriai teljesítménye igen impresszív - a G92-nél 4-szer, az alacsonyabb core órajellel üzemelő GT200-nál pedig közel 5-ször magasabb. Ez a gyakorlatban kiugró különbséget nem fog jelenteni, de mindenesetre mostantól a frontend rész szűkössége nem lesz gátja az fps-ek növekedésének.
- ALU-teljesítményben a megelőző generációk tripláját, ill. dupláját hozza a GTX480 - a duplázás a GTX280-nal szemben megfelelőnek tűnik, és tekintettel arra, hogy a GTX280 csak kb. 50%-kal gyorsabb a 9800GTX-nél, a G92-re való rátriplázás is rendben lehet.
- Függetlenül attól, hogy milyen újításokat hozott az nVidia a textúrázók környékére, azt nyilván senki nem gondolja komolyan, hogy a textúrázási kapacitás csökkenésének nem lesz meg a szomorú következménye. A 3 kártya ezen a téren közel egyforma - ez 1-2 játéknál nagyon szépen ki is fog jönni.
- Látván a mai játékokban egyre jobban elharapódzó post processing effekteket, nem meglepő, hogy a backend téren kissé gyengécske G92 után az nVidia a GT200-zal majdnem duplázta, majd a GF100-ban további 75%-kal növelte a ROP-ok kapacitását ...
- ... viszont annál meglepőbb, hogy míg a GT200 memória-sávszélesség terén is közel rádupláz a G92-re, a GF100-as chip az órajelek alakulása miatt alig 25%-kal van előrébb, mint az elődje - ezt a különbséget pedig majdnem lenullázza a gDDR5 memóriák magasabb késleltetése. Bár azt tudjuk, hogy a GTX280 memória-sávszélessége rettentő overkill volt, a GTX480-ban az egységnyi ROP-kapacitásra jut sávszélesség közel harmadával csökkent - ez azért helyenként már megárthat a teljesítménynek.
Úgy gondoljuk, hogy az komolyabb elemzés nélkül is látszik, hogy a GTX480 közelében
sem lesz annak, hogy a GTX280 sebességének a dupláját hozza - többnyire 50-60%-kal várjuk az új nVidia zászlóshajót
gyorsabbnak, ami azt is jelenti, hogy a 9800GTX-nél mindössze 2.2-2.5-ször lesz erősebb - két generáció alatt,
négyszerannyi tranzisztor felhasználásával ez bizony nem túl biztató.
A szokásos információk után akkor lássuk a számokat!
Tesztkörnyezet
A konfiguráció elemei | |
Alaplap | Gigabyte P45-DS3R, FSB @400MHz |
CPU és órajel | Intel Q9550 @Q9770 (3.2GHz, 8x400) |
CPU hűtés | Cooler Master HyperTX2 |
Memória | 4x1GB Geil Ultra DDR2-8500 |
Memória beállítások | 1066MHz (2.66x400), 5-5-5-15, tRD: 8 |
Tápegység | Corsair TX650 |
Operációs rendszer | Windows 7 x64 |
VGA | Core clock | Shader clock | Memory clock | Driver |
GeForce 9800GTX 1GB | 675 MHz | 1674 MHz | 1100 MHz | ForceWare 257.15 beta |
GeForce GTX280 | 602 MHz | 1296 MHz | 1107 MHz | ForceWare 257.15 beta |
GeForce GTX480 | 700 MHz | 1400 MHz | 924 MHz | ForceWare 257.15 beta |
A kártyák terén a fentebb leírtakon túl csak annyit fűznénk hozzá, hogy miután
az első két kártya nem DirectX 11-képes, a tesztben ezúttal csak a DirectX 10-es eredmények szerepelnek. Ahol
van relevanciája a GTX480 DirectX 11-es teljesítményének, ott erre külön kitérünk.
A tesztben résztvevő játékok
- Aliens VS Predator
- Battlefield: Bad Company 2
- Crysis Warhead
- Far Cry 2
- Just Cause 2
- METRO 2033
- STALKER: Call of Pripyat
- Unigine Heaven 2.0