Bevezető
Amikor 2009. szeptemberében az AMD megjelentette a HD5800-as szériát, az nVidia meglehetősen komoly
bajba került - az új VGA-k sebessége mintegy 70-80%-kal múlta felül az előző generációt, és a relatíve
kis méretű (334 mm2-es), 40nm-en gyártott GPU-k gyártási költsége is jól kézben tartható volt, ezért az AMD az új kártyákat
szinte tetszés szerint árazhatta. Ezzel a teljesítménnyel szemben az nVidia egyedül a GTX295-öt tudta
felmutatni, amely bár sebességben felülmúlta a HD5870-et, minden egyéb tulajdonságában mögötte maradt,
különös tekintettel a gyártási költségre, amely olyan magas volt, hogy az itthon bőven 100e FT felett kapható
két GPUs szörnyet alig érte meg gyártani és forgalmazni. Ezek után már csak hab volt a tortán, hogy a
HD5800-asok teljes DirectX 11-kompatibilitással érkeztek, amire az nVidiának szintén nem volt válasza.
A zöld oldal ellen-kártyáira igen sokat kellett várni - a számos újítást tartalmazó, viszont igencsak nagy
méretű (529 mm2) GF100-as chip igazi kálváriát járt végig, amíg olyan állapotba került, hogy piacra
dobható mennyiségben gyártani lehessen. 2010. március végén aztán végre megjelent az első két kártya
a GTX480 és a GTX470 személyében - a fogadtatást pedig legjobb indulattal is úgy lehet leírni, hogy
mérsékelten volt lelkes. Nagy publicitást kapott a kártyák irdatlan fogyasztása és melegedése (a kettő
természetesen szorosan összefügg), és a tesztek tanúsága szerint a teljesítményük nem volt annyira kiemelkedő,
hogy feledtetni tudja a fenti hiányosságokat, valamint a korántsem visszafogott árat.
Nekünk az elemzések és a teszteredmények forgatagában végig az volt az érzésünk,
hogy méltatlanul elsikkad a GF100 chip egyik óriási vívmánya - az összes eddigi GPU-ban teljesen monolitikus
frontend részt (command processor - setup - geometria) feldarabolták, és a command processoron kívül
mindegyik egységet multiplikáltak - GPC-nként (Graphics Processing Cluster) van belőlük 1-1 adag, és a GF100-ban összesen 4 ilyen GPC
található. Ennek előnyeit talán nem szükséges ecsetelni - a GPC-k számának növelésével növekszik az előfeldolgozási
és a geometriai teljesítmény is, azaz a chip teljesítménye egyenletesen tud javulni, ahelyett, hogy
a frontend rész szűkössége egyre jobban korlátozná a gyorsulás mértékét. Persze van hátrány is -
az egyik az, hogy ez a mutatvány minden bizonnyal több százmillió tranzisztort emésztett fel, és ez
bizony sem fogyasztás, sem előállítási költség terén nem tesz jót a chipnek. A másik hátrány sokkal
inkább orvosolható - egy új architektúra mindig némi csuklással indul driverek terén, ami viszont azt
is jelenti, hogy a kezdeti gyengébb teljesítmény javítására lehet még bőven potenciál, a hardver
megváltoztatása nélkül is.
A fentiek tükrében egyrészt természetesen kíváncsian vártuk, mit teljesítenek
a GF100 alapú VGA-k a mi tesztlaborunkban - másrészt viszont azért is érdekesek ezek a tesztek 2.5 hónappal
a kártyák megjelenése után, mert két olyan driver-revízió is felbukkant azóta, amely kézzelfogható javulást
hoz a GTX400-asok teljesítményében - az első már WHQL státuszú, a második pedig a nálunk is
tesztelt 257.15 beta.
Ezen változásoknak köszönhetően úgy gondoljuk, hogy "helyreállt a rend" a kártyák
besorolása tekintetében - míg a megjelenés környékén inkább a GTX480 versenyzett az AMD HD5870-esével,
mostanra már a GTX470 is összevethető az AMD egy-GPU-s csúcskártyájával. Ez pedig azért jó, mert a GTX480 a
maga korlátozatlan, vadállati mivoltában nem igazán hasonlít a lényegesen visszafogottabb
HD5870-re - a GTX470 karakterében sokkal inkább azonos kategória a Radeonnal, és ráadásul árban is
közel azonos szinten vannak. Ezért első GTX400-as cikkünkben a GTX470 és a HD5870 viszonyát elemezzük ki,
a GTX480-ra pedig egy GF100-fókuszú cikk keretében térünk ki.
Első benyomások, fogyasztás
Míg a HD5870-nél újdonság-számba ment, a GTX470-ként mintegy elvárásként merült fel a jó minőség és
az üzembe helyezés probléma-mentessége. Kellően nagy ház esetén egyik VGA sem jelent gondot, de el tudunk
képzelni olyan szituációt, amikor a GTX470 24cm-es hossza előnyt jelent a HD5870 28cm-ével szemben - viszont
HDD-t egyik kártya mögé sem javaslunk berakni, mert mindkét esetben fontos, hogy a bemenő légáram
útja zavartalan legyen.
Röviden, a GTX470 gond nélkül teljesítette egy felsőkategóriás nVidia VGA-val szemben támasztott
elvárásainkat - menjünk tovább! Nézzük a fogyasztást:
Power consumption - Crysis Warhead DX10 Max (displayed post-flash)
Idle | GTX470 | ||||||||||||||||||||||| 117 |
HD5870 | |||||||||||||||||||| 102 | |
Load | GTX470 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 299 |
HD5870 | |||||||||||||||||||||||||||||||||||||||||||||||||||| 259 |
A HD5870 kitűnő idle fogyasztásával a GTX470 nem tud versenyezni, annak
ellenére, hogy a HD5870 157MHz-ével szemben a core órajel a GeForce-on 50MHz-re van csökkentve. Persze,
a 117W-os érték egyáltalán nem rossz - egyszerűen csak az ellenfél ebben ügyesebb.
A terhelt fogyasztás kapcsán már szívtuk egy kicsit a fogunkat. Várható volt, hogy az óriási GF100
chip az alacsonyabb órajelek ellenére éhesebb lesz, mint az RV870, de a +40W-ot azért egy kicsit sokalljuk,
különösen, hogy a méréshez használt Crysis Warheadben a HD5870 jelentősen gyorsabb. Persze ebben a
kategóriában nem a fogyasztás a legelső szempont, de azért egy szolid feketepontot bevésünk a GTX470-nek.
Hőmérséklet, melegedés, zaj
Lássuk az idle és a terhelt hőmérsékleteket:
Temperature - Crysis Warhead DX10 Max (displayed post-flash)
Idle | GTX470 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||| 55 |
HD5870 | |||||||||||||||||||||||||||||||||||||||||||| 44 | |
Load | GTX470 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 92 |
HD5870 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 84 |
A HD5870 kártya egyik nagy erőssége, hogy alacsony zaj mellett is épeszű
hőmérsékleten tudja tartani a terhelt GPU-t - a 84 fokos hőmérséklet mellett a hűtés hangja jól hallható, de
egyáltalán nem zavaró. A GTX470 határozottan hangosabban, de még mindig nem zavaróan produkálja a 92
fokot - ez a hőmérséklet már kissé magas az ízlésünkhöz képest, ezért kicsit körülnéztünk, milyen hatással
jár a melegebb GPU az egész számítógépre nézve. Legnagyobb meglepetésünkre sem a CPU, sem az alaplap,
sem a HDD hőmérséklete nem volt magasabb, mint a HD5870 tesztek alatt, és a gép oldalán sem éreztük sehol,
hogy melegednének a dolgok. A jelenséget azonnal megértettük, amint megvizsgáltuk a GTX470 hátsó részét -
a kártya úgy önti ki a házból a meleg levegőt, mint egy ipari turbina. Ezért fontos, hogy biztosítva legyen
a házba a bemenő légáramlat, ill. hogy a gép hátuljánál legyen némi szabad tér - viszont ha ezek
a feltételek teljesülnek, akkor a GTX470 hűtése ellen különösebb kifogásunk nem lehet. A HD5870 megoldása
jobb, de ezt a különbséget csak abban az esetben érezzük jelentősnek, ha fontos a halk üzem - akkor
pedig ebben a kategóriában úgyis érdemes megfontolni a vízhűtést.
Felépítés, várható teljesítmény
Mivel a GF100 architektúráját már rengeteg oldal alaposan bemutatta, mi inkább
azzal foglalkozunk, hogy mi a várható hatása a kétségkívül sajátos felépítésnek a játékokban - bár eltérő
architektúrák esetén kevésbé beszédes a kapacitások szerinti összevetés, a GTX470 és a HD5870 viszonylatában
nagyon érdekesek a számok, ezért érdemes egy pillantást vetni az alábbi táblázatra:
VGA neve | GTX470 | HD5870 | HD5870 előny |
Core órajel | 607 MHz | 850 MHz | |
Shader órajel | 1214 MHz | 850 MHz | |
Memória-órajel | 837 MHz | 1200 MHz | |
Memória mennyisége | 1280 MB | 1024 MB | |
Tranzisztorok száma | 3 milliárd | 2.15 milliárd | |
Gyártástechnológia | 40nm (TSMC) | 40nm (TSMC) | |
Geometriai egységek | 4 | 1 | |
Scanline konverzió | 64 Pix/clock | 32 Pix/clock | |
ALU egységek ("SP"-k) | 448 (scalar) | 1600 (5-way superscalar) | |
Textúrázó egységek | 56 | 80 | |
ROP egységek | 40 | 32 | |
Memóriabusz és típus | 320-bit gDDR5 | 256-bit gDDR5 | |
Triangle setup | 2428 Mtri / sec | 850 Mtri / sec | -185% |
Scanline konverzió | 38.8 GPix / sec | 27.2 GPix / sec | -43% |
Számítási teljesítmény | 1088 GFlops | 2720 GFlops | 150% |
Texel fillrate, 32-bit (FP10) | 34.0 GTex / sec | 68.0 GTex / sec | 100% |
Pixel fillrate | 24.3 GPix / sec | 27.2 GPix / sec | 12% |
Z-only fillrate | 97.1 GPix / sec | 108.8 GPix / sec | 12% |
Memória-sávszélesség | 133.9 GB / sec | 153.6 GB / sec | 15% |
Az első dolog, ami szinte ordít a táblázatról, hogy míg a GTX470
geometriában igen erős, a HD5870 esetében az ALU és TEX vonalon van a hangsúly. A shader kapacitás
direkt összevetése ugyan az eltérő ALU-architektúra miatt nem igazán releváns (bár az azonos kategóriában
versenyző Radeon és GeForce kártyák között eddig inkább kétszeres különbség volt az előbbiek javára, nem
2.5-szeres), a textúrázási kapacitásban mutatott ilyen fokú Radeon-előny meglehetősen sokkoló. Az nVidia
a GF100-zal praktikusan 180 fokot fordult az ALU:TEX arány kérdésében - míg a G92 esetében az arány
5:1 volt, a GT200 esetében pedig 6.5:1, a GF100-as chipben 16:1-nél tartunk, ami már majdnem eléri
az R600 alapú architektúrák 20:1-es arányát. Igen ám, csak míg az 5-utas szuperskalár ALU-k kihasználtsága
messze van az ideálistól, a GF100 skalár ALU-i sokkal magasabb hatékonysággal dolgoznak, ezért a
gyakorlatban még nagyobb a GF100-ban az ALU-dominancia. Ekkora változást nyilván nem lehet büntetlenül
meglépni - a textúrázási képességekre ma is rengeteg játék épít legalább annyira erősen, mint a
számítási kapacitásra, és hiába az agyonoptimalizált cache-elés a GF100-ban, a tesztekben látni fogjuk,
hogy a kártya egyes esetekben súlyosan orra bukik. Lesz viszont olyan eset is, ahol a megnövelt
geometriai kapacitás jelent majd előnyt a GeForce-nak - az összesítésből kiderül, hogy
melyik filozófia milyen eredményességgel működik.
A backend oldalt szolid Radeon-fölény jellemzi - és bár nem látványos, de itt lelhető fel a GTX470
másik előnye a geometrián túl. Míg a ROP-onkénti memória-sávszélesség majdnem egyforma két versenyzőnk
esetében, a HD5870 duplaannyi textúrázója határozottan nagyobb terhet rak a memóriabuszra, és végső soron
azokban az esetekben, ahol a HD5870-et már érezhetően korlátozza az a szolid 150 GB/sec, ott a GTX470-nek
van esélye lefaragni a hátrányból.
Egy szó mint száz, a két VGA versenyében várható eredmény nagyban függ
a játékok felépítésétől. A konvencionálisabb, textúra-intenzív motorok a HD5870-nek kedveznek, itt akár
nagyobb különbség is előfordulhat - a GTX470 ezzel szemben akkor lesz elemében, ha a rajta futó 3D
motorban a geometria felé billen az egyensúly. Lássuk!
Tesztkörnyezet
A konfiguráció elemei | |
Alaplap | Gigabyte P45-DS3R, FSB @400MHz |
CPU és órajel | Intel Q9550 @Q9770 (3.2GHz, 8x400) |
CPU hűtés | Cooler Master HyperTX2 |
Memória | 4x1GB Geil Ultra DDR2-8500 |
Memória beállítások | 1066MHz (2.66x400), 5-5-5-15, tRD: 8 |
Tápegység | Corsair TX650 |
Operációs rendszer | Windows 7 x64 |
VGA | Core clock | Shader clock | Memory clock | Driver |
GeForce GTX470 | 607 MHz | 1214 MHz | 837 MHz | ForceWare 257.15 beta |
Radeon HD5870 | 850 MHz | 1200 MHz | Catalyst 10.5 WHQL |
A HD5870-et az elérhető legfrissebb WHQL driverrel teszteltük, a GTX470 esetében
viszont a bevezetőben említettek miatt kivételt tettünk - a 257.15 beta driver
tesztünk alapján igencsak belopta magát a szívünkbe.
A tesztben résztvevő játékok
- Aliens VS Predator
- Battlefield: Bad Company 2
- Crysis Warhead
- Far Cry 2
- Just Cause 2
- METRO 2033
- STALKER: Call of Pripyat
- Unigine Heaven 2.0