Bevezető
Akik a leginkább kitűnő ár/teljesítmény viszonyokkal jellemezhető klasszikus középkategóriás
VGA-kkal "nőttek fel" (ld. 6600GT, 7600GT), azok minden bizonnyal hozzánk hasonlóan némi melankóliával
vagy morcosan szemlélték az utóbbi években ezt a szegmenst. Az AMD/ATI valamilyen okból sosem gyártott
célzottan chipet ebbe a kategóriába, az nVidia pedig a botrányos indulóárú 8600GT után előállt
ugyan egy jól sikerült 9600GT-vel, csak ott az volt a bökkenő, hogy a 9000-es széria nem volt előrelépés
teljesítmény terén a 8000-eshez képest, ezért a 9600GT relatív jó szereplése a világmegváltástól
alaposan elmaradt. Azóta pedig jobbára semmi érdemleges nem érkezett ebbe a szegmensbe:
- az AMD felülről a nagyobb chipek alapos csonkolásával (HD4830, HD5830), alulról pedig felturbózott, de nem elég erős alsó-közép kártyákkal (4670, 5770) próbálkozott, átütő siker nélkül;
- az nVidia pedig a GT200 chipből nem is készített kisebb verziót, hanem a G92-es chippel "szúrta ki" a középkategóriára éhes vásárlók szemét.
Nem csoda tehát, hogy az egész piac élénk érdeklődéssel várta a mérsékelten
jól sikerült GF100 chip "slankított" változatát, a GF104-et, és a rá épülő két VGA-variánst, a GTX460
két különböző verzióját. Mi is alaposan körbe fogjuk járni ezeket a kártyákat - először a 768MB-os
változatot vizsgáljuk meg vásárlói szempontból, majd sort kerítünk az 1GB-os változatra is, aztán alaposan
megvizsgáljuk a GF104 chipet, és szokásunktól eltérően még overclock teszteket is fogunk futtatni - megvizsgálandó
az nVidia azon állítását, hogy a GTX460-ak kitűnő túlhajtási képességekkel rendelkeznek.
Lássuk akkor, mire számíthat egy leendő GTX460-768M vásárló, aki nem tud
dönteni az új nVidia kártya és a HD5830 között!
Első benyomások, fogyasztás
Mivel az nVidia nem nagyon erőltette a GTX460-asok referencia-változatát, szinte minden gyártó
más hűtéssel szállítja a kártyát: a referencia-modell középső ventillátora mellett felbukkant egy, a nagyobb
GTX-ekre jellemző blower típusú megoldás, sőt, a Gigabyte műhelyéből egy kétventillátoros változat került ki.
A nálunk járt Gainward kártya a hűtésben közelebb jár a referencia-modellhez (bár nem egyezik meg vele), viszont a gyártó
a PCB terén is újított - a referencia-modellnél kb. 3 centiméterrel rövidebb a kártya, és így a HD5750-nel
összevethetőek a méretei. Miután a két 6-pines tápcsatlakozó a kártya oldalán helyezkedik el, a Gainward
GTX460 a masszív felépítésével az egyik legjobban szerelhető kártya, amivel valaha találkoztunk, és kisebb
házak tulajdonosainak is jó szívvel tudjuk ajánlani.
A GTX460-at az első hivatalos WHQL-driverével teszteltük, és roppant pozitívak
a tapasztalataink - semmi akadás, semmi fagyás, minden simán ment. Ügyfélélmény terén tehát jeles, akárcsak
a HD5830, de a kisebb méretből fakadó előnyök miatt a GTX460 nyeri az első fordulót.
Nézzük a fogyasztási adatokat:
Power consumption - Crysis Warhead DX10 Max (displayed post-flash)
Idle | GTX280 | ||||||||||||||||||||||| 115 |
HD5830 | |||||||||||||||||||| 102 | |
GTX460-768M | |||||||||||||||||| 91 | |
Load | GTX280 | |||||||||||||||||||||||||||||||||||||||||||||||||||||| 268 |
HD5830 | ||||||||||||||||||||||||||||||||||||||||||||| 223 | |
GTX460-768M | ||||||||||||||||||||||||||||||||||||||||||| 215 |
Terhelés alatt minimális a különbség a két fő versenyző között - nyilván itt tesztünk harmadik
szereplője, az 55nm-en készült GTX280 nincs versenyben. Idle fogyasztás terén mindkét kártya kitűnő, de
a GTX460 külön említést érdemel, mert még a HD5750-nél is kevesebb áramot vesz fel terhelés nélkül - ráadásul,
ha terhelés nélkül, de a 3D-s órajelekkel megy, akkor sem megy a fogyasztása 120W fölé, ami a Radeon kártyákra
éppenséggel nem jellemző. Mindenki döntse el maga, elég nagy-e a különbség a két kártya között, hogy
a GTX460-nak +1 pontot bevéssünk - nálunk ez a menet döntetlen.
Hőmérséklet, melegedés, zaj
Lássuk az idle és a terhelt hőmérsékleteket:
Temperature - Crysis Warhead DX10 Max (displayed post-flash)
Idle | GTX280 | |||||||||||||||||||||||||||||||||||||||||||||| 46 |
HD5830 | ||||||||||||||||||||||||||||||||||||||||||||||| 47 | |
GTX460-768M | |||||||||||||||||||||||||||||||||||||| 38 | |
Load | GTX280 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 81 |
HD5830 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 73 | |
GTX460-768M | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 76 |
Érdekes az ábra hőmérsékletek terén. A GTX460 idle hőmérséklete igen alacsony, miután nálunk a tesztek
minimum 24-25, de nyáron inkább 28-29 fokos szobában készülnek - a 46-47 fok már remek eredmény, ehhez
képest a Gainward GTX460 közel 10 fokkal hűvösebb, mindamellett a másik két kártyához hasonlóan teljesen
hangtalan. Terhelt hőmérsékletek terén viszont meglepő módon a HD5830 nyer - ráadásul, bár hangerőben
nincs különbség a két kártya között, a HD5830 szélzaján túl a GTX460-nál némi sivító / nyüszítő felhang
is hallatszik, ezért hűtés terén egyértelműen a Sapphire HD5830-at tartjuk jobbnak. A GTX280, bár melegebb
és hangosabb a másik két kártyánál, még mindig bőven az elvárt szinten belül teljesít.
A GF104 chipről
Eddig sem volt szokásunk, és ezután sem tervezünk hosszas ismertetőket írni a GPU-k architektúrájáról
(az Interneten számos forrásban fellelhetők), viszont pár szóban azért emlékezzünk meg, kicsoda is ez
a GF104:
- A GF100-as chip rendelkezett 4 GPC-vel (Graphics Processing Cluster) és 6 ROP blokkal - a GF104-ban maradt 2 GPC és 4 ROP blokk;
- A GPC-ken belül több kisebb-nagyobb változást eszközölt az nVidia: továbbra is 4 ALU/TEX blokk van egy GPC-ben, viszont a blokkok duplaannyi SFU-t (Special Function Unit) és textúrázót, ill. 50%-kal több ALU-t tartalmaznak;
- A ROP blokkok szerkezete változatlan, egyenként 8 ROP tartozik hozzájuk, és egy 64-bites crossbar memóriavezérlőhöz kapcsolódnak;
- A GTX460-as kártyák a GF104 csonkolt változatára épülnek - az 1GB-os kártyából egy ALU/TEX blokk hiányzik, a 768MB-os változat pedig ezen felül egy ROP blokkot is kénytelen nélkülözni.
A további részletek a következő fejezetben találhatók, a konkurens VGA-k adataival együtt.
Felépítés, várható teljesítmény
Jelen cikk keretein belül nem végzünk mélyelemzést a GF104-es chip kapcsán,
de egy gyors pillantást azért vetünk a három versenyző kapacitásaira:
VGA neve | GTX280 | HD5830 | GTX460 768M | GTX460 vs GTX280 |
GTX460 vs HD5830 |
Core órajel | 602 MHz | 800 MHz | 675 MHz | ||
Shader órajel | 1296 MHz | 800 MHz | 1350 MHz | ||
Memória-órajel | 1107 MHz | 1000 MHz | 900 MHz | ||
Memória mennyisége | 1024 MB | 1024 MB | 768 MB | ||
Geometriai egységek | 1 | 1 | 2 | ||
Scanline konverzió | 16 Pix/clock | 32 Pix/clock | 32 Pix/clock | ||
ALU egységek (SP-k) | 240 (scalar) | 1120 (5-way superscalar) |
224/336 (scalar/ superscalar) |
||
Textúrázó egységek | 56 | 80 | 56 | ||
ROP egységek | 32 | 16 | 24 | ||
Memóriabusz és típus | 512-bit gDDR3 | 256-bit gDDR5 | 192-bit gDDR5 | ||
Triangle setup | 602 Mtri/sec | 800 Mtri/sec | 1350 Mtri/sec | 125% | 68.8% |
Scanline konverzió | 9.6 GPix/sec | 25.6 GPix/sec | 21.6 GPix/sec | 125% | -18.5% |
Számítási teljesítmény * | 622/933 GFlops | 1792 GFlops | 605/907 GFlops | ||
Texel fillrate, 32-bit (FP10) | 48.2 GTex/sec | 44.8 GTex/sec | 37.8 GTex/sec | -27.5% | -18.5% |
Pixel fillrate | 19.3 GPix/sec | 12.8 GPix/sec | 16.2 GPix/sec | -19.1% | 26.6% |
Z-only fillrate | 77.1 GPix/sec | 51.2 GPix/sec | 86.4 GPix/sec | -19.1% | 26.6% |
Memória-sávszélesség ** | 141.7 GB/sec | 128.0 GB/sec | 86.4 GB/sec | -64.0% | -48.1% |
*: a három chip számítási kapacitása nem hasonlítható közvetlenül össze,
mert eltérő felépítésűek az ALU blokkok - bővebben ld. lejjebb.
**: bár névlegesen egy 256-bit + gDDR5 kombináció egyforma órajel mellett ugyanakkora
sávszélességet biztosít, mint egy 512-bit + gDDR3, a gyakorlatban azt tapasztaltuk, hogy az előbbi megoldásnak
kb. 15%-kal magasabb órajelre van szüksége ahhoz, hogy megegyező teljesítményt nyújtson - ennek oka a gDDR5
memóriák magasabb késleltetése.
Szokásunkkal ellentétben induljunk a chipek hátsó vége felől:
- Memória-sávszélesség terén mind a GTX280-nak, mind a HD5830-nak lényegesen nagyobb a kapacitása, mint a kisebbik GTX460-nak - ez azonban csalós, mert mindkét kártya lényegesen szélesebb "csővel" rendelkezik a memória felé, mint az szükséges lenne. A GTX460 memória általi limitációjára egy későbbi cikkben visszatérünk, egyelőre élünk azzal a feltételezéssel, hogy ettől a tényezőtől a másik két kártya csak minimális előnyhöz jut.
- ROP-ok terén a GTX280 20%-kal erősebb, a HD5830 pedig 25%-kal gyengébb főszereplőnknél - ezek a különbségek átlagosan 4-6%-nyi differenciát jelentenek önmagukban.
- A GTX460 leggyengébb pontja a textúrázás - a GTX280 a több egység, a HD5830 pedig a magasabb órajel miatt jobb ezen a téren. Itt a ROP-okból származó előny egy része elveszik az 5830-assal szemben, a GTX280-nak pedig ez a faktor további 6-7%-nyi fölényt jelenthet.
- A chip elején részben fordított a helyzet, mint a ROP-oknál - egy korábbi tesztünkben már megállapítottuk, hogy a GTX280-at erősen limitálja a frontend rész, itt egyértelműen a GTX460 a jobb, a HD5830 viszont a magasabb órajel és a Cypress chip megduplázott scanline konverziós tudása miatt azokban az esetekben előnyben lehet az új nVidia kártyával szemben, ahol a háromszögek pixelesítése a szűk keresztmetszet. Ahol viszont a sok-sok háromszög vizsgálata a leghangsúlyosabb (ld. Unigine Heaven extrém tesszeláció), ott a GTX460 az úr.
Kimaradtak volna az ALU-k? Nem véletlenül. Míg az AMD az R600-as chip megjelenése
óta ugyanazt a struktúrát használja kisebb optimalizációk mellett, az nVidia minden új generációban csavar
egy kicsit az ALU/TEX tömbök felépítésén. A GF104-ben egy igazán váratlan fordulatot hoztak - míg a G80, a G92,
a GT200 és a GF100 chipek tisztán skalár ALU-kat tartalmaztak, amelyeknek a vezérlése blokkonként direkt módon történt,
a GF104 chip lépett egy aprót a Radeonok szuperskalár feldolgozóinak irányába. A GTX460 336 ALU-ja 7 blokkba van
beosztva (a teljes értékű GF104 chip 8 blokkban 384 ALU-t tartalmaz), azaz egy blokkban 48 ALU lakik. A 48 egység
további 3 csoportra osztható, csoportonként 16 ALU-val, viszont a 3 csoportra csak két ütemező egység jut, ezért
elvi síkon a blokk ALU-inak 1/3-a pihen. A gyakorlatban ez azért nincs így, mert a chip képes az AMD által már régóta
kihasznált ILP (Instruction Level Parallelism, utasítás szintű párhuzamosítás) alkalmazására: ha a shader kódban
egy "a" utasítást egy olyan "b" utasítás követ, amely operandusa(i) nem függ(nek) "a" utasítás
eredményétől, akkor "a" és "b" utasítás párhuzamosan is végrehajtható - ezért az ütemező "a" utasítást az egyik
16-os blokkra osztja, "b" utasítást pedig egy másikra, párhuzamosan. Tehát akkor nincs gond, a blokk mind a
48 ALU-ja kihasználható...
... vagy mégsem? Sajnos nem. Az AMD számra minden bizonnyal igen fájdalmas lecke volt az R600 indulásakor,
hogy az ILP a legtöbb 3D alkalmazásban igen alacsony szinten használható ki - ezért hiába rendelkeznek
a Radeonok rendszerint duplaakkora számítási kapacitással, mint a konkurens GeForce-ok, még a kifejezetten
számítás-orientált tesztekben sem igazán tud érvényesülni az előnyük. Miután a szuperskalár végrehajtók
kihasználására az R600-nak és utódainak az ILP-n túl számos egyéb eszköz áll rendelkezésére, szemben a GF104-gyel,
az a véleményünk, hogy a GF104 effektív ALU-sebesség terén lényegesen közelebb áll a 224 egységhez (ill. a teljes
chip a 256-hoz), mint a reklámozott, és nagyon is valós tranzisztorokat felhasználó 336-hoz (384-hez). Erre a
kérdésre a GF104 elemzésével kapcsolatos cikkeinkben még visszatérünk, most lássuk a szokásos környezeti adatokat,
aztán pedig a tesztek eredményeit!
Tesztkörnyezet
A konfiguráció elemei | |
Alaplap | Gigabyte P45-DS3R, FSB @400MHz |
CPU és órajel | Intel Q9550 @Q9770 (3.2GHz, 8x400) |
CPU hűtés | Cooler Master HyperTX2 |
Memória | 4x1GB Geil Ultra DDR2-8500 |
Memória beállítások | 1066MHz (2.66x400), 5-5-5-15, tRD: 8 |
Tápegység | Corsair TX650 |
Operációs rendszer | Windows 7 x64 |
VGA | Core clock | Shader clock | Memory clock | Driver |
GeForce GTX280 | 602 MHz | 1296 MHz | 1107 MHz | ForceWare 257.15 beta |
Radeon HD5830 | 800 MHz | 1000 MHz | Catalyst 10.7 WHQL | |
GeForce GTX460 768MB | 675 MHz | 1350 MHz | 900 MHz | ForceWare 258.96 WHQL |
A konfiguráció sok kommentárt nem igényel - a GTX460-at és a HD5830-at a legfrissebb
WHQL minősítésű driverrel teszteltük, a GTX280-at pedig az eggyel korábbi verziójú bétával - mivel a
ForceWare 256-os szériában az nVidia nem foglalkozik a GT200-as chipek teljesítményének javításával,
a GTX280-nak nem fog hátránya származni a korábbi driver használatából.
A tesztben résztvevő játékok
- Aliens VS Predator
- Battlefield: Bad Company 2
- Crysis Warhead
- Far Cry 2
- Just Cause 2
- METRO 2033
- STALKER: Call of Pripyat
- Unigine Heaven 2.0