Bemutatkozik a GTX460

Összehasonlító teszt - 2010/08/21

Oldalak:     
Fórum
Bevezető
Akik a leginkább kitűnő ár/teljesítmény viszonyokkal jellemezhető klasszikus középkategóriás VGA-kkal "nőttek fel" (ld. 6600GT, 7600GT), azok minden bizonnyal hozzánk hasonlóan némi melankóliával vagy morcosan szemlélték az utóbbi években ezt a szegmenst. Az AMD/ATI valamilyen okból sosem gyártott célzottan chipet ebbe a kategóriába, az nVidia pedig a botrányos indulóárú 8600GT után előállt ugyan egy jól sikerült 9600GT-vel, csak ott az volt a bökkenő, hogy a 9000-es széria nem volt előrelépés teljesítmény terén a 8000-eshez képest, ezért a 9600GT relatív jó szereplése a világmegváltástól alaposan elmaradt. Azóta pedig jobbára semmi érdemleges nem érkezett ebbe a szegmensbe:
  • az AMD felülről a nagyobb chipek alapos csonkolásával (HD4830, HD5830), alulról pedig felturbózott, de nem elég erős alsó-közép kártyákkal (4670, 5770) próbálkozott, átütő siker nélkül;
  • az nVidia pedig a GT200 chipből nem is készített kisebb verziót, hanem a G92-es chippel "szúrta ki" a középkategóriára éhes vásárlók szemét.
Nem csoda tehát, hogy az egész piac élénk érdeklődéssel várta a mérsékelten jól sikerült GF100 chip "slankított" változatát, a GF104-et, és a rá épülő két VGA-variánst, a GTX460 két különböző verzióját. Mi is alaposan körbe fogjuk járni ezeket a kártyákat - először a 768MB-os változatot vizsgáljuk meg vásárlói szempontból, majd sort kerítünk az 1GB-os változatra is, aztán alaposan megvizsgáljuk a GF104 chipet, és szokásunktól eltérően még overclock teszteket is fogunk futtatni - megvizsgálandó az nVidia azon állítását, hogy a GTX460-ak kitűnő túlhajtási képességekkel rendelkeznek.
Lássuk akkor, mire számíthat egy leendő GTX460-768M vásárló, aki nem tud dönteni az új nVidia kártya és a HD5830 között!

Első benyomások, fogyasztás
Mivel az nVidia nem nagyon erőltette a GTX460-asok referencia-változatát, szinte minden gyártó más hűtéssel szállítja a kártyát: a referencia-modell középső ventillátora mellett felbukkant egy, a nagyobb GTX-ekre jellemző blower típusú megoldás, sőt, a Gigabyte műhelyéből egy kétventillátoros változat került ki. A nálunk járt Gainward kártya a hűtésben közelebb jár a referencia-modellhez (bár nem egyezik meg vele), viszont a gyártó a PCB terén is újított - a referencia-modellnél kb. 3 centiméterrel rövidebb a kártya, és így a HD5750-nel összevethetőek a méretei. Miután a két 6-pines tápcsatlakozó a kártya oldalán helyezkedik el, a Gainward GTX460 a masszív felépítésével az egyik legjobban szerelhető kártya, amivel valaha találkoztunk, és kisebb házak tulajdonosainak is jó szívvel tudjuk ajánlani.
A GTX460-at az első hivatalos WHQL-driverével teszteltük, és roppant pozitívak a tapasztalataink - semmi akadás, semmi fagyás, minden simán ment. Ügyfélélmény terén tehát jeles, akárcsak a HD5830, de a kisebb méretből fakadó előnyök miatt a GTX460 nyeri az első fordulót.
Nézzük a fogyasztási adatokat:

Power consumption - Crysis Warhead DX10 Max (displayed post-flash)

Idle GTX280||||||||||||||||||||||| 115
HD5830|||||||||||||||||||| 102
GTX460-768M|||||||||||||||||| 91
Load GTX280|||||||||||||||||||||||||||||||||||||||||||||||||||||| 268
HD5830||||||||||||||||||||||||||||||||||||||||||||| 223
GTX460-768M||||||||||||||||||||||||||||||||||||||||||| 215

Terhelés alatt minimális a különbség a két fő versenyző között - nyilván itt tesztünk harmadik szereplője, az 55nm-en készült GTX280 nincs versenyben. Idle fogyasztás terén mindkét kártya kitűnő, de a GTX460 külön említést érdemel, mert még a HD5750-nél is kevesebb áramot vesz fel terhelés nélkül - ráadásul, ha terhelés nélkül, de a 3D-s órajelekkel megy, akkor sem megy a fogyasztása 120W fölé, ami a Radeon kártyákra éppenséggel nem jellemző. Mindenki döntse el maga, elég nagy-e a különbség a két kártya között, hogy a GTX460-nak +1 pontot bevéssünk - nálunk ez a menet döntetlen.
Hőmérséklet, melegedés, zaj
Lássuk az idle és a terhelt hőmérsékleteket:

Temperature - Crysis Warhead DX10 Max (displayed post-flash)

Idle GTX280|||||||||||||||||||||||||||||||||||||||||||||| 46
HD5830||||||||||||||||||||||||||||||||||||||||||||||| 47
GTX460-768M|||||||||||||||||||||||||||||||||||||| 38
Load GTX280||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 81
HD5830||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 73
GTX460-768M|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 76

Érdekes az ábra hőmérsékletek terén. A GTX460 idle hőmérséklete igen alacsony, miután nálunk a tesztek minimum 24-25, de nyáron inkább 28-29 fokos szobában készülnek - a 46-47 fok már remek eredmény, ehhez képest a Gainward GTX460 közel 10 fokkal hűvösebb, mindamellett a másik két kártyához hasonlóan teljesen hangtalan. Terhelt hőmérsékletek terén viszont meglepő módon a HD5830 nyer - ráadásul, bár hangerőben nincs különbség a két kártya között, a HD5830 szélzaján túl a GTX460-nál némi sivító / nyüszítő felhang is hallatszik, ezért hűtés terén egyértelműen a Sapphire HD5830-at tartjuk jobbnak. A GTX280, bár melegebb és hangosabb a másik két kártyánál, még mindig bőven az elvárt szinten belül teljesít.
A GF104 chipről
Eddig sem volt szokásunk, és ezután sem tervezünk hosszas ismertetőket írni a GPU-k architektúrájáról (az Interneten számos forrásban fellelhetők), viszont pár szóban azért emlékezzünk meg, kicsoda is ez a GF104:
  • A GF100-as chip rendelkezett 4 GPC-vel (Graphics Processing Cluster) és 6 ROP blokkal - a GF104-ban maradt 2 GPC és 4 ROP blokk;
  • A GPC-ken belül több kisebb-nagyobb változást eszközölt az nVidia: továbbra is 4 ALU/TEX blokk van egy GPC-ben, viszont a blokkok duplaannyi SFU-t (Special Function Unit) és textúrázót, ill. 50%-kal több ALU-t tartalmaznak;
  • A ROP blokkok szerkezete változatlan, egyenként 8 ROP tartozik hozzájuk, és egy 64-bites crossbar memóriavezérlőhöz kapcsolódnak;
  • A GTX460-as kártyák a GF104 csonkolt változatára épülnek - az 1GB-os kártyából egy ALU/TEX blokk hiányzik, a 768MB-os változat pedig ezen felül egy ROP blokkot is kénytelen nélkülözni.
A további részletek a következő fejezetben találhatók, a konkurens VGA-k adataival együtt.
Felépítés, várható teljesítmény
Jelen cikk keretein belül nem végzünk mélyelemzést a GF104-es chip kapcsán, de egy gyors pillantást azért vetünk a három versenyző kapacitásaira:
VGA neve GTX280 HD5830 GTX460 768M GTX460 vs
GTX280
GTX460 vs
HD5830
Core órajel 602 MHz 800 MHz 675 MHz
Shader órajel 1296 MHz 800 MHz 1350 MHz
Memória-órajel 1107 MHz 1000 MHz 900 MHz
Memória mennyisége 1024 MB 1024 MB 768 MB
Geometriai egységek 1 1 2
Scanline konverzió 16 Pix/clock 32 Pix/clock 32 Pix/clock
ALU egységek (SP-k) 240 (scalar) 1120 (5-way
superscalar)
224/336 (scalar/
superscalar)
Textúrázó egységek 56 80 56
ROP egységek 32 16 24
Memóriabusz és típus 512-bit gDDR3 256-bit gDDR5 192-bit gDDR5
Triangle setup 602 Mtri/sec 800 Mtri/sec 1350 Mtri/sec 125% 68.8%
Scanline konverzió 9.6 GPix/sec 25.6 GPix/sec 21.6 GPix/sec 125% -18.5%
Számítási teljesítmény * 622/933 GFlops 1792 GFlops 605/907 GFlops
Texel fillrate, 32-bit (FP10) 48.2 GTex/sec 44.8 GTex/sec 37.8 GTex/sec -27.5% -18.5%
Pixel fillrate 19.3 GPix/sec 12.8 GPix/sec 16.2 GPix/sec -19.1% 26.6%
Z-only fillrate 77.1 GPix/sec 51.2 GPix/sec 86.4 GPix/sec -19.1% 26.6%
Memória-sávszélesség ** 141.7 GB/sec 128.0 GB/sec 86.4 GB/sec -64.0% -48.1%
*: a három chip számítási kapacitása nem hasonlítható közvetlenül össze, mert eltérő felépítésűek az ALU blokkok - bővebben ld. lejjebb.
**: bár névlegesen egy 256-bit + gDDR5 kombináció egyforma órajel mellett ugyanakkora sávszélességet biztosít, mint egy 512-bit + gDDR3, a gyakorlatban azt tapasztaltuk, hogy az előbbi megoldásnak kb. 15%-kal magasabb órajelre van szüksége ahhoz, hogy megegyező teljesítményt nyújtson - ennek oka a gDDR5 memóriák magasabb késleltetése.
Szokásunkkal ellentétben induljunk a chipek hátsó vége felől:
  • Memória-sávszélesség terén mind a GTX280-nak, mind a HD5830-nak lényegesen nagyobb a kapacitása, mint a kisebbik GTX460-nak - ez azonban csalós, mert mindkét kártya lényegesen szélesebb "csővel" rendelkezik a memória felé, mint az szükséges lenne. A GTX460 memória általi limitációjára egy későbbi cikkben visszatérünk, egyelőre élünk azzal a feltételezéssel, hogy ettől a tényezőtől a másik két kártya csak minimális előnyhöz jut.
  • ROP-ok terén a GTX280 20%-kal erősebb, a HD5830 pedig 25%-kal gyengébb főszereplőnknél - ezek a különbségek átlagosan 4-6%-nyi differenciát jelentenek önmagukban.
  • A GTX460 leggyengébb pontja a textúrázás - a GTX280 a több egység, a HD5830 pedig a magasabb órajel miatt jobb ezen a téren. Itt a ROP-okból származó előny egy része elveszik az 5830-assal szemben, a GTX280-nak pedig ez a faktor további 6-7%-nyi fölényt jelenthet.
  • A chip elején részben fordított a helyzet, mint a ROP-oknál - egy korábbi tesztünkben már megállapítottuk, hogy a GTX280-at erősen limitálja a frontend rész, itt egyértelműen a GTX460 a jobb, a HD5830 viszont a magasabb órajel és a Cypress chip megduplázott scanline konverziós tudása miatt azokban az esetekben előnyben lehet az új nVidia kártyával szemben, ahol a háromszögek pixelesítése a szűk keresztmetszet. Ahol viszont a sok-sok háromszög vizsgálata a leghangsúlyosabb (ld. Unigine Heaven extrém tesszeláció), ott a GTX460 az úr.
Kimaradtak volna az ALU-k? Nem véletlenül. Míg az AMD az R600-as chip megjelenése óta ugyanazt a struktúrát használja kisebb optimalizációk mellett, az nVidia minden új generációban csavar egy kicsit az ALU/TEX tömbök felépítésén. A GF104-ben egy igazán váratlan fordulatot hoztak - míg a G80, a G92, a GT200 és a GF100 chipek tisztán skalár ALU-kat tartalmaztak, amelyeknek a vezérlése blokkonként direkt módon történt, a GF104 chip lépett egy aprót a Radeonok szuperskalár feldolgozóinak irányába. A GTX460 336 ALU-ja 7 blokkba van beosztva (a teljes értékű GF104 chip 8 blokkban 384 ALU-t tartalmaz), azaz egy blokkban 48 ALU lakik. A 48 egység további 3 csoportra osztható, csoportonként 16 ALU-val, viszont a 3 csoportra csak két ütemező egység jut, ezért elvi síkon a blokk ALU-inak 1/3-a pihen. A gyakorlatban ez azért nincs így, mert a chip képes az AMD által már régóta kihasznált ILP (Instruction Level Parallelism, utasítás szintű párhuzamosítás) alkalmazására: ha a shader kódban egy "a" utasítást egy olyan "b" utasítás követ, amely operandusa(i) nem függ(nek) "a" utasítás eredményétől, akkor "a" és "b" utasítás párhuzamosan is végrehajtható - ezért az ütemező "a" utasítást az egyik 16-os blokkra osztja, "b" utasítást pedig egy másikra, párhuzamosan. Tehát akkor nincs gond, a blokk mind a 48 ALU-ja kihasználható...
... vagy mégsem? Sajnos nem. Az AMD számra minden bizonnyal igen fájdalmas lecke volt az R600 indulásakor, hogy az ILP a legtöbb 3D alkalmazásban igen alacsony szinten használható ki - ezért hiába rendelkeznek a Radeonok rendszerint duplaakkora számítási kapacitással, mint a konkurens GeForce-ok, még a kifejezetten számítás-orientált tesztekben sem igazán tud érvényesülni az előnyük. Miután a szuperskalár végrehajtók kihasználására az R600-nak és utódainak az ILP-n túl számos egyéb eszköz áll rendelkezésére, szemben a GF104-gyel, az a véleményünk, hogy a GF104 effektív ALU-sebesség terén lényegesen közelebb áll a 224 egységhez (ill. a teljes chip a 256-hoz), mint a reklámozott, és nagyon is valós tranzisztorokat felhasználó 336-hoz (384-hez). Erre a kérdésre a GF104 elemzésével kapcsolatos cikkeinkben még visszatérünk, most lássuk a szokásos környezeti adatokat, aztán pedig a tesztek eredményeit!
Tesztkörnyezet
A konfiguráció elemei
Alaplap Gigabyte P45-DS3R, FSB @400MHz
CPU és órajel Intel Q9550 @Q9770 (3.2GHz, 8x400)
CPU hűtés Cooler Master HyperTX2
Memória 4x1GB Geil Ultra DDR2-8500
Memória beállítások 1066MHz (2.66x400), 5-5-5-15, tRD: 8
Tápegység Corsair TX650
Operációs rendszer Windows 7 x64
VGA Core clock Shader clock Memory clock Driver
GeForce GTX280 602 MHz 1296 MHz 1107 MHz ForceWare 257.15 beta
Radeon HD5830 800 MHz 1000 MHz Catalyst 10.7 WHQL
GeForce GTX460 768MB 675 MHz 1350 MHz 900 MHz ForceWare 258.96 WHQL
A konfiguráció sok kommentárt nem igényel - a GTX460-at és a HD5830-at a legfrissebb WHQL minősítésű driverrel teszteltük, a GTX280-at pedig az eggyel korábbi verziójú bétával - mivel a ForceWare 256-os szériában az nVidia nem foglalkozik a GT200-as chipek teljesítményének javításával, a GTX280-nak nem fog hátránya származni a korábbi driver használatából.
A tesztben résztvevő játékok
  • Aliens VS Predator
  • Battlefield: Bad Company 2
  • Crysis Warhead
  • Far Cry 2
  • Just Cause 2
  • METRO 2033
  • STALKER: Call of Pripyat
  • Unigine Heaven 2.0
Oldalak:     
Fórum