Cypress VS GF104

Elemzés - 2010/10/01

Oldalak:     
Fórum
Bevezető
Bár a 2009. szeptemberében piacra került Cypress GPU már egy kicsit kilógott az AMD sweet spot stratégiájából a 334mm2-es méretével, így is igazi sikertörténet lett az előállítási költség, a teljesítmény és a ráépülő kártyákért elkérhető ár tekintetében. Ezen a téren nagyon sokáig nem volt ellenfele, hiszen a Cypress a GF100 megjelenéséig minden más GPU-nál sokkal gyorsabb volt, az első Fermi architektúrás chip pedig az 500mm2 feletti méretével árversenyre éppenséggel nem volt alkalmas.
Az nVidia második Fermi alapokra építő GPU-ja, a GF104 viszont sok hasonlóságot mutat a Cypress-szel, a tranzisztorok száma és a chipméret mellett a végrehajtó egységek számai sem sokban különböznek, ezért kíváncsiak lettünk, hogy viszonyul a két chip egymáshoz - persze nem a rájuk épülő kártyák referencia-órajele mellett, hanem azonos MHz-eken megfuttatva.

Miután a GF104-es chipből teljes értékű változattal még nem érkezett kártya, a Cypress-ből is az egyik csonkolt változatot vettük elő - bár a GTX460 1GB alapjául szolgáló GF104 chipből arányosan több egység van kitiltva, mint a HD5850 Cypress-variánsából, a különbség nem óriási, a várható hatására a konklúzióban kitérünk. Az egyszerűség kedvéért a HD5850 gyári órajeleit használtuk a chipek összehasonlítására, azaz 725MHz-es core órajel és 1000MHz-es memória-órajel mellett történt az összevetés.
Fogyasztás, hőmérséklet, hűtés
A GTX460 tuningolós cikkben láttuk, hogy az órajelek emelése feszültségemelés nélkül nem igazán hat drámaian a GF104 fogyasztására, ezért az alábbi grafikon korántsem meglepő:

Power consumption - Crysis Warhead DX10 Max (displayed post-flash)

Idle GTX460-1G @725/1000||||||||||||||||||| 94
HD5850|||||||||||||||||||| 102
Load GTX460-1G @725/1000||||||||||||||||||||||||||||||||||||||||||||||||| 245
HD5850|||||||||||||||||||||||||||||||||||||||||||||| 231

Ahogy azt az eddigiekben is láttuk, idle fogyasztásban a GF104 a jobb, viszont terhelés alatt középső Cypress hatékonyabb - egyik különbség sem igazán hatalmas, mi egy kicsit többre értékeljük a jobb idle fogyasztást, de ez erősen szubjektív. Lássuk, van-e különbség a hőmérsékletekben:

Temperature - Crysis Warhead DX10 Max (displayed post-flash)

Idle GTX460-1G @725/1000||||||||||||||||||||||||||||||||||||||||| 41
HD5850|||||||||||||||||||||||||||||||||||||||||||||| 46
Load GTX460-1G @725/1000||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 77
HD5850||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 77

Lényegében nincs, a GF104 igen alacsony idle hőmérséklete látványos, de gyakorlati jelentőséggel nem bír, míg terhelt hőmérsékletek terén teljes a döntetlen. A hangerő már erősen a hűtési megoldás függvénye, a nálunk járt Gainward kártya kicsit zajosabb volt, mint a HD5850, de pl. a Gigabyte két ventillátoros megoldása biztosan halkabb, és valószínűleg még hőmérsékletek terén is jobban produkál.
Az első forduló tehát döntetlen - ugorjunk fejest az architektúrákba!
Felépítés, várható teljesítmény
Íme a megszokott táblázat:
VGA neve GF104 Cypress Cypress vs GF104
Core órajel 725 MHz 725 MHz
Shader órajel 1450 MHz 725 MHz
Memória-órajel 1000 MHz 1000 MHz
Memória mennyisége 1024 MB 1024 MB
Tranzisztorok száma 1.95 milliárd 2.15 milliárd
Gyártástechnológia 40nm (TSMC) 40nm (TSMC)
Geometriai egységek 2 1
Scanline konverzió 32 Pix/clock 32 Pix/clock
ALU egységek ("SP"-k) * 224-336 (scalar) 1440 (5-way superscalar)
Textúrázó egységek 56 72
ROP egységek 32 32
Memóriabusz és típus 256-bit gDDR5 256-bit gDDR5
Triangle setup 1450 Mtri / sec 725 Mtri / sec -100%
Scanline konverzió 23.2 GPix / sec 23.2 GPix / sec 0%
Számítási teljesítmény * 650-975 GFlops 2088 GFlops
Texel fillrate, 32-bit (FP10) 40.6 GTex / sec 52.2 GTex / sec 28.6%
Pixel fillrate 23.2 GPix / sec 23.2 GPix / sec 0%
Z-only fillrate 92.8 GPix / sec 92.8 GPix / sec 0%
Memória-sávszélesség 128.0 GB / sec 128.0 GB / sec 0%
*: a két chip számítási kapacitása nem hasonlítható közvetlenül össze, mert eltérő felépítésűek az ALU blokkok.
Jól látszik, hogy egységek terén igen nagy a hasonlóság, szaladjunk végig a chipeken:
  • Frontendben van némi előnye a GF104-nek, a duplázott triangle setup ebben a kategóriában már számít, ez biztosan hoz pár %-ot a konyhára;
  • Textúrázók terén van egy közel 30%-os előnye a Cypress-nek, ezen minden bizonnyal kompenzál valamennyit a GF100-zal bevezetett optimalizált cache-elés. Az ALU-teljesítmények összevetése nem egyszerű, de miután azonos sebességű GeForce és Radeon kártyák között 2-2.5-szeres különbség szokott lenni az utóbbi javára, itt pedig a GF104 hatékonyságának függvényében 2.5-3-szoros a differencia, egy 20-25%-os előnyt tudunk becsülni a piros oldalon. Kombinálva a textúrázókkal, durván 10-15% valós teljesítmény-előnyre tehet szert ettől a Cypress.
  • Backend oldalon nincs sok mindent mondani - a két GPU kapacitásai azonos órajel mellett teljesen egyformák.
Kombinálva a GF104 setup-oldali előnyét, ill. a Cypress magasabb ALU+TEX kapacitását, becslés jelleggel azt tudjuk mondani, hogy a Cypress chip 8-12%-kal erősebbnek tűnik - lássuk, mit mondanak a mérések!
Tesztkörnyezet
A konfiguráció elemei
Alaplap Gigabyte P45-DS3R, FSB @400MHz
CPU és órajel Intel Q9550 @Q9770 (3.2GHz, 8x400)
CPU hűtés Cooler Master HyperTX2
Memória 4x1GB Geil Ultra DDR2-8500
Memória beállítások 1066MHz (2.66x400), 5-5-5-15, tRD: 8
Tápegység Corsair TX650
Operációs rendszer Windows 7 x64
VGA Core clock Shader clock Memory clock Driver
GeForce GTX460 1GB 725 MHz 1450 MHz 1000 MHz ForceWare 258.96 WHQL
Emu5850 (using HD5870) 700 MHz 1000 MHz Catalyst 10.5 WHQL
Két megjegyzés a VGA-khoz:
  • A 258.96-os ForceWare-rel egyidős Catalyst a 10.7 lenne - ezzel nincs gond, tesztünk tanúsága szerint a 10.5 semmivel sem lassabb;
  • HD5850 téren továbbra is az emulált eredményeket kell használnunk - ezért itt 1-2%-nyi hiba előfordulhat.
A tesztben résztvevő játékok
  • Aliens VS Predator
  • Battlefield: Bad Company 2
  • Crysis Warhead
  • Far Cry 2
  • Just Cause 2
  • METRO 2033
  • STALKER: Call of Pripyat
  • Unigine Heaven 2.0
Oldalak:     
Fórum