A Cayman GPU önmaga ellen

Elemzés - 2011/05/01

Oldalak:     
Fórum
Bevezető
Ahogy az élet más területein is, a VGA-tesztekben is előfordul, hogy az ember tervez, aztán pedig nem végez. Amikor anno sikerült szert tennünk egy HD6970-esre, akkor gyorsan több órajel-kombinációval is megmértük őkelmét, arra készülve, hogy csinálunk egy alaposabb elemzést a chipről, felkutatva az erősségeket és a gyengeségeket. Miután az elemzéshez szükséges 5 méréssorozatból 4-et megcsinátunk a 6970-essel, már csak egyetlen sorozatra lett volna szükség egy alapórajeles HD6950-nel - ilyen kártyára viszont sajnos azóta sem sikerült szert tennünk. Az elmúlt hetekben aztán platformot cseréltünk, ezért ha esetleg sikerülne is 6950-et szereznünk, akkor sem tudnánk mihez mérni, mert a korábbi 6970-es tesztjeinkkel már nem lenne összevethető. Ezen okból kiindulva úgy döntöttünk, hogy megjelentetjük a Cayman elemzést a teljes értékű chip eredményei alapján, és később, ha lesz rá alkalom, akkor futtatunk egy külön kört a két Cayman-variánssal azonos órajeleken - sőt, ha lesz addigra HD6930, akkor rögtön őt is bevonjuk :)
Most viszont nézzük, hogy reagál egy teljes értékű Cayman chip az órajelek állítgatására!

Előzetes elemzés
Azt már több cikkben leírtuk, hogy az overclocking teszteket önmagukban nem tartjuk túl izgalmasnak, mert 10% egyetemes órajel-emeléssel 10% extra teljesítményt kapunk (ha nem, akkor ott van valami gond - a gond pedig az esetek 80%-ában platform limitáció szokott lenni). Érdekesebb külön vizsgálni a core órajel és a memória-órajel emelését, mert itt lehet arra nézve informálódni, hogy mennyire van a chip memória-sávszélesség terén kiéheztetve - a GTX460 esetében ennek kimondottan hasznát vettük, hiszen az a GPU core órajelben jól tuningolható, míg memória-órajelben sokkal kevésbé.
A gyakorlat azonban némileg kiábrándító - a core órajel 10%-os emelése rendszerint 7-8%-os vagy magasabb teljesítmény-növekedéssel jár, és a memória-órajel csak a maradék 2-3%-ért felel. Ilyen szűk mozgástér esetén pedig nem sok értelme van az elemezgetésnek, mert bármilyen következtetés meg fog maradni az elmélet szintjén, gyakorlati jelentőséggel is bíró tanácsot aligha tudunk meg belőle azon túl, hogy "húzzuk a core-t, mint a' állat" (GTX460-as tuning tesztünk is pont ezt bizonyította be).
Miért álltunk akkor neki mégis egy ilyen tesztnek a Cayman chippel? Azért, mert a GPU paraméterei alapján elképzelhetőnek tartjuk, hogy egy kicsit másképp fog festeni a kép. A Cayman megerősített frontendje, valamint a brutális mennyiségű ALU és textúrázó egység miatt az esetek nagy részében a backend fogja a szűk keresztmetszetet jelenteni - annál is inkább, mivel napjaink játékai a sok post processing miatt igencsak ROP-igényesek, a ROP-ok pedig közismerten nagy barátai a memória-sávszélességnek. Lesznek persze olyan esetek is, ahol maguk a ROP-ok nem fogják tudni tartani a lépést a kártya többi részével, és nem a memória fogja visszatartani őket - a tesztből erre is fény fog derülni.
Tesztkörnyezet és beállítások
A konfiguráció elemei
Alaplap Gigabyte P45-DS3R, FSB @400MHz
CPU és órajel Intel Q9550 @Q9770 (3.2GHz, 8x400)
CPU hűtés Cooler Master HyperTX3
Memória 4x1GB Geil Ultra DDR2-8500
Memória beállítások 1066MHz (2.66x400), 5-5-5-15, tRD: 8
Tápegység Corsair TX650
Operációs rendszer Windows 7 x64
VGA Core clock Shader clock Memory clock Driver
Radeon HD6970 800 MHz 1250 MHz Catalyst 10.12a hotfix
Radeon HD6970 800 MHz 1375 MHz Catalyst 10.12a hotfix
Radeon HD6970 880 MHz 1250 MHz Catalyst 10.12a hotfix
Radeon HD6970 880 MHz 1375 MHz Catalyst 10.12a hotfix
Ahogy a táblázatban látható, a szokásos lépcsős módszert alkalmazzuk - alapbeállításnak a HD6950 órajeleit tekintjük, majd megemeljük 10%-kal először a memória, majd a core órajelet, végül pedig, mintegy ellenőrzésképpen, mindkettőt, amivel a HD6970 órajeleihez lyukadunk ki.
Tesztmódszer, a tesztben résztvevő játékok
Tesztjeinkben minden játékhoz 3 beállítást használunk: Balanced, High és Max, sorban az alsó középkategóriás, a középkategóriás és a felső / csúcskategóriás kártyákkal szemben támasztható elvárásokhoz szabva. A Balanced és a High beállítást 1680x1050-es felbontásban vetjük be, az 1920x1080-as felbontásnál pedig szintén megjelenik a High beállítás, és szerepel a Max is - így lesz játékonként 4 tesztesetünk, amelyeket háromszor lemérünk, és a grafikonokra a mérések átlaga kerül.
Megjegyzés: architektúrával foglalkozó cikkeinkben előfordul, hogy csak a két 1920x1080 teszteset szerepel - ez a helyzet most is.
A játékokban vagy beépített benchmarkot használunk, vagy egy-egy kellően intenzív jelenetet játszunk le. Mindkét esetben a méréseket a fraps-szal végezzük - a grafikonokon szereplő átlag fps értékekhez a fraps számait használjuk, a minimum-fps-eket viszont egy egyéni statisztikai módszerrel állítjuk elő a mérés alatt megjelenített frame-ek kiszámolásához szükséges időkből. Az így kapott értékek lényegesen jobban jellemzik a játékokban tapasztalt folyamatosság-érzetet, mint az Internet-szerte használt abszolút minimum-érték.
A tesztekben használt játékok / benchmarkok:

Battlefield:
Bad Company 2
Crysis Warhead F1 2010 Just Cause 2 Lost Planet 2

Mafia II METRO 2033 S.T.A.L.K.E.R.:
Call of Pripyat
Unigine Heaven
Oldalak:     
Fórum