A Barts chip közelebbről

Elemzés - 2011/01/06

Oldalak:     
Fórum
Bevezető
A Barts chipet már több nézetből is megvizsgáltuk - teszteltük a ráépülő két VGA-t, a HD6850-et és a HD6870-et, illetve megvizsgáltuk azt is, hogyan viszonyul a nála nagyobb méretű, de mégis közvetlen piaci konkurens GF104-hez. Még két dolog van hátra - össze kell ereszteni a Barts-ot a Cypress-szel (ez megtörténik, mihelyt sikerül rátenni a kezünket egy HD5870-esre), ill. magát a Barts GPU-t is közelebbről meg kell vizsgálnunk. Ez utóbbira kerítünk most sort egy igencsak mélyreható elemzés keretében.

A HD6870 PCB-je (forrás: ixbt.com)
Ahogy az elemzéseinknél lenni szokott, már a mérések elkészítése során elkezdett terjeszkedni a tervezett tartalom, majd a cikk az elemzési struktúra összerakása során hízott tovább, és végül az utolsó oldalt csak írtuk, írtuk, és sehogy nem akart vége lenni. Az eredménnyel viszont elégedettek vagyunk - úgy gondoljuk, hogy ami információt játék-orientáltságú tesztekkel ki lehet facsarni egy GPU-ból, azt mi a Barts-ból kiszedtük. Négy különböző szempont szerint vizsgáljuk a chipet:
  • Az egész onnan indult, hogy a teljes értékű Barts XT chipet (HD6870) és az enyhén csonkított Barts Pro chipet (HD6850) azonos órajeleken összemérjük, hogy a Pro változatból hiányzó egységek hatását lássuk, és ebből következtessünk arra, hogyan van egyensúlyozva a kártya kapacitások terén
  • Összevetettük egymással a két "bolti" terméket is, ami az AMD pozicionálási politikájába enged betekintést
  • Ha már rendelkezésre állt az XT verzióval két tesztsor (775/1000 és 900/1050), akkor ezeket is összehasonlítottuk - mivel itt a core órajelet sokkal jobban növeljük, mint a memória-órajelet, ez az összevetés meg fogja mutatni, hogy a HD6870 érzékeny-e a memória-órajelre
  • Végül az utolsó tesztsorunk eredetileg nem is ehhez a cikkhez készült, viszont ha az alapórajeles HD6870-et a HD5870 órajelein futó Barts XT-hez hasonlítjuk, akkor további információkat kapunk a chip memória-sávszélesség iránti igényéről, ill. a HD6800-as kártyák pozícionálásának okai is világosabbá válnak.
Felépítés, előzetes elemzés
Mélyrepülős cikkeinkben általában két, maximum három méréssor viszonyára szoktunk koncentrálni - ez azonban most nem így lesz. A tesztben négy méréssor szerepel, és ezen belül négy különböző relációt fogunk vizsgálni, ezért a felépítést bemutató táblázatot kicsit másképp csináljuk, mint szoktuk - konkrétan nem egy, hanem két táblázatunk lesz. Az elsőben összefoglaljuk a műszaki adatokat, a másodikban pedig az összevetendő konfigurációk közötti különbségeket vázoljuk fel.
Lássuk először a nyers erőt:
VGA és órajel HD6850
775/1000
HD6870
775/1000
HD6870
900/1050
HD6870
850/1200
Core órajel 775 MHz 775 MHz 900 MHz 850 MHz
Shader órajel 775 MHz 775 MHz 900 MHz 850 MHz
Memória-órajel 1000 MHz 1000 MHz 1050 MHz 1200 MHz
Memória mennyisége 1024 MB 1024 MB 1024 MB 1024 MB
Tranzisztorok száma 1.7 milliárd 1.7 milliárd 1.7 milliárd 1.7 milliárd
Gyártástechnológia 40nm (TSMC) 40nm (TSMC) 40nm (TSMC) 40nm (TSMC)
Geometriai egységek 1 1 1 1
Scanline konverzió 32 Pix/clock 32 Pix/clock 32 Pix/clock 32 Pix/clock
ALU egységek ("SP"-k) 960 (5w-SS) 1120 (5w-SS) 1120 (5w-SS) 1120 (5w-SS)
Textúrázó egységek 48 56 56 56
ROP egységek 32 32 32 32
Memóriabusz és típus 256-bit gDDR5 256-bit gDDR5 256-bit gDDR5 256-bit gDDR5
Triangle setup 775 Mtri/sec 775 Mtri/sec 900 Mtri/sec 850 Mtri/sec
Scanline konverzió 24.8 GPix/sec 24.8 GPix/sec 28.8 GPix/sec 27.2 GPix/sec
Számítási teljesítmény 1488 GFlops 1736 GFlops 2016 GFlops 1904 GFlops
Texel fillrate, 32-bit (FP10) 37.2 GTex/sec 43.4 GTex/sec 50.4 GTex/sec 47.6 GTex/sec
Pixel fillrate 24.8 GPix/sec 24.8 GPix/sec 28.8 GPix/sec 27.2 GPix/sec
Z-only fillrate 99.2 GPix/sec 99.2 GPix/sec 115.2 GPix/sec 108.8 GPix/sec
Memória-sávszélesség 128.0 GB/sec 128.0 GB/sec 134.4 GB/sec 153.6 GB/sec
Itt pedig az összevetések láthatók a négy elemzendő szituációban:
Esetek 6870@775/1000
vs 6850
6870 vs
6850
6870 vs
6870@775/1000
6870 vs
6870@850/1200
Triangle setup 0.0% 16.1% 16.1% 5.9%
Scanline konverzió 0.0% 16.1% 16.1% 5.9%
Számítási teljesítmény 16.7% 35.5% 16.1% 5.9%
Texel fillrate, 32-bit (FP10) 16.7% 35.5% 16.1% 5.9%
Pixel fillrate 0.0% 16.1% 16.1% 5.9%
Z-only fillrate 0.0% 16.1% 16.1% 5.9%
Memória-sávszélesség 0.0% 5.0% 5.0% -14.3%
Miről árulkodnak a számok?
  • Az azonos órajelen hajtott Barts variánsok között csak az ALU és a TEX kapacitásban van különbség, konkrétan 16.7%, ami kiegyensúlyozott kártyák esetén 7-10% előnyt jelentene a teljes értékű chipnek. Miután a Barts GPU sávszélességben nem túlzottan erős, a tényleges differencia ennél várhatóan kevesebb lesz
  • Második esetünk a két gyári órajeles kártyát veti össze egymással, ami elsősorban fogyasztói szempontból érdekes - 20-25%-os előnyt várunk a HD6870-től
  • A harmadik összevetésben a magasabb órajelű mérésnek illene 12-15%-os előnyt felmutatni - hacsak nem komoly korlátozó tényező a memória-sávszélesség
  • A negyedik vizsgálat a harmadikat viszi tovább - ha a sávszélesség nem jelentős korlát, akkor a HD5870-es órajelén futó HD6870-nek kb. 3%-kal lassabbnak kell lenni a gyári órajelestől.
Tesztkörnyezet
A konfiguráció elemei
Alaplap Gigabyte P45-DS3R, FSB @400MHz
CPU és órajel Intel Q9550 @Q9770 (3.2GHz, 8x400)
CPU hűtés Cooler Master HyperTX3
Memória 4x1GB Geil Ultra DDR2-8500
Memória beállítások 1066MHz (2.66x400), 5-5-5-15, tRD: 8
Tápegység Corsair TX650
Operációs rendszer Windows 7 x64
VGA Core clock Shader clock Memory clock Driver
Radeon HD6850 775 MHz 1000 MHz Catalyst 10.10d hotfix
Radeon HD6870 775 MHz 1000 MHz Catalyst 10.10d hotfix
Radeon HD6870 900 MHz 1050 MHz Catalyst 10.10d hotfix
Radeon HD6870 850 MHz 1200 MHz Catalyst 10.10d hotfix
Érdemes kiemelni itt is, hogy a 4. méréssor eredetileg nem ehhez a cikkhez készült, hanem a Bevezetőben is említett Cypress VS Barts elemzéshez - viszont az eredmények alapján láttuk értelmét itt is szerepeltetni, segít alátámasztani néhány következtetésünket.
A tesztben résztvevő játékok, tesztmódszer
  • Battlefield: Bad Company 2
  • Crysis Warhead
  • F1 2010
  • Just Cause 2
  • Lost Planet 2
  • Mafia II
  • METRO 2033
  • STALKER: Call of Pripyat
  • Unigine Heaven 2.1
Tesztmódszer terén is eltérünk egy kicsit a megszokottaktól - ennek oka, hogy a HD6870 olyan kevés időt töltött nálunk, hogy fizikailag lehetetlen lett volna 3 teljes tesztet végigfuttatni vele. Ezért úgy döntöttünk, hogy a High és a Max beállításokra fókuszálunk - annyiban nem is bánjuk a dolgot, hogy a grafikonok így sokkal áttekinthetőbbek, és a Balanced beállításban fel-felbukkanó CPU-limites esetekhez sem kell külön kommentárt fűznünk.
Oldalak:     
Fórum