Bevezető
A Barts chipet már több nézetből is megvizsgáltuk - teszteltük a ráépülő két VGA-t, a
HD6850-et és a HD6870-et,
illetve megvizsgáltuk azt is, hogyan viszonyul a nála nagyobb méretű, de mégis közvetlen piaci konkurens
GF104-hez. Még két dolog van hátra - össze kell ereszteni a Barts-ot
a Cypress-szel (ez megtörténik, mihelyt sikerül rátenni a kezünket egy HD5870-esre), ill. magát a Barts
GPU-t is közelebbről meg kell vizsgálnunk. Ez utóbbira kerítünk most sort egy igencsak mélyreható elemzés
keretében.
A HD6870 PCB-je (forrás: ixbt.com)
Ahogy az elemzéseinknél lenni szokott, már a mérések elkészítése során
elkezdett terjeszkedni a tervezett tartalom, majd a cikk az elemzési struktúra összerakása során hízott tovább,
és végül az utolsó oldalt csak írtuk, írtuk, és sehogy nem akart vége lenni. Az eredménnyel viszont elégedettek
vagyunk - úgy gondoljuk, hogy ami információt játék-orientáltságú tesztekkel ki lehet facsarni egy
GPU-ból, azt mi a Barts-ból kiszedtük. Négy különböző szempont szerint vizsgáljuk a chipet:
- Az egész onnan indult, hogy a teljes értékű Barts XT chipet (HD6870) és az enyhén csonkított Barts Pro chipet (HD6850) azonos órajeleken összemérjük, hogy a Pro változatból hiányzó egységek hatását lássuk, és ebből következtessünk arra, hogyan van egyensúlyozva a kártya kapacitások terén
- Összevetettük egymással a két "bolti" terméket is, ami az AMD pozicionálási politikájába enged betekintést
- Ha már rendelkezésre állt az XT verzióval két tesztsor (775/1000 és 900/1050), akkor ezeket is összehasonlítottuk - mivel itt a core órajelet sokkal jobban növeljük, mint a memória-órajelet, ez az összevetés meg fogja mutatni, hogy a HD6870 érzékeny-e a memória-órajelre
- Végül az utolsó tesztsorunk eredetileg nem is ehhez a cikkhez készült, viszont ha az alapórajeles HD6870-et a HD5870 órajelein futó Barts XT-hez hasonlítjuk, akkor további információkat kapunk a chip memória-sávszélesség iránti igényéről, ill. a HD6800-as kártyák pozícionálásának okai is világosabbá válnak.
Felépítés, előzetes elemzés
Mélyrepülős cikkeinkben általában két, maximum három méréssor viszonyára szoktunk koncentrálni - ez azonban
most nem így lesz. A tesztben négy méréssor szerepel, és ezen belül négy különböző relációt fogunk vizsgálni,
ezért a felépítést bemutató táblázatot kicsit másképp csináljuk, mint szoktuk - konkrétan nem egy, hanem két
táblázatunk lesz. Az elsőben összefoglaljuk a műszaki adatokat, a másodikban pedig az összevetendő
konfigurációk közötti különbségeket vázoljuk fel.
Lássuk először a nyers erőt:
VGA és órajel | HD6850 775/1000 |
HD6870 775/1000 |
HD6870 900/1050 |
HD6870 850/1200 |
Core órajel | 775 MHz | 775 MHz | 900 MHz | 850 MHz |
Shader órajel | 775 MHz | 775 MHz | 900 MHz | 850 MHz |
Memória-órajel | 1000 MHz | 1000 MHz | 1050 MHz | 1200 MHz |
Memória mennyisége | 1024 MB | 1024 MB | 1024 MB | 1024 MB |
Tranzisztorok száma | 1.7 milliárd | 1.7 milliárd | 1.7 milliárd | 1.7 milliárd |
Gyártástechnológia | 40nm (TSMC) | 40nm (TSMC) | 40nm (TSMC) | 40nm (TSMC) |
Geometriai egységek | 1 | 1 | 1 | 1 |
Scanline konverzió | 32 Pix/clock | 32 Pix/clock | 32 Pix/clock | 32 Pix/clock |
ALU egységek ("SP"-k) | 960 (5w-SS) | 1120 (5w-SS) | 1120 (5w-SS) | 1120 (5w-SS) |
Textúrázó egységek | 48 | 56 | 56 | 56 |
ROP egységek | 32 | 32 | 32 | 32 |
Memóriabusz és típus | 256-bit gDDR5 | 256-bit gDDR5 | 256-bit gDDR5 | 256-bit gDDR5 |
Triangle setup | 775 Mtri/sec | 775 Mtri/sec | 900 Mtri/sec | 850 Mtri/sec |
Scanline konverzió | 24.8 GPix/sec | 24.8 GPix/sec | 28.8 GPix/sec | 27.2 GPix/sec |
Számítási teljesítmény | 1488 GFlops | 1736 GFlops | 2016 GFlops | 1904 GFlops |
Texel fillrate, 32-bit (FP10) | 37.2 GTex/sec | 43.4 GTex/sec | 50.4 GTex/sec | 47.6 GTex/sec |
Pixel fillrate | 24.8 GPix/sec | 24.8 GPix/sec | 28.8 GPix/sec | 27.2 GPix/sec |
Z-only fillrate | 99.2 GPix/sec | 99.2 GPix/sec | 115.2 GPix/sec | 108.8 GPix/sec |
Memória-sávszélesség | 128.0 GB/sec | 128.0 GB/sec | 134.4 GB/sec | 153.6 GB/sec |
Itt pedig az összevetések láthatók a négy elemzendő szituációban:
Esetek | 6870@775/1000 vs 6850 |
6870 vs 6850 |
6870 vs 6870@775/1000 |
6870 vs 6870@850/1200 |
Triangle setup | 0.0% | 16.1% | 16.1% | 5.9% |
Scanline konverzió | 0.0% | 16.1% | 16.1% | 5.9% |
Számítási teljesítmény | 16.7% | 35.5% | 16.1% | 5.9% |
Texel fillrate, 32-bit (FP10) | 16.7% | 35.5% | 16.1% | 5.9% |
Pixel fillrate | 0.0% | 16.1% | 16.1% | 5.9% |
Z-only fillrate | 0.0% | 16.1% | 16.1% | 5.9% |
Memória-sávszélesség | 0.0% | 5.0% | 5.0% | -14.3% |
Miről árulkodnak a számok?
- Az azonos órajelen hajtott Barts variánsok között csak az ALU és a TEX kapacitásban van különbség, konkrétan 16.7%, ami kiegyensúlyozott kártyák esetén 7-10% előnyt jelentene a teljes értékű chipnek. Miután a Barts GPU sávszélességben nem túlzottan erős, a tényleges differencia ennél várhatóan kevesebb lesz
- Második esetünk a két gyári órajeles kártyát veti össze egymással, ami elsősorban fogyasztói szempontból érdekes - 20-25%-os előnyt várunk a HD6870-től
- A harmadik összevetésben a magasabb órajelű mérésnek illene 12-15%-os előnyt felmutatni - hacsak nem komoly korlátozó tényező a memória-sávszélesség
- A negyedik vizsgálat a harmadikat viszi tovább - ha a sávszélesség nem jelentős korlát, akkor a HD5870-es órajelén futó HD6870-nek kb. 3%-kal lassabbnak kell lenni a gyári órajelestől.
Tesztkörnyezet
A konfiguráció elemei | |
Alaplap | Gigabyte P45-DS3R, FSB @400MHz |
CPU és órajel | Intel Q9550 @Q9770 (3.2GHz, 8x400) |
CPU hűtés | Cooler Master HyperTX3 |
Memória | 4x1GB Geil Ultra DDR2-8500 |
Memória beállítások | 1066MHz (2.66x400), 5-5-5-15, tRD: 8 |
Tápegység | Corsair TX650 |
Operációs rendszer | Windows 7 x64 |
VGA | Core clock | Shader clock | Memory clock | Driver |
Radeon HD6850 | 775 MHz | 1000 MHz | Catalyst 10.10d hotfix | |
Radeon HD6870 | 775 MHz | 1000 MHz | Catalyst 10.10d hotfix | |
Radeon HD6870 | 900 MHz | 1050 MHz | Catalyst 10.10d hotfix | |
Radeon HD6870 | 850 MHz | 1200 MHz | Catalyst 10.10d hotfix |
Érdemes kiemelni itt is, hogy a 4. méréssor eredetileg nem ehhez a cikkhez készült,
hanem a Bevezetőben is említett Cypress VS Barts elemzéshez - viszont az eredmények alapján láttuk értelmét itt is
szerepeltetni, segít alátámasztani néhány következtetésünket.
A tesztben résztvevő játékok, tesztmódszer
- Battlefield: Bad Company 2
- Crysis Warhead
- F1 2010
- Just Cause 2
- Lost Planet 2
- Mafia II
- METRO 2033
- STALKER: Call of Pripyat
- Unigine Heaven 2.1
Tesztmódszer terén is eltérünk egy kicsit a megszokottaktól - ennek oka, hogy
a HD6870 olyan kevés időt töltött nálunk, hogy fizikailag lehetetlen lett volna 3 teljes tesztet végigfuttatni
vele. Ezért úgy döntöttünk, hogy a High és a Max beállításokra fókuszálunk - annyiban nem is
bánjuk a dolgot, hogy a grafikonok így sokkal áttekinthetőbbek, és a Balanced beállításban fel-felbukkanó
CPU-limites esetekhez sem kell külön kommentárt fűznünk.