Mit várhatunk a HD6770-től?

Piaci spekuláció - 2010/09/16

Update: az AMD jól beültetett mindenkit a hintába a hamis pletykákkal, a lenti cikkben 3 feltételezés is bukik:
  • az október 22-én megjelenő kártyák nem a HD6700-asok, hanem „előkelőbb” HD6800-asok lettek;
  • a 70-es kártya (és ezáltal a Barts GPU) ALU/TEX információi sem helyesek, ugyanis 2x1 tömbbel több van benne, mint amit a szeptember közepén kiszivárgott (hamis) slide mutatott;
  • Végül a HD6870 kártya core órajele a korábban tervezett 850MHz helyett 900MHz-re ugrott.
A fentiek miatt a spekuláció a HD6870-re vonatkozóan teljesen helytelen eredményeket ad - viszont vicces módon jól közelíti a HD6850 teljesítményét, ami ténylegesen 960 ALU és 48 TEX egységgel bír, és mindössze órajelek terén van néhány százalékkal a cikkben feltételezett értékek alatt.
Bevezető
Új VGA-k megjelenése környékén a nagyközönség egyik legfőbb szórakozása, hogy próbálja a hétpecsétes titoként kezelt paramétereket valahonnan kiszagolni. Nyilván a gyártóknak ez nem annyira szórakoztató - ők jobban örülnének, ha a konkurencia nem értesülne hónapokkal korábban a terveikről, mert még a végén valami célzatos ellenlépéssel találnak előállni, ami alaposan le tudja lombozni a launch party-t. A nagy titokzatoskodás néha jobban sikerül, néha kevésbé - a HD6000-es széria kapcsán, úgy tűnik, a kevésbé változat áll fenn, mert az október végére-november elejére várható HD6770-es kártya adatai egy hitelesnek tűnő prezentációs slide formájában Internet-szerte hozzáférhetőek. Mivel a HD6770 alapját képező Barts GPU némileg szokatlan az AMD utóbbi néhány szériája tekintetében, kicsit megvizsgáltuk közelebbről, és némi felelőtlen jóslatokba bocsátkoztunk a várható teljesítményével kapcsolatban.

A HD6770, minden bizonnyal egy nem végleges mintapéldány formájában (forrás: chiphell.com)
Felépítés, várható teljesítmény
Mivel a Barts chip leginkább a HD5770-es alapjául szolgáló Juniper felturbózott változatának tekinthető, becslé-sünknek a HD5770-es kártya teljesítménye fog alapjául szolgálni. Lássuk, hogy fest a két GPU kapacitások terén:
VGA neve HD5770 HD6770 6770 vs 5770
Core órajel 850 MHz 850 MHz 0%
Shader órajel 850 MHz 850 MHz 0%
Memória-órajel 1200 MHz 1050 MHz -14.3%
Memória mennyisége 1024 MB 1024 MB
Geometriai egységek 1 1? 0%?
Scanline konverzió 16 Pix/clock 32 Pix/clock? 100%?
ALU egységek 800 (5-way superscalar) 960 (5-way superscalar) 20%
Textúrázó egységek 40 48 20%
ROP egységek 16 32 100%
Memóriabusz és típus 128-bit gDDR5 256-bit gDDR5 100%
Triangle setup 850 Mtri / sec 850 Mtri / sec? 0%?
Scanline konverzió 13.6 GPix / sec 27.2 GPix / sec? 100%?
Számítási teljesítmény 1360 GFlops 1632 GFlops 20%
Texel fillrate, 32-bit (FP10) 34.0 GTex / sec 40.8 GTex / sec 20%
Pixel fillrate 13.6 GPix / sec 27.2 GPix / sec 100%
Z-only fillrate 54.4 GPix / sec 108.8 GPix / sec 100%
Memória-sávszélesség 76.8 GB / sec 134.4 GB / sec 75%
Jó kis vegyes eredményt kaptunk, nézzük sorban:
  • A Barts frontendje körül van a legtöbb kérdőjel - azt valószínűnek tartjuk, hogy a Cypress-hez hasonlóan (és a Junipertől eltérően) duplázzák a scanline konverziós tudást, de erről adatunk nincs. Másfelől az sem kizárt, hogy az nVidia Fermi családjának mintájára még a setup egységeket is kétfelé veszik - ennek viszont annyira nagy esélyét nem látjuk a középkategóriás Barts chipben, ezért a kalkulációban megmaradtunk az 1 geometriai egységnél. Nagyon sok jelentősége amúgy nincs a dolognak, mert a Juniper még abszolút nem volt gyenge frontendben, csak a duplaakkora Cypress alatt kezdett recsegni-ropogni a GPU eleje, ezért itt számottevő extra teljesítményt ettől a tényezőtől nem várunk.
  • A 20%-kal több ALU és TEX egység minden bizonnyal jól fog hasznosulni.
  • Végül a backend rész brutálisan meg van erősítve a Juniperhez képest - gyakorlatilag a Cypress backendjét találjuk a chipen. Azért duplázásról nincs szó - miután mind a Juniper, mind a Cypress esetén a memória-sávszélesség fogta vissza a kártyát, a duplaannyi ROP a 75%-kal magasabb sávszélességgel nem fogja teljesen kifutni magát - persze nyilván nem ez lesz a kártyán a szűk keresztmetszet.
Összegészében egy olyan chipet kaptunk, ahol elsősorban az ALU-kapacitás fogja bekorlátozni a kártya tudását - a teljesítmény-becslő modellünk szerint kb. 40%-kal lesz gyorsabb a HD6770, mint a HD5770. Ezt a következők tudják még befolyásolni:
  • A setup és a scanline konverzió pontos paraméterei (+/-)
  • Az extra ROP teljesítmény sok szituációban nem fog kijönni, az ALU-k vissza fogják fogni a kártyát (-)
  • Viszont nem kizárt, hogy itt-ott némi optimalizációt vet be az AMD (+)
A becslésünk ebből következően egy konzervatív 35-40%. Lássuk, mire lesz elég ez az extra teljesítmény!
A HD6770 és a konkurencia
Nézzük kicsit vizuálisabban, hová várjuk a HD6770-est a legközelebbi konkurrenseihez képest:

Summary - Average fps (displayed post-flash)

1920x1080 DX10 Balanced HD5770||||||||||||||||||||||||||||||||||||||||| 40.5
HD5830|||||||||||||||||||||||||||||||||||||||||||||||| 47.9
GTX460 768MB|||||||||||||||||||||||||||||||||||||||||||||||||| 49.6
HD6770 lower end||||||||||||||||||||||||||||||||||||||||||||||||||||||| 54.7
GTX460 1GB||||||||||||||||||||||||||||||||||||||||||||||||||||| 53.1
HD6770 higher end||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 56.7
1920x1080 DX10 Max HD5770|||||||||||||||||||||||||| 26.2
HD5830||||||||||||||||||||||||||||||| 31.1
GTX460 768MB||||||||||||||||||||||||||||||| 30.7
HD6770 lower end||||||||||||||||||||||||||||||||||| 35.4
GTX460 1GB|||||||||||||||||||||||||||||||||| 33.8
HD6770 higher end||||||||||||||||||||||||||||||||||||| 36.7
1920x1080 DX11 Balanced HD5770||||||||||||||||||||||||||||||||||| 35.3
HD5830||||||||||||||||||||||||||||||||||||||||||| 43.2
GTX460 768MB||||||||||||||||||||||||||||||||||||||||||| 42.8
HD6770 lower end|||||||||||||||||||||||||||||||||||||||||||||||| 47.7
GTX460 1GB|||||||||||||||||||||||||||||||||||||||||||||| 45.7
HD6770 higher end||||||||||||||||||||||||||||||||||||||||||||||||| 49.4
1920x1080 DX11 Max HD5770|||||||||||||||||||| 20
HD5830|||||||||||||||||||||||| 23.9
GTX460 768MB||||||||||||||||||||||||| 24.7
HD6770 lower end||||||||||||||||||||||||||| 27
GTX460 1GB|||||||||||||||||||||||||||| 27.5
HD6770 higher end|||||||||||||||||||||||||||| 28

Hosszas analízist nem fűznénk az irdatlan méretű grafikonhoz, elég annyi, hogy jelen adatok alapján úgy tűnik, az AMD jóslatának megfelelően a HD6770-es, ha csak minimálisan is, de meg fogja előzni az 1GB-os GTX460-at. Érdekes ősznek nézünk elébe VGA-fronton!