További RV870 spekulációk

Piaci spekuláció - 2009/09/27

Oldalak: << - < - 1 - 2 - 3 - > - >>
Bevezető
Miután intenzíven elkezdtek a HD5800-as kártyák adatai szivárogni, mi is készítettünk egy rövid elemzést a HD5870 és a HD5850 várható teljesítményéről. Az itt becsült számok némileg fölélőttek annak, amit 12 nappal később a tesztek mutattak - utánajártunk, hogy ennek mi lehetett az oka, ill. egy kicsit elidőztünk a HD5850-nél, valamint megpróbáltuk megjósolni, mi várható a HD5700-as széria kapcsán.

Miért nem gyorsabb a HD5870 a HD4870X2-nél?
Bár az előző cikkben is láttuk, hogy a gyakorlatban a HD5870-nel nem számíthatunk kétszeres gyorsulásra a HD4870-hez képest, úgy tűnt, hogy a helyenként skálázódási nehézségekkel küzdő HD4870X2-t bőven meg fogja tudni előzni az új kártya - ill. a kiemelten VGA-limitált esetekben azért közel kétszer annyi fps-t fog tudni produkálni, mint a HD4870. Az eddig megjelent tesztek azonban azt mutatják, hogy a nálunk normál beállításként futó 1920x1200 4xAA beállítás mellett a HD4870X2 átlagosan picivel gyorsabb, és a HD4870-hez képest az előny inkább 60-70%, 80% fölé már kevés játékban jutunk. Megpróbáltuk összeszedni, hogy milyen összetevői lehetnek ennek a különbségnek:
  • Driver: Az ATI / AMD kapcsán mindig népszerű téma a driver hiányosságaira hivatkozni - jelenleg olaj a tűzre, hogy a HD5870-eshez jelenleg csak "béta" címkével ellátott driverek elérhetőek. Véleményünk szerint nincs szó "kőkorszaki" szintű driverről, viszont ettől függetlenül nyilván a több, mint 1 éves HD4800-asok drivere kiforrottabb, ezért az idő múlásával számíthatunk némi gyorsulásra. Ezért a "hiányzó" teljesítményből 5-10%-ot a driver számlájára írunk.
  • Interpolátor egységek: A HD5870 hivatalos megjelenésével derült ki, hogy az RV770-es chip fix funkciós interpolátorai eltűntek, és a funkciójukat a shader core vette át. Ez marketinges szemmel nézve azt jelenti, hogy a súlyosan interpolátor-limitált esetekben javulni fog az átbocsátóképesség, viszont kicsit reálisabb szemszögből, az interpolátorok kiváltásához szükséges ALU-teljesítményt elveszíti a kártya. Véleményünk szerint egy interpolátor ára 1db 5-utas szuperskalár egység (ideális ütemezést feltételezve), tehát szélső esetben a 64 elméleti interpolátor a GFlops-ok 1/5-ét elfogyasztja. Miután két erőforrás kombinálása mindig jár hatékonyság-növekedéssel, arra tippelünk, hogy az ALU-tömbök teljesítményét átlagosan 15%-kal fogja csökkenteni az interpolációs funkció, amitől a teljes chip teljesítménye durván 5%-kal lesz alacsonyabb.
  • Memória-sávszélesség: A hivatalos információk megjelenésekor talán a legnagyobb meglepetést a HD5870 memóriájának órajele okozta - míg az egész chip szinte mindenben ráduplázott a HD4870-re, és még a core órajel is emelkedett, a memória teljesítménye mindössze 33%-kal lett magasabb. Ez még úgy is kevésnek tűnik, hogy a HD4870 köztudottan bővében volt a sávszélességnek. A többi elemhez hasonló teljesítmény-növekedéshez a 256-bites busz mellett 2040MHz-es gDDR5 memóriára lett volna szükség, ami 70%-kal több, mint a HD5870 1200MHz-es memória-órajele. Ez a differencia modellünk szerint kb. 10%-os teljesítmény-csökkenést jelent, de érzésünk szerint ez a memória-sebesség számos esetben már komoly szűk keresztmetszet lehet, ezért 15%-kal kalkulálunk.
  • Egyéb tényezők: Két dolgot lehet még felhozni, mint várhatóan problémás területet - egyrészt központi vezérlő egység továbbra is csak egy van, másrészt, bár raszterizálóból lett kettő, ezek között a munkamegosztás várhatóan nem 100%-os hatékonyságú. Ezekből a gondokból már nem gyártunk további %-okat, de egy kis teljesítmény még itt is elveszhet.
A főbb problémákból adódó gondokat összesítve arra jutunk, hogy a valódi, kézzelfogható, és 2009. szeptemberi driverrel üzemelő HD5870-nél nagyjából 27-33%-kal lenne gyorsabb a "dream edition", amelyben minden kapacitás ténylegesen duplája a HD4870-ének - az egyszerűség kedvéért a következőkben ezt 30%-nak vesszük. Kérdés, hogy a "dream edition" mennyivel lenne gyorsabb, mint a HD4870? A dupla kapacitások és a 13%-kal magasabb órajel miatt az elméleti plafon +126%, amit csak megközelíteni lehet, elérni nem - ideális körülmények között +120%-os extra teljesítmény tekinthető kb. reálisnak. Ezek alapján a HD4870 és a "hús-vér" HD5870 között a különbség 70% (nem pedig 90%, ld. százalékszámítási szabályok), ami már korántsincs komoly ellentmondásban a gyakorlatban látottakhoz képest.
Lássuk egy grafikonon, hogy is sorakoznak fel a VGA-k egymáshoz képest - először feltételezve, hogy az 5870-variánsok nem futnak platform-limitációba:

Expected ideal performance (displayed post-flash)

Normal settings 1920x1200 4xAA HD4870 1GB|||||||||||||||||||||||||||||||||||||||||||||||| 48.0
HD4890||||||||||||||||||||||||||||||||||||||||||||||||||||| 53.0
HD5870 "real world"|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 81.6
HD5870 "Cat 10.9"|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 87.7
HD5870 "dream edition"|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 105.8

A grafikonon feltüntettünk a fentebb említett két HD5870 variáns mellett egy harmadikat - egy olyat, ami egy jövőbeli Catalyst 10.9-es driverrel üzemel, ezáltal megjósolva a teljesítményt akkor, amikor a meghajtó hasonló érettségi szintre lép, mint a HD4800-as széria esetében. A jelenlegi kártyától tehát átlagosan +70% teljesítményt várhatunk a HD4870-hez, ill. +54%-ot a HD4890-hez képest - a driverek finomodásával ezek az értékek felmehetnek +83%-ra, ill. +65%-ra.
Most pedig lássuk azt a grafikont, ami a múltkorihoz hasonlóan a platform-limitációt is figyelembe veszi:

Expected real performance (displayed post-flash)

Normal settings 1920x1200 4xAA HD4870 1GB|||||||||||||||||||||||||||||||||||||||||||||||| 48.0
HD4890||||||||||||||||||||||||||||||||||||||||||||||||||||| 53.0
HD4870X2|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 67.9
HD5870 "real world"||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 70.6
HD5870 "Cat 10.9"|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 74.0

Ezen a grafikonon már igencsak megtépázódik a HD5870 előnye - bár 10 játékból álló tesztcsomagunk (10 játék támogat 4xAA-t) tekintetében átlagosan még mindig egy kicsit gyorsabbnak tűnik, mint a HD4870X2, a HD4870-hez képest már csak 47% az előnye, a HD4890-et pedig 33%-kal utasítja maga mögé. Ezek a számok többé-kevésbé összecsengenek az Interneten hozzáférhető mérésekkel. Az újabb driverekkel sem lesz minden tökéletes - a HD4870-et nagy vonalakban 54%-kal, a HD4890-et pedig 40%-kal fogja megelőzni a HD5870. Érdemes persze hozzátenni, hogy a 10 játékból hármat már a HD4870 is megevett reggelire, így ezek nagyban lerontják az átlagos eredményt - de ez a valóságban is így van, aki pl. a GRID-del és a Crysis-szal játszik, az a második játékban a HD5870-nel meg fogja kapni a csaknem 70%-os teljesítmény-növekedést, míg az elsőben nagyjából semmi sem fog változni. Esetleg, ha vesz még két monitort, és aktiválja az Eyefinity-t :)
Összegezve a fentieket, amikor megbecsültük, hogy a HD5870 ideális esetben kétszer gyorsabb lehet a HD4870-nél, akkor egyrészt nem kalkuláltunk a driver érettségével (ebben idővel a HD5870 fel fog fejlődni), kicsit alábecsültük a memória-sávszélesség hatását (15% helyett 10%-kal számoltunk), és nem számoltunk (információ hiányában) az interpolátor célegységek megszüntetésével. Mindegyik tényező csak kismértékben járult hozzá a "real world edition" teljesítményének csökkenéséhez, viszont az együttes következményük az lett, hogy platform-limitáció nélkül is csak 70%-os extra teljesítményt várhatunk a HD5870-től a HD4870-hez képest - továbbra is átlagosan, kilengések mindkét irányba előfordulhatnak.
Nézzük a HD5850-et!
Oldalak: << - < - 1 - 2 - 3 - > - >>