RV740-várás

Piaci spekuláció - 2009/01/17

Figyelmeztetés
Az alábbi cikkben leírtak az Interneten keringő információk, a piaci környezet ismerete és a józan paraszti ész összekombinálásából jöttek létre. Bár valószínűnek tartjuk, hogy a lent leírtakhoz valami nagyon hasonló fog kijönni az AMD "gyárból", a tévedés jogát fenntartjuk :)
Update: az RV740-es chipre épülő HD4770 kártya megjelenése mindkét alábbi feltételezésünket cáfolta, mert az új chip lényegében a HD4830 paramétereit hordozza, 128-bites memóriabusszal és gDDR5-tel helyettesítve az RV770 256-bites buszát és a hozzá kapcsolt gDDR3 memóriát. A lenti írás ennek tükrében már inkább csak érdekesség a spekuláció és a valóság viszonyáról.
Mi az az RV740, és mi vezetett hozzá?
Az AMD az RV700-as chipekkel (HD4000-es széria) végleg áthelyezte a hangsúlyt a kis méretű, költséghatékonyan gyártható, de mindemellett mégis jó teljesítményt nyújtó GPU-kra. A teljesítmény-bajnoki cím eleresztése valószínűleg jelentős nyomástól szabadította meg a tervezőket, mert a sorozat első tagja, az RV770 (HD4850 és HD4870) remek eredményeket ért el hatékonyság terén - 30%-kal kevesebb tranzisztorral és kevesebb, mint fele alapterületen az nVidia GT200-as GPU-jával szerelt GTX200-as kártyái nyakán liheg.
Értelemszerűen ezt a hatékonyságot az alacsonyabb szegmensbe is át kellett vinni, így született az RV730 (HD4670), amely azzal lepte meg a nagyérdeműt, hogy az előző széria ár/érték bajnokával, a HD3850-nel tartani tudja a lépést. Ez a chip, amellett, hogy egy kitűnő ár/érték arányú kártya lelkét adja, lehetőséget adott az AMD-nek arra, hogy kísérletezzen az RV770 megnyirbálásával, és irányt mutasson, hogy egy igazán jó középkategóriás chipet hogyan lehet optimálisan kihozni.
Végül meg kell még említeni az RV770LE GPU-t (HD4830), amely a kevés hibával rendelkező RV770 chipek értékesíthetőségét szolgálja, és olyan jól sikerült, hogy még a HD4850-es kártyát is elhomályosítja. Ezen a chip teljesítménye is nyilván számos hasznos tapasztalattal gazdagította az AMD tervezőit.
A fentiek után akkor térjünk rá az RV740-re. Ez a chip az AMD első 40nm-en készülő GPU-ja lesz, nyilván részben azzal a célzattal, hogy a 40nm-es gyártási folyamat fogzási gondjait egy olcsóbb chipen keresztül vészeljék át. És hogy mit fog tudni? Azt próbáljuk kispekulálni lentebb!
Ami nagyjából biztos
Bár teljesen semmi sem biztos, van pár információ, amit meglehetős bizonyossággal lehet sejteni:
  • 40nm-es gyártási processz
  • gDDR5-ös memória
Mire lehet ebből következtetni?
Az AMD céljainak ismeretében, ill. a józan logika mentén az alábbiak látszanak:
  • A GPU nem a HD4670-et fogja váltani, ahhoz ugyanis felesleges lenne megduplázni a memória-sávszélességet. Valószínűleg a HD4830 lesz a célpont - az a GPU a teljesítményéhez képest drága, és ha az RV770 chipek kihozatali aránya nagyon magas lesz, akkor a drágábban eladható HD4850 helyett is HD4830-at kell egyes chipekből gyártani a kereslet kielégítése érdekében.
  • Az RV740-re építő kártya a HD4830-nál valamivel alacsonyabb teljesítményre lesz belőve, mert a HD4830 a HD4850 órajelén hajtva szinte ugyanazt a teljesítményt hozza számos játékban, mint a nagyobbik testvér - mi nem tartjuk valószínűnek, hogy az RV740-nel az AMD a HD4850-et is le akarná váltani.
  • Shader és textúrázó teljesítményben valahol a HD4830 körül fogunk járni. Ehhez el kell szakadni az RV730 8 cluster, clusterenként 8x5 SP és 4 textúrázó modelljétől - itt az RV770-es clusterekre lesz szükség (16x5 SP, 4 textúrázó). Nagyon népszerű a 8 clusterről (640SP) szóló pletyka - a másik reális alternatíva a 6 cluster (480SP).
  • 128-bites memóriabuszra számítunk - ez ugyan tényként hangzik el mindenhol, de ugyanúgy tényként kezelik a 16 ROP-ot is, és a kettő együtt kizárt, hogy igaz legyen. Miután a 128-bit + gDDR5 kombinációval kényelmesen elérhető a HD4830 vagy a HD4850 memória-sávszélessége, mi erre a verzióra tesszük a voksunkat.
  • A 128-bites memóriabusz 2 ROP blokkot jelent, egyenként 4 ROP-pal
  • A 8 ROP viszont nagyon vissza fogja húzni a kártyát, ezért a core órajelnek számottevően magasabbnak kell lennie, mint a HD4830 esetében
  • Voltak pletykák arról is, hogy az új chip mérete 100mm2 körül lesz - ez durván 650-700M tranzisztort jelent.
A fenti elgondolások mentén összeállítottunk két teoretikus kártyát - az egyik a 128-bites memóriabuszra épít, a másik a 192-bitesre (itt viszont elvetettük a gDDR5-öt).
A teoretikus kártyák adatai
Az alábbi táblázat az RV730, a fent felsorolt két elméleti RV740 variáns, valamint az RV770LE adatait veti össze:
VGA neve RV730 / HD4670 RV740-A RV740-B RV770LE / HD4830
Core órajel 750 MHz 750 MHz 600 MHz 575 MHz
Memória-órajel 1000 MHz 900 MHz 1000 MHz 900 MHz
Memória mennyisége 512 MB 512 MB 512 MB 512 MB
ALU-k (SP-k) 320 480 640 640
Textúrázó egységek 32 24 32 32
ROP egységek 8 8 12 16
Memóriabusz 128-bit 128-bit 192-bit 256-bit
Memória típusa gDDR3 gDDR5 gDDR3 gDDR3
Számítási teljesítmény 480 GFlops 720 GFlops 768 GFlops 736 GFlops
Texel fillrate 24.0 GTex / sec 18.0 GTex / sec 19.2 GTex / sec 18.4 GTex / sec
Pixel fillrate 6.0 GPixel / sec 6.0 GPixel / sec 7.2 GPixel / sec 9.2 GPixel / sec
Memória-sávszélesség 32.0 GB / sec 57.6 GB / sec 48.0 GB / sec 57.6 GB / sec
Lássuk, mit mondanak a nyers erőt demonstráló adatok:
  • Az RV740-B az alacsonyabb fillrate és memóriasávszélesség kapcsán valós alkalmazásokban kb. 5-10%-kal múlná alul az RV770LE-t - ezen lehet hangolni a core órajel emelésével, csak kérdés, mennyi értelme van, mert az így keletkező kártya igen rövid úton a 4850-et is elkezdené szorongatni. Méretek tekintetében ez a variáns nem áll túl jól - csak a 4 ROP-pal, egy 64-bites memóriavezérlővel és azzal a 2 clusterrel kisebb lenne kisebb, ami az RV770-ben inaktív. Ezzel véleményünk szerint nem lehet 260-300 millió tranzisztort megspórolni.
  • Az RV740-A a teljesítmény-mutatókat tekintve szinte másolja az RV770LE-t, egyedül a fillrate (és az összes többi ROP-művelet) terén van komoly hátránya - az RV770LE itt 50%-kal gyorsabb. Ez játékokban AA mellett rossz esetben 10-15% sebesség-különbséget jelenthet, jó esetben minimálisat. Megspórolunk 8 ROP-ot, 2 memóriavezérlőt és 4 clustert - ez a megoldás talán már tranzisztorszám tekintetében is kielégítő eredményt fog adni.
Konklúzió
A leírtak alapján mi a táblázatban RV740-A néven jelölt megoldásra tennénk le a voksunkat - remélhetőleg hamarosan kiderül, mennyire spekuláltunk jól!