RV740-várás
Piaci spekuláció - 2009/01/17
Figyelmeztetés
Az alábbi cikkben leírtak az Interneten keringő információk, a piaci környezet ismerete és a józan
paraszti ész összekombinálásából jöttek létre. Bár valószínűnek tartjuk, hogy a lent leírtakhoz valami
nagyon hasonló fog kijönni az AMD "gyárból", a tévedés jogát fenntartjuk :)
Update: az RV740-es chipre épülő HD4770 kártya megjelenése mindkét alábbi feltételezésünket
cáfolta, mert az új chip lényegében a HD4830 paramétereit hordozza, 128-bites memóriabusszal és gDDR5-tel
helyettesítve az RV770 256-bites buszát és a hozzá kapcsolt gDDR3 memóriát. A lenti írás ennek tükrében már inkább
csak érdekesség a spekuláció és a valóság viszonyáról.
Mi az az RV740, és mi vezetett hozzá?
Az AMD az RV700-as chipekkel (HD4000-es széria) végleg áthelyezte a hangsúlyt a kis méretű, költséghatékonyan
gyártható, de mindemellett mégis jó teljesítményt nyújtó GPU-kra. A teljesítmény-bajnoki cím eleresztése
valószínűleg jelentős nyomástól szabadította meg a tervezőket, mert a sorozat első tagja, az RV770 (HD4850 és
HD4870) remek eredményeket ért el hatékonyság terén - 30%-kal kevesebb tranzisztorral és kevesebb, mint fele
alapterületen az nVidia GT200-as GPU-jával szerelt GTX200-as kártyái nyakán liheg.
Értelemszerűen ezt a hatékonyságot az alacsonyabb szegmensbe is át kellett vinni, így született az RV730
(HD4670), amely azzal lepte meg a nagyérdeműt, hogy az előző széria ár/érték bajnokával, a HD3850-nel tartani tudja
a lépést. Ez a chip, amellett, hogy egy kitűnő ár/érték arányú kártya lelkét adja, lehetőséget adott az AMD-nek
arra, hogy kísérletezzen az RV770 megnyirbálásával, és irányt mutasson, hogy egy igazán jó középkategóriás chipet
hogyan lehet optimálisan kihozni.
Végül meg kell még említeni az RV770LE GPU-t (HD4830), amely a kevés hibával rendelkező RV770 chipek
értékesíthetőségét szolgálja, és olyan jól sikerült, hogy még a HD4850-es kártyát is elhomályosítja. Ezen a chip
teljesítménye is nyilván számos hasznos tapasztalattal gazdagította az AMD tervezőit.
A fentiek után akkor térjünk rá az RV740-re. Ez a chip az AMD első 40nm-en készülő
GPU-ja lesz, nyilván részben azzal a célzattal, hogy a 40nm-es gyártási folyamat fogzási gondjait egy olcsóbb
chipen keresztül vészeljék át. És hogy mit fog tudni? Azt próbáljuk kispekulálni lentebb!
Ami nagyjából biztos
Bár teljesen semmi sem biztos, van pár információ, amit meglehetős bizonyossággal lehet sejteni:
- 40nm-es gyártási processz
- gDDR5-ös memória
Mire lehet ebből következtetni?
Az AMD céljainak ismeretében, ill. a józan logika mentén az alábbiak látszanak:
- A GPU nem a HD4670-et fogja váltani, ahhoz ugyanis felesleges lenne megduplázni a memória-sávszélességet. Valószínűleg a HD4830 lesz a célpont - az a GPU a teljesítményéhez képest drága, és ha az RV770 chipek kihozatali aránya nagyon magas lesz, akkor a drágábban eladható HD4850 helyett is HD4830-at kell egyes chipekből gyártani a kereslet kielégítése érdekében.
- Az RV740-re építő kártya a HD4830-nál valamivel alacsonyabb teljesítményre lesz belőve, mert a HD4830 a HD4850 órajelén hajtva szinte ugyanazt a teljesítményt hozza számos játékban, mint a nagyobbik testvér - mi nem tartjuk valószínűnek, hogy az RV740-nel az AMD a HD4850-et is le akarná váltani.
- Shader és textúrázó teljesítményben valahol a HD4830 körül fogunk járni. Ehhez el kell szakadni az RV730 8 cluster, clusterenként 8x5 SP és 4 textúrázó modelljétől - itt az RV770-es clusterekre lesz szükség (16x5 SP, 4 textúrázó). Nagyon népszerű a 8 clusterről (640SP) szóló pletyka - a másik reális alternatíva a 6 cluster (480SP).
- 128-bites memóriabuszra számítunk - ez ugyan tényként hangzik el mindenhol, de ugyanúgy tényként kezelik a 16 ROP-ot is, és a kettő együtt kizárt, hogy igaz legyen. Miután a 128-bit + gDDR5 kombinációval kényelmesen elérhető a HD4830 vagy a HD4850 memória-sávszélessége, mi erre a verzióra tesszük a voksunkat.
- A 128-bites memóriabusz 2 ROP blokkot jelent, egyenként 4 ROP-pal
- A 8 ROP viszont nagyon vissza fogja húzni a kártyát, ezért a core órajelnek számottevően magasabbnak kell lennie, mint a HD4830 esetében
- Voltak pletykák arról is, hogy az új chip mérete 100mm2 körül lesz - ez durván 650-700M tranzisztort jelent.
A fenti elgondolások mentén összeállítottunk két teoretikus kártyát - az egyik a
128-bites memóriabuszra épít, a másik a 192-bitesre (itt viszont elvetettük a gDDR5-öt).
A teoretikus kártyák adatai
Az alábbi táblázat az RV730, a fent felsorolt két elméleti RV740 variáns, valamint az RV770LE adatait
veti össze:
VGA neve | RV730 / HD4670 | RV740-A | RV740-B | RV770LE / HD4830 |
Core órajel | 750 MHz | 750 MHz | 600 MHz | 575 MHz |
Memória-órajel | 1000 MHz | 900 MHz | 1000 MHz | 900 MHz |
Memória mennyisége | 512 MB | 512 MB | 512 MB | 512 MB |
ALU-k (SP-k) | 320 | 480 | 640 | 640 |
Textúrázó egységek | 32 | 24 | 32 | 32 |
ROP egységek | 8 | 8 | 12 | 16 |
Memóriabusz | 128-bit | 128-bit | 192-bit | 256-bit |
Memória típusa | gDDR3 | gDDR5 | gDDR3 | gDDR3 |
Számítási teljesítmény | 480 GFlops | 720 GFlops | 768 GFlops | 736 GFlops |
Texel fillrate | 24.0 GTex / sec | 18.0 GTex / sec | 19.2 GTex / sec | 18.4 GTex / sec |
Pixel fillrate | 6.0 GPixel / sec | 6.0 GPixel / sec | 7.2 GPixel / sec | 9.2 GPixel / sec |
Memória-sávszélesség | 32.0 GB / sec | 57.6 GB / sec | 48.0 GB / sec | 57.6 GB / sec |
Lássuk, mit mondanak a nyers erőt demonstráló adatok:
- Az RV740-B az alacsonyabb fillrate és memóriasávszélesség kapcsán valós alkalmazásokban kb. 5-10%-kal múlná alul az RV770LE-t - ezen lehet hangolni a core órajel emelésével, csak kérdés, mennyi értelme van, mert az így keletkező kártya igen rövid úton a 4850-et is elkezdené szorongatni. Méretek tekintetében ez a variáns nem áll túl jól - csak a 4 ROP-pal, egy 64-bites memóriavezérlővel és azzal a 2 clusterrel kisebb lenne kisebb, ami az RV770-ben inaktív. Ezzel véleményünk szerint nem lehet 260-300 millió tranzisztort megspórolni.
- Az RV740-A a teljesítmény-mutatókat tekintve szinte másolja az RV770LE-t, egyedül a fillrate (és az összes többi ROP-művelet) terén van komoly hátránya - az RV770LE itt 50%-kal gyorsabb. Ez játékokban AA mellett rossz esetben 10-15% sebesség-különbséget jelenthet, jó esetben minimálisat. Megspórolunk 8 ROP-ot, 2 memóriavezérlőt és 4 clustert - ez a megoldás talán már tranzisztorszám tekintetében is kielégítő eredményt fog adni.
Konklúzió
A leírtak alapján mi a táblázatban RV740-A néven jelölt megoldásra tennénk le a voksunkat - remélhetőleg
hamarosan kiderül, mennyire spekuláltunk jól!