Bevezető
Rutinos Olvasóink tudják lapunkról, hogy nálunk legalább annyira nagy hangsúly van a GPU-k
architektúrális tulajdonságain, mint a videokártyák teljesítményén. Ezért aztán amikor egy-egy új GPU
megjelenik, nem mulasztjuk el a lehetőséget, hogy alaposan a körmére nézzünk, és lehetőleg valamelyik
konkurens megoldás tükrében fel ne mérjük a teljesítményét - ez történt a nyáron az nVidia GF104 névre
hallgató chipjével (cikkünket ld. itt), amikor a méretben
és tranzisztorszámban hozzá legközelebb álló Cypress-szel vetettük össze. Alig telt el pár hónap,
és a GF104 kihívóból kihívott lett - ezúttal az összehasonlítást nem a méretbeli hasonlóság provokálta,
hanem az, hogy az AMD-nek nem tetszett a GTX460-ak sikere, és a Barts chipre épített kártyái közül a kisebbet,
a HD6850-et árban meglehetősen aggresszíven az 1GB-os GTX460 ellen állította csatasorba. Mivel a Barts chip jóval
kisebb, mint a GF104, ezt költséghatékonyan meg is tudta tenni - és a
két videokártyát összehasonlító tesztünkből kiderül, hogy a HD6850
igencsak eredményesen végzi a feladatát.
Két roppantul különböző termék
Miután a GTX460-ak a referencia-ajánlás szerint relatíve alacsony órajelen
érkeznek, viszont emelett az nVidia teledekorálta az Internetet a tuning-képességeikkel, célszerűnek tartottuk
a két konkurens kártya chipjeit azonos órajelek mellett is összemérni. Tehettük ezt azért, mert mindkét
chip esetében 1GHz körüli legjobb eredményeket látunk feszültségemelés mellett és léghűtéssel, és
a memória-órajelek esetében sincs már meg az az előny AMD-oldalon, ami a Cypress-t jellemezte.
Mind a GTX460 1GB, mind a HD6850 csonkolt chipre épít - mindkét chipből ALU+TEX egységek hiányoznak,
a GTX460-ban a teljes chip számítási és textúrázási kapacitásának 87.5%-a található meg, a HD6850-ben pedig
ez az érték 85.7%, azaz szinte egyforma a csonkítás mértéke.
Órajelek tekintetében a HD6850 számai mellett döntöttünk - ez core órajelben 14.8%, memória órajelben
pedig 11.1%-os emelés a GTX460-nak, azaz a GPU "egyensúlyát" nem borítjuk fel.
Fogyasztás
Tesztjeink ismerői tudják, hogy most a hűtések jellemzésének kellene következni - sajnos a HD6850-nel
befürödtünk, mert a kártya gyári BIOS-a valamilyen megfontolásból 75% környékén tartotta a ventillátort, amitől
a legnagyobb terhelés mellett sem ment a hőmérő 67 foknál magasabbra, viszont meglehetősen hangos volt a
kártya. GTX460-asunk
74 fokig melegedett, aholis a pörgettyű 70%-on ment - és mivel egy nagyságrenddel halkabb
volt így, erős a gyanúnk, hogy a Radeon kártyánál a %-ok sem ugyanazt a fordulatszámot takarják, annak
ellenére, hogy mindkét tesztelt kártya a Gigabyte-féle Windforce hűtéssel volt szerelve. Csupa rejtély az élet...
A fogyasztások összevetésének viszont már nem állt az útjába semmilyen ventillátor:
Power consumption - Mafia II 1920x1080 Max (displayed post-flash)
Idle | GTX460-1G @775/1000 | |||||||||||||||||| 91 |
HD6850 | ||||||||||||||||||| 93 | |
Load | GTX460-1G @775/1000 | ||||||||||||||||||||||||||||||||||||||||||||||||||||| 265 |
HD6850 | |||||||||||||||||||||||||||||||||||||||| 200 |
... és ez a grafikon bizony igen csúnyán fest. Egyfelől a HD6850 fogyasztása igencsak szerény (becslésünk
szerint a 200W felvett teljesítményből kb. 90W jut a VGA-ra, ami kevesebb, mint 80W tényleges fogyasztás),
másrészt a tuningolt GTX460 (155W/130W), bár túlzottan nagyétkűnek nem nevezhető, nem is kifejezetten takarékos,
a HD6850-et fogyasztás terén mintegy 60%-kal haladja meg.
Felépítés, várható teljesítmény
Lássuk közkedvelt táblázatunkat a GPU-k tulajdonságaival és az ezekből következő kapacitásokkal:
VGA neve | GF104 (336 ALU) | Barts Pro | Barts vs GF104 |
Core órajel | 775 MHz | 775 MHz | |
Shader órajel | 1550 MHz | 775 MHz | |
Memória-órajel | 1000 MHz | 1000 MHz | |
Memória mennyisége | 1024 MB | 1024 MB | |
Tranzisztorok száma | 1.95 milliárd | 1.70 milliárd | |
Gyártástechnológia | 40nm (TSMC) | 40nm (TSMC) | |
Geometriai egységek | 2 | 1 | |
Scanline konverzió | 16 Pix/clock * | 32 Pix/clock | |
ALU egységek ("SP"-k) ** | 224-336 (scalar) | 960 (5-way superscalar) | |
Textúrázó egységek | 56 | 48 | |
ROP egységek | 32 | 32 | |
Memóriabusz és típus | 256-bit gDDR5 | 256-bit gDDR5 | |
Triangle setup | 1550 Mtri / sec | 775 Mtri / sec | -100% |
Scanline konverzió | 12.4 GPix / sec | 24.8 GPix / sec | 100% |
Számítási teljesítmény * | 694-1041 GFlops | 1488 GFlops | |
Texel fillrate, 32-bit (FP10) | 43.4 GTex / sec | 37.2 GTex / sec | -16.6% |
Pixel fillrate | 24.8 GPix / sec | 24.8 GPix / sec | 0% |
Z-only fillrate | 99.2 GPix / sec | 99.2 GPix / sec | 0% |
Memória-sávszélesség | 128.0 GB / sec | 128.0 GB / sec | 0% |
*: nemrégiben rá kellett jönnünk, hogy a Fermi chipek
scanline konverziós egységei csak 8 pixel/clock sebességgel dolgoznak, nem 16-tal.
**: a két chip számítási kapacitása nem hasonlítható közvetlenül össze,
mert eltérő felépítésűek az ALU blokkok.
Sokban hasonlít a két chip, lássuk, hol van eltérés:
- Az újonnan kiderített scanline konverziós teljesítménnyel a GF104 elég hülyén fest a Barts-szal összevetve - duplaannyi háromszöget dolgoz fel, viszont ezeket fele sebességgel pixelesíti. Ez a felállás akkor jó, ha sok az eldobandó háromszög - ha sokat kell vizsgálni, viszont utána sokat is kell pixellé konvertálni, akkor a Barts chip előnyben van.
- Textúrázásban a GF104 áll jobban, és bár az ALU-teljesítmény nem összevethető közvetlenül, ebben is az nVidia chipje tűnik acélosabbnak, talán kb. hasonló mértékben, mint a textúrázásnál. Persze egyes játékoknál kevésbé hátrányos az AMD-féle ALU-modell, azokban jobban kijön a sok-sok GFlops értéke.
- Backend kapacitások terén pedig egyforma a két chip.
A magasabb ALU és TEX teljesítmény 5-10% közötti előnyt jelenthet a GTX460-nak -
ezt valamelyest kompenzálja a HD6850 előnye a scanline konverzióban, mert az esetek többségében inkább ez lesz
a frontend oldalon a szűk keresztmetszet, nem a háromszögek válogatása.
Tesztkörnyezet
A konfiguráció elemei | |
Alaplap | Gigabyte P45-DS3R, FSB @400MHz |
CPU és órajel | Intel Q9550 @Q9770 (3.2GHz, 8x400) |
CPU hűtés | Cooler Master HyperTX3 |
Memória | 4x1GB Geil Ultra DDR2-8500 |
Memória beállítások | 1066MHz (2.66x400), 5-5-5-15, tRD: 8 |
Tápegység | Corsair TX650 |
Operációs rendszer | Windows 7 x64 |
VGA | Core clock | Shader clock | Memory clock | Driver |
GeForce GTX460 1GB | 775 MHz | 1550 MHz | 1000 MHz | ForceWare 260.99 WHQL |
Radeon HD6850 | 775 MHz | 1000 MHz | Catalyst 10.10d hotfix |
A tesztben résztvevő játékok
- Battlefield: Bad Company 2
- Crysis Warhead
- F1 2010
- Just Cause 2
- Lost Planet 2
- Mafia II
- METRO 2033
- STALKER: Call of Pripyat
- Unigine Heaven 2.1
Lássuk akkor, mit kezd egymással a két architektúra!