Barts VS GF104

Elemzés - 2010/11/22

Oldalak:     
Fórum
Bevezető
Rutinos Olvasóink tudják lapunkról, hogy nálunk legalább annyira nagy hangsúly van a GPU-k architektúrális tulajdonságain, mint a videokártyák teljesítményén. Ezért aztán amikor egy-egy új GPU megjelenik, nem mulasztjuk el a lehetőséget, hogy alaposan a körmére nézzünk, és lehetőleg valamelyik konkurens megoldás tükrében fel ne mérjük a teljesítményét - ez történt a nyáron az nVidia GF104 névre hallgató chipjével (cikkünket ld. itt), amikor a méretben és tranzisztorszámban hozzá legközelebb álló Cypress-szel vetettük össze. Alig telt el pár hónap, és a GF104 kihívóból kihívott lett - ezúttal az összehasonlítást nem a méretbeli hasonlóság provokálta, hanem az, hogy az AMD-nek nem tetszett a GTX460-ak sikere, és a Barts chipre épített kártyái közül a kisebbet, a HD6850-et árban meglehetősen aggresszíven az 1GB-os GTX460 ellen állította csatasorba. Mivel a Barts chip jóval kisebb, mint a GF104, ezt költséghatékonyan meg is tudta tenni - és a két videokártyát összehasonlító tesztünkből kiderül, hogy a HD6850 igencsak eredményesen végzi a feladatát.

Két roppantul különböző termék
Miután a GTX460-ak a referencia-ajánlás szerint relatíve alacsony órajelen érkeznek, viszont emelett az nVidia teledekorálta az Internetet a tuning-képességeikkel, célszerűnek tartottuk a két konkurens kártya chipjeit azonos órajelek mellett is összemérni. Tehettük ezt azért, mert mindkét chip esetében 1GHz körüli legjobb eredményeket látunk feszültségemelés mellett és léghűtéssel, és a memória-órajelek esetében sincs már meg az az előny AMD-oldalon, ami a Cypress-t jellemezte.
Mind a GTX460 1GB, mind a HD6850 csonkolt chipre épít - mindkét chipből ALU+TEX egységek hiányoznak, a GTX460-ban a teljes chip számítási és textúrázási kapacitásának 87.5%-a található meg, a HD6850-ben pedig ez az érték 85.7%, azaz szinte egyforma a csonkítás mértéke.
Órajelek tekintetében a HD6850 számai mellett döntöttünk - ez core órajelben 14.8%, memória órajelben pedig 11.1%-os emelés a GTX460-nak, azaz a GPU "egyensúlyát" nem borítjuk fel.
Fogyasztás
Tesztjeink ismerői tudják, hogy most a hűtések jellemzésének kellene következni - sajnos a HD6850-nel befürödtünk, mert a kártya gyári BIOS-a valamilyen megfontolásból 75% környékén tartotta a ventillátort, amitől a legnagyobb terhelés mellett sem ment a hőmérő 67 foknál magasabbra, viszont meglehetősen hangos volt a kártya. GTX460-asunk 74 fokig melegedett, aholis a pörgettyű 70%-on ment - és mivel egy nagyságrenddel halkabb volt így, erős a gyanúnk, hogy a Radeon kártyánál a %-ok sem ugyanazt a fordulatszámot takarják, annak ellenére, hogy mindkét tesztelt kártya a Gigabyte-féle Windforce hűtéssel volt szerelve. Csupa rejtély az élet...
A fogyasztások összevetésének viszont már nem állt az útjába semmilyen ventillátor:

Power consumption - Mafia II 1920x1080 Max (displayed post-flash)

Idle GTX460-1G @775/1000|||||||||||||||||| 91
HD6850||||||||||||||||||| 93
Load GTX460-1G @775/1000||||||||||||||||||||||||||||||||||||||||||||||||||||| 265
HD6850|||||||||||||||||||||||||||||||||||||||| 200

... és ez a grafikon bizony igen csúnyán fest. Egyfelől a HD6850 fogyasztása igencsak szerény (becslésünk szerint a 200W felvett teljesítményből kb. 90W jut a VGA-ra, ami kevesebb, mint 80W tényleges fogyasztás), másrészt a tuningolt GTX460 (155W/130W), bár túlzottan nagyétkűnek nem nevezhető, nem is kifejezetten takarékos, a HD6850-et fogyasztás terén mintegy 60%-kal haladja meg.
Felépítés, várható teljesítmény
Lássuk közkedvelt táblázatunkat a GPU-k tulajdonságaival és az ezekből következő kapacitásokkal:
VGA neve GF104 (336 ALU) Barts Pro Barts vs GF104
Core órajel 775 MHz 775 MHz
Shader órajel 1550 MHz 775 MHz
Memória-órajel 1000 MHz 1000 MHz
Memória mennyisége 1024 MB 1024 MB
Tranzisztorok száma 1.95 milliárd 1.70 milliárd
Gyártástechnológia 40nm (TSMC) 40nm (TSMC)
Geometriai egységek 2 1
Scanline konverzió 16 Pix/clock * 32 Pix/clock
ALU egységek ("SP"-k) ** 224-336 (scalar) 960 (5-way superscalar)
Textúrázó egységek 56 48
ROP egységek 32 32
Memóriabusz és típus 256-bit gDDR5 256-bit gDDR5
Triangle setup 1550 Mtri / sec 775 Mtri / sec -100%
Scanline konverzió 12.4 GPix / sec 24.8 GPix / sec 100%
Számítási teljesítmény * 694-1041 GFlops 1488 GFlops
Texel fillrate, 32-bit (FP10) 43.4 GTex / sec 37.2 GTex / sec -16.6%
Pixel fillrate 24.8 GPix / sec 24.8 GPix / sec 0%
Z-only fillrate 99.2 GPix / sec 99.2 GPix / sec 0%
Memória-sávszélesség 128.0 GB / sec 128.0 GB / sec 0%
*: nemrégiben rá kellett jönnünk, hogy a Fermi chipek scanline konverziós egységei csak 8 pixel/clock sebességgel dolgoznak, nem 16-tal.
**: a két chip számítási kapacitása nem hasonlítható közvetlenül össze, mert eltérő felépítésűek az ALU blokkok.
Sokban hasonlít a két chip, lássuk, hol van eltérés:
  • Az újonnan kiderített scanline konverziós teljesítménnyel a GF104 elég hülyén fest a Barts-szal összevetve - duplaannyi háromszöget dolgoz fel, viszont ezeket fele sebességgel pixelesíti. Ez a felállás akkor jó, ha sok az eldobandó háromszög - ha sokat kell vizsgálni, viszont utána sokat is kell pixellé konvertálni, akkor a Barts chip előnyben van.
  • Textúrázásban a GF104 áll jobban, és bár az ALU-teljesítmény nem összevethető közvetlenül, ebben is az nVidia chipje tűnik acélosabbnak, talán kb. hasonló mértékben, mint a textúrázásnál. Persze egyes játékoknál kevésbé hátrányos az AMD-féle ALU-modell, azokban jobban kijön a sok-sok GFlops értéke.
  • Backend kapacitások terén pedig egyforma a két chip.
A magasabb ALU és TEX teljesítmény 5-10% közötti előnyt jelenthet a GTX460-nak - ezt valamelyest kompenzálja a HD6850 előnye a scanline konverzióban, mert az esetek többségében inkább ez lesz a frontend oldalon a szűk keresztmetszet, nem a háromszögek válogatása.
Tesztkörnyezet
A konfiguráció elemei
Alaplap Gigabyte P45-DS3R, FSB @400MHz
CPU és órajel Intel Q9550 @Q9770 (3.2GHz, 8x400)
CPU hűtés Cooler Master HyperTX3
Memória 4x1GB Geil Ultra DDR2-8500
Memória beállítások 1066MHz (2.66x400), 5-5-5-15, tRD: 8
Tápegység Corsair TX650
Operációs rendszer Windows 7 x64
VGA Core clock Shader clock Memory clock Driver
GeForce GTX460 1GB 775 MHz 1550 MHz 1000 MHz ForceWare 260.99 WHQL
Radeon HD6850 775 MHz 1000 MHz Catalyst 10.10d hotfix
A tesztben résztvevő játékok
  • Battlefield: Bad Company 2
  • Crysis Warhead
  • F1 2010
  • Just Cause 2
  • Lost Planet 2
  • Mafia II
  • METRO 2033
  • STALKER: Call of Pripyat
  • Unigine Heaven 2.1
Lássuk akkor, mit kezd egymással a két architektúra!
Oldalak:     
Fórum