Update: Sikerült szereznünk egy HD5750-es kártyát, így az emulált kártyával végzett méréseket
lecseréltük valódiakra. A konklúzió nem változott.
Bevezető
Várható volt, hogy az nVidia idővel úrrá lesz a Fermi architektúrás chipekkel kapcsolatos nehézségeken,
és akkor az AMD-hez hasonlóan megpróbálják lefedni GF10x-es GPU-kra épülő VGA-kkal a teljes árskálát, azaz
ők is jelentkeznek minden szegmensben DirectX 11-képes videokártyával. Mivel előállítási költség terén
az AMD jelentős előnyben van, az eddigi stratégia az volt, hogy nem közvetlen konkurenciát állítanak
a Radeon hardvernek, hanem az AMD megoldásai közötti résekbe érkeztetnek kártyákat, és a relatíve magasabb
árakat a "GeForce-ökoszisztéma" (PhysX, 3DVision és általában a CUDA) előnyeivel igyekeznek alátámasztani.
Így érkezett a HD5970 és a HD5870 közé a GTX480, a HD5870 és a HD5850 közé a GTX470, és a HD5850 alá a GTX465
és a GTX460 1GB-os verziója. A GTX460 alapjául szolgáló GF104-es chipre már készült egy árversenyzős kártya -
a Fermi-architektúra rugalmasságát kihasználva az nVidia épített egy 768MB-os kártyát, amely teljesítményben
a HD5830-assal egyenértékű, míg az árazásban ügyesen él a 256MB-tal kisebb memória adta olcsóbb előállítási
költséggel - a két kártya számára releváns beállítások mellett ugyanis a 768MB VRAM az esetek 95%-ában elég.
Megkapóan ismerős kép (vö. GTX460)
A legfrissebb versenyző a DirectX 11-es palettán a GTS450, amelyet az árazása alapján
a HD5750 ellenében szánták, esetleg egy kicsit fölé - az AMD viszont belekontárkodott a partiba,
mert a GTS450 megjelenésének tiszteletére árat csökkentett, és így az új nVidia VGA az MSRP-k alapján a két
HD5700-as között van. Később látni fogjuk, hogy az MSRP és a magyar piaci árak nem feltétlen egyforma arányokat
tükröznek, de ne szaladjunk előre - nézzük, mivel találja szemben magát a vásárló, amikor kibontja
a GTS450 csomagolását!
Első benyomások, fogyasztás
A kártya kibontása után rettentő deja vu érzésünk támadt - ha nem lett volna a felirat, ill. nem hiányzott
volna az egyik tápcsatlakozó a kártyáról, akkor azt hihettük volna, hogy a nemrégiben tesztelt GTX460 látogatott
vissza hozzánk álcázott csomagolásban. Ahogy a referencia-megoldás, úgy a Gainward egyedi verziója sem nagyon különbözik
a GTX460-tól - bár a GF104 chip nagyobb, és magasabb TDP-vel rendelkezik, láthatóan mind az nVidia, mind a
gyártók mérnökei hasonló hődisszipációra készültek fel. Nézzük akkor a fogyasztást:
Power consumption - Crysis Warhead DX10 Max (displayed post-flash)
Idle | GTS250-1G | ||||||||||||||||||||||| 113 |
Emu5750 | |||||||||||||||||| 92 | |
GTS450 | |||||||||||||||||| 89 | |
GTX460-768M | |||||||||||||||||| 91 | |
Load | GTS250-1G | |||||||||||||||||||||||||||||||||||||||||||||||||| 252 |
Emu5750 | ||||||||||||||||||||||||||||||||||| 176 | |
GTS450 | ||||||||||||||||||||||||||||||||||||||||| 203 | |
GTX460-768M | ||||||||||||||||||||||||||||||||||||||||||| 215 |
Idle fogyasztás terén új bajnokunk van, a GTS450 az első VGA, amely áttörte a 90W-os határt terhelés
nélküli üzemben. Gyakorlati szinten persze nem jelentős az előny a HD5750-nel és a GTX460-nal szemben, viszont
a GTS250-hez képest a 24W mínusz már nem elhanyagolható - egy napi 16 órát idle üzemben működő gép esetén
havi 500FT-tal kisebb a villanyszámla, azaz a kártya 5 hónap alatt visszatermeli az árkülönbözetet (jelenleg
ugyanis kb. 2500 FT-tal drágább a GTS250-nél az új jövevény).
Bár az 55nm-es GTS250-nel szemben terhelt fogyasztás terén is jól szerepel a GTS450, a 40nm-es
mezőnyben már korántsem vagyunk tőle elájulva. A HD5750-nél sokkal többet fogyaszt, és alig több, mint 10W-tal
marad el a 768MB-os GTX460-tól, amely finoman szólva is felmossa vele a padlót teljesítmény terén.
Hőmérséklet, hűtés és zaj
Lássuk az idle és a terhelt hőmérsékleteket:
Temperature - Crysis Warhead DX10 Max (displayed post-flash)
Idle | GTS250-1G | |||||||||||||||||||||||||||||||||||||||||||||||| 48 |
Emu5750 | ||||||||||||||||||||||||||||||||||||||||||| 43 | |
GTS450 | ||||||||||||||||||||||||||||||||||||||||| 41 | |
GTX460-768M | |||||||||||||||||||||||||||||||||||||| 38 | |
Load | GTS250-1G | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 84 |
Emu5750 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 70 | |
GTS450 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 78 | |
GTX460-768M | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| 76 |
Akárcsak a korábbi tesztekben, az 55nm-es VGA-k hátrányos helyzetből indulva egész tűrhetően helytállnak,
és a GTS250 zaj terén sem drámaian rosszabb, mint a 40nm-es kártyák. Legjobbnak itt a HD5750 bizonyul a
70 fokos hőmérséklettel és a halk, szélzajra korlátozott hűtéssel, míg a GTS450 szintén halk,
de a GTX460-aknál hallott nyöszörgés itt is jelen van. A GTX460 valamivel hangosabb, de akinek ez játék közben
feltűnik... nos, az inkább a játékra figyeljen :)
A GF106 chipről
A GF104-hez hasonlóan íme egy rövid összegzés a GTS450 szívéről:
- Az elődök 4, ill. 2 GPC-jéhez képest a GF106-ban már csak egy ilyen egység van - ezzel a jobb frontendből következő előny elveszett a Radeonokkal szemben (kivéve a tesszelációt, ott továbbra is erősebb a GeForce), de ebben a teljesítmény-kategóriában ennek igazi jelentősége már nincs;
- Érdekes a backend: a chipben 3 ROP blokk van és 192-bites a memóriabusz, viszont a GTS450-ben a három partíció közül az egyik le van tiltva, így egy konvencionálisnak nevezhető, 16 ROP-pal és 128-bites memóriabusszal operáló kártyát kapunk - egy későbbi kártyában ezek az egységek esetleg aktiválva lesznek cirka 15-20% extra teljesítmény reményében;
- A GPC-k szerkezete egy az egyben a GF104-es chipet tükrözi: 4 shader blokk van, mindegyikhez 48 cuda core és 4 textúrázó egység tartozik - a GTS450-ben minden egység aktiválva van;
- A ROP blokkok szerkezete változatlan, egyenként 8 ROP tartozik hozzájuk, és egy 64-bites crossbar memóriavezérlőhöz kapcsolódnak.
Lássuk a részleteket!
Felépítés, várható teljesítmény
A GTS450-et nem meglepő módon két "természetes ellenségével", a GTS250-nel és a HD5750-nel vetjük össze:
VGA neve | GTS250 | HD5750 | GTS450 768M | GTS450 vs GTS250 |
GTS450 vs HD5750 |
Core órajel | 738 MHz | 700 MHz | 783 MHz | ||
Shader órajel | 1836 MHz | 700 MHz | 1566 MHz | ||
Memória-órajel | 1100 MHz | 1150 MHz | 902 MHz | ||
Memória mennyisége | 1024 MB | 1024 MB | 1024 MB | ||
Geometriai egységek | 1 | 1 | 1 | 0% | 0% |
Scanline konverzió | 16 Pix/clock | 16 Pix/clock | 16 Pix/clock | 0% | 0% |
ALU egységek (SP-k) * | 128 (scalar) | 720 (5-way superscalar) |
128/192 (scalar/ superscalar) |
||
Textúrázó egységek | 64 | 36 | 32 | -100% | -12.5% |
ROP egységek | 16 | 16 | 16 | 0% | 0% |
Memóriabusz és típus ** | 256-bit gDDR3 | 128-bit gDDR5 | 128-bit gDDR5 | 0% | 0% |
Triangle setup | 738 Mtri/sec | 700 Mtri/sec | 783 Mtri/sec | 6.1% | 11.9% |
Scanline konverzió | 11.8 GPix/sec | 11.2 GPix/sec | 12.5 GPix/sec | 6.1% | 11.9% |
Számítási teljesítmény * | 470/705 GFlops | 1008 GFlops | 401/601 GFlops | ||
Texel fillrate, 32-bit (FP10) | 47.2 GTex/sec | 25.2 GTex/sec | 25.1 GTex/sec | -88.0% | -0.6% |
Pixel fillrate | 11.8 GPix/sec | 11.2 GPix/sec | 12.5 GPix/sec | 6.1% | 11.9% |
Z-only fillrate | 47.2 GPix/sec | 44.8 GPix/sec | 50.1 GPix/sec | 6.1% | 11.9% |
Memória-sávszélesség ** | 70.8 GB/sec | 73.6 GB/sec | 57.7 GB/sec | -22.7% | -27.6% |
*: a három chip számítási kapacitása nem hasonlítható közvetlenül össze,
mert eltérő felépítésűek az ALU blokkok.
**: bár névlegesen egy 128-bit + gDDR5 kombináció egyforma órajel mellett ugyanakkora
sávszélességet biztosít, mint egy 256-bit + gDDR3, a gyakorlatban azt tapasztaltuk, hogy az előbbi megoldásnak
kb. 15%-kal magasabb órajelre van szüksége ahhoz, hogy megegyező teljesítményt nyújtson - ennek oka a gDDR5
memóriák magasabb késleltetése.
Mivel a három kártya az egységek számának
tekintetében nagyon hasonlít, igazából főleg az ALU-k és a textúrázók közötti különbségekre kell figyelni, ill.
az órajelek kavarhatják meg a dolgokat:
- Frontend terén csak a magasabb órajel miatt van előrébb a GTS450, a 6-12%-kal gyorsabb chip 1-2% előnyt hozhat;
- Az ALU-k összevetése nehéz kérdés az eltérő architektúrák miatt - mi úgy saccoljuk, hogy a GTS250 és a GTS450 effektív ALU-teljesítménye kb. hasonló lehet, míg a HD5750 a sokkal magasabb elméleti GFlops érték ellenére egy kicsit gyengébb ezen a téren;
- Textúrázok terén is vicces a helyzet - a két DirectX 11-es kártya egyforma kapacitással bír, míg a GTS250 majdnem duplaannyi szűrt texelt bír magából kipréselni másodpercenként. Kérdés, hogy ezzel az előnnyel mennyire tud élni - egyrészt a több textúrázó több memória-sávszélességet igényel, amiben egyik kártya sem áll túl jól, másrészt az nVidia szentül esküszik, hogy a Fermi chipekben a textúrázók az áttervezett cache-elés miatt sokkal hatékonyabban működnek;
- A backenddel kicsit bizonytalanok vagyunk. ROP kapacitásban a GTS450 a nyerő, viszont sokkal kisebb memória-sávszélességgel rendelkezik, mint a másik két kártya - a GTX460-nál ugyan láttuk, hogy nem a memória-sávszélesség a fő akadály, viszont a 450-es magasabb core órajellel megy, amíg a memória órajele nem változott. Nehéz ügy megmondani, hogy vajon mennyire kihasználható a magasabb elméleti pixel- és zixel-fillrate.
A fentiek alapján egy biztos - a három kártya között túlzottan nagy
differencia nem lesz, ami egyben azt is jelenti, hogy a GTS450 nem a HD5750 és a HD5770 közé ékelődik be,
hanem a HD5750 közvetlen versenytársa. A sorrendre a tippünk a következő: GTS250 - GTS450 - HD5750.
Tesztkörnyezet
A konfiguráció elemei | |
Alaplap | Gigabyte P45-DS3R, FSB @400MHz |
CPU és órajel | Intel Q9550 @Q9770 (3.2GHz, 8x400) |
CPU hűtés | Cooler Master HyperTX2 |
Memória | 4x1GB Geil Ultra DDR2-8500 |
Memória beállítások | 1066MHz (2.66x400), 5-5-5-15, tRD: 8 |
Tápegység | Corsair TX650 |
Operációs rendszer | Windows 7 x64 |
VGA | Core clock | Shader clock | Memory clock | Driver |
GeForce GTS250 1GB | 738 MHz | 1836 MHz | 1100 MHz | ForceWare 260.63 beta |
Radeon HD5750 | 700 MHz | 1150 MHz | Catalyst 10.9 WHQL | |
GeForce GTS450 | 783 MHz | 1566 MHz | 902 MHz | ForceWare 260.63 beta |
Bár a fogyasztásos és hőmérsékletes tesztekben használtuk a GTX460-at, az
fps-mérésekhez nem lesz rá szükségünk, sebességben teljesen más világ, ezért a további grafikonokon
csak három kártya fog szerepelni.
Érdemes még megemlíteni a GeForce kártyákhoz használt drivert - mivel WHQL driver még nincs a GTS450-hez,
ezért a nemrég megjelent publikus béta, a 260.63 volt a meghajtó mind a GTS450, mind a GTS250 esetében.
A tesztben résztvevő játékok
- Aliens VS Predator
- Battlefield: Bad Company 2
- Crysis Warhead
- Far Cry 2
- Just Cause 2
- METRO 2033
- STALKER: Call of Pripyat
- Unigine Heaven 2.0