ARTIKEL/TESTS / GT200: Nvidia GeForce GTX 200 im Detail

GT200: Architektur und Features

Im direkten Vergleich mit dem G92, dem bis dato neusten Chip aus dem Hause Nvidia, hat man ein wahres Monster geschaffen! Mit etwa 1,4 Milliarden Transistoren wurde die Anzahl nahezu verdoppelt (754 Mio. bei G92)! Festgehalten hat man am bewährten 65 nm Fertigungsprozess (TSMC), der gemeinsam mit umfangreichen Stromsparfunktionen die maximale Leistungsaufnahme entsprechender Grafikkarten drosseln soll. Dennoch bewegt man sich mit 236 Watt für das Spitzenmodell der neuen GeForce-Serie auf sehr hohem Niveau, was eine gute Kühlung aller Komponenten notwendig macht.

Durch neuartige Mechanismen hat man allerdings Wege gefunden die Leistungsaufnahme in verschiedenen Betriebsmodi weiter zu senken und beispielsweise eine GeForce 9800 GTX zu unterbieten. Nach Angaben Nvidias benötigen GeForce GTX 200 Grafikkarten im Idle lediglich 25 Watt (9800 GTX: 45 Watt) und begnügen sich bei der Wiedergabe von Blu-ray-Material mit moderaten 35 Watt (9800 GTX: 50 Watt). Dank HybridPower lässt sich bei bestimmten Systemkonfigurationen (integrierte Grafik) die Grafikkarten komplett abschalten: Bei weniger grafikintensiven Anwendungen, beispielsweise bei E-Mail und Internet-Surfen, wird mit HybridPower die mGPU genutzt und die externe Grafik über den SMBUS abgeschaltet (angeblich 0 Watt Leistungsaufnahme bei Off-Modus). Das senkt die Hitzeentwicklung im Gehäuse, den Geräuschpegel und den gesamten Stromverbrauch.

Im folgenden Bild ist die Architektur des GT200 übersichtlich dargestellt und lässt sich in drei wesentliche Teile splitten: Scheduler für anfallende Operationen (violett), Recheneinheiten für Abarbeitung (schwarz), Speicher-Interfaces und ROPs (blau). Wie in den vorherigen Unified-Shader-Architekturen hat man auch bei der jüngsten Auflage die Rechenpower in Clustern zusammengefasst und erreicht dadurch ein hohes Maß an Flexibilität bei der Konfiguration und eine maximale Chipausbeute pro Wafer. Ein solcher Cluster (10 Stück im Falle des unteren Bildes), namentlich bei Nvidia kurz als TPC (Thread Processing Cluster) verankert, fasst verschiedene Komponenten zu einem Bündel zusammen. Dazu gehören jeweils drei so genannter Streaming Multiprocessors (SMs), die wiederum aus acht einzelnen Shader Processors (SPs) bestehen. Neu ist hier beispielsweise ein lokaler Speicher innerhalb eines SM, der die direkte und schnellstmögliche Kommunkation zwischen SPs möglich macht. Dadurch will man weitere Latenzen in der Praxis einsparen, da nicht mehr der umständliche Weg über höher liegende Speicherebenen (Frame Buffer) gegangen werden muss. Komplettiert wird ein TPC durch entsprechende Filtereinheiten (jeweils 8 TUs) und einen großen L1-Cache-Speicher.

Zu den weiteren Architektur-Verbesserungen gehören neue Scheduler, die im Bereich des Texturing bis zu 20 Prozent effektiver arbeiten sollen, eine verdoppelte Anzahl an Registersätzen für komplexere Shader-Operationen, Double-Precision (64 Bit) Gleitkomma-Berechnungen nach IEEE 754R, optimierte Geometrie-Shader und vieles mehr. Nicht zu vergessen ist die vollständige Unterstützung der PhysX-Engine. Nach wie vor verzichtet man allerdings auf eine Implementierung von Microsofts DirectX 10.1 und setzt auch bei der GTX-Serie weiterhin auf DX10. Nach Angaben der Ingenieure wurde während der Entwicklung des GT200 der Support von DX10.1 evaluiert, allerdings für nicht wichtig eingestuft. Stattdessen hat man sich auf eine verbesserte Performance in DX10 konzentriert.

Im unteren Teil der Architektur-Übersicht befinden sich die ROPs (Raster Operation Processors) und die jeweils 64 Bit breiten Interfaces zum externen GDDR3-Speicher. Anhand der Skizze lassen sich auch leicht die Hardware-Skalierung bzw. die technischen Daten auf der folgenden Seite nachvollziehen.

Nvidias GT200-Chip (hier: GTX 280) setzt auf geballte Rechenpower
und kommt mit mehr Shader-Cores als jede Unified-Generation zuvor.

Autor: Patrick von Brunn
INNO3D GeForce RTX 5080 X3 OC im Test
INNO3D GeForce RTX 5080 X3 OC im Test
INNO3D RTX 5080 X3 OC

Mit der GeForce RTX 5080 X3 OC von INNO3D haben wir ein weiteres Custom-Design auf Basis der neuen Blackwell-Architektur im Testlab empfangen. Mehr zum Praxistest des Boliden in unserem Artikel.

Blackwell: KFA2 RTX 5080 1-Click OC im Test
Blackwell: KFA2 RTX 5080 1-Click OC im Test
KFA2 RTX 5080 1-Click OC

Nachdem wir vor ein paar Tagen und pünktlich zur Marktverfügbarkeit die RTX 5080 1-Click OC von KFA2 angetestet haben, folgt nun der gewohnt ausführliche Review des Blackwell-Boliden.

Angetestet: KFA2 GeForce RTX 5080 1-Click OC
Angetestet: KFA2 GeForce RTX 5080 1-Click OC
KFA2 RTX 5080 1-Click OC

Am heutigen Tag endet die Sperrfrist für Benchmarks und Reviews für die neuen GeForce RTX 5080 Custom-Modelle. Wir durften vorab einen Blick auf die KFA2 GeForce RTX 5080 1-Click OC werfen.

ASUS ROG Strix GeForce RTX 4090 OC im Test
ASUS ROG Strix GeForce RTX 4090 OC im Test
ASUS ROG Strix RTX 4090 OC

Mit der ROG Strix RTX 4090 bietet ASUS eine ab Werk übertaktete GeForce an, die mithilfe einer wuchtigen Quad-Slot-Kühlung eine überragende Kühlleistung bietet. Wir haben den Boliden in der Praxis ausgiebig begutachtet.