ARTIKEL/TESTS / R600: ATi kommt mit Radeon HD Serie

R600: Unified-Shader

Nachdem Konkurrent Nvidia bereits vor einigen Monaten mit der GeForce 8-Generation den Umschwung auf eine Unified-Shader-Architektur geschafft hat, zieht nun auch ATi im Desktop- und Mobile-Bereich nach. Das Design basiert dabei auf dem erfolgreichen "Xenos"-Chip der Xbox 360, den man weiterentwickelt und verbessert hat. Das Ergebniss kann sich (zumindest auf dem Papier) sehen lassen und trägt die Bezeichnung R600 bzw. in den abgespeckten Varianten RV610 und RV630.

Der Trick an Unified-Shader ist dabei relativ leicht nachzuvollziehen. Herkömmliche Architekturen setzen auf verschiedene Arten von Shader-Prozessoren, die jeweils nur für eine Aufgabe bestimmt sind (zum Beispiel Vertex oder Pixel). Shader aus Unified-Shader-GPUs sind in der Lage alle anfallenden Arbeiten zu erledigen und somit auf keinen Typ festgelegt. Diese Einheiten nennt man Stream-Prozessoren und können im Falle der R600-Generation sowohl Vertex- und Pixel- als auch Geometry-Operationen ausführen. Je nach Modell können bis zu 320 dieser SPs integriert sein und superskalar in der Berechnung agieren. Dies heißt konkret, dass bis zu fünf Operationen pro Takt abgearbeitet werden können (bisher: zwei Ops/sec). Superskalar bedeutet dabei auch, dass eine dynamische Zuteilung der Operationen auf die Prozessoren besteht, um eine maximale Parallelität zu erreichen und das System maximal auslasten zu können. Da die Zuteilung eben nicht mehr direkt durch den Compiler vorgenommen wird, sondern während des Betriebs dynamisch geschieht, wird eine entsprechenden Zuteilungseinheit benötigt. Diese nennt sich im Fachschargon "Dispatcher" (Koordinator bzw. Zuteiler). In der zweiten Unified-Shader Generation von ATi hat man auch diese Einheit weiter verbessert und den "Ultra Threaded Dispatch Processor" geschaffen, der eine maximale Auslastung der zur Verfügung stehenden Stream-Prozessoren und somit höchstmögliche Berechnungsgeschwindigkeit erreichen soll.

Ein Blick auf die Architektur des R600 (HD 2900).

Ein einfaches Beispiel zur Verdeutlichung von Flaschenhälsen in einer Nicht-Unified-Architektur: Hat man eine Szene zum Rendern in die GPU geschickt die besonders Vertex-Shader-lastig ist, wie zum Beispiel durch Formveränderungen und Lichteinfalländerungen, werden primär die Vertex-Shader-Einheiten der GPU benutzt und die Pixel-Shader-Einheiten befinden sich überwiegend im Leerlauf. Dieser suboptimale Zustand gilt auch umgekehrt, wenn kaum Vertex-Berechnungen anliegen und die Szene vor allem die Pixel-Shader, beispielsweise durch Interpolationen mit Texturen beim Shading, fordert. Stream-Prozessoren der Unified-GPU sind in der Lage alle anfallenden Operationen durchzuführen und damit im Optimalfall maximal ausgelastet, was Flaschenhälse verhindert und eine beschleunigte Abarbeitung forciert. Diese kann jedoch nur der Fall sein, wenn die Dispatch-Einheit zuverlässig die Threads auf die freien SPs verteilt. R6xx-GPUs können Vertex-, Shader- und Geometry-Operationen je nach Bedarf abarbeiten.

512 Bit: Ringbus-Interface des R600 (HD 2900).

Wieder mit dabei ist das bereits von vorherigen Generationen bekannte Ringbus-Speicherinterface, welches man nun auf insgesamt 1024 Bit (512 Bit in jede Richtung des Rings) aufgestockt hat. Die Daten können somit noch schneller innerhalb der GPU rotieren und von Punkt A nach B gebracht werden. Für die Anbindung von DDR-Speicher hat man wiederum die Unterstützung von GDDR3 und GDDR4 realisiert. Dieser kann an insgesamt vier Schnittstellen paarweise konnektiert werden. Daraus ergeben sich wiederum acht Einzelbusse mit 64 Bit Breite zu je einem Speicherbaustein. Alles in Allem bringt die Radeon HD 2900 also ein 512 Bit Speicherinterface mit in den Kampf gegen ATi und sorgt für neue Rekorde in Sachen Durchsatz. Die Varianten HD 2600 und HD 2400 wurden entsprechend abgespeckt.

Weitere Details zu Features und Neuheiten in der Bildqualität entnehmen Sie der folgenden Seite.

Autor: Patrick von Brunn
ASUS ROG Strix GeForce RTX 4090 OC im Test
ASUS ROG Strix GeForce RTX 4090 OC im Test
ASUS ROG Strix RTX 4090 OC

Mit der ROG Strix RTX 4090 bietet ASUS eine ab Werk übertaktete GeForce an, die mithilfe einer wuchtigen Quad-Slot-Kühlung eine überragende Kühlleistung bietet. Wir haben den Boliden in der Praxis ausgiebig begutachtet.

Sapphire NITRO+ RX 7900 GRE im Test
Sapphire NITRO+ RX 7900 GRE im Test
NITRO+ RX 7900 GRE

Mit der AMD Radeon RX 7900 GRE hat eine bisher als OEM-Variante vertriebene GPU nun den offiziellen Weg in den Handel gefallen. Passend zum Marktstart haben wir uns die Sapphire NITRO+ RX 7900 GRE im Test angesehen.

KFA2 GeForce RTX 4080 SUPER SG im Test
KFA2 GeForce RTX 4080 SUPER SG im Test
KFA2 RTX 4080 SUPER SG

Die GeForce RTX 4080 SUPER SG von KFA2 kommt mit 1-Click OC und einer wuchtigen Kühlung im Quad-Slot-Design inkl. RGB-Beleuchtung. Wir haben uns den Boliden im Praxistest ausführlich zur Brust genommen.

ZOTAC RTX 4070 Ti SUPER Trinity Black Test
ZOTAC RTX 4070 Ti SUPER Trinity Black Test
Trinity Black Edition

ZOTAC bietet mit der Trinity Black Edition ein Custom-Design der GeForce RTX 4070 Ti SUPER an, die erst kürzlich von Nvidia vorgestellt wurde. Wie sich die extravagante Grafikkarte im Test schlägt, lesen Sie hier in unserem Review.