Ampere ist die Next-Gen GPU-Architektur, die Nvidia im September offiziell als Turing-Nachfolger vorgestellt hat und seither im Markt platziert. Flaggschiff der neuen Familie ist der GA102-Grafikchip, der in einem 8-nm-Fertigungsverfahren von Partner Samsung produziert wird und in der maximalen Ausbaustufe satte 28 Mrd. Transistoren beinhaltet. Als abgespecktes Derivat gesellt sich der kleinere GA104 hinzu, der aktuell für die GeForce RTX 3070 als Basis dient. Die Flaggschiffe GeForce RTX 3090 und RTX 3080 bedienen sich derweil der GA102-GPU und bilden die Speerspitze des neuerlichen GeForce-Lineups von Nvidia. Die maximale Ausbaustufe von Ampere nutzen diese aber dennoch nicht ‒ mehr dazu in den folgenden Abschnitten. Ganz nebenbei führt Nvidia mit Ampere auch PCI Express der vierten Generation in sein Produktsortiment ein und tut es somit Konkurrent AMD gleich.
Grundsätzlich hat Nvidia einige GPU-Begrifflichkeiten und Grundgerüste beibehalten, denn die Chips werden weiterhin in mehrere Graphics Processor Cluster (GPC) unterteilt, die wiederum weitere Einheiten beinhalten. Je GPC bietet ein Ampere-Grafikchip die bekannten Streaming Multiprocessors (SMs), Texture Processing Clusters (TPCs), Geometrieeinheiten und ROPs. In den SMs befinden sich die Recheneinheiten (ALUs) für konventionelle Gleitkomma- und Ganzzahl-Berechnungen (FP32 und INT32), die bezogen auf einen Streaming Multiprocessor gegenüber Turing verdoppelt wurden. D.h. die neuen Chips verfügen über bei gleicher Anzahl SMs über doppelt so viele ALUs für verschiedene Rechenaufgaben. Auch Nvidia selbst sieht die neuen SMs als wichtigen Baustein für den schnellsten und effizientesten Grafikprozessor aus eigener Entwicklung, der damit den doppelten FP32-Durchsatz der vorherigen Generation und bis zu 30 Shader-TFLOPS an Rechenleistung bietet.
Die Ampere-Architektur ist die zweite GeForce-RTX-Generation (Bildquelle: Nvidia)
Neben den herkömmlichen Rechenknechten in den Ampere-Grafikchips, verspricht Nvidia auch bei den Raytracing-Kernen deutliche Verbesserungen und bezeichnet diese als RT-Kerne der zweiten Generation. Diese neuen, dedizierte RT-Cores liefern den doppelten Durchsatz der vorherigen Generation, plus gleichzeitiges Raytracing sowie Shading und arbeiten mit 58 RT-TFLOPS an Rechenleistung. Ebenso weiterentwickelt wurden die Tensor-Kerne, die in der mittlerweile dritten Generation vorliegen. Die aufpolierten und ebenfalls dedizierten Tensor-Kerne erreichen bis zu doppelten Durchsatz gegenüber der Vorgängergeneration, wodurch KI-gestützte Technologien wie DLSS und 238 Tensor-TFLOPS an Rechenleistung schneller und effizienter ausgeführt werden können. Zwar wurde die Anzahl Tensor-Kerne je SM von acht (Turing) auf vier (Ampere) reduziert, doch stieg gleichzeitig die Leistungsfähigkeit um das Vierfache. Ergebnis soll unterm Strich eine massiv gesteigerte KI-Leistung bei Ampere-GPUs sein.
Das neue Flaggschiff namens GeForce RTX 3090 darf sich über insgesamt sieben GPCs freuen und kommt auf in Summe 82 SMs mit beeindruckenden 10.496 ALUs („CUDA-Cores“). Die Anzahl der RT-Kerne umfasst ebenso 82, die Tensor-Kerne sind mit 328 ebenfalls üppig vorhanden. Ergänzt wird der Bolide durch ein 384 Bit breites Speicherinterface zur Anbindung von GDDR6X-Speicher, der mit 24 GB auch durchaus groß ausfällt. Dank der hohen Taktraten und der GDDR6X-Speichertechnologie erreicht die GeForce RTX 3090 damit Bandbreiten jenseits von 900 GB/s. Vergleichen wir diese technischen Eckdaten mit denen einer GeForce RTX 2080 Ti, konnte die RTX 3090 in allen Bereichen zulegen.
Die Inno3D GeForce RTX 3090 iCHILL X3 wird von insgesamt drei Lüftern gekühlt.
Das gilt auch für die Leistungsaufnahme, die Nvidia von 250 Watt (RTX 2080 Ti) auf satte 350 Watt angehoben hat. Inno3D setzt die Messlatte mit bis zu 370 Watt noch einmal etwas höher an und spendiert dadurch Overclocking ab Werk. Für die Stromversorgung kommen entsprechend zwei 8-Pin-PCIe-Anschlüsse zum Einsatz. Rein rechnerisch kann die Karte somit 375 Watt (2 x 150 Watt + 75 Watt) aufnehmen und wird dies in der Praxis wohl auch tun. Mehr zur Leistunsaufnahme gibt es auf Seite 18 des Tests. Den Boost-Takt hat der Hersteller ab Werk um 55 MHz auf 1.755 MHz angehoben (+3,2%), der Speichertakt ist unverändert.
Am Slot-Bracket befinden sich ein HDMI-Anschluss und drei DisplayPorts.
Die GeForce RTX 3090 iCHILL X3 wird durch ein Custom-Kühler-Design gekühlt und wurde dabei, wie der Name vermuten lässt, in Inno3Ds bekanntem iCHILL-Design gestaltet. Unter der überwiegend schwarzen Abdeckung arbeiten drei 90-mm-Axial-Lüfter, die im 2D-Betrieb zum Stillstand kommen und so die Geräuschkulisse im Desktop-Betrieb minimieren. Das wuchtige Kühlerdesign basiert auf acht Heatpipes, ist mit einer schwarzen Kunststoffabdeckung versehen und insgesamt drei Slots hoch. Auf der Rückseite befindet sich eine schwarze Aluminium-Backplate, deren Oberflächen-Beschaffenheit den Wärmeabtransport unterstützen soll. Das seitliche iCHILL-Logo wird per programmierbarer RGB-Beleuchtung (Aura Sync, Mystic Light, RGB Fusion) in Szene gesetzt und hebt die Grafikkarte auch bei Dunkelheit noch einmal optisch besonders hervor.
Die iCHILL-Kühlung belegt insgesamt drei Slots im PC-Gehäuse.
Ebenso mit dabei sind zwei NVLink-Anschlüsse. Die beiden NVLink-Ports spielen im Gaming-Bereich allerdings kaum noch eine Rolle, da nur noch wenige Spiele SLI unterstützen und entsprechend vom Einsatz zweiter baugleicher Grafikkarten profitieren. Hinsichtlich der Anschlussmöglichkeiten für Monitore bietet die GeForce RTX 3090 1 x HDMI 2.1 und 3 x DisplayPort 1.4a. Die erhöhte Bandbreite von HDMI 2.1 ermöglicht erstmals eine einzige Kabelverbindung zu 8K-HDR-Fernsehern für Spiele mit ultrahoher Auflösung. Dank Unterstützung für AV1-Decodierung sind die Ampere-Grafikchips die ersten dedizierten GPUs, die es Spielern ermöglichen bis zu 8K-HDR-Internet-Videos bei um bis zu 50 Prozent reduzierter Bandbreite zu sehen.
Folgend die technischen Eckdaten im Vergleich mit der GeForce RTX 2080 Ti.
Hersteller | Nvidia | ||
Produktbezeichnung | GeForce RTX 2080 Ti | GeForce RTX 3080 | GeForce RTX 3090 |
Logo | ![]() |
![]() |
![]() |
Architektur | Turing | Ampere | |
Grafikchip | TU102 | GA102 | |
Fertigung | 12 nm | 8 nm | |
Transistoren | ca. 18,6 Mrd. | ca. 28,0 Mrd. | |
CUDA-Cores | 4.352 | 8.704 | 10.496 |
Tensor-Cores | 544 (2. Gen) | 272 (3. Gen) | 328 (3. Gen) |
Raytracing-Cores | 68 (1. Gen) | 68 (2. Gen) | 82 (2. Gen) |
Basistakt | 1.350 MHz | 1.450 MHz | 1.400 MHz |
Boosttakt | 1.545 MHz | 1.710 MHz | 1.700 MHz |
FP32-Rechenleistung | 13.448 GFLOPS | 29.768 GFLOPS | 35.686 GFLOPS |
FP16-Rechenleistung | 26.896 GFLOPS | 29.768 GFLOPS | 35.686 GFLOPS |
ROPs | 88 | 96 | 112 |
TMUs | 272 | 328 | |
Speichertakt | 7.000 MHz | 9.504 MHz | 9.752 MHz |
Speicherinterface | 352 Bit | 320 Bit | 384 Bit |
Speicherbandbreite | 616.000 MB/s | 760.320 MB/s | 936.192 MB/s |
Speichermenge | 11 GB GDDR6 | 10 GB GDDR6X | 24 GB GDDR6X |
Interface | PCIe 3.0 | PCIe 4.0 | |
Leistungsaufnahme | 250 Watt | 320 Watt | 350 Watt |
Auf der Rückseite befindet sich eine große Aluminium-Backplate.
#AMD #Benchmark #DLSS #Gaming #GeForce #Gigabyte #Grafikchip #Grafikkarte #INNO3D #KFA2 #Kühlung #Künstliche Intelligenz #Lüfter #Micron #Monitor #MSI #Nvidia #Overclocking #PCI #PCIe #Raytracing #Samsung #Sapphire #SMS #Technologie #Turing #ZOTAC
MSI stellt seine neuen Grafikkarten auf Basis der GeForce RTX 5070 Ti GPU vor. Dazu gehören die Serien VANGUARD, GAMING...
KIOXIA Corporation und SanDisk Corporation haben eine hochmoderne 3D-Flash-Speichertechnologie entwickelt, die mit einer NAND-Schnittstellengeschwindigkeit von 4,8 Gbit/s, überlegener Energieeffizienz und...
Betmatch bleibt weiterhin führend bei der Entwicklung des Sportwettensektors. Es bietet Wettenden eine große Vielfalt an Märkten und modernste Taktiken...
Bereits zur CES in Las Vegas präsentierte Nvidia seine neue RTX-50-Familie auf Basis der KI-optimierten Blackwell-Architektur. Die neue GeForce-RTX-5000-Generation, die...
Unter dem Motto „FRITZ! Connects“ zeigt AVM vom 3. bis 6. März auf dem MWC 2025 die neuesten FRITZ!-Produkte für...
Mit der GeForce RTX 5080 X3 OC von INNO3D haben wir ein weiteres Custom-Design auf Basis der neuen Blackwell-Architektur im Testlab empfangen. Mehr zum Praxistest des Boliden in unserem Artikel.
Nachdem wir vor ein paar Tagen und pünktlich zur Marktverfügbarkeit die RTX 5080 1-Click OC von KFA2 angetestet haben, folgt nun der gewohnt ausführliche Review des Blackwell-Boliden.
Am heutigen Tag endet die Sperrfrist für Benchmarks und Reviews für die neuen GeForce RTX 5080 Custom-Modelle. Wir durften vorab einen Blick auf die KFA2 GeForce RTX 5080 1-Click OC werfen.
Mit der ROG Strix RTX 4090 bietet ASUS eine ab Werk übertaktete GeForce an, die mithilfe einer wuchtigen Quad-Slot-Kühlung eine überragende Kühlleistung bietet. Wir haben den Boliden in der Praxis ausgiebig begutachtet.