ARTIKEL/TESTS / KFA2 RTX 3070 Ti SG (1-Click OC) im Test

GPU-Architektur

Ampere ist die Next-Gen GPU-Architektur, die Nvidia im September letztes Jahr offiziell als Turing-Nachfolger vorgestellt hat und seither im Markt platziert. Flaggschiff der Familie ist der GA102-Grafikchip, der in einem 8-nm-Fertigungsverfahren von Partner Samsung produziert wird und in der maximalen Ausbaustufe satte 28 Mrd. Transistoren beinhaltet. Als abgespecktes Derivat gesellt sich der kleinere GA104 hinzu, der aktuell für die GeForce RTX 3070 und die im Dezember 2020 präsentierte GeForce RTX 3060 Ti als Basis dient. Neu hinzugekommen ist außerdem der GA106-Chip, der für die GeForce RTX 3060 Verwendung findet.

Die Flaggschiffe GeForce RTX 3090 und RTX 3080 bedienen sich derweil der GA102-GPU und bilden die Speerspitze des neuerlichen GeForce-Lineups von Nvidia. Die maximale Ausbaustufe von Ampere nutzen diese aber dennoch nicht ‒ mehr dazu in den folgenden Abschnitten. Ganz nebenbei führte Nvidia mit Ampere auch PCI Express der vierten Generation in sein Produktsortiment ein und tut es somit Konkurrent AMD gleich. Seit wenigen Wochen umfasst die GPU-Familie auch zwei neue Ti-Versionen: GeForce RTX 3070 Ti und RTX 3080 Ti. Das neue 3070er-Modell basiert auf dem GA104-400 Chip, bei der 3080 Ti handelt es sich um eine weitere GA102-Variante, nämlich den GA102-225. Ingesamt gehören nun sieben unterschiedlichen Ausführungen zur GeForce-RTX-3000-Familie: RTX 3060 (Ti), RTX 3070 (Ti), RTX 3080 (Ti) sowie RTX 3090.

Grundsätzlich hat Nvidia einige GPU-Begrifflichkeiten und Grundgerüste beibehalten, denn die Chips werden weiterhin in mehrere Graphics Processor Cluster (GPC) unterteilt, die wiederum weitere Einheiten beinhalten. Je GPC bietet ein Ampere-Grafikchip die bekannten Streaming Multiprocessors (SMs), Texture Processing Clusters (TPCs), Geometrieeinheiten und ROPs. In den SMs befinden sich die Recheneinheiten (ALUs) für konventionelle Gleitkomma- und Ganzzahl-Berechnungen (FP32 und INT32), die bezogen auf einen Streaming Multiprocessor gegenüber Turing verdoppelt wurden. D.h. die neuen Chips verfügen über bei gleicher Anzahl SMs über doppelt so viele ALUs für verschiedene Rechenaufgaben. Auch Nvidia selbst sieht die neuen SMs als wichtigen Baustein für den schnellsten und effizientesten Grafikprozessor aus eigener Entwicklung, der damit den doppelten FP32-Durchsatz der vorherigen Generation und bis zu 30 Shader-TFLOPS an Rechenleistung bietet.

Die Ampere-Architektur ist die zweite GeForce-RTX-Generation (Bildquelle: Nvidia)

Die Ampere-Architektur ist die zweite GeForce-RTX-Generation (Bildquelle: Nvidia)

Neben den herkömmlichen Rechenknechten in den Ampere-Grafikchips, verspricht Nvidia auch bei den Raytracing-Kernen deutliche Verbesserungen und bezeichnet diese als RT-Kerne der zweiten Generation. Diese neuen, dedizierte RT-Cores liefern den doppelten Durchsatz der vorherigen Generation, plus gleichzeitiges Raytracing sowie Shading und arbeiten mit 58 RT-TFLOPS an Rechenleistung. Ebenso weiterentwickelt wurden die Tensor-Kerne, die in der mittlerweile dritten Generation vorliegen. Die aufpolierten und ebenfalls dedizierten Tensor-Kerne erreichen bis zu doppelten Durchsatz gegenüber der Vorgängergeneration, wodurch KI-gestützte Technologien wie DLSS und 238 Tensor-TFLOPS an Rechenleistung schneller und effizienter ausgeführt werden können. Zwar wurde die Anzahl Tensor-Kerne je SM von acht (Turing) auf vier (Ampere) reduziert, doch stieg gleichzeitig die Leistungsfähigkeit um das Vierfache. Ergebnis soll unterm Strich eine massiv gesteigerte KI-Leistung bei Ampere-GPUs sein.

Technische Daten

Laut Nvidia ist die RTX 3070 die beliebteste Grafikkarte mit Ampere-Architektur und die neue Ti-Version soll schlicht die Leistung dieser gern gekauften GPU weiter steigern. Leistungsmäßig sortiert sich die RTX 3070 Ti, wie zu erwarten war, zwischen der bestehenden RTX 3070 und der RTX 3080 ein. Dabei basiert diese GeForce auf einer weiteren Ausführung des abgespeckten GA104-Grafikchips, der gegenüber dem Flaggschiff GA102 deutlich beschnitten wurde. Von den ursprünglich ca. 28 Mrd. Transistoren sind beim GA104 derer noch ca. 17,4 Mrd. übriggeblieben. Daraus resultieren sechs GPCs.

Entsprechend umfasst die neue GeForce in Summe 48 SMs mit 6.144 ALUs („CUDA-Cores“). Die Anzahl der RT-Kerne entspricht 48, die Tensor-Kerne sind mit 192 ebenfalls ebenso etwas mehr als bei der GeForce RTX 3070. Ergänzt wird die 3070 Ti durch ein 256 Bit breites Speicherinterface zur Anbindung von GDDR6X-Speicher, der mit 8 GB in der Founders Edition eine solide Größe aufweist. Gegenüber der Non-Ti-Version kann die aufpolierte GeForce punkten, denn der GDDR6X-Speicher arbeitet mit deutlich höheren Frequenzen und bietet entsprechend gesteigerte Bandbreiten. Die 448 GB/s der RTX 3070 kann die RTX 3070 Ti mit satten 608 GB/s deutlich übertreffen. Wie sehr sich dies auf die Performance auswirkt, klären wir anhand ausführlicher Benchmarks ab Seite 5 des Artikels. Der Vergleich der technischen Daten befindet sich am Ende dieser Seite.

Drei 92-mm-Axial-Lüfter zeichnen sich für die Kühlung der GeForce-GPU verantwortlich.

Drei 92-mm-Axial-Lüfter zeichnen sich für die Kühlung der GeForce-GPU verantwortlich.

Die Leistungsaufnahme der Founders Edition gibt Nvidia mit 290 Watt an, was 70 Watt mehr gegenüber der Non-Ti sind. Diese Angabe übernimmt auch Board-Partner KFA2 für seine Serious-Gaming-Variante, die über zwei 8-Pin-PCIe-Anschlüsse mit Leistung versorgt wird und somit 375 Watt zur Verfügung hat (75 Watt PCIe Slot + 2 x 150 Watt 8-Pin Anschluss). Mehr zur Leistungsaufnahme gibt es auf Seite 18 des Tests. Den Boost-Takt hat der Hersteller ab Werk um immerhin 45 MHz auf 1.815 MHz angehoben (+2,5%), der Speichertakt ist unverändert. Der höhere Boost-Takt setzt allerdings die Installation der Xtreme Tuner Plus Software und anschließender Aktivierung des OC Mode voraus. KFA2 bezeichnet dies als 1-Click OC, was der Bolide auch entsprechend mit im Namen trägt. Ohne weiteres Zutun des Nutzers arbeitet die Karte mit den üblichen 1.770 MHz der Founders Edition.

Die Karte belegt drei Slots Bauhöhe und noch mehr, wenn man den 1-Click Booster montiert.

Die Karte belegt drei Slots Bauhöhe und noch mehr, wenn man den 1-Click Booster montiert.

Die KFA2 GeForce RTX 3070 SG (1-Click OC) wird durch ein wuchtiges Custom-Kühler-Design, das wir bereits von der RTX 3070 kennen, gekühlt. Integriert in den Kühler sind drei 92-mm-Axial-Lüfter, die im 2D-Betrieb zum Stillstand kommen und so die Geräuschkulisse im Desktop-Betrieb minimieren. Das Kühlerdesign basiert auf sechs Heatpipes, ist mit einer schwarzen Kunststoffabdeckung versehen und insgesamt drei Slots hoch. Auf der Rückseite befindet sich eine schwarze Aluminium-Backplate, deren Oberfläche mit einem großen GeForce-Schriftzug versehen ist. Außerdem sieht der Hersteller dort die Montage eines vierten Lüfters vor, der als 80 mm große Axial-Ausführung mit im Lieferumfang liegt.

Der sogenannte „1-Clip Booster“ wird einfach nur aufgeklippst und an der Grafikkarte für die Stromversorgung und Steuerung eingesteckt. Der Zusatzlüfter saugt die Warmluft aus dem Kühler (die anderen drei Lüfter blasen Frischluft hinein) und soll laut Herstellerangabe dafür sorgen, dass die Karte insgesamt kühler bleibt und die GPU somit ihre volle Leistungsfähigkeit entfalten kann. Natürlich ist dafür der entsprechende Bauraum im Gehäuse notwendig, was beim Kauf beachtet werden sollte. Die RGB-Beleuchtung der Karte und des mitgelieferten Lichtleiters sorgt für optische Untermalung der GeForce-Platine. Die entsprechenden Anschlüsse für die Verbindung mit einem RGB-Sync-fähigen Mainboard sind vorhanden und werden von KFA2 auch in einem separaten Guide nochmals ausführlich erläutert. Ein Anschlusskabel zum Verbinden der Karte mit dem Mainboard liegt bei.

An der Stirnseite der Serious-Gaming-Grafikkarte von KFA2 sind die Anschlüsse für RGB-Beleuchtung und 1-Clip Booster zu finden.

An der Stirnseite der Serious-Gaming-Grafikkarte von KFA2 sind die Anschlüsse für RGB-Beleuchtung und 1-Clip Booster zu finden.

Am Slot-Bracket sind insgesamt drei DisplayPort-Anschlüsse und ein HDMI-Port vorhanden.

Am Slot-Bracket sind insgesamt drei DisplayPort-Anschlüsse und ein HDMI-Port vorhanden.

NVLink ist bei der GeForce RTX 3070 Ti kein Thema und entsprechend auch nicht an der Grafikkarte zu finden. Hinsichtlich der Anschlussmöglichkeiten für Monitore bietet die neue GeForce RTX 1 x HDMI 2.1 und 3 x DisplayPort 1.4a. Die erhöhte Bandbreite von HDMI 2.1 ermöglicht erstmals eine einzige Kabelverbindung zu 8K-HDR-Fernsehern für Spiele mit ultrahoher Auflösung. Dank Unterstützung für AV1-Decodierung sind die Ampere-Grafikchips die ersten dedizierten GPUs, die es Spielern ermöglichen bis zu 8K-HDR-Internet-Videos bei um bis zu 50 Prozent reduzierter Bandbreite zu sehen.

Folgend die technischen Eckdaten im Vergleich mit der GeForce RTX 3070.

Hersteller Nvidia
Produktbezeichnung GeForce RTX 2070 SUPER GeForce RTX 3070 GeForce RTX 3070 Ti
Logo
Architektur Turing Ampere
Grafikchip TU104 GA104
Fertigung 12 nm 8 nm
Transistoren ca. 13,6 Mrd. ca. 17,4 Mrd.
CUDA-Cores 3.072 5.888 6.144
Tensor-Cores 384 (2. Gen) 184 (3. Gen) 192 (3. Gen)
Raytracing-Cores 48 (1. Gen) 46 (2. Gen) 48 (2. Gen)
Basistakt 1.650 MHz 1.500 MHz 1.575 MHz
Boosttakt 1.815 MHz 1.725 MHz 1.770 MHz
FP32-Rechenleistung 11.151 GFLOPS 20.314 GFLOPS 21.750 GFLOPS
FP16-Rechenleistung 22.302 GFLOPS 20.314 GFLOPS 21.750 GFLOPS
ROPs 64 96
TMUs 192 184 192
Speichertakt 7.000 MHz 9.504 MHz
Speicherinterface 256 Bit
Speicherbandbreite 448.000 MB/s 608.256 MB/s
Speichermenge 8 GB GDDR6 8 GB GDDR6X
Interface PCIe 3.0 PCIe 4.0
Leistungsaufnahme 250 Watt 220 Watt 290 Watt
Auf der Rückseite befindet sich eine große Backplate.

Auf der Rückseite befindet sich eine große Backplate.

Autor: Patrick von Brunn, Stefan Boller
Sapphire NITRO+ RX 7900 GRE im Test
Sapphire NITRO+ RX 7900 GRE im Test
NITRO+ RX 7900 GRE

Mit der AMD Radeon RX 7900 GRE hat eine bisher als OEM-Variante vertriebene GPU nun den offiziellen Weg in den Handel gefallen. Passend zum Marktstart haben wir uns die Sapphire NITRO+ RX 7900 GRE im Test angesehen.

KFA2 GeForce RTX 4080 SUPER SG im Test
KFA2 GeForce RTX 4080 SUPER SG im Test
KFA2 RTX 4080 SUPER SG

Die GeForce RTX 4080 SUPER SG von KFA2 kommt mit 1-Click OC und einer wuchtigen Kühlung im Quad-Slot-Design inkl. RGB-Beleuchtung. Wir haben uns den Boliden im Praxistest ausführlich zur Brust genommen.

ZOTAC RTX 4070 Ti SUPER Trinity Black Test
ZOTAC RTX 4070 Ti SUPER Trinity Black Test
Trinity Black Edition

ZOTAC bietet mit der Trinity Black Edition ein Custom-Design der GeForce RTX 4070 Ti SUPER an, die erst kürzlich von Nvidia vorgestellt wurde. Wie sich die extravagante Grafikkarte im Test schlägt, lesen Sie hier in unserem Review.

INNO3D RTX 4080 SUPER iCHILL Frostbite
INNO3D RTX 4080 SUPER iCHILL Frostbite
INNO3D RTX 4080 SUPER iCHILL Frostbite

Mit der GeForce RTX 4080 SUPER iCHILL Frostbite von INNO3D haben wir heute ein Custom-Design für Systeme mit Wasserkühlung im Test. Der Hersteller arbeitet zu diesem Zweck mit Alphacool zusammen. Mehr in unserem Review.