Startseite » Nicht kategorisiert » NVIDIA Rubin CPX GPU: Eine neue Ära für Millionen-Token-KI und generatives Video

NVIDIA Rubin CPX GPU: Eine neue Ära für Millionen-Token-KI und generatives Video

von ytools
1 kommentar 9 ansichten

NVIDIA Rubin CPX GPU: Eine neue Ära für Millionen-Token-KI und generatives Video

NVIDIA Rubin CPX GPU: Eine neue Ära für Millionen-Token-KI und generatives Video

NVIDIA hat erneut bewiesen, dass das Unternehmen die Speerspitze der KI-Hardware bleibt. Mit der Vorstellung der Rubin CPX GPU bringt NVIDIA einen Chip auf den Markt, der speziell für Aufgaben entwickelt wurde, die aktuelle Systeme schnell überfordern: von Code-Assistenten, die Millionen Tokens verarbeiten, bis hin zu generativen Videos im Langformat. Rubin CPX ist damit nicht einfach nur eine schnellere GPU – es ist eine komplett neue Klasse, die auf Massiv-Kontext-Verarbeitung zugeschnitten ist.

Die Rubin CPX GPU ist Teil der kommenden Rubin-Plattform, zu der auch die neuen Vera CPUs und die ConnectX-9 SuperNICs gehören. Diese Bausteine finden sich im NVIDIA Vera Rubin NVL144 CPX System wieder, das auf der MGX-Architektur basiert. Die Eckdaten lesen sich wie aus einem Science-Fiction-Roman: 8 Exaflops KI-Rechenleistung, das 7,5-fache der aktuellen GB300 NVL72 Systeme, dazu 100 Terabyte extrem schneller Speicher und eine Bandbreite von 1,7 Petabyte pro Sekunde – alles in einem einzigen Rack.

Der Schlüssel zum Rubin CPX ist die Fähigkeit, lange Kontexte effizient zu handhaben. Für Programmier-Assistenten bedeutet das, nicht mehr nur Code-Schnipsel vorzuschlagen, sondern komplexe Software-Projekte mit Millionen Zeilen zu verstehen und zu optimieren. Im Videobereich ermöglicht der Chip, dass Modelle bis zu eine Million Tokens für eine Stunde Inhalt verarbeiten – eine Dimension, die weit über das hinausgeht, was heutige GPUs leisten können. Anwendungen wie Video-Suche, generatives Langformat-Video oder Content-Erstellung werden dadurch auf ein ganz neues Niveau gehoben.

Technisch setzt NVIDIA auf ein monolithisches Design: Alle NVFP4-Recheneinheiten sowie integrierte Video-Codecs befinden sich auf einem einzigen Chip. Während andere Rubin-Varianten auf Multi-Reticle-Designs setzen, geht CPX den direkten Weg – effizienter und kostengünstiger. Auffällig ist auch die Entscheidung, GDDR7-Speicher anstelle von HBM einzusetzen. Mit bis zu 128 GB ist dieser Ansatz nicht nur günstiger, sondern auch leistungsstark genug für Inferenzaufgaben im Rechenzentrum.

In Zahlen: Eine Rubin CPX GPU liefert 30 PFLOPs NVFP4. Im Vollausbau des NVL144 CPX Systems summiert sich das auf 8 Exaflops. Dazu kommt eine Verdreifachung der Attention-Leistung im Vergleich zum GB300 NVL72. Mit anderen Worten: NVIDIA hat die Messlatte deutlich nach oben verschoben.

Zum Vergleich: Die Standardplattform Vera Rubin NVL144 ohne CPX, bestehend aus vier Rubin GPUs und zwei Vera CPUs, schafft 3,6 Exaflops, 75 TB Speicher und 1,4 PB/s Bandbreite. Das CPX-System legt hier noch einmal kräftig drauf: 8 Exaflops, 100 TB Speicher und 1,7 PB/s Bandbreite. Der Unterschied ist eklatant.

Besonders spannend ist auch die Videokomponente. Rubin CPX verfügt über viermal so viele NVENC- und NVDNC-Einheiten wie die Vorgänger. Damit wird es möglich, KI für generative Videoproduktion oder synthetische Trainingsdaten auf ganz neue Art einzusetzen. In einer Welt, in der KI-generierte Medien immer wichtiger werden, ist das ein entscheidender Vorteil.

Laut NVIDIA soll die Rubin CPX Plattform Ende 2026 verfügbar sein. Die Standard-Rubin-Systeme werden bereits im zweiten Halbjahr 2026 erwartet. Darüber hinaus arbeitet NVIDIA an Rubin Ultra und hat bereits die nächste Generation namens Feynman angedeutet. Über den Fertigungsprozess schweigt das Unternehmen noch, aber Experten rechnen mit TSMC N3 oder N2 – also modernsten Technologien.

Für Entwickler, Forschung und Unternehmen ist Rubin CPX ein Wendepunkt. Projekte mit Millionen von Codezeilen, lange Videoinhalte oder Sprachmodelle mit riesigem Kontext – all das wird durch Rubin CPX nicht nur möglich, sondern effizient. Es zeigt sich klar: NVIDIA zielt nicht auf die Probleme von heute, sondern auf die Herausforderungen von morgen.

Das könnte Ihnen auch gefallen

1 kommentar

Conor November 23, 2025 - 11:14 pm

wenn TSMC N3 oder N2 stimmt, dann absolut Highend

Antworten

Einen Kommentar hinterlassen