Startseite » Nicht kategorisiert » NVIDIA Rubin CPX: Neuer Maßstab für Inferenz in der KI

NVIDIA Rubin CPX: Neuer Maßstab für Inferenz in der KI

von ytools
0 kommentar 4 ansichten

NVIDIA hat die Branche erneut überrascht und seine neuen Rubin CPX GPUs vorgestellt – eine komplett neue Klasse von Chips, die speziell für groß angelegte Inferenz-Aufgaben entwickelt wurden.
NVIDIA Rubin CPX: Neuer Maßstab für Inferenz in der KI
Präsentiert auf dem AI Infra Summit macht der Konzern deutlich, dass er nicht länger nur das Training von Modellen im Blick hat, sondern verstärkt auf die effiziente Ausführung von KI-Anwendungen mit langen Kontexten setzt. Genau hier entsteht der nächste Wettlauf in der KI-Industrie.

Die Rubin CPX GPU liefert 30 PetaFLOPs NVFP4-Rechenleistung und ist mit satten 128 GB GDDR7-Speicher ausgestattet. Während viele auf teurere HBM-Speicher spekulierten, entschied sich NVIDIA bewusst für GDDR7, um ein besseres Verhältnis von Leistung zu Kosten zu erzielen. Die Karten laufen jedoch nicht isoliert: Sie werden in das neue Vera Rubin NVL144 CPX-Rack integriert, das 144 Rubin CPX GPUs, 144 klassische Rubin GPUs und 36 Vera CPUs kombiniert. Das Resultat sind bis zu acht ExaFLOPs an NVFP4-Rechenleistung – laut NVIDIA rund 7,5-mal schneller als die Blackwell Ultra Generation.

Doch die eigentliche Stärke liegt in der Ausrichtung: Rubin CPX ist für millionenlange Kontextfenster ausgelegt, eine Schlüsselanforderung für die nächste Welle von generativen KI-Modellen. Zusammen mit Spectrum-X Ethernet soll das System nicht nur extrem skalierbar sein, sondern auch eine Kapitalrendite von 30- bis 50-fach liefern. Damit positioniert NVIDIA die Plattform als weitaus mehr als ein simples Upgrade – vielmehr als Grundstein für die nächste Ära der KI-Infrastruktur.

Allerdings kommt die Begeisterung nicht ohne Skepsis. Der extrem kurze Produktzyklus bedeutet, dass ältere Generationen sehr schnell obsolet werden. Kritiker warnen vor einer massiven Welle an Elektroschrott, wenn Unternehmen gezwungen sind, ihre Hardware in immer kürzeren Abständen auszutauschen, nur um mithalten zu können.

Trotz dieser Bedenken ist Rubin CPX ein strategischer Coup. Indem NVIDIA die Inferenz in den Fokus rückt – ein Bereich, den viele Wettbewerber noch unterschätzen – sichert sich das Unternehmen entscheidende Vorteile in Forschung und Unternehmensanwendungen. Rubin CPX könnte damit den Auftakt zu einer völlig neuen Phase im KI-Hardwaremarkt markieren.

Das könnte Ihnen auch gefallen

Einen Kommentar hinterlassen