Startseite » Nicht kategorisiert » Tachyum Prodigy 2 nm: KI-Revolution mit 1024 Kernen – oder doch nur Vaporware?

Tachyum Prodigy 2 nm: KI-Revolution mit 1024 Kernen – oder doch nur Vaporware?

von ytools
1 kommentar 0 ansichten

Tachyum ist wieder da – zumindest in den Präsentationen. Das Unternehmen hat eine neue Ausbaustufe seines Prodigy-Prozessors angekündigt, diesmal als extrem ambitionierten 2-nm-„Universalchip“ mit Spezifikationen, die auf den ersten Blick mehr nach Science-Fiction klingen als nach einem kurzfristig lieferbaren Produkt.
Tachyum Prodigy 2 nm: KI-Revolution mit 1024 Kernen – oder doch nur Vaporware?
Die Folien versprechen bis zu 1024 64-Bit-Kerne pro Sockel, Taktfrequenzen von bis zu 6 GHz, 1 GB Last-Level-Cache, 24 Kanäle DDR5-17600, bis zu 48 TB RAM pro Sockel und eine AI-Rack-Performance, die angeblich mehr als das 20-Fache von NVIDIAs Rubin-Ultra-Plattform erreicht. Auf dem Papier wäre das eine kleine Revolution im Rechenzentrum – in der Realität ist Prodigy aber nach wie vor ein Projekt ohne einen einzigen ausgelieferten Chip.

Um einzuordnen, warum diese Ankündigungen einerseits für leuchtende Augen und andererseits für Spott sorgen, lohnt sich ein Blick zurück. Tachyum spricht seit etwa 2018 davon, einen „General Purpose“-Prozessor zu bauen, der CPU, GPU und spezialisierte KI-Beschleuniger in einem einzigen Design vereinen soll. Die erste öffentlich diskutierte Version lag bei rund 128 Kernen auf einem 5-nm-Prozess mit Taktraten um 5,7 GHz. Danach wuchs die Kernzahl auf 192 und später auf 256 Kerne pro Chiplet
Tachyum Prodigy 2 nm: KI-Revolution mit 1024 Kernen – oder doch nur Vaporware?
. Zeitpläne rutschten von 2020 auf 2021, 2022 und weiter in die Mitte des Jahrzehnts. Keine dieser Roadmap-Stufen hat es bislang in ein kommerziell verfügbares Produkt geschafft.

Von 128 auf 1024 Kerne: die neue 2-nm-Ausbaustufe von Prodigy

Die aktuell vorgestellte 2-nm-Generation ist die mit Abstand aggressivste Version des Prodigy-Konzepts. Tachyum spricht von einem 2-nm-Fertigungsprozess und SKUs mit bis zu 1024 64-Bit-Kernen auf einem einzigen Sockel. Diese Kerne sollen – zumindest laut Folie – Taktraten von bis zu 6,0 GHz erreichen. Solche Frequenzen kennt man eher aus übertakteten Desktop-Systemen als aus Servern mit vielen Hundert oder gar Tausend Kernen.

Laut Datenblatt sollen die 2-nm-Prodigy-Chips folgende Eckdaten bieten:

  • 2-nm-Prozesstechnologie (für Prodigy selbst noch nicht getaped-out);
  • bis zu 1024 universelle 64-Bit-Kerne pro Sockel;
  • Taktraten von bis zu 6 GHz;
  • bis zu 1 GB kombinierter L2+L3-Last-Level-Cache;
  • SKU-Spektrum mit 32, 64, 96, 128, 256, 320, 384, 448, 512, 768 und 1024 Kernen;
  • TDP-Spanne von rund 30–70 W im Einstiegsbereich bis zu 1600 W im Flaggschiff;
  • bis zu 24 Kanäle DDR5 mit Geschwindigkeiten bis 17.600 MT/s;
  • RAM-Kapazitäten von bis zu 48 TB DDR5 pro Sockel;
  • bis zu 128 Lanes PCI Express 7.0, verteilt auf 64 PCIe-Controller.

Hinzu kommt: Die Plattform soll sich laut Tachyum zu Multi-Sockel-Systemen skalieren lassen – in der Spitze ist von bis zu 16 Sockeln und 8192 CPU-Kernen in einem System die Rede, wobei der 1024-Kern-Ausbau auf 8 Sockel begrenzt sein soll. In der Theorie könnten solche Systeme ganze Racks klassischer CPU- und GPU-Server ersetzen und trotzdem mehr AI- und HPC-Leistung bereitstellen.

Mikroarchitektur: CPU-Kerne mit Accelerator-Ambitionen

Kern des Designs ist eine hauseigene 64-Bit-Mikroarchitektur. Tachyum beschreibt Prodigy als Out-of-Order-Design, das bis zu 8 Instruktionen pro Takt ausgeben kann. Ergänzt wird das Ganze durch moderne Vektor- und Matrix-Erweiterungen, die gezielt KI- und HPC-Workloads beschleunigen sollen. Die Idee dahinter: ein Kern, der generische Server-Lasten ebenso stemmen kann wie typischerweise GPU- oder TPU-dominierte KI-Inferenz.

Jeder Kern besitzt 128 KB Instruktions-Cache und 64 KB Daten-Cache, beide mit ECC-Schutz. Den darüber liegenden Last-Level-Cache (L2 + L3 zusammen) gibt Tachyum mit bis zu 1 GB pro Chip an – ein Wert, der deutlich über dem liegt, was bei CPUs heute üblich ist. Damit versucht die Architektur, möglichst viele Parameter und Aktivierungen von KI-Modellen auf dem Die selbst zu halten, um Speicherzugriffe nach außen zu reduzieren und Latenzen zu drücken.

Der Preis dieser Ambition lässt sich an den TDP-Angaben ablesen. Während kleine Varianten mit 30 oder 70 W angegeben sind, klettern die Leistungsaufnahmen bei den größeren SKUs rasch: 140 W, 150 W, 300 W, 420 W, 550 W, 645 W, 800 W, 1000 W und schließlich bis zu 1600 W. Damit konkurriert Prodigy nicht mehr nur mit klassischen Server-CPUs, sondern bewegt sich in Regionen, in denen sonst nur große GPU-Beschleuniger oder ganze Knoten liegen.

Speicher und I/O: DDR5-17600 und PCIe 7.0 aus einer zukünftigen Serverwelt

Besonders futuristisch wirken die Aussagen zur Speicher- und I/O-Ausstattung. Ein 24-kanaliger DDR5-Controller mit Unterstützung für DDR5-17600 und bis zu 48 TB pro Sockel liegt weit jenseits dessen, was derzeit in realen Systemen zur Verfügung steht. Weder DDR5-17600 noch PCIe 7.0 spielen im aktuellen Server-Mainstream eine praktische Rolle; viele Details dieser Standards befinden sich noch in Entwicklung oder frühem Ökosystem-Aufbau.

In Kombination mit 128 Lanes PCIe 7.0 und 64 separaten Controllern zeichnet Prodigy ein Bild einer Plattform, in der Bandbreite kein Engpass mehr ist: extrem schnelle Anbindung für Storage, Netzwerke und Beschleunigerkarten. Gleichzeitig setzt dieses Bild voraus, dass die Industrie in sehr kurzer Zeit mehrere Technologiesprünge vollzieht – deutlich schneller, als es die bisherigen Roadmaps großer CPU- und GPU-Hersteller vermuten lassen. Genau das nährt den Verdacht, hier werde eher ein „Wünsch-dir-was“-System beschrieben als eine kurzfristig realisierbare Plattform.

Leistungsversprechen: über 1000 PFLOPs und 21× Rubin Ultra

Noch mutiger als die Spezifikationen sind die Performance-Folien. Tachyum behauptet, Prodigy 2 nm werde der erste Chip sein, der bei KI-Inferenz die Marke von 1000 PFLOPs (1 ExaFLOP) übertrifft – im Vergleich zu rund 50 PFLOPs, die NVIDIA für die Rubin-Plattform in Aussicht stellt. Auf Rack-Ebene spricht das Unternehmen von etwa 21,3-fach höherer AI-Rack-Performance für „Prodigy Ultimate“ gegenüber Rubin Ultra (NVL756) und von rund 25,9-fach für „Prodigy Premium“ gegenüber Rubin (NVL144).

Was in diesen Zahlen genau steckt, bleibt allerdings vage. Weder die genaue Präzision (FP8, FP4, BF16 etc.) noch die verwendeten Modelle, Batch-Größen, Konfigurationen oder Energie-Budgets werden transparent gemacht. Zudem handelt es sich um einen Äpfel-Birnen-Vergleich: Rubin ist eine GPU-zentrierte Plattform mit einem über Jahre gereiften Software-Stack, während Prodigy als CPU-Architektur mit breit ausgebauten Vektor- und Matrix-Einheiten daherkommt. Rein in PFLOPs oder „Rack-Performance“ zu vergleichen, blendet viele praktische Aspekte von Programmierung, Portierung und Betrieb aus.

Sieben Jahre Roadmaps, kein einziges ausgeliefertes Die

Genau hier setzt der wachsende Zynismus in der Community an. Prodigy wurde seit 2018 mehrfach angekündigt, umdesignt und neu positioniert. Termine wurden verschoben, Spezifikationen angepasst, Folien aufgehübscht – doch bis Ende 2025 gibt es keinen Prodigy-Chip, den Rechenzentren tatsächlich kaufen, einbauen und unter realen Workloads testen könnten. Stattdessen demonstriert Tachyum seine Ideen anhand von FPGA-Emulationssystemen und theoretischen Benchmarks.

Gleichzeitig vermeldet das Unternehmen durchaus Fortschritte auf der Finanzierungsseite. Rund 220 Millionen US-Dollar an frischem Kapital sollen den Weg zum 2-nm-Tape-out ebnen. Das ist kein Pappenstiel und zeigt, dass Investoren das Konzept eines universellen Prozessors ernst nehmen. Aber Geld löst nicht automatisch die klassischen Probleme der Halbleiterbranche: stabile Fertigung, ausreichende Yield-Raten, robuste Plattformen, zertifizierte Server-Designs und ein breiter Software-Support von Betriebssystemen über Hypervisoren bis hin zu KI-Frameworks.

Unter Hardware-Fans und Infrastrukturverantwortlichen hat Prodigy daher längst den Beigeschmack eines „On-Paper-Produkts“ bekommen. In Foren wird gerne ironisch angemerkt, man habe selbst zu Hause einen „300× schnelleren“ Chip als Rubin Ultra – auf dem Papier, versteht sich. Die Botschaft hinter dem Spott ist klar: Nach so vielen Ankündigungen reicht es nicht mehr, die Balken in den Marketing-Grafiken höher zu malen. Entscheidend ist, wann erstmals ein echtes Board mit echtem Silizium in einem Rack steckt.

Was wäre, wenn Prodigy 2 nm tatsächlich kommt?

Trotz aller Skepsis lohnt es sich, das Szenario durchzuspielen, in dem Tachyum zumindest einen großen Teil der Versprechen einlöst. Ein 2-nm-Prozessor mit 1024 Kernen bei bis zu 6 GHz, 1 GB Cache, dutzenden Speicherkanälen und ExaFLOP-Klasse bei KI-Inferenz könnte die Architektur moderner Rechenzentren grundlegend verändern. Statt getrennten CPU- und GPU-Clustern würden Betreiber einheitliche Knoten auf Basis eines einzigen Prozessortyps aufbauen, der alles von Microservices über Datenbanken bis hin zu KI-Inferenz und wissenschaftlichen Simulationen abdeckt.

In der Theorie reduziert das Komplexität: weniger Spezial-Hardware, weniger Datenverkehr zwischen CPU- und GPU-Inseln, dafür mehr Flexibilität bei der Zuteilung von Rechenzeit. Cloud-Anbieter könnten ein homogenes Flotten-Design fahren und trotzdem sehr unterschiedliche Workloads auf derselben Plattform konsolidieren. Für Kunden sähe der Unterschied vielleicht nur in einer neuen Instanzfamilie aus – im Hintergrund würde sich die Art, wie Rechenleistung bereitgestellt wird, aber massiv verschieben.

Bis dahin ist der Weg jedoch lang. Ein Tape-out ist nur der erste Schritt. Danach folgen Validierung, Errata, Steppings, Plattform-Design, BIOS-Anpassungen, Treiber, Optimierungen für Linux-Distributionen, Container-Umgebungen und KI-Frameworks wie PyTorch und TensorFlow. Gleichzeitig müssen OEMs überzeugt werden, Server mit einer noch völlig unbewiesenen Architektur in Serie zu bringen. Und all das passiert, während etablierte Anbieter wie AMD, Intel und NVIDIA ihre eigenen, sehr aggressiven Roadmaps verfolgen.

Fazit: beeindruckender Fahrplan, aber noch kein Produkt

Stand heute lässt sich Prodigy 2 nm am besten als ambitioniertes Statement verstehen. Die Spezifikationen lesen sich wie ein Wunschzettel für das Rechenzentrum von übermorgen: 1024 Kerne mit 6 GHz, 1 GB Cache, 24 Kanäle DDR5-17600, bis zu 48 TB RAM pro Sockel, 128 Lanes PCIe 7.0 und Racks, die NVIDIAs Rubin-Ultra-Plattform bei KI-Inferenz angeblich um mehr als den Faktor 20 schlagen. Gleichzeitig gibt es aber keinen einzigen Prodigy-Chip im Feld, und frühere Ankündigungen sind immer wieder an der Wirklichkeit gescheitert.

Wer Tachyum ernsthaft einordnen will, sollte deshalb beides im Blick behalten: die Vision eines universellen Prozessors, der CPU, GPU und KI-Beschleuniger vereint – und die harte Realität eines Marktes, in dem selbst Branchenriesen mit Verzögerungen, Design-Iterationen und technischen Rückschlägen kämpfen. Wenn Tachyum tatsächlich einen funktionsfähigen 2-nm-Prodigy mit auch nur annähernd diesen Eckdaten liefern kann, wäre das eine der spannendsten Geschichten der letzten Jahre im High-Performance-Computing. Bis dahin bleibt Prodigy aber vor allem eines: ein Konzept, das auf Folien beeindruckt, in Racks jedoch erst noch beweisen muss, dass es mehr ist als gut verpacktes Vaporware.

Das könnte Ihnen auch gefallen

1 kommentar

SnapSavvy December 15, 2025 - 5:35 pm

Das Ding direkt mit Nvidia Rubin zu vergleichen ist mutig, vor allem solange nicht ein einziger Server mit Prodigy tatsächlich läuft

Antworten

Einen Kommentar hinterlassen