[wunderbare welt der wissenschaft]

Es rauscht im Karton

VON ANDREAS BEUTHNER

[10-11-04 / p57]
Die Supercomputer ...

… gehören zur Champion´s League der weltbesten Rechenknechte. Dafür werden sie gebaut, gehätschelt und trainiert. Wenn sie nicht gerade an Titelkämpfen in Gestalt von Linpack-Benchmarks teilnehmen, berechnen sie Wetterbewegungen und Klimaschwankungen, untersuchen Proteinmoleküle, simulieren Kriegsszenarien und helfen überhaupt ganz gern den Militärs bei heiklen Missionen im In- und Ausland.

Ein gewöhnlicher PC-User, der hört, was im Inneren der Supermaschinen abgeht, kriegt unweigerlich rote Ohren. Der bis vor kurzem amtierende Weltmeister Earth Simulator stammt von NEC und rechnet unter japanischer Aufsicht in Yokohama im Bereich Klimaforschung und Umweltschutz. Das Erfolgsmodell besteht aus 640 Knotenrechnern mit einem Hauptspeicher im Terabyte-Bereich. Jeder Knoten enthält acht Vektorprozessoren, von denen schon jeder einzelne einen handelsüblichen Hochleistungs-PC vom Tisch pustet. Summa summarum sind es 5.120 Prozessoren, die auf Knopfdruck loslegen und pro Sekunde über 35 Billionen Additionen oder Multiplikationen in Form von so genannten Fließkommazahlen-Operationen ausführen. Das Rechenmonster braucht ein eigenes Kraftwerk für Strom und eine 3.000 Quadratmeter große Halle. Die Entwicklungskosten haben den japanischen Staatshaushalt umgerechnet mit 350 Millionen US-Dollar belastet und NEC hat sicherlich auch ein paar Millionen investiert.

Während der Automobilfan bei Pferdestärken aufhorcht, geht es beim Computerkenner um Flops, genauer gesagt um Floating Point Operations Per Second (= Flops). Eine Maßzahl für die Leistung, die zwei mal jährlich im Rahmen der International Supercomputing Conference ermittelt und als Grundlage für die Tabellenliste Top 500 hergenommen wird. Dabei bedeutet beispielsweise die Addition zweier Zahlen in einer Sekunde 1 Flops. Derzeit bewegt sich der in einem Benchmark-Verfahren (Linpack) ermittelte Leistungswert im Bereich Teraflops (Billionen Flops). Gemessen wird dabei nicht die reine Prozessorgeschwindigkeit, sondern das Zusammenspiel der gesamten Rechnerarchitektur (Hauptspeicher, Bus und Compiler).

Die meist in Clustern zusammengeschalteten Rechner repräsentieren nicht nur die Leistungselite moderner Computertechnik, sondern dienen ebenso der Imagepflege ihrer Schöpfer. In der Teraflops-Klasse rangieren neben NEC so Schwergewichte wie IBM, Hewlett-Packard, Silicon Graphics oder der Supercomputer-Spezialist Cray, der zeitweise völlig von der Bildschirmoberfläche verschwunden war. Die Firmen stecken einen nicht unerheblichen Teil ihrer Einnahmen in den Entwurf und den Bau solcher High-Tech-Maschinen und erhoffen sich natürlich im Gegenzug durch werbewirksame Auftritte einen Imagegewinn, der sich irgendwann in klingende Münze umsetzen läßt.

Die Rechnung scheint aufzugehen. Im Windschatten von Grid Computing, Antiterror-Simulationen und medizinischer Wirk- sowie Werkstoffforschung erleben die Rechenboliden weltweiten Zuspruch. Prompt entbrennt der Wettbewerb um den Weltmeistertitel in diesem Jahr in bisher kaum bekanntem Ausmaß. Vor allem wollen die US-amerikanischen Computeringenieure der japanischen Dauerpräsenz im Spitzenfeld der Top 500 ein Ende bereiten. Blue Gene/L heißt der neue Favorit, den IBM kürzlich ins Rennen geschickt hat und der die bisherige Nummer Eins, Earth Simulator, vom Siegerpodest holen soll.

„Wir sind einfach besser“, könnte auf den Blue-Gene-Schränken stehen, auch wenn Big Blue das Rechnersystem nur als Prototyp in den Benchmark schickt. Im Juni hat der IBM-Hoffnungsträger mit 8.192 Power-Prozessoren immerhin 12 Teraflops geschafft. Jetzt wollen die Amerikaner zum finalen Endspurt anheben und den Siegerkranz nach Hause holen, was ihnen nach neuesten Verlautbarungen aus dem Austragungsort Pittsburgh im US- Bundesstaat Pennsylvania auch gelungen ist.

In einem ersten Probelauf schaffte das Blue-Gene-System mit 16.000 Prozessoren eine Linpack-Spitzenleistung von 36,01 Teraflops. Das reicht, um NEC erst einmal abzuhängen. Im entscheidenden Durchgang haben IBM-Wissenschaftler in Pittsburgh noch mal nachgelegt: Laut Veranstalter erreichten neu zusammengesteckte Dual-Core-Prozessoren von IBM die Rekordmarke von 70,7 Teraflops und deplazierten damit die NEC-Konkurrenz nicht nur auf den vierten Platz, sondern auch den heimischen Rivalen Silicon Graphics (Systemname: Columbia, 51,8 Teraflops) auf Platz zwei.

Etwas bescheidener macht sich die Nummer drei im US-Gespann, Red Storm von Cray, aus. Der Cluster-Rechner erreicht zwar auch je nach Konfiguration einen zweistelligen Teraflops-Wert, schafft aber nicht den Sprung an die Spitze. Das macht auch nichts, denn die US-Company verzeichnet gute Geschäfte mit ihren massiv-parallelen Gleitkomma-Rechnern und installiert gerade für 93 Millionen US-Dollar einen Red Storm in den heimischen Sandia National Labs. 11.648 AMD-Opteron-Prozessoren sollen es mal auf 42 Teraflops bringen.

Wer hat denn nun den schnellsten Rechner? Die Top 500 sind ja nur eine Momentaufnahme, deren zugrundeliegender Benchmark im übrigen unter Experten umstritten ist. Vielleicht ist der eigentliche Champion eine Maschine, die im Verborgenen rechnet. Zum Beispiel im Shanghai Supercomputer Center. Von dort dringen nur spärliche Informationen an die Öffentlichkeit. Auf rund acht Teraflops bringt es ein von Dawning zusammengestellter Opteron-Cluster. Chinesische Computerwissenschaftler kündigen aber bereits an, daß sie schon bald mit ihren Systemen in die nächste Leistungsklasse aufsteigen werden. Da bahnt sich offenbar ein neues Kraftzentrum im fernen Osten an, das mit gut trainierten Maschinen Einschnitte im etablierten Lager der Supercomputer-Champions vornehmen will.

[navigation]