Bundeshöchstleistungsrechner ´SGI Altix´ am LRZ in Stufe 1 installiert und in Betrieb genommen

4096-Prozessor-System bildet am Leibniz-Rechenzentrum innovative Ressource mit 17 TB großem einheitlich nutzbaren Hauptspeicher
SGI Altix 4700  am LRZ (PresseBox) (München, ) Das Leibniz-Rechenzentrum (LRZ) in Garching bei München hat seinen neuen, auf der Server-Plattform ´SGI Altix 4700´ basierenden Bundeshöchstleistungsrechner in erster Ausbaustufe in Betrieb genommen. Der Superrechner, der mit seinen zunächst 4,096 Prozessoren und einem einheitlich adressierbaren Hauptspeicher von 17 TB Größe eine europaweit einzigartige Ressource darstellt und Forschern und Wissenschaftlern in Bayern, Deutschland und darüber hinaus quantitativ wie auch qualitativ neue Möglichkeiten des Supercomputings schafft, wurde von SGIs CEO Dennis McKenna offiziell übergeben.
--------------------------------------------

Die Übergabe erfolgte am 21.07. im Rahmen einer feierlichen Einweihung des neuen Rechenzentrums in Garching - in Gegenwart der Bundesministerin für Bildung und Forschung, Dr. Annette Schavan, des Bayerischen Ministerpräsidenten, Dr. Edmund Stoiber, sowie des bayerischen Staatsministers für Wissenschaft, Forschung und Kunst, Dr. Thomas Goppel.

Die Investitionskosten für den neuen Nationalen Höchstleistungsrechner liegen insgesamt bei 38 Millionen Euro.

Das SGI-System wird dem LRZ erlauben, die akademische Nutzergemeinde bei den immer anspruchvolleren und zahlreicheren Simulationsproblemen in Physik und Astrophysik, Materialforschung, Strömungsdynamik, Chemie, Geo- und Biowissenschaften auch in Zukunft mit schneller State-of-the-art-Technologie und ausreichender Kapazität zu unterstützen. Gleichzeitig erschließt die SGI-Lösung Möglichkeiten, um verstärkt auch Nutzer aus anderen aufstrebenden Bereichen wie den LifeSciences auf die Simulationsplattform zu führen. Mit dem Altix-Superrechner wird das LRZ insbesondere auch die internationale Konkurrenzfähigkeit beim wissenschaftlichen Höchstleistungsrechnen weiter ausbauen.

Prof. Dr. H-G. Hegering, Vorsitzender des Direktoriums des LRZ: "Der neue Höchstleistungsrechner des LRZ hebt sich innerhalb der bisherigen Landschaft deutlich ab - in seiner Architektur, seiner vielseitigen Einsatzfähigkeit und seiner anwenderorientierten Leistungsfähigkeit. Er wird die Innovationskraft der Region stärken, das Angebot innerhalb der deutschland-weit verfügbaren Spitzenleistung ergänzen und uns letztlich erlauben, mit einem differenzierenden Konzept in den Wettbewerb um einen Europäischen Höchstleistungsrechner zu gehen." .

Dennis McKenna: "Es freut mich, ein System zu übergeben, das eines der weltweit leistungsfähigsten ist. Nicht nur in theoretischen Zahlen gemessen, sondern insbesondere in der erzielbaren Produktivität. SGI ist der Forschung und Wissenschaft in hohem Maße verpflichtet - und die Maßstäbe, die uns bei der Entwicklung fortgeschrittenster Technologie für diese Nutzerkreise leiten, sind ´Time-to-Result´, ´Time-to-Solution´, ´Time-to-Innovation´. Die SGI-Plattform soll helfen, beim Ringen um Ergebnisse und Erkenntnisse, um Innovationen und Durchbrüche schnelle, effiziente Wege zu beschreiten. SGI wünscht dem LRZ und seiner herausfordernden Science-Community viel Erfolg."

Investition in Anwendungsleistung und Einsatzflexibilität
----------------------------------------------------------------------------------
In der jetzigen Ausbaustufe mit 4,096 Intel®Itanium®2-Madison9M-Prozessoren (Clock-Rate 1.6 GHz) bietet der Altix-Supercomputer eine theoretische Peakleistung von rund 26 TeraFlops (die 2007 in Stufe 2 auf der Basis neuester Itanium-Dual-Core-Technologie auf über 60 TeraFlops anwachsen soll).

"Nicht die abstrakte Spitzenleistung war das Kriterium für das LRZ bei der Wahl des Rechners", unterstreicht Dr. Horst-Dieter Steinhöfer, am LRZ Abteilungsleiter für Höchstleistungsrechner. "Kriterium war ´Sustained-Performance´, die anhaltend höchste Leistung, die das System im praktischen Einsatz zu erbringen vermag, unter einem realistischen Lastmix mit Programmen, die für die Forschungsfragestellungen wichtig und nutzertypisch sind. Hinsichtlich der zu erwartenden Sustained-Performance zählt der neue LRZ-Superrechner international zu den leistungsfähigsten Systemen."

Für SGI Altix hatte sich das LRZ Ende 2004 entschieden, weil die Plattform mit ihrer bandbreitenstarken, hochgradig skalierenden ccNUMA-Architektur laut Benchmark-Tests unter den Angeboten die höchste aggregierte Gesamtleistung für relevante, gewichtete Applikationen und Applikationskerne erwarten ließ.
(Näheres siehe im Anhang).

Weiterer Grund für die Wahl von SGI: Mit ihrem extrem ausbaubaren, einheitlich adressierbaren Hauptspeicher und ihrer variablen Konfigurierbarkeit in Partitionen unterschiedlicher Größe erschließt die SGI-Plattform einzigartige Perspektiven hinsichtlich der Einsatzflexibilität und Nutzungseffizienz.

Der Blade-Server SGI Altix 4700, eingeführt Ende 2005, erlaubt, in nur einer Partition, unter einer einzigen Linux-Instanz, bis zu 512 Prozessoren im Shared-Memory-Verbund zusammenarbeiten zu lassen. Erst kürzlich konnte SGI auf dem LRZ-System mit Hilfe einer Beta-Version von ´Novell SuSE® Linux Enterprise Server 10´ sogar demonstrieren, dass die Plattform im Single-System-Image (SSI) bis zu 1,024 Prozessoren unterstützt - womit SGI bei der SSI-Skalierbarkeit unter 64-Bit-Linux einen neuerlichen Weltrekord aufstellte.

Auch in punkto Speicherzugriff hat sich SGI Altix 4700 erneut als Weltmeister erwiesen. Mit einer 1,024-Prozessor-SSI-Konfiguration konnte kürzlich auf dem LRZ-System als Weltrekord eine Memory-Bandbreite von dauerhaft 4.35 TB/s in STREAM-Triad-Benchmark-Tests verbucht werden.

Robert Übelmesser, bei SGI Sales Director European HPC Projects: " SGI ist stolz, dem LRZ ein Supercomputer-System übergeben zu können, das die Höchstleistungsrechner-Landschaft in Europa wesentlich erweitern wird. Neben der hohen Rechenleistung bieten die weltweit einmaligen 17 TeraByte gemeinsamer Hauptspeicher sowie die Weltrekord-Technologie in punkto SSI-Linux-Skalierbarkeit und Memory-Bandbreite einen substantiellen quantitativen und qualitativen Schritt vorwärts für das Höchstleistungsrechnen in Deutschland und in Europa."

Das LRZ wird den Rechner zunächst in 16 Partitionen mit je 256 Prozessoren betreiben. Mit einer Login-Partition mit 2 TB Shared-Memory sowie 15 Produktionspartitionen für das eigentliche Batch-Processing mit 1 TB Shared-Memory.

Im Zuge der nächsten Installationsstufe plant das LRZ bei der Granularität dann auf 512 Prozessoren pro Partition zu gehen.

“Wir sind interessiert, diese Möglichkeiten weiter zu verfolgen und später auch bis zur SSI-Grenze mit 1,024 Prozessoren zu gehen, wenn Anwender hierfür Bedarf melden” sagt Dr. Matthias Brehm, Leiter der Gruppe Hochleistungsrechnen am LRZ.

System für einfache Programmierung und neue Einsatzkonzepte
-------------------------------------------------------------------------------------------
Auf der SGI-Plattform am LRZ werden Programme laufen können, die
* für Distributed-Memory-Architekturen geschrieben sind (MPI-Codes) und wie in einem Cluster je nach Bewilligung mit bis zu 4000 Prozessoren arbeiten,
* für Shared-Memory-Umgebungen geschrieben sind (z.B. OpenMP-Codes) und mit bis zu 256 Prozessoren im Shared-Memory arbeiten,
* sowie auch solche Programme, die als Hybrid-Codes beide Architektur-Typen kombiniert nutzen.

Damit erschließen sich in allen denkbaren Anwendungsgebieten neue Größenordnungen der Berechenbarkeit. Insbesondere wird mit der Shared-Memory-ccNUMA-Architektur des Altix-Systems das Programmieren von parallel ablaufenden Anwendungen erheblich erleichtert.

Während etwa Astrophysiker oder Strömungsmechaniker Supercomputer seit Erfindung einsetzen und sich schon seit Jahrzehnten mit schwierigsten Parallelprogrammier-Methoden auseinander setzen, ist es für viele andere, aufstrebende Forschungsfelder wie etwa die Lebenswissenschaften unabdingbar, dass der Nutzer einen Supercomputer sofort auf möglichst unkomplizierte Weise nutzen kann.

Eine Shared-Memory-Partition bietet dies. Es zeichnen sich hochattraktive Einsatzkonzepte ab, die ideal Gebrauch machen können von dem großen Arbeitsspeicher. Beispiel sind die enormen Datenbanken, die in der Genomik und Proteomik gegeneinander abgeglichen werden müssen. Kann das Datamining komplett im schnellen Memory stattfinden, ohne Zugriff auf Festplatte, lassen sich enorme Beschleunigungen erzielen.

Brehm: "Rechen- und I/O-Leistung sind bei dem neuen LRZ-System ausgewogen konfigurierbar. Bei Programmierwerkzeugen und Anwendungscodes erschließt sich eine breite Verfügbarkeit. Ebenso erlaubt das SGI-System eine nahtlose, auf leichte Nutzbarkeit zielende Einbettung in die gesamte LRZ-Umgebung. Damit stellt die Plattform SG Altix 4700 des LRZ für den Nutzer von Höchstleistungsrechnern in Deutschland einen gewaltigen Fortschritt dar."

Vielfältige Aufgaben warten
-----------------------------------------
Auf ihren Einsatz auf dem neuen LRZ-Höchstleistungsrechner wartet inzwischen eine Vielfalt von Anwendungen und Projekte.

Der SGI-Altix-Rechner am LRZ soll helfen u.a. bei der Simulation von Turbulenzen, beim Studium von Strömungen in porösen Gebilden, beim Zusammenwirken von Strömungen und deformierbaren Strukturen, bei Fragen der Entstehung und Ausbreitung von Schall, bei Hochtemperatur-Supraleitung, bei Formgedächtnis-Materialien, bei der chemischen Reaktionen in Verbrennungs- und Katalyseprozessen, bei der Ausbreitung von seismischen Wellen und Erdbeben sowie bei der Untersuchung der Beziehungen zwischen Sequenz, Struktur und Funktion von Proteinen.

Voraussetzung für die Nutzung des Rechners ist eine positive Begutachtung des jeweiligen Projektes durch ein Expertengremium.


Kurze Installationszeit
---------------------------------
Die Übergabe des Systems konnte nach kurzer Installationszeit, wenige Wochen nach Anlieferung der ersten System-Racks erfolgen.

Ausbau Sufe1 und Stufe 2 - und einige Zahlen
--------------------------------------------------------------------
In seiner jetzigen Ausbaustufe 1 ist der Höchstleistungsrechner mit einer Plattenspeicherkapazität von 300 TB FibreChannel-Disks ausgestattet, die direkt an die Partitionen angebunden sind und die Ergebnisse und die möglichst schnell auszulagernden und den Verarbeitungsprozessen immer wieder zuzuführenden Zwischenergebnisse der Simulationsläufe halten.

In Stufe2 (Sommer 2007) wird der Plattenspeicher auf 600 TB erweitert werden, der Hauptspeicher auf 40 TB ausgebaut. Mit der Aufrüstung auf neueste Intel-Itanium-Dual-Core-Technologie wird sich die Applikationsleistung verdoppeln.

Der LRZ-Höchstleistungsrechner setzt sich zusammen aus 128 Altix-Racks, die in 8 Reihen (Ranks) zu je 16 Racks (mit derzeit 2 Partitionen) angeordnet sind, sowie einer Reihe aus 18 Racks mit SGI®InfiniteStorage®-Technologie - mit den FibreChannel-Platten, Switches und CXFS-Metadaten-Servern.

Die 146 SGI-Racks (plus 2 Racks NAS-Storage von Network Appliance für das File-Serving) wiegen rund 100 Tonnen. Sie belegen eine Stellfläche von rund 290 m2 (24mx12m) und stehen auf einem 1.8m hohen, begehbaren Unterboden, der die Verkabelung des Altix-Systems zu Storage und Netzwerk-Infrastruktur beherbergt und den erforderlich hohen Luftdurchsatz für die Kühlung erlaubt. Die Leistungsaufnahme des Systems beträgt 1 MegaWatt. Die Kühlung, die weitere 300 KiloWatt benötigt, wälzt stündlich 400,000 Kubikmeter Warm- in Kaltluft um.

Der Bundeshöchstleistungsrechner des LRZ ist über einen 10-GigaBit-Anschluss an das Deutsche Wissenschaftsnetz und die DEISA-Infrastruktur (Verbund europäischer Höchstleistungszentren) angekoppelt.

****** Bilder-Download *************:
www.sgi.com/...

____________________________ Anhang / Details

*** Maximale dauerhafte Anwendungsleistung ******
Um im Vorfeld der Systemwahl Ende 2004 zu bewerten, welche dauerhafte Leistung die diversen wettbewerbenden Angebote für den praktischen Einsatz erwarten ließen, hatte das LRZ eine Suite von Benchmark-Tests erstellt, die repräsentativ sind für das Mix der den Rechner hauptsächlich fordernden Applikationen. Die Test-Suite umfasste eine Large-Eddy-Simulation (Strömungsdynamik, CFD, klassisch, mit Gittern), eine Lattice-Boltzmann-Applikation (CFD, neuerer Ansatz über Partikel-Stöße), ein Quanten-Chromodynamik-Programm und drei Programme aus der Astrophysik, der Hochenergiephysik und der Quantenchemie; dazu diverse Kernels, Kern-Aufgaben, die bei Parallel-Programmen in großer Zahl als Basisroutinen und Standardprozeduren vorkommen (Fourier-Analysen, Matrix-Multiplikationen udgm).

Die Suite testete die Leistungsfähigkeit sowohl für Parallelverarbeitungs-Codes, die für Distributed-Memory-Architekturen (wie Cluster) geschrieben sind (MPI), wie auch solche, die für Shared-Memory-Architekturen codiert sind (OpenMP).

Dr. Matthias Brehm nach der System-Wahl, Dezember 2004: "Die ccNUMA-Plattform von SGI hat in 5 der 6 Anwendungsbenchmarks die höchste Leistung gebracht und sich in der aggregierten Gesamtleistung als die beste im Wettbewerb der Angebote erwiesen. Neben der Verarbeitungsleistung haben wir gezielt auch die interne Kommunikationsleistung und die I/O-Leistung geprüft. Auch hier zeigte sich SGI Altix mit ihrer hohen Bandbreite, die mit dem Systemausbau mitwachsen kann, als führende Plattform. Die Maschine liegt bei dem Benchmark-Mix weit vorne, sie skaliert gut und sie ist darüber hinaus auch noch flexibel nutzbar."

**** SGI Altix 4700 ********
SGI Altix 4700, angekündigt Ende 2005, kombiniert innovative Blade-Technologie mit der branchenweit renommierten NUMAlink-Interconnect-Technologie, die interner Bestandteil der SGIs ccNUMA-Architektur ist und die blade-basierten Systemressourcen bandbreiten-stark vernetzt. Zugriffe auf den gesamt installierten Hauptspeicher von theoretisch bis zu über 16,000 architektur-intern vernetzbaren Prozessoreinheiten können mit beispielhaft kurzen Latenz-Zeiten und hohen Datenraten erfolgen. SGI Altix 4700 bietet unter 64-Bit-Linux industrieführende Skalierbarkeit: Bis zu 512 (und bald auch offiziell bis zu 1,024) Prozessoren können in einer einzigen Partition im SSI-Verbund (Single-System-Image, unter einer einzelnen Linux-Instanz) mit einem bis zu Zig TeraByte ausbaubaren, gemeinsam im Shared-Memory-Modus nutzbaren Hauptspeicher arbeiten.

SGI Altix 4700 ist mit Blick auf mittlere bis größte Umgebungen entwickelt und für "Plug-&-Solve" und flexibelste Konfigurierbarkeit ausgelegt: Blades sind in verschiedensten Typen verfügbar - neben diversen Basis-Blades z.B. für möglichst dicht gepackte Prozessor-Ausstattung, für primär bandbreitenstarke Prozessor-Ausstattung, für Memory-only-Erweiterungen, für RASC (Rekonfigurierbares Anwendungs-Spezifisches Computing) mit applikationsbeschleunigenden re-programmierbaren Spezialhardware-Lösungen auf FPGA-Basis (Field Programmable GateArray) und mehr.

-------###
This news release contains forward-looking statements regarding SGI technologies and third-party technologies that are subject to risks and uncertainties. These risks and uncertainties could cause actual results to differ materially from those described in such statements. The reader is cautioned not to rely unduly on these forward-looking statements, which are not a guarantee of future or current performance. Such risks and uncertainties include long-term program commitments, the performance of third parties, the sustained performance of current and future products, financing risks, the ability to integrate and support a complex technology solution involving multiple providers and users, and other risks detailed from time to time in the company's most recent SEC reports, including its reports on Form 10-K and Form 10-Q.

Kontakt

Silicon Graphics International
Werner-von-Siemens-Ring 1
D-85630 Grasbrunn
Dr. Gernot Schaermeli

Bilder

Social Media