SGI führt OpenSource-Supercomputing in neue Höhen: 256 CPUs unter einem einzigen Linux-Kernel

Large-Scale-Systeme jetzt verfügbar - Itanium2-basierte Altix-Linie baut führende Stellung bei HPC-Benchmarks aus
(PresseBox) (München, ) Die High-Performance-Computing-Plattform SGI®Altix® ist jetzt weltweit in Konfigurationen verfügbar, bei denen bis zu 256 der mächtigen 64-Bit-Prozes­soren Intel® Itanium®2 unter einer einzigen Linux®-Parti­tion zusammenarbeiten. Dass sich jetzt auf einer OpenSource-Maschine im ´Single-System-Image´-(SSI)-Betrieb eine derartig hohe Anzahl von CPUs betreiben lässt und dass dabei sämtliche CPUs auf einen großen zusammenhängenden Arbeitsspeicher zugreifen können, ist das Ergebnis eines internationalen Beta-Programms, das ursprünglich darauf abzielte, die Skalierbarkeit von 64 (offizieller Stand Dezember 2003) auf zunächst 128 auszu­dehnen.

Der neue Meilenstein unterstreicht SGIs Commitment, den wachsenden HPC-Bedarf unter Linux fokussiert zu unterstützen und die Skalierbarkeit der Hochleistungsrechner-Familie forciert in immer neue Rekord­höhen zu treiben. Parallel zu den SSI-Errungenschaften weist das Unternehmen anhaltend führen­de Leistungswerte bei Industriestandard-Benchmarks wie auch bei Kunden-Anwendungen vor. Das Unternehmen hat die techno­logi­sche Spitzen­stellung der Altix-Plattform im Vergleich zu wettbewer­benden Systemen von IBM, HPB und Sun damit weiter ausgebaut.

Egal um welche Anwendungssektoren es geht, ob um Aufgaben der Ferti­gungs­industrie, der Geowissenschaften, der Luft-&-Raumfahrt, der Life-Sciences, der Erdölbranche oder des Heimatschutzes - eine hochgradig skalierbare Platt­form, bei der sämtliche Prozessoren unter nur einem Linux-Kernel operieren, bildet für umfangreiche Berechnungs­probleme der Forscher und Ingenieure oft wesent­liche Vorteile. Das Altix-Einzelsystem bietet als Shared-Memory jetzt einen bis zu 2 TeraByte ausbaubaren Arbeitsspeicher; in ihm lassen sich größte Probleme unter­bringen, die dann von den 100en Prozessoren in effi­­zien­ter Parallelarbeit bei optimalen Kooperationsbedingungen gelöst werden.


Tera-Scale-Computing - einfacher, effizienter

Die Technologie, die HPC auf einem solchen ´Tera-Scale-Level´ möglich macht, ist die renommierte Systemarchitektur SGI® NUMAflex™. Die SSI-Umgebung sorgt beim Tera-Scale-Computing für einfachere Programmier-Verhältnisse. Mit einer entsprechend dimensionierten Shared-Memory-Plattform SGI Altix können Ingenieure und Wissenschaftler aufwändige Datensätze und Simula­tions­­modelle in unzerstückelter Weise berechnen und als Ganzes analysieren; im Vergleich zu üblichen Clustern (Distributed-Memory-Architektur und viele Betriebssystem-Instanzen) wird die Problemlösung erheblich beschleunigt.

Mit den erweiterten, kommerziell verfügbaren SSI- und Shared-Memory-Fähig­kei­ten stellt Altix nun eine 64-Bit-Linux-Produktiv-Plattform dar, die Forschern und Ingenieuren bei der Entwicklung neuer, hochquali­tativer Produkte weniger Grenzen setzt und Wissenschaftler schneller zu neuen Erkenntnissen führt.


512 CPUs: heute bei der NASA, zum Jahresende für alle

SGI sieht Bedarf für noch mächtigere Altix-Systeme und gibt deshalb bekannt, zum Jahresende die Verfügbarkeit eines Altix-Einzelsystems zu planen, das bis zu 512 CPUs im SSI skaliert. Dass dies möglich ist, wurde kürzlich am NASA Ames Research Center bewiesen, wo eine Technologie-Demonstration des weltweit größten SSI-Linux-Systems stattfand. Im November 2003 hatte die NASA-Einrichtung dieses kundenspezifisch erweiterte Altix-System für Zwecke der Ozean-Simulation und andere Forschungsvorhaben vorgestellt.

“Modellrechnungen über die globale Klimaveränderung und andere herausfor­dernde wissenschaftliche Forschung kann die NASA nicht ohne Hochleis­tungs­rechner wie die am Ames installierte 512-Prozessor-Altix durchführen", sagt Dr. Ghassem Asrar, Associate Administrator, NASA Earth Science Enterprise. "Fortschritte bei der Rechnertechnik wird uns beim Klimawandel schneller und effizienter zu neuen Erkenntnissen führen, so dass wir unseren Planeten besser schützen lernen".


Linux-Erweiterung SGI ProPack - in Release 2.4

Weitere Schlüsseltechnologie, die die 256-CPU-Unterstützung möglich macht, ist neben der NUMAflex-Systemarchitektur die jüngst releaste Betriebs­umge­bung SGI Advanced Linux™ Environment mit SGI ProPack™ 2.4. Das jetzt in Version 2.4 vorliegende Betriebssystem-Erweiterungspaket ist verfügbar für neue wie auch früher installierte Altix-3000- und Altix-350-Systeme. ProPack 2.4 hebt die SSI-Skalierbarkeit auf das neue Rekord-Niveau und bringt asynchrones I/O, den Vitesse SATA-Treiber sowie plattenloses Booting für partitionierte Systeme. Darüber hinaus enthält die ProPack-Release neue Versionen für den Message-Passing-Toolkit (MPT) und die Science- und Mathe-Libraries (SCSL), wobei jetzt auch Unterstützung von ScaLAPACK gegeben ist.


Benchmarks: STREAM Triad, Linpack, SPEC

Parallel zu den wiederholten Erfolgen in puncto Itanium2-Skalierbarkeit unter Linux hat SGI jetzt eine weitere Runde mit führenden Leistungsergebnissen bei Industriestandard-HPC-Benchmarks eröffnet. Bei Tests, deren Resultate am 23. Februar veröffentlicht wurden, verbuchte ein Altix-3000-System mit einem 1.5-GHz-Itanium2 ein Linpack-100x100-Benchmark-Ergebnis von 1659 MFLOPS; nächst folgendes Wettbewerber-System war ein HP-Server Integrity rx2600, der mit der gleichen CPU 1635 MFLOPS verbuchte. Bei Linpack-1000-x1000-Tests lieferte das Altix-System die höchsten Werte sämtlicher Single-Prozessor-Systeme mit der 1.5-GHz-Itanium2-CPU: 5400 MFLOPS, versus 5303 von HP. Linpack ist eine Sammlung von Fortran-Subroutinen, mit denen Anwender lineare Gleichungen und lineare Kleinste-Quadrate-Probleme berechnen. Mehr zu den Linpack-Ergebnissen: www.netlib.org/...

Schon vor den jetzt erzielten dominierenden Linpack-Ergebnissen konnte SGIs Linux-basierte HPC-Plattform führende Resultate vorweisen. Im Nov. 2003 hatte das Altix-System Geschichte geschrieben, als es beim STREAM-Triad-Bench­mark, einem Industriestandard-Test für Memory-Bandbreite, die TeraByte/Sek-Marke durchstieß. Das Rekordergebnis belegt die skalierenden Fähigkeiten der Shared-Memory-Architektur NUMAflex, die dazu führen, dass die Altix-Linie unter allen anderen weltweit verfügbaren Systemen - inklusive von Skalar- und Vektorsystemen von IBM, HP, Cray, NEC und Sun - die höchste Triad-Band­breite liefert.

Auch bei anderen Leistungskriterien, wie beim Benchmark SPECfp_rate2000, zeigt die Plattform weiterhin hervor­ragende Ergebnisse. SPECfp_rate2000 misst die Durchsatzfähigkeit eines Systems bei Fließkomma-intensiven Lasten. In der Liga der Systeme, die mit 64 und mehr Prozessoren ausgestattet sind, lässt die SGI-Maschine ähnlich konfigurierte Produkte von HP, Sun und Fujitsu hinter sich. So arbeitet ein Altix-System mit 64 mal 1.5-GHz-Itanium2-Prozessoren um mehr als 35% schneller als ein HP-Server Integrity Superdome mit 64 mal 1.5-GHz-Itanium2-Prozessoren.

“Der Altix-Linie liegt ein Designkonzept zugrunde, das die jeweils beste, in ihrer Art verfügbare Technologie kombiniert", betont Dave Parry, bei SGI Senior VP und General Manager der Server and Platform Group. "Wir haben das OpenSource-64-Bit-Betriebssystem Linux und Intels performanten Itanium2-Prozessor mit der NUMAflex-Architektur und damit der branchenweit leistungs­fähigsten Interconnect-Technologie zusammengeführt. Die jetzt bis zu 256 Prozessoren im SSI-Betrieb unterstützende Plattform bringt die besten System-Komponenten zum Einsatz, die die Branche zu bieten hat, und liefert damit genau das, was Forscher, Wissenschaftler und Ingenieure brauchen, um schneller zu Innovationen zu kommen - nämlich Rekordleistung.”


Supercluster-Konfigurationen

SGI Altix 3000 ist als skalierbares Einzelsystem, das im SSI-Modus (unter einer einzigen Linux-Partition) 4 bis zu 256 Intel-Itanium2-Prozessoren zu betreiben erlaubt, sofort verfügbar. Ebenso sofort verfügbar sind Altix-Supercluster-Konfi­gu­ra­tionen mit einer Ausbaubarkeit bis zu 512 Itanium2-Prozessoren.

Eine Supercluster-Umgebung besteht aus mehreren speziell verkop­pelten Altix-Einzelsystemen. Dabei wird die Verbindung der einzelnen SSI-Großknoten mit der architektur-eigenen, nach "außen geführten" Interconnect-Technologie NUMAlink realisiert, so dass extrem hohe Bandbreite und geringe Latenz nicht nur für Zugriffsprozesse innerhalb eines Einzelsystems, sondern auch zwischen den Einzelsystemen gesichert sind. In der Supercluster-Umgebung können sämtliche Prozessoren, egal in welchem Knoten sie sich befinden, den gesamten installierten Speicher (bis zu 4 TeraByte) partitionsübergreifend als Globales Shared-Memory nutzen.

Für Kunden, die noch größere Altix-Umgebungen benötigen, wird SGI Super­cluster-Konfigurationen mit bis zu 1,024 Prozessoren voraussichtlich ab Mai 2004 unter­stützen. Einzelsysteme, die im SSI-Betrieb bis zu 512 Prozessoren skalieren, plant SGI bis zum Ende des Jahres zu liefern. In weiteren Schritten sollen Systeme mit immer umfangreicheren Ausbaumöglichkeiten folgen.


Näheres zu Technik und Verfügbarkeit: siehe www.sgi.com/servers/altix.

Kontakt

Silicon Graphics International
Werner-von-Siemens-Ring 1
D-85630 Grasbrunn
Dr. Gernot Schaermeli
Social Media