Columbia Universität setzt bei der Verarbeitung von Big Data auf EMC Isilon

Das im Zentrum für Bioinformatik der renommierten Universität betriebene EMC Isilon Scale-out NAS vereinfacht Wissenschaftlern den Zugriff auf Daten und ermöglicht Forschungsarbeiten schneller durchzuführen
(PresseBox) (Seattle, WA, ) Das Zentrum für Bioinformatik, kurz C2B2, der Columbia Universität wechselte auf ein EMC Isilon Scale-out NAS, das sich aus Knoten der EMC Isilon X- und NL-Produktfamilien zusammensetzt. Des weiteren kommen die EMC Isilon Software-Anwendungen SmartPools und SmartQuotas zum Einsatz. Die höhere Systemleistung ermöglicht, die im Rahmen der Forschung anfallenden rechenintensiven Aufgaben schneller abzuwickeln. Bereitstehende Ressourcen lassen sich zudem flexibler nutzen und damit besser auslasten, gleichermaßen können Wissenschaftler einfacher auf die für ihre Arbeit erforderlichen Daten zugreifen. Zu den weiteren Pluspunkten zählt, dass sich die üblicherweise mit der Verwaltung großer Datenmengen in Verbindung stehende Komplexität verringert und daraus resultierende laufende Betriebskosten zurückgehen.

"Das bislang betriebene traditionelle NAS-System war den hohen Input-/Output-Anforderungen der in unserer Rechnerinfrastruktur genutzten 400 CPUs nicht länger gewachsen," erläutert John Lowell Wofford, Director IT Services des C2B2 der Columbia Universität. "Wir wussten, dass wir diesen Wert in Kürze mindestens um das zehnfache überschreiten werden. Nach der Umstellung auf EMC Isilon, mussten wir uns nicht länger darum sorgen, ob unser System dieser Entwicklung standhält. Vielmehr können wir die Lösung nun jederzeit unkompliziert an die jeweiligen Erfordernisse anpassen, da sich Kapazität und Leistung vollständig unabhängig voneinander skalieren lassen. Das Beste dabei ist, dass wir nur kaufen müssen, was wir gerade tatsächlich benötigen."

Die Installation im C2BS

Das heute im C2B2 eingesetzte EMC Isilon-Speichersystem unterstützt etwa 4.000 CPUs und erfüllt damit die hohen I/O-Anforderungen von Forschungs- und Datenanalyseanwendungen, wie sie beispielsweise in der Biophysik oder der biologischen Strukturforschung zum Einsatz kommen. Darüber hinaus wird die EMC Isilon-Lösung von weiteren der Columbia Universität zugehörigen Instituten wie dem Herbert Irving Krebszentrum, dem Institut für Krebsgenomforschung und dem J.P. Sulzberger Genomzentrum für Speicherzwecke genutzt. Die Leistungsmerkmale des EMC Isilon- Systems ausschöpfend, können die Forschungszentren nun für ein breites Spektrum an Aufgaben auf eine einzige gemeinsame flexibel ausgelegte Rechen- und Speicherinfrastruktur zurückgreifen.

Speicherung von Metadaten auf Solid State Disks (SSDs)

Bei genomischen Datenbanken, wie sie das C2B2 verwendet, handelt es sich üblicherweise um Verzeichnisse mit einer gewaltigen Zahl an Dateien, für deren Indexierung riesige Mengen an Metadaten gelesen werden müssen. Wofford merkt an, dass sich 40 Prozent aller an das beim C2B2 genutzte System gestellten I/O-Anfragen auf den Namespace, also die Struktur der Daten, beziehen. Bei den EMC Isilon-Produkten der neuesten Generation lassen sich Solid-State-Laufwerke je nach Ausführung mit SAS- oder SATA-Festplatten kombinieren. Dies bietet den Vorteil, dass Metadaten auf den SSDs und reguläre Daten auf den SAS- oder SATA-Drives gespeichert werden. Durch dieses Konzept lassen sich Namespace-Operationen schneller durchführen, dies stellt aus Sicht der Verantwortlichen des C2B2 einen "ungeheuren Fortschritt" gegenüber der zuvor genutzten Rechen-/NAS-Systeminfrastruktur dar.

Einfache Verwaltung selbst größter Datenmengen

Das EMC Isilon-System ermöglicht dem C2B2, Wissenschaftlern einen schnelleren Zugriff auf Daten einzuräumen und vereinfacht die Verwaltung von Big Data. "Wir verarbeiten große Mengen an genomischen Daten und führen molekulare biophysikalische Simulationen sowie Sequenzanalysen durch, die zur Entwicklung neuer Medikamente und Fortschritten in der Basiswissenschaft führen können," erklärt Wofford. "Obwohl sich unser Datenbestand auf nahezu 1 Petabyte beläuft, lässt sich dieses Volumen dank des hauseigenen EMC Isilon Dateisystems OneFS einfach verwalten, ohne dass wir hierfür eigens einen Storage-Administrator beschäftigen müssen. Dies gibt unseren IT-Mitarbeitern Freiraum, um sich auf andere Aufgaben wie beispielsweise die Virtualisierung von Infrastrukturen zu konzentrieren. Folge sind Kosteneinsparungen auf allen Ebenen."

"Die vom Zentrum für Bioinformatik der Columbia Universität aufgelegten Forschungsprogramme gelten in der Welt der Wissenschaft als richtungsweisend," so Sam Grocott, Vice President Marketing, Isilon. "Wir freuen uns daher sehr darüber, dass das C2B2 auf Basis unserer Speichersysteme rechenintensive Forschungsarbeiten abwickelt. Dies erlaubt ihnen, sich auf ihre wissenschaftliche Arbeit anstelle auf die Verwaltung der Big-Data-Infrastruktur zu konzentrieren."

Kurzprofil EMC: Die EMC Corporation ermöglicht Unternehmen und Service Providern, ihre Geschäftsprozesse zu verändern und IT as a Service bereitzustellen. Cloud Computing ist ein entscheidender Faktor für diese Transformation. EMC erleichtert IT-Abteilungen mit innovativen Produkten und Dienstleistungen den Weg in die Cloud. Die Informationen als wichtigstes Gut lassen sich mit Lösungen von EMC flexibel, sicher und kosteneffizient speichern, verwalten, schützen und für die Analyse aufbereiten. Weitere Informationen über EMC finden sich unter: http://germany.emc.com.

Kontakt

EMC Deutschland GmbH
Am Kronberger Hang 2a
D-65824 Schwalbach/Taunus
Frank Schoofs
Isilon Systems GmbH
Marketing Manager Central Europe
Marie-Christine Billo
billo pr GmbH
Tina Billo
billo pr GmbH
Social Media