Monitoring of HPC-Usage

Monitoring of HPC-Usage

Introduction

Das Ziel des HKHLR ist es, eine effektive und effiziente Nutzung der hessischen HPC-Ressourcen zu erreichen. Neben der Zusammenarbeit mit den Administratoren zur Optimierung der Systemeinstellungen und allgemeinen Fortbildung der Nutzer ist die direkte Nutzerberatung und Unterstützung ein essentieller Aspekt um dieses Ziel zu erreichen, da hier ein großes Potential besteht. Diese Beratung muss allerdings „bedarfsgesteuert und zielgerichtet“ sein, da es nicht möglich ist, jeden Nutzer individuell zu beraten; selbst die Beratung von sog. Power-Usern ist allein aufgrund der Menge nicht möglich.

Dabei ist aus Sicht des HKHLR die Beratung von Powerusern besonders effektiv, da hier viel Rechenzeit durch relativ wenige Anwendungen verbraucht wird. Ein weiteres Manko ist, dass bisher die Steuerung von Beratungsaktivitäten nur aufgrund von Erfahrungswerten der Mitarbeiter und in der Regel nur durch Eigeninitiative der Nutzer verursacht wird. Es wird somit bisher hauptsächlich dem geholfen, der am lautesten (und häufigsten) Unterstützung einfordert. Hierbei besteht die Gefahr der einseitigen Betrachtung, weil bisher nur Nutzern geholfen wird, die sich selbständig melden und nicht den schweigenden Nutzern, die zwar erfolgreich rechnen und keine offensichtlichen Fehler beobachten, aber zur Verbesserung der Effizienz Unterstützung benötigen.  Die Dunkelziffer dieser Nutzer ist bisher völlig unbekannt.

Daher wird ein kontinuierliches Monitoring eingesetzt, um einerseits die effiziente Konfiguration der HPC-Systeme zu überwachen und andererseits Anwendungen mit großem Tuningpotential zu identifizieren, sowie eine Datengrundlage zu schaffen, die eine Einschätzung von Schulungspotential (z.B. für viel verwendete Softwarepakete) und künftigem Bedarf an HPC-Ressourcen erlaubt.

Ein Beispiel der sich daraus ergebenden Daten ist in folgender Abbildung dargestellt.

Translation will follow soon.

Last Update

  • Last Update: 2018-10-31 13:26