Ein typisches Problem beim Betrieb mehrerer (redundanter) Rechner ist, dass ein Administrator ohne weitere Werkzeuge i.d.R. zu spät informiert wird, wenn ein Rechner aus unbekannten Gründen keine Dienste mehr anbietet bzw. stehengeblieben oder ausgefallen ist oder ggf. automatisch ein anderer Rechner für den ausgefallenen Rechner die Aufgaben übernimmt. Ein Programm, das die Anwesenheit von Rechnern überprüft (sog. Heartbeat), kann helfen, Administratoren zeitnah über den Ausfall von Rechnern zu informieren.
Ziel dieses Projekts ist es, eine möglichst ausfallsichere Client-Server-Software zur ständigen Überwachung von Rechnern zu erstellen, d.h. ein Client soll (lokale) Messungen auf einem Rechner durchführen, ein Server soll die Aktionen seiner Clients koordinieren. Fällt der Server aus, soll nach vorgegebener Zeit ein Client die Serverrolle übernehmen und die verbliebenen Clients koordinieren. Ermittelte Mess- und Überwachungsdaten sollen so verteilt werden, dass bei Rechnerausfällen möglichst kein Verlust der Messdaten entsteht.
Prof. Dr. Klaus Schmid
Institut für Informatik
AG Software Systems Engineering
Universitätsplatz 1
31141 Hildesheim
Besucheradresse:
Institut für Informatik
Samelsonplatz 1
31141 Hildesheim
Sekretariat: Raum C212 Spl
Telefon +49 5121 883-40330
Besucheradresse:
Stiftung Universität Hildesheim
Institut für Informatik
Samelsonplatz 1
31141 Hildesheim