Ausfallsicherer Server-Heartbeat

Java-Projekt Heartbeat WiSe 2006/07

Ein typisches Problem beim Betrieb mehrerer (redundanter) Rechner ist, dass ein Administrator ohne weitere Werkzeuge i.d.R. zu spät informiert wird, wenn ein Rechner aus unbekannten Gründen keine Dienste mehr anbietet bzw. stehengeblieben oder ausgefallen ist oder ggf. automatisch ein anderer Rechner für den ausgefallenen Rechner die Aufgaben übernimmt. Ein Programm, das die Anwesenheit von Rechnern überprüft (sog. Heartbeat), kann helfen, Administratoren zeitnah über den Ausfall von Rechnern zu informieren.

Ziel dieses Projekts ist es, eine möglichst ausfallsichere Client-Server-Software zur ständigen Überwachung von Rechnern zu erstellen, d.h. ein Client soll (lokale) Messungen auf einem Rechner durchführen, ein Server soll die Aktionen seiner Clients koordinieren. Fällt der Server aus, soll nach vorgegebener Zeit ein Client die Serverrolle übernehmen und die verbliebenen Clients koordinieren. Ermittelte Mess- und Überwachungsdaten sollen so verteilt werden, dass bei Rechnerausfällen möglichst kein Verlust der Messdaten entsteht.