Apr 10, 2008
Systemprobleme zum Semesterstart
Immer mehr Studenten nutzen das Webportal der TU Dresden (http://tu-dresden.de), um ihren Semesterstart zu planen. Tatsächlich sind immer mehr Informationen zum Studium über dieses zentrale Informationssystem verfügbar und nur dort ohne Probleme erreichbar.
Zum Sommersemesterstart am Montag, 7. April 2008 verlangsamte sich das System erst merklich, bis es dem Ansturm nicht mehr gewachsen war und zusammenbrach. Eine Kettenreaktion brachte das komplexe Zusammenspiel von sich die Arbeit teilenden Servern (sog. Webserver-Cluster) aus dem Tritt.
Für die schnelle Behebung des Problems bot das Zentrum für Informationsdienste und Hochleistungsrechnen (ZIH) dem Media Design Center (MDC) seine Unterstützung bei der Identifikation des Problems an. Gemeinsam konnten die Administratoren von ZIH und MDC ein Hardwareproblem identifizieren. Es mussten einige Server "herausoperiert" werden, da diese die Arbeit aller anderen Server behinderten. Die Situation beruhigte sich danach etwas, Webseiten wurden, wenn auch langsam, ausgeliefert.
Am Dienstag, 8. April 2008 brach gegen 14.30 der Dienst erneut zusammen, da die reduzierte Anzahl an Frontend-Servern die weiter steigende Anzahl an Webseitenanfragen nicht mehr schnell genug bearbeiten konnte. Daraufhin entschied das ZIH, 20 Server aus einem der am ZIH betriebenen Server-Parks (HPC-Cluster Phobos) herauszulösen und zur Verfügung zu stellen.
Diese wurden umgehend in das interne Netzwerk des Webserver-Clusters verkabelt, um sie danach mit der Software des Content Management Systems auszurüsten. Sie konnten dem MDC am gleichen Tag gegen 16.30 zur Verfügung gestellt werden, so dass von dort die noch notwendigen Pakete für das CMS nachinstalliert werden konnten. Ab etwa 19.30 lieferte der erste neu bereitgestellte Server erfolgreich Webseiten aus. Während der Nacht wurden noch neun weitere Server in das Webcluster eingebunden, im Laufe des Mittwoch die restlichen zehn Server. Abschließende Tests im Laufe des Tages wurden zur Kontrolle und Behebung verbliebener Probleme genutzt.
Wir bitten alle Nutzer des Webangebots der TU Dresden, die entstandenen Unannehmlichkeiten zu entschuldigen.
Administrationsteam des TUD-WebClusters