I söndags kväll började Tarzan, en av våra Windows-servrar, att larma. Det visade sig rätt så snabbt att något var fel med den, frågan var bara vad?
Vår erfarenhet visar att den vanligaste orsaken till störningar på en server är en hemsida som ligger på servern ifråga (omedveten felaktig kodning). Loggarna indikerade likaså att det rörde sig om en minnesläcka (vilket brukar innebära en felaktig hemsida).
För att isolera och identifiera “boven i dramat” så flyttade vi runt samtliga hemsidor på servern till olika applikationspooler. Det blev helt enkelt till att spendera söndag kväll/natt framför datorskärmen. Efter ett tag hittade vi en hemsida som verkade väldigt suspekt och som därför stängdes ned.
Men störningarna fortsatte och ökade dessutom i intensitet. Vi la därför in script som temporärt löste störningarna samtidigt som vi utökade loggningen. Nu såg det inte lika muntert ut, Tarzan hade oss rejält mot repen.
Microsoft har tidigare inte erbjudit några vettiga verktyg för att felsöka sådana här problem. Vi har istället, precis som jag beskrev, behövt rodda runt en massa. Efter kontakt med deras support så visade det sig dock att saker har hänt på den här fronten.
Vi fick nämligen tillgång till ett särskilt verktyg, avsett just för detta, som vi genast satte på prov. Efter en ordentlig genomgång så lyckades vi till slut vända matchen till vår fördel.

Det visade sig att minnesläckaget mycket riktigt orsakades av en felaktigt kodad hemsida, i kombination med en väldigt ovanlig bugg i Service Pack 2 för Windows Server 2003. Med hjälp av en särskild (icke-publik) patch från Microsoft och några konfigurationsförbättringar lyckades vi eliminera problemet. Efter det har Tarzan spunnit som en liten katt.
Att enskilda hemsidor kan påverka en hel server på detta sätt är ett av de största problemen med Windows Server 2003. Det är något som Microsoft har åtgärdat med Windows Server 2008, som släpps nu i mars. Till dess att vi har fått upp vårt nya system, där Windows Server 2008 ingår, så har vi dock ett riktigt snabbt och effektivt verktyg när det gäller framtida felsökningar. Det känns verkligen helt underbart.