Re: Telldus live
Posted: Fri Mar 17, 2023 9:45 am
Tänkte beskriva lite vad som hände med Telldus Live!, och hur vi jobbar på att förhindra att det händer igen.
I aktuell version av vår servermjukvara har vi upptäckt en bugg som gör att tråden som rensar upp döda/försvunna anslutningar kan hamna i ett felläge. Detta i sig gör inte så mycket direkt, men det innebär att antalet tillgängliga sockets och öppna filer långsamt fylls på. Detta i kombination med ständigt ökande antal användare ledde till att en av våra servrar natten till den 25:e stötte i en övre gräns. Serverprogrammet stängde då ner och startade om. Precis som planerat började då anslutna TellStick och TelldusCenter att flytta över till andra servrar. Tyvärr var även dessa servrar nära sina tak, och den ökade belastningen som fördelades ut ledde till slut till att alla servrarna startade om, fick ta emot nästan alla anslutna klienter, slog i taket och startade om igen. Detta ledde också till att andra funktioner, som hemsida och databas, fick problem.
Detta hände vid ytterligare ett par tillfällen, men inte för alla servrarna på en gång, så effekterna har inte varit riktigt lika illa.
Dessa tak och gränser är justerade sedan en tid tillbaka, och vi startar för tillfället om servermjukvaran enligt ett rullande schema för att försäkra oss om att alla gamla anslutningar tas bort. Under tiden letar vi för fullt efter buggen (som eventuellt är flera) med hjälp av en hel rad spårningsfunktioner, och senast idag började vi rulla ut en ny uppgradering som vi hoppas ska lösa detta.
Att en enda server går ner slår olika. Med senaste firmware i TellStick Net, eller senaste versionen av TelldusCenter återansluter man till en annan server inom ett par minuter. Denna fördröjning är medveten, för att undvika en DoS när många ansluter på en gång. I de flesta fall återansluter även tidigare versioner, men ibland kan de hamna i ett tillstånd då de är omedvetna om att de har tappat kontakten utan fortsätter som om allt var bra.
En stabil Telldus Live!-tjänst har givetvis högst prioritet för oss, och vi jobbar ständigt för att förbättra denna.
I aktuell version av vår servermjukvara har vi upptäckt en bugg som gör att tråden som rensar upp döda/försvunna anslutningar kan hamna i ett felläge. Detta i sig gör inte så mycket direkt, men det innebär att antalet tillgängliga sockets och öppna filer långsamt fylls på. Detta i kombination med ständigt ökande antal användare ledde till att en av våra servrar natten till den 25:e stötte i en övre gräns. Serverprogrammet stängde då ner och startade om. Precis som planerat började då anslutna TellStick och TelldusCenter att flytta över till andra servrar. Tyvärr var även dessa servrar nära sina tak, och den ökade belastningen som fördelades ut ledde till slut till att alla servrarna startade om, fick ta emot nästan alla anslutna klienter, slog i taket och startade om igen. Detta ledde också till att andra funktioner, som hemsida och databas, fick problem.
Detta hände vid ytterligare ett par tillfällen, men inte för alla servrarna på en gång, så effekterna har inte varit riktigt lika illa.
Dessa tak och gränser är justerade sedan en tid tillbaka, och vi startar för tillfället om servermjukvaran enligt ett rullande schema för att försäkra oss om att alla gamla anslutningar tas bort. Under tiden letar vi för fullt efter buggen (som eventuellt är flera) med hjälp av en hel rad spårningsfunktioner, och senast idag började vi rulla ut en ny uppgradering som vi hoppas ska lösa detta.
Att en enda server går ner slår olika. Med senaste firmware i TellStick Net, eller senaste versionen av TelldusCenter återansluter man till en annan server inom ett par minuter. Denna fördröjning är medveten, för att undvika en DoS när många ansluter på en gång. I de flesta fall återansluter även tidigare versioner, men ibland kan de hamna i ett tillstånd då de är omedvetna om att de har tappat kontakten utan fortsätter som om allt var bra.
En stabil Telldus Live!-tjänst har givetvis högst prioritet för oss, och vi jobbar ständigt för att förbättra denna.