Page 3 of 3

Re: Telldus live

Posted: Fri Mar 17, 2023 9:45 am
by stefan.persson
Tänkte beskriva lite vad som hände med Telldus Live!, och hur vi jobbar på att förhindra att det händer igen.

I aktuell version av vår servermjukvara har vi upptäckt en bugg som gör att tråden som rensar upp döda/försvunna anslutningar kan hamna i ett felläge. Detta i sig gör inte så mycket direkt, men det innebär att antalet tillgängliga sockets och öppna filer långsamt fylls på. Detta i kombination med ständigt ökande antal användare ledde till att en av våra servrar natten till den 25:e stötte i en övre gräns. Serverprogrammet stängde då ner och startade om. Precis som planerat började då anslutna TellStick och TelldusCenter att flytta över till andra servrar. Tyvärr var även dessa servrar nära sina tak, och den ökade belastningen som fördelades ut ledde till slut till att alla servrarna startade om, fick ta emot nästan alla anslutna klienter, slog i taket och startade om igen. Detta ledde också till att andra funktioner, som hemsida och databas, fick problem.

Detta hände vid ytterligare ett par tillfällen, men inte för alla servrarna på en gång, så effekterna har inte varit riktigt lika illa.

Dessa tak och gränser är justerade sedan en tid tillbaka, och vi startar för tillfället om servermjukvaran enligt ett rullande schema för att försäkra oss om att alla gamla anslutningar tas bort. Under tiden letar vi för fullt efter buggen (som eventuellt är flera) med hjälp av en hel rad spårningsfunktioner, och senast idag började vi rulla ut en ny uppgradering som vi hoppas ska lösa detta.

Att en enda server går ner slår olika. Med senaste firmware i TellStick Net, eller senaste versionen av TelldusCenter återansluter man till en annan server inom ett par minuter. Denna fördröjning är medveten, för att undvika en DoS när många ansluter på en gång. I de flesta fall återansluter även tidigare versioner, men ibland kan de hamna i ett tillstånd då de är omedvetna om att de har tappat kontakten utan fortsätter som om allt var bra.

En stabil Telldus Live!-tjänst har givetvis högst prioritet för oss, och vi jobbar ständigt för att förbättra denna.

Re: Telldus live

Posted: Fri Mar 17, 2023 9:45 am
by tronde
OK, dette forklarer hva som skjedde den 25., men hva med den lange nedetiden flere av oss opplevde i perioden 7. - 10. mars? ( http://www.telldus.com/forum/viewtopic.php?f=1&t=1930 ) Da var det ingen tegn til manglede server, og jeg fikk i alle fall lest inn sensordata.


Jeg har noen lamper som styres av mottaker med kodehjul. Tre av dem står i samme rom som Tellstick Net, og har samme kode. I tiden etter nyttår har jeg flere ganger opplevd at at ingen av dem slår seg av på angitt tidspunkt som er 01:06. Det er ingen logikk i at ingen av dem slår seg av, så jeg antar at det ikke har blitt sendt ut kommando. Likefullt viser Live! at de skal være avslått. Lamper som skal slås av noen minutter før 01:00, og 02:00 blir slått av som forventet. Er ca. 01:00 et "magisk" tidspunkt i deres logikk?

Re: Telldus live

Posted: Fri Mar 17, 2023 9:45 am
by nickolo
Och så klabbar inloggning till Telldus Live igen !

SUCK

Re: Telldus live

Posted: Fri Mar 17, 2023 9:45 am
by stefan.persson
Webbsidan hade nertid några minuter igår runt kvart i sju, vilket drabbade inloggningen. Live!-servrarna fortsatte dock köra som vanligt. Beklagar detta.

Re: Telldus live

Posted: Fri Mar 17, 2023 9:45 am
by tronde
Har Live vært nede i dag ca. 1940? Jeg har tre forskjellige brytere som skulle aktiveres da. Live viser at de er avslått, slik de faktisk er. Da kan det ikke ha blitt sendt ut noe.

Re: Telldus live

Posted: Fri Mar 17, 2023 9:45 am
by stefan.persson
Ingen nertid eller problem igår. Kan du/kunde du styra manuellt?

Re: Telldus live

Posted: Fri Mar 17, 2023 9:45 am
by tronde
[quote="stefan.persson"]Ingen nertid eller problem igår. Kan du/kunde du styra manuellt?[/quote

Jeg registrerte bare at de bryterne ikke var styrt, og at Live viste at de ikke var slått på. Brytere som skulle slås på ca. 2000 ble styrt korrekt, og ingenproblemer ble registrert senere. Ettersom Live viste at de ikke var slått på selv om de skulle vær det i hht. scheduler, antar jeg at noe var galt på serversiden.

Re: Telldus live

Posted: Fri Mar 17, 2023 9:45 am
by stefan.persson
Har undersökt loggarna runt denna tidpunkt, men har inte kunnat hitta något problem. Vi ska se till att logga misslyckanden bättre: http://developer.telldus.com/ticket/209

Re: Telldus live

Posted: Fri Mar 17, 2023 9:45 am
by tronde
Det er "hick-ups" på serveren.
I går, og i dag, er det en bryter som ikke har slått seg på som planlagt i scheduler. Live viser at den ikke er på. Kan styres manuelt fra live.

Tidspunkt 20 min. før solnedgang (ca. 20:03 - 20:05).

Re: Telldus live

Posted: Fri Mar 17, 2023 9:45 am
by stefan.persson
Hmm, vi får undersöka detta närmare. Schemaläggningen borde ju försöka igen om den inte lyckats första gången.

Re: Telldus live

Posted: Fri Mar 17, 2023 9:45 am
by tronde
stefan.persson wrote:Hmm, vi får undersöka detta närmare. Schemaläggningen borde ju försöka igen om den inte lyckats första gången.
Samme bryter feilet i dag også. Tid for påslag skulle vært 20:08. Live melder at den er av.

Den har alltid slått seg av som forutsatt etter at jeg har slått den på manuelt.

Re: Telldus live

Posted: Fri Mar 17, 2023 9:45 am
by stefan.persson
Och andra scheman som kör ungefär samtidigt fungerar? Kan du posta en supportticket om detta, http://telldus.com/support/index ?

Re: Telldus live

Posted: Fri Mar 17, 2023 9:45 am
by tronde
stefan.persson wrote:Och andra scheman som kör ungefär samtidigt fungerar?

Ja, disse tre dagene er det kun den ene som har sviktet ved påslag. Denne bryteren er satt opp til Number of retries: 10
Retry interval: 6, og 3 repeats.

Jeg har seks andre brytere som styres på av solnedgang. En settes på 3 min etter den problematiske, og en 5 min etter. Disse har fungert fint. De fire resterende bryterne tennes suksessivt i løpet av 50 minutter.

Den som har vært feil disse tre dagene, er den første som tennes tidsmessig etter solnedgangstid. Kan det være en sammenheng der?

stefan.persson wrote:Kan du posta en supportticket om detta, http://telldus.com/support/index ?
Utført

Re: Telldus live

Posted: Fri Mar 17, 2023 9:45 am
by stefan.persson
Vid genomgång av loggarna har vi hittat en väldig peak just runt denna tid, väldigt många schemaläggningar skulle köras samtidigt. Inte vid någon annan tidpunkt är vi i närheten av samma antal. Vi har nu lagt på mer minne på våra servrar som en kortsiktig lösning, och får se om det räcker för tillfället. Samtidigt har vi börjat koda om schemaläggaren för att den ska dra mindre resurser. Vi hoppas att detta ska lösa problemet.

Re: Telldus live

Posted: Fri Mar 17, 2023 9:45 am
by tronde
stefan.persson wrote:Vid genomgång av loggarna har vi hittat en väldig peak just runt denna tid, väldigt många schemaläggningar skulle köras samtidigt. Inte vid någon annan tidpunkt är vi i närheten av samma antal. Vi har nu lagt på mer minne på våra servrar som en kortsiktig lösning, och får se om det räcker för tillfället. Samtidigt har vi börjat koda om schemaläggaren för att den ska dra mindre resurser. Vi hoppas att detta ska lösa problemet.
I kveld har alt fungert som forventet.