Air Selbstdiagnose

Antworten
Simon
Beiträge: 976
Registriert: Sa 19. Mär 2016, 20:03

So 24. Apr 2022, 17:58

@JBMedia

Gibt es eine Funktion oder könnt ihr eine der Selbstdiagnose programmieren, der nach und nach alle seine Erreichbarkeiten abfragt und ggf. einen Neustart automatisiert durchführt?
Leider hängt sich der Air von Zeit zu Zeit immer komplett auf, so dass eine Neustartszene z.B. nicht mehr funktioniert.

Im Grunde genommen habt ihr ja sowas schon wenn die FW / Konfig an den Air übertragen wird...... dort prüft eine Routine im Grunde genommen einige Dinge bereits ab und teilt dieses mittels grün / rot mit.... hier vor allem die Erreichbarkeit des internen Webservers.

Ich habe festgestellt, dass sich der Air sporadisch aufhängt und er weder per lokaler IP noch per DNS erreichbar ist und auch einen Neustart nach xx Stunden Zeit nicht (mehr) durchführt.
Jetzt stellt sich mir natürlich die Frage, wie der Air intern versucht Probleme anzugehen / zu lösen und ob hier eine Art Selbstdiagnose alle xx min / std. durchgeführt werden kann und im Falle eines Fehlers er sich automatisch neu startet (gerne per Haken im airstudio einzustellen).

Das Log zeigt leider hier nix brauchbares an, er zeigt dann maximal den Neustart an, wenn ich das Device selber trenne und er sich halt neu verbindet.
Meines Erachtens müsste man hier von ganz unten ansetzen (also bei internen Routinen) da eine Szenenabfrage halt im Falle eines Fehlschlagens siehe oben erwähnt leider keine Aktion mehr ausführen lässt.
Benutzeravatar
jbmedia
Administrator
Beiträge: 4446
Registriert: Mi 17. Feb 2016, 13:42

Mo 25. Apr 2022, 10:10

Die Firmware beinhaltet bereits mehrere Selbstdiagnosen. Zunächst gibt es einen Watchdog, welcher das Gerät nach 60s bei einem Absturz automatisch neustartet. Das ist Hardware-mäßig implementiert und somit "rock-solid". Weiterhin wird ein Neustart durchgeführt, wenn die Cloud für 10 Minuten nicht erreichbar ist. Der dritte Check betrifft die WLAN Verbindung. Besteht für länger als 10 Minuten keine WLAN Verbindung, wird ebenfalls ein Neustart ausgeführt. Die beiden letzten Checks werden jeweils nur wiederholt, wenn Verbindung wiederhergestellt wurde, damit keine Neustart-Loops auftreten.

Wenn wir uns richtig erinnern, war es im vorliegenden Fall so, dass die Cloud Verbindung einwandfrei funktioniert. Da in diesem Fall alle Netzwerk-Funktionen des Light-Managers aktiv sind, halten wir einen partiellen Ausfall des lokalen Zugangs nach wie vor für techn. ausgeschlossen. Wir behalten das aber im Auge, d.h. die Firmware wird auf etwaige Probleme analysiert.
Wir wünschen viel Spaß mit den Produkten und einen erfolgreichen Tag! Ihr jbmedia Team :)

Simon
Beiträge: 976
Registriert: Sa 19. Mär 2016, 20:03

Mo 25. Apr 2022, 10:37

Super. Danke.
Der Witz dabei ist eben, prüfe ich per Updatefunktion die Sachen ab, ist alles online, der air hat die blaue LED (bis auf den internen webserver, da blinkt es rot)...aber er führt keine automat. Szenen mehr aus. Offenbar hängt sich der Air komplett auf...das tritt vollkommen sporadisch auf. Mal geht er 1, 2 Tage... dann hängt er sich alle paar Stunden weg....
Die Prüffunktion müsste gegen sich selbst wohl erweitert werden....
Benutzeravatar
freebsd-man
Beiträge: 155
Registriert: Do 29. Okt 2020, 18:03

Mo 25. Apr 2022, 23:07

USB Netzteil (ggf. incl. Kabel) mal getauscht?
Simon
Beiträge: 976
Registriert: Sa 19. Mär 2016, 20:03

Mo 25. Apr 2022, 23:08

Ja, hat damit nix zu tun.... ;)
Benutzeravatar
freebsd-man
Beiträge: 155
Registriert: Do 29. Okt 2020, 18:03

Mo 25. Apr 2022, 23:12

Factory Reset gemacht?
Simon
Beiträge: 976
Registriert: Sa 19. Mär 2016, 20:03

Di 26. Apr 2022, 08:44

Ja. Das Thema ist mehr oder weniger bekannt...
Benutzeravatar
freebsd-man
Beiträge: 155
Registriert: Do 29. Okt 2020, 18:03

Di 26. Apr 2022, 10:30

Wenn der interne Webserver des LMair bei Dir nicht einwandfrei erreichbar ist, solltest Du mal prüfen, ob entweder Dein LAN ein Problem hat,
der PC, auf dem AirStudio läuft, ein Problem mit der AirStudio-Installation, dem LAN oder der Firewall (z.B. Webfilter) hat,
oder die Konfig schuld ist.
Wann lief es zuletzt, und kannst Du die letzte funktionierende Konfig stabil nutzen?
Was hast Du an Deiner IT-Umgebung geändert, nachdem zuletzt alles stabil lief? (neue Geräte, Änderungen am LAN, Port-Weiterleitungen, etc.)

(Und sag nicht wieder: "Ist bekannt, hat nix damit zu tun...", denn niemand hier weiß, welche Änderungen Du gleichzeitig und in welcher Anzahl gemacht hast, die eventuell der Auslöser sind. Das kannst nur Du nachvollziehen.)

Meiner Meinung nach sind Neustarts des gesamten LMair durch Watchdogs oder andere Mechanismen nur eine Notlösung.
Sowas hilft bei der Ursachen Beseitigung nicht und macht das System nicht stabiler.
Benutzeravatar
jbmedia
Administrator
Beiträge: 4446
Registriert: Mi 17. Feb 2016, 13:42

Di 26. Apr 2022, 12:04

freebsd-man hat geschrieben:
Di 26. Apr 2022, 10:30
Meiner Meinung nach sind Neustarts des gesamten LMair durch Watchdogs oder andere Mechanismen nur eine Notlösung.
Sowas hilft bei der Ursachen Beseitigung nicht und macht das System nicht stabiler.
Prinzipiell stimmt das, allerdings sind Watchdogs in jedem Gerät enthalten. Selbst Smartphones, IP-Kameras oder Router wie die Fritz!Box führen Neustarts durch, wenn bestimmte Zustände eintreten. Bei Samsung kam früher die freundliche Nachricht: "Das Gerät wurde zur Verbesserung der Systemleistung neugestartet". Mittlerweile kann man es kaum noch bemerken.
Wir wünschen viel Spaß mit den Produkten und einen erfolgreichen Tag! Ihr jbmedia Team :)

Benutzeravatar
freebsd-man
Beiträge: 155
Registriert: Do 29. Okt 2020, 18:03

Di 26. Apr 2022, 12:55

Um so wichtiger sollte es sein, sich nicht auf die "Notlösung" zu verlassen.
Die "bestimmten Zustände" erkennen und abfangen oder im Vorfeld zum Betrieb vermeiden, sollte wichtiger sein,
als immer mehr "Notlösungen" zu implementieren.
Ich kann aber nachvollziehen, dass Entwicklung auf einer "embedded Platform" und den schlanken System Resourcen, diverse Kompromisse erfordert.
Manchmal hilft auch ein Simulator, um komplexe Fehlerbilder zu untersuchen. Aber darum geht es hier ja nicht.
Ich würde einfach nur hoffen, dass alle Beteiligten nicht nur eine "Notlösung" zum Symptom implementieren, sondern ernsthaft nach der Ursache forschen. Jeder mit den Werkzeugen, die er hat. Der User kennt die Randbedingungen des Problems, der Entwickler kennt die Grenzwerte und Interna des Systems.
Das Problem hier und andere Probleme mit z.B. "nicht so endlosen Endlos-Schleifen" sollten man meiner Meinung nach nicht mit der "Notlösung" System-Neustart abfangen. Zumindest nicht langfristig und prinzipiell.
Und nur weil andere das Konzept "Notlösung" dauerhaft als Betriebskonzept nutzen, sollte es meiner Meinung nach nicht jeder nachmachen.
Damit verteufle ich die "Notlösungen" nicht. Ich halte sie nur langfristig nicht für zielführend.
Antworten