CPU Task Stack Overflow

Fehlermeldungen, Verständnisfragen zur ProCon.IP, Anregungen
Benutzeravatar
speedymax
Beiträge: 53
Registriert: 24. März 2015, 00:33

Re: CPU Task Stack Overflow

Beitrag von speedymax »

Hallo zusammen, es ist nun schon eine Weile her seit meiner letzten Meldung zu dem Problem.

Der Controller hängt bei mir in einem separaten Schaltschrank in der Gartenhütte und zu dieser führt eine eigene Zulaitung von der Hausverteilung.
In diesem Schaltschrank ist bis auf den Controller seit Monaten alles andere abgeschaltet.

Es hat sich nur leider nicht sonderlich viel verändert. Der Controller wirft weiterhin sporadisch Fehlermeldungen.
Ich habe alle Meldungen mal in einer Liste gesammelt.

Mi 06.10.2021 07:49 Periodische CRC Prüfung des Firmware ROM-Inhalts fehlerhaft.
Do 28.10.2021 15:42 Periodische CRC Prüfung des Firmware ROM-Inhalts fehlerhaft.
Di 09.11.2021 23:01 Task Stack Overflow.
Mi 10.11.2021 13:04 Periodische CRC Prüfung des Firmware ROM-Inhalts fehlerhaft.
So 12.12.2021 23:42 Periodische CRC Prüfung des Firmware ROM-Inhalts fehlerhaft.
Di 14.12.2021 04:38 Periodische CRC Prüfung des Firmware ROM-Inhalts fehlerhaft.
Fr 31.12.2021 03:14 Periodische CRC Prüfung des Firmware ROM-Inhalts fehlerhaft.
Sa 01.01.2022 02:17 Periodische CRC Prüfung des Firmware ROM-Inhalts fehlerhaft.
Do 06.01.2022 22:38 Periodische CRC Prüfung des Firmware ROM-Inhalts fehlerhaft.
Sa 08.01.2022 20:05 Periodische CRC Prüfung des Firmware ROM-Inhalts fehlerhaft.
Mo 24.01.2022 09:13 Task Stack Overflow

Externe Einflüsse über die Leitungen kann ich nach Stand der Dinge eigentlich ausschließen, und der Controller hat aktuell auch keine aktiven Aktionen.
Alle Aktoren sind aus, wobei die auch alle entstört sind. Das hätte man dann viel früher mitbekommen wenn dadurch eine Störung induziert würde.

Ich hatte früher immer ein Temperaturproblem in Verdacht, weil das Problem im Hochsommer gehäufter auftritt.
Mir ist inzwischen aber auch klar geworden das ich in den letzten Wintern immer die Mailbenachrichtigung deaktiviert hatte.
Deshalb habe ich auch nicht mitbekommen wenn da eine Meldung gekommen ist. Die hohen Temperaturen haben das Problem höchstens verstärkt, aber offensichtlich ist es latent immer da.
An externen Einflüssen habe ich momentan alles machbare ausgeschlossen.

Ich hatte ja schon mal gefragt wie oft diese CRC Prüfung des ROM Inhalts geprüft wird und was die noch stören kann.
Aber Ihr hattet da auch keine weitere Idee dazu. Deshalb jetzt die Frage, was kann man noch machen?

Es muss doch möglich sein das man die Kiste fehlerfrei bekommt!

Benutzeravatar
Alex
Administrator
Beiträge: 9988
Registriert: 28. Mai 2014, 23:00

Re: CPU Task Stack Overflow

Beitrag von Alex »

Dann musst Sie uns nochmal schicken, dann tauschen wir die CPU.
Oder lassen die hier erstmal ein paar Tage laufen bei verschiedenen Temperaturen und kucken uns das an (falls Du sie ein paar Tage nicht brauchst).

Benutzeravatar
speedymax
Beiträge: 53
Registriert: 24. März 2015, 00:33

Re: CPU Task Stack Overflow

Beitrag von speedymax »

Ja das können wir gern so machen, die nächsten Monate ist ja noch keine Poolsaison :lol:
Ihr könnt sie da gerne noch mal in Ruhe testen, ich habe ja auch keine richtige Idee wie man es noch weiter eingrenzen kann.
Es ist leider auch schwierig, wenn der Fehler so unbestimmt auftritt. Manchmal alle paar Tage und dann können es auch wieder mehrere Wochen sein.

Es kann natürlich auch sein das es besser wird wenn ich Controller aus dem Schrank ausbaue, oder wenn ich alle externen Kabel abmache bis auf die Stromversorgung.
Oder einen Tausch des Netzteiles selber habe ich auch noch nicht gemacht. Ich habe zwar kein 5V Hutschienennetzteil da, aber ein USB Netzteil sollte es auch tun.

Ein klares Ergebnis bekommt man dann natürlich nur wenn es ein externer Einfluss wäre.
Was ist mir aber momentan überhaupt nicht erklären kann, wie da etwas den Inhalt des CRC Roms beeinflussen sollte.

Es ist mir auch ein Rätsel wieso ich scheinbar der Einzige mit dem Problem bin.
Also was denktst Du, soll ich dahingehend noch etwas ausprobieren oder doch lieber ausbauen und Euch zusenden?

Benutzeravatar
Alex
Administrator
Beiträge: 9988
Registriert: 28. Mai 2014, 23:00

Re: CPU Task Stack Overflow

Beitrag von Alex »

>>Was ist mir aber momentan überhaupt nicht erklären kann, wie da etwas den Inhalt des CRC Roms beeinflussen sollte.
Der ROM Inhalt ist wohl immer gleich, sonst würde das Teil gar nicht laufen. Die CRC Prüfung ist sowas wie "Daten lesen, Quersumme berechnen und kucken ob das Ergebnis richtig ist"... also normale "Rechenoperationen" und dabei kann/könnte man eine CPU theoretisch immer mal mit irgendwas durcheinander bringen.

Netzteil... kannst versuchen, halte ich aber eher für unwahrscheinlich als Auslöser.
Gehen noch irgendwelche Kabel über oder unter der Platine durch?

Benutzeravatar
speedymax
Beiträge: 53
Registriert: 24. März 2015, 00:33

Re: CPU Task Stack Overflow

Beitrag von speedymax »

Ich denke eigentlich auch nicht das das Netzteil die Ursache ist.
Ich hatte mir zumindest die Mal die Restwelligkeit mit dem Oszi angeschaut um auszuschliesen das da irgendwas defekt ist. Ein Elko kann immer mal versagen, aber das sah eigentlich gut aus.
Aber aus Erfahrung weiß ich auch das manchmal seltsame Dinge passieren und gerade Signalstörungen durch Einkopplung usw. passieren auf den seltsamsten wegen.

Über oder unter der Platine laufen keine Kabel lang. Ich habe im Schaltschrank eine ordentliche Kabelführung in Kanälen realisiert.
Da alles soweit wie möglich abgeschaltet ist, sollte da auch das meiste spannungsfrei sein.
IMG_20171015_130127.jpg

Benutzeravatar
Alex
Administrator
Beiträge: 9988
Registriert: 28. Mai 2014, 23:00

Re: CPU Task Stack Overflow

Beitrag von Alex »

Ok. Dann schicke ich Dir im Laufe des Tages per Mail ein Versandlabel mit der Adresse - wenn das OK ist.

Benutzeravatar
speedymax
Beiträge: 53
Registriert: 24. März 2015, 00:33

Re: CPU Task Stack Overflow

Beitrag von speedymax »

Klasse, dann bau ich den Controller mal aus und schicke Euch den zu.
Soll ich die SD Karte drin lassen oder brauch Ihr die nicht zum testen?

Benutzeravatar
Alex
Administrator
Beiträge: 9988
Registriert: 28. Mai 2014, 23:00

Re: CPU Task Stack Overflow

Beitrag von Alex »

Lass am besten drin, der wird ja wieder neu (hardware)kalibriert - und diese Daten werden ja auf der Card gespeichert.

Benutzeravatar
speedymax
Beiträge: 53
Registriert: 24. März 2015, 00:33

Re: CPU Task Stack Overflow

Beitrag von speedymax »

Leider muss ich mich doch schon wieder mit schlechten Nachrichten zurückmelden.
Nach dem CPU Tausch war ich voller Hoffnung das wir das Problem endlich beseitigt haben.
Diese Hoffnung wurde aber schon nach kurzer Zeit zerstört und seitdem bin ich weiterhin an der Fehlereingrenzug dran.

Ich hatte den Controller nach dem Tausch natürlich gleich komplett angeschlossen. Nachdem aber dier ersten Fehler wieder aufliefen habe ich suczessive alles wieder aufgetrennt.
Inzwischen hängt der Controller nur noch am Strom und ist mit dem Netzwerk verbunden. Aber leider ist es nicht wirklich besser geworden.

Es ist auch wirklich schwierig, weil manchmal tagelang nichts kommt und man immer denkt das man es eingegrenzt hat. Dann kommt doch wieder einer der Alarme.
Netzteil habe ich natürlich auch schon mal ein anderes probiert. Langsam bin ich wirklich am verzweifeln. Die CPU können wir ja nun auch ausschließen da diese durch Euch getauscht wurde.

Wenn aber wie aktuell nur noch die Stromversorgung und das Ethernetkabel dran hängen, dann sehe ich aktuell nur 2 Möglichkeiten die bleiben.

Entweder es hat sich auf der Controllerplatine irgendwas verändert was irgendwie diesen Effekt verursacht, oder der Fehler wird durch irgendwas externes induziert.
Ich hatte ja immer schon mal eine Einkopplung von HF im verdacht oder so etwas. Aber lokal habe ich da nichts was läuft und in der Nähe des Controllers ist eh alles abgeschaltet.

Ich weiß es einfach nicht, aber es muss doch Möglich sein die Ursache irgendwei einzugrenzen. Habt Ihr noch Ideen?

Grüße Dirk

Benutzeravatar
Alex
Administrator
Beiträge: 9988
Registriert: 28. Mai 2014, 23:00

Re: CPU Task Stack Overflow

Beitrag von Alex »

is das ein Netzwerkkabel mit Schirm am Stecker? (Metall) und steckt das in irgendeinem Switch der auch Metall-Buchsen hat?
Könntest an einem Ende mal noch den Schirm vom Stecker "entfernen" (mit ner Zange wegmachen). Sonst hab ich auch keine Idee mehr

Benutzeravatar
speedymax
Beiträge: 53
Registriert: 24. März 2015, 00:33

Re: CPU Task Stack Overflow

Beitrag von speedymax »

Das habe ich nun auch noch ausgeschlossen, auch wenn es unwahrscheinlich war das der Fehler hierdurch provoziert wird.
1 Tag nachdem ich den Schirm aufgetrennt habe kam der nächste Fehler und wie immer wenn die Temperaturen steigen kommt der Fehler wieder häufiger.
Ich habe den Controller nur an der Stromversorgung und am Netzwerk angeschlossen und trotzdem zickt der so rum.

Es ist wirklich zum verzweifeln damit. Mein nächster Schritt wäre jetzt gewesen den Controller auszubauen und in einer geschirmten Metallkiste isoliert im Keller zu testen.
Einfach um auszuschliessen das es durch eine Einkopplung von HF verursacht wird.
Das hattest Du glaube ich schon mal ausgeschlossen, aber ich habe diesbezüglich schon das ein oder andere Phänomen erlebt auf Arbeit.
Wenn die Bedingungen passen kann es da schon zu Störungen kommen. Das die sich aber so auswirken habe ich bisher auch noch nicht erlebt, aber es gibt ja auch keinen Vergleich.

Aber nun wird es warm und das ist eigentlich der perfekte Zeitpunkt um den Pool wieder in Betrieb zu nehmen, so das ich da nicht noch länger mit dem Controller Testreihen machen kann.
Eigentlich hatte ich gedacht das ich das Problem in diesem Winter nun irgendwie abstellen kann, aber jetzt stehe ich wieder am Anfang.