Watchdog deaktivieren, stoppen - Was ist Watchdog?

Was ist Watchdog
Watchdog ist eine Funktion in Computersystemen, die dazu dient, die Stabilität und Funktionsfähigkeit des Systems zu überwachen. In Arch Linux Systemen wie Manjaro gibt es verschiedene Arten von Watchdogs, darunter Hardware-Watchdogs und Software-Watchdogs wie den NMI (Non-Maskable Interrupt) Watchdog.
Laut der Arch Wiki ist diese Funktion für normale Benutzer (z.B. auf Desktop-PCs und Laptops) nicht notwendig und kann deaktiviert werden.

Funktion des Watchdogs

  • Der Watchdog ist ein Sicherheitsmechanismus, der dazu dient, das System bei Abstürzen oder Hängern automatisch neu zu starten.

Potenzielle Probleme:

a) Systemstabilität: In den meisten Fällen wird die Deaktivierung des Watchdogs keine unmittelbaren negativen Auswirkungen haben. Für normale Desktop-Nutzung ist der Watchdog oft nicht notwendig.

b) Fehlende automatische Wiederherstellung: Der Hauptnachteil ist, dass das System bei einem schwerwiegenden Absturz oder Hänger nicht mehr automatisch neu startet. Man müsste in solchen Fällen manuell einen Neustart durchführen.

c) Spezifische Anwendungen: Einige spezielle Anwendungen oder Server-Setups könnten auf den Watchdog angewiesen sein. In solchen Fällen könnte die Deaktivierung zu Problemen führen.

  • Empfehlung: Für die meisten Heimanwender und normale Desktop-Nutzung ist die Deaktivierung des Watchdogs in der Regel unproblematisch und kann sogar vorteilhaft sein, da sie lästige Neustarts bei bestimmten Systemzuständen verhindert.
  • Rückgängig machen: Sollte nach der Deaktivierung unerwartete Probleme feststellt werden, so kann man die Änderung einfach rückgängig machen, indem z.B. den nowatchdog Parameter wieder aus den Boot-Optionen entfernt.

Allgemeine Deaktivierung
Um den Watchdog in Arch Linux zu deaktivieren, gibt es mehrere Möglichkeiten:

  1. Kernel-Parameter: Parameter nowatchdog zu den Kernel-Bootoptionen hinzufügen. Dies kann in der Datei
    /etc/default/grub erfolgen.
  2. sysctl-Optionen: Eine weitere Möglichkeit besteht darin, sysctl-Optionen zu verwenden, um
    den Watchdog zu deaktivieren.
  3. Blacklisting: Für spezifische Hardware-Watchdogs, wie den AMD-Chipsatz-Watchdog
    (sp5100-tco), können das entsprechende Kernelmodul auf die Blacklist gesetzt werden.
  4. NMI Watchdog: Um den NMI Watchdog speziell zu deaktivieren, kann man
    nmi_watchdog=0 zu den Kernel-Parametern hinzufügen. Allerdings wurde berichtet, dass
    sich dieser manchmal während des Bootens wieder aktiviert.
  5. Systemd-Konfiguration: In der systemd-Konfiguration gibt es auch eine Option, um die
    Watchdog-Logik zu deaktivieren.
    Wenn es Probleme beim Deaktivieren des Watchdogs gibt, kann man die Systemprotokolle
    überprüfen, indem man nach “watchdog” in den Journaleinträgen sucht
    journalctl | grep watchdog

Meine Fragen

  1. Welche Möglichkeiten zur Deaktivierung sind bei Manjaro Linux überhaujpt sinnvoll bzw. greifen dort überhaupt? Ich selbst habe einen Lenovo Notebook mit Manjaro KDE Plasma.
  2. Gibt es noch anderen “Überwachungssysteme”, die man ggf. abschalten kann oder sollte?

Long story short - desktop do not need an active watchdog.

Translation

Lange Rede, kurzer Sinn - der Desktop braucht keinen aktiven Watchdog.

Improving performance - ArchWiki

Im wiki findet man eigentlich sehr hübsch erklärt, was der watchdog eigentlich an Funktionen hat:

Ich bin den lästigen Hund losgeworden mittels:

  1. Anderung von /etc/default/grub
    Ergänzen von nmi_watchdog=0 nowatchdog am Ende der Zeile, die beginnt mit
    GRUB_CMDLINE_LINUX_DEFAULT="
    innerhalb der Anführungszeichen.
  2. Anlegen einer Datei zum Besipiel mit dem Namen watchdog.conf
    im Verzeichnis /etc/modprobe.d/
    mit dem Inhalt
# Blacklist unwanted drivers
blacklist iTCO_wdt
blacklist iTCO_vendor_support

Anschließend folgende Befehle ausführen:

sudo update-grub
sudo mkinitcpio -P

und rebooten.

Siehe auch hier:
https://wiki.archlinux.org/title/Power_management#Disabling_NMI_watchdog

Es hängt ein wenig vom Prozessor ab, wenn es nicht direkt klappt, in den verlinkten Referenzen genauer nachschauen, ob da was zu Deiner Hardware steht.

Ich habe das gerade vorgestern gemacht. Vorher habe ich brutal getestet ob es Unterschied macht (ich habe sysreq crashed den Kernel) und festgestellt es macht nix).
Intel System, ohne extra Video. Habe einfach

nowatchdog modprobe.blacklist=iTCO_wdt

Zu meine Kernelparameters zugefügt. Danach mit journalctl und wdctl kontrollert.

Du kannst wie hier gezeigt auch für andere suchen

Habe mal alles umgesetzt, was Du geschrieben hast und den Befehl ausgeführt:

journalctl | grep watchdog

Das Ergebnis

Okt 12 09:01:10 user-lenovo sudo[19871]:  user : TTY=pts/2 ; PWD=/home/user ; USER=root ; COMMAND=/usr/bin/touch /etc/modprobe.d/watchdog_disable.conf
Okt 12 09:01:42 user-lenovo sudo[19965]:  user : TTY=pts/2 ; PWD=/home/user ; USER=root ; COMMAND=/usr/bin/micro /etc/modprobe.d/watchdog_disable.conf
Okt 12 09:05:10 user-lenovo kernel: Command line: BOOT_IMAGE=/@/boot/vmlinuz-6.10-x86_64 root=UUID=... rw rootflags=subvol=@ quiet cryptdevice=UUID=...:luks-... root=/dev/mapper/luks-.... splash udev.log_priority=3 nmi_watchdog=0 nowatchdog
Okt 12 09:05:10 user-lenovo kernel: Kernel command line: BOOT_IMAGE=/@/boot/vmlinuz-6.10-x86_64 root=UUID=... rw rootflags=subvol=@ quiet cryptdevice=UUID=.....:luks-..... root=/dev/mapper/luks-..... splash udev.log_priority=3 nmi_watchdog=0 nowatchdog
Okt 12 09:05:12 user-lenovo boltd[1155]: watchdog: enabled [pulse: 90s]

Es scheint immer noch aktiv zu sein.

Was steht denn in der Datei drin?

cat /etc/modprobe.d/watchdog_disable.conf

ps:
das, was @xabbu gerade sagte

Ist wohl nicht zielführend, sich um den Inhalt von:
/etc/modprobe.d/watchdog_disable.conf
zu kümmern.

Das ist nicht der Kernel Watchdog den du mit Kernel Parametern ausschalten kannst. Der Begriff “Watchdog” ist sehr allgemein, viele Programme verwenden Wachhunde um auf Ereignisse zu reagieren.

Der im Log genannte “Watchdog” wird vom “Thunderbolt 3 device manager” verwendend. Wenn du das Programm nicht braust einfach entfernen.

Genau das, was Wollie geschrieben hat:

# Blacklist unwanted drivers
blacklist iTCO_wdt
blacklist iTCO_vendor_support

Ich habe jetzt den Befehl zur Überprüfung der Aktivität des Kernel Watchdog verwendet:

cat /proc/sys/kernel/nmi_watchdog

Die Ausgabe ist “0”, was bedeutet, dass der KernelNMI Watchdog deaktiviert ist. “1” wäre aktiviert.
Insofern müsste jetzt alles ok sein! Danke.

Sollte man diesen Befehl noch in die

/etc/modprobe.d/watchdog_disable.conf

einfügen oder wie immer man die Datei bezeichnen mag? Der Befehl wird in den verlinkten Artikeln auch noch empfohlen.

cat /proc/cmdline

Da man den Kernel Watchdog bei PCs und Notebooks nicht braucht, wäre es womöglich zu überlegen, ob man diesen nicht von vornherein in dem Manjaro Image zum Download deaktiviert.

Abhängig von Deiner CPU können da noch andere Module beteiligt sein.
Hier ist ein Forumbeitrag dazu:

[HowTo] Disable watchdogs (and silence "watchdog did not stop!")

… nur zur Info …



nein - dort gehören nur Modulnamen hinein, Module, die Du vermeiden willst zu laden

cat /proc/cmdline
zeigt Dir lediglich, mit welchen Parametern Du den Kernel gebootet hast.

z.B. mein momentanes System:
cat /proc/cmdline
BOOT_IMAGE=/boot/vmlinuz-5.15.0-122-generic root=UUID=e3d59116-1204-4700-b8c4-4f496790d85c ro quiet splash mitigations=off nowatchdog audit=0 resume=UUID=e3d59116-1204-4700-b8c4-4f496790d85c resume_offset=4171776

Danke an all die hilfreichen Beiträge.

Gibt es noch “Watchdogs”, die man deaktivieren sollte?
Wenn ja, wie findet man sie heraus und wie schaltet man sie ab?

This link has already been posted 3 times. But here it is again.


Dieser Link wurde bereits 3 Mal gepostet. Aber hier ist er noch einmal.


mod. edit: german transl. added

This topic was automatically closed 3 days after the last reply. New replies are no longer allowed.