Kompletter DE/KDE? Ausfall

Guten Tag,

ich habe mir vor rund 3 Wochen Manjaro auf mein HP ZBook Fury G6 installiert. Leider habe ich immer wieder das Problem, das mit komplett das KDE oder vielleicht auch etwas anderes, abschmiert.

Ich arbeite an System und auf einmal kommt keine Reaktion mehr auf Mausklicks. Maus-Over Funktionen gehen noch. Aber es reagiert nix mehr, die ganze Taskleiste und das Startmenü ist tot. ALT+TAB geht, aber die Programme reagieren alle nicht. Ich komme dann nicht mal mehr mit ALT + F2 in die Konsole. Es geht einfach nichts mehr. Das habe ich mal nach 30 Sekunden nach dem Aufstarten, mal nach 5h mit arbeiten und auch kein Muster festgestellt, woran es liegen könnte.
Ich muss dann jedes mal mit dem Power Button das System komplett abwürgen.

Ich habe auch schon diverse Logs durchgeschaut und bin auch kein Linux Neuling, komme jedoch aus der Suse und Ubuntu Welt und habe feststellen müssen, dass hier doch das ein oder andere woanders ist.
Kann mich jemand etwas durch Logs und mögliche Fehlerstellen führen, um dem ganzen auf die Schliche zu kommen?

Noch erwähnenswert vielleicht, ich habe keine NVIDIA Karte im Laptop, nur die Intel integrierte.
Vielen Dank euch !

Hallo @Garog ,
kannst du uns bitte mal die ausgabe von

inxi --admin --verbosity=7 --filter --width

posten. das ist bei uns immer die standardinfo damit man sich grob einen überblick machen kann welche hardware und "treiber"module verwendet sind.
bitte nutze die funktion des “vorformatierten textes” (die drei ```) und füge es da ein

Hallo @Garog :wink:

Zusätzlich zu dem was @Olli sagt, auch noch den journal:

Du weißt bestimmt, wann es passiert ist. Du kannst es zum Beispiel so eingrenzen:

journalctl --since "2023-04-25 20:00:00" --until "2023-04-25 22:00:00" --no-pager

Meine Vermutung ist, dass es wieder einmal die OpenGL-Effekte sind oder da du nur eine Intel-GPU hast, vermute ich stark, dass Plasma hier mit Wayland läuft. Hast du Xorg auch getestet?

Hallo zusammen,

vielen Dank für die Infos erstmal,
Output von inxi → inxi --admin --verbosity=7 --filter --widthSystem: Kernel: 6.1.25-1-MANJA - Pastebin.com
Output vom journalctl →
Teil 1: journalctl --since "2023-05-09 16:35:00" --until "2023-05-09 17:10:00" --no-page - Pastebin.com
Teil 2: Mai 09 17:00:06 garog-hpzbookfury steam[2053]: g_main_context_push_thread_defaul - Pastebin.com

Im zweiten sind auch direkt zwei Freezes des Systems drauf, ich habe den Lapi um 16:44 eingeschaltet und er hat sich Sekunden danach mit einem Freeze verabschiedet. Um 16:45 habe ich dann den Power Button gedrückt und das System neu gestartet. Mittem im schreiben dieser Antwort, hat er dann um 17:04 wieder verabschiedet und ich musste wieder abwürgen :frowning:

KDE läuft unter Xorg. Wayland habe ich noch nicht probiert.

Vielen Dank euch :slight_smile:

PS: Das mit den OpenGL Effekten hatte ich auch schon gelesen, jedoch finde ich bei Einstellungen nicht den Punkt, wo ich den Composer umstellen kann.

Wenn ich das richtig sehe, beginnt dein Logauszug nach dem Neustart. Interessanter wäre bis einschließlich des Freezes also 16:40 - 17:05

Das ist ja alles schön beschrieben, aber warum verlinkst du ein Protokoll, dass um 17:05 beginnt, wenn alles vorher passiert ist? Macht wenig Sinn für mich. :man_shrugging:

Das ging früher, aber scheint geändert worden zu sein:

steam, discord und was sucht der xfce notifier ??? ganz koscher kommt mir die installation jetzt nicht vor.

ohne jetzt tiefer in dein system eintauchen zu wollen ein kleiner tipp:
schmeiss diese installation in die tonne, installiere zuersteinmal ein grundsystem von dem du dir ein backup machst und danach kannst du die spielereien stück für stück installieren bis du merkst was von den kinkerlitzchen dein system schrottet. an plasma liegst hier offensichtlich nicht.

Ach sry, das war dem Absturz beim erstellen des Posts geschuldet, habe den Post angepasst und habe nun beide Teile hinzugefügt

Offensichtlich? Wieso ist das Offensichtlich?
Steam und Discord habe ich selbst installiert, ja, das Problem hatte ich aber auch schon bevor ich diese installiert habe. Da war es halt nur “mal ein Problem” aber das wiederholte sich nun zusehens.
Und was da der XFCE Notifier sucht, vielleicht ist es noch eine Leiche, da ich XFCE zwischendurch auch mal ausprobiert habe, dann aber wieder entfernt wurde. Allerdings habe ich XFCE auch nur ausprobiert, weil ich da schon reichlich geplagt von den Freeze Problemen gewesen bin.
Installiert war eine saubere Manjaro KDE Version, dazu ist dann recht wenig installiert worden.
Und wenn eins dieser “kinkerlitzchen” das Problem sein sollte das Manjaro KDE damit nicht läuft, dann ist Manjaro KDE das Problem, den beides habe ich ziemlich lange unter KDE Neon und Ubuntu laufen gehabt und dort nicht solche Probleme bekommen. Daher vermute ich liegt es mehr am Manjaro System, eben auch weil die Probleme schon ohne diese “kinkerlitzchen” passierten :wink:

PS: habe den restlichen XFCE Kram noch entfernt. Wird aber nix ändern an dem Problem :frowning:

Hm, nichts drin wovon ich sagen würde, dass es die Ursache sein könnte. Sorry.

wo wir bei dem Thema wären. es ist bekannt das man nicht verschiedene gui’s installieren soll weil es immer wieder zu problemen kommt und es das system schrottet. selbst wenn man dann die andere wieder deinstalliert hat man ein inkonsistentes system. deshalb mein tip mit dem glatten schnitt. jetzt im nachhinein rausfinden zu wollen welcher der installationsschritte das system “vermurkst” ist vergebene liebesmühe.
in den allermeisten fällen führt das installieren einer zweiten gui dann zu solchen problemen die man im grunde nur durch eine saubere neuinstallation lösen kann.
nichts für ungut das haben andere auch schon hinter sich.

An und für sich kann ich auch kein konkretes Problem feststellen, außer dass du es am Ende herunterfahren lässt. Ein Treiber Problem schließe ich mal aus, es scheint KDE spezifisch zu sein

Hast du mal deine Sitzung gespeichert? Ich würde dir mal empfehlen, ohne gespeicherte Sitzung zu starten und auch die Programme im Autostart erstmal zu deaktivieren.

Discord macht hier Probleme:

Mai 09 17:05:48 garog-hpzbookfury Discord[1994]: [1994:0509/170548.865040:ERROR:shared_image_factory.cc(575)] Could not find SharedImageBackingFactory with params: usage: Gles2|Raster|DisplayRead|Scanout, format: BGRA_8888, share_between_threads: 0, gmb_type: shared_memory

Scheint ein Problem mit einer verbuggten Electron-Version zu sein, die mitgeliefert wird. Der Parameter --disable-gpu-memory-buffer-video-frame sollte Abhilfe schaffen.

Vielen Dank fürs anschauen. Ich habe Manjaro neu installiert und habe direkt wieder die gleichen Probleme gehabt, schon wenige Minuten nach dem ersten Boot.
Also habe ich es mit was anderem probiert, Nobara, und hatte dort kurz nach dem installieren das gleiche. Habe also vermutet, dass es etwas mit KDE und den Treibern fürs System zu tun haben muss.
Da ist es wieder abgestürzt, gerade als ich im Terminal gewesen bin. Und als ich dort mal htop eingeben wollte, bekam ich einen Ein-/Ausgabefehler, bei allem was ich versucht habe.
Wollte dann noch mal Manjaro mit GNOME testen und dort hat er dann bei der Installation die Partitionen der M2 Festplatte nicht erkannt.
Da kam mir die Idee, das ggf. die Festplatte kaputt ist und mir kam in den Sinn, das die Freeze Probleme tatsächlich immer aufgetreten sind, wenn ich Daten bewegt habe oder Installationen liefen etc…
Neue M2 eingebaut, dort ein neues System installiert und bis jetzt sieht es gut aus. Noch kein Freeze in der Zeit.
Ich würde also davon ausgehen, dass entweder die M2 SSD kaputt ist, was komisch wäre, da sie davor immer lief, oder aber die M2 in dem HP Notebook zu Inkompatibilitäten führt (Ist von mir nachgebaut und keine "offiziell verbaute).

Wie schon gesagt, vielen Dank euch für die Analyseversuche !

Da habe ich mich wohl zu früh gefreut.
Es lief ein paar Tage wirklich gut, aber nun habe ich wieder mehrmals Ausfälle.
Ich habe aktuell Manjaro auf der einen M2 und Nobara auf der zweiten M2.
Dort habe ich dann nach einem Absturz interessante Log Einträge gefunden, die genau zum Zeitpunkt des Freezes aufgetreten sind.

Mai 15 20:24:20 nobara-pc kernel: nvme 0000:6f:00.0: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
Mai 15 20:24:20 nobara-pc kernel: nvme 0000:6f:00.0:   device [8086:f1a6] error status/mask=00000001/0000e000
Mai 15 20:24:20 nobara-pc kernel: nvme 0000:6f:00.0:    [ 0] RxErr                  (First)
tippe oder füge den Code hier ein

heute hatte ich dann im Manjaro sogar eine Fehleranzeige in dem Moment als nix mehr ging →
2023-05-17-09-48 hosted at ImgBB — ImgBB (Leerzeichen löschen)

Das ist nicht so interessant, wie du glaubst: https://www.kernel.org/doc/Documentation/PCI/pcieaer-howto.txt

Es hat tatsächlich einen Fehler erkannt, der aber korrigiert wurde (severity=Corrected). Das passiert ständig, wird auf unterstützen Mainboards in die Logs “gespamt”.

AER Module → “Advanced Error Reporting Driver” → “Erweiterter Fehlerberichtstreiber” funktioniert nur da, wo das Mainboard es unterstützt, lässt sich aber auch abschalten.

grafik

Was dieser Fehler angeht, kann es sich tatsächlich um fehlerhafte Daten handeln, da hier bei Ausführung eines Programms ein EIO Fehler entsteht.


Häufige Fehler mit NVME’s sind “Standby” oder die “Energieverwaltung” und sind abhängig von der verwendeten Marke/Model. Ich würde dich mal in die Troubleshooting Sektion weiterleiten, wo es Lösungsansätze für bestimmte Protokoll-Einträge gibt.

Ich habe eine TEAM TM8FP6512G und 0 Probleme.

$ sudo nvme list 
Node                  Generic               SN                   Model                                    Namespace  Usage                      Format           FW Rev  
--------------------- --------------------- -------------------- ---------------------------------------- ---------- -------------------------- ---------------- --------
/dev/nvme0n1          /dev/ng0n1            TPBF2211030050201960 TEAM TM8FP6512G                          0x1        512,11  GB / 512,11  GB    512   B +  0 B   SN09843 

Aus den oben genannten Logs sehe ich:

ID-1: /dev/nvme0n1 maj-min: 259:0 vendor: Samsung model: MZVL21T0HCLR-00BH7

Damit könnte ich vermuten, dass diese SSD mit APST nicht klar kommt oder umgekehrt. Dieser Kernel Parameter sollte es abschalten: nvme_core.default_ps_max_latency_us=0

das zwei nvme’s defekt sind ist eher unwahrscheinlich, aber es könnte auch der controller auf dem mainboard sein der entweder nvme’s nicht richtig ansteuert oder tatsächlich einen hardwaredefekt hat. beide möglichkeiten solltest du aber in betracht ziehen und prüfen.
a) aktuelles bios-update des herstellers aufspielen
b) im handbuch des herstellers schauen welche bios-einstellungen möglich sind. zum testen im bios auch alle einstellungen für die stromsparfunktionen erstmal deaktivieren.
c) mit “smartctl” und ähnlichen diagnosetools prüfen
S.M.A.R.T. - ArchWiki
Solid state drive/NVMe - ArchWiki
Open Source NVMe® SSD Management Utility – NVMe Command Line Interface (NVMe-CLI) – NVM Express

Vielen Dank für die ausführlichen Infos. Das mit dem PCI Bus Error habe ich mir mal weiter angeschaut. Wenn ich es richtig verstehe, haben alle Lösungen auch eine negative Kehrseite. Da dies aber scheinbar nicht die Ursache für mein Problem ist, werde ich dies also erstmal so lassen. Eine neue Baustelle wäre gerade ungünstig.

Bezüglich dem Screenshot, da habe ich mit fsck ein mehrere Stunden lang laufenden Test machen lassen. Alles tip top. Da muss also etwas Live beim Lesen/Schreiben dann schief gehen ?

Der Eintrag vom Log, mit dem Samsung Model, ist nicht die aktive Linux Festplatte sonder das Windowssystem. Die Festplatte existiert zwar, aber dort greife ich nicht drauf zu, sie ist nicht mal gemountet.
Ich nahm an, dass ich diese dann als Ursache für mein Problem ausschliessen könnte.
Das mit dem APST werde ich mir anschauen und dann probieren. Danke

Auch dir danke für die Infos.

das tatsächlich ein Hardwaredefekt vorliegt, kann ich “fast” ausschliessen. Den selben Laptop nutze ich den ganzen lieben Tag lang für die Arbeit, dort mit Windows und dort habe ich noch nie ein Problem feststellen können.
Habe aber trotzdem mal geschaut, was deine Punkte angeht.
a) ist geprüft und aktuell
b) sind deaktiviert, generell habe ich am Laptop keine Energiesparfunktionen aktiv, weder für USB Ports, noch im BIOS, nicht im Windows selbst, weder im Akku noch Netzbetrieb noch nutze ich einen Standby, Ruhezustand oder sonst etwas.
c) die SMART Daten hatte ich mir schon angeschaut, bevor ich die vierte SSD eingebaut habe, da war leider nichts auffälliges zu sehen, mit gestern waren dort nach wie vor bei beiden Festplatten (eine für Manjaro und eine für Nubara) keine Unregelmässigkeiten zu erkennen.

Ich wäre froh, wenn es etwas so einfaches wäre. Ich habe auch mal andere Logs von anderen Programmen angeschaut, aber auch dort ist nie etwas zu finden, dort sind meist nicht mal einträge drin, die auch nur in die nähe der Freezes vom System kommen. Wobei Freeze vielleicht das falsche Wort ist. den die Maus geht ja, Mouseover Funktionen reagieren auch auf den Mauszeiger, es reagiert nur einfach nicht mehr und wenn ich das Fenster wechseln will, stürzen die Programme ab, die Taskleiste ist nicht bedienbar und verschwindet wenn ich drauf klicke und wenn ich zu viel versuche, wird der Bildschirm einfach schwarz mit einem beweglichem Mauszeiger. Komme aber weder in die Konsolen noch sonst irgendwas funktioniert.

So wie es ausschaut, war es wirklich die Intel Festplatte und damit eine Inkompatibilität.
Ich habe sie rausgebaut und in ein anderes System, den Intel NUC aus dem sie gekommen ist, dort läuft sie absolut stabil. Seit dem habe ich keinen einzigen Freeze vom System mehr gehabt.

Ich danke euch fürs Feedback und die Idee.

This topic was automatically closed 2 days after the last reply. New replies are no longer allowed.