Installer kann Dateisystem nicht erstellen

Hallo Manjaro-Fans,

nach dem ich Manjaro seit fast über zwei Jahren genutzt habe, hat es mir gestern das System zerschossen.

Vorgeschichte: Ich habe oft die Hibernation-Funktion genutzt, und alles auf die SSD geschrieben, wenn ich den Laptop ausschalten will. Gestern beim erneuten hochfahren erhielt ich die Fehlermeldung, dass das Dateisystem nicht gelesen werden konnte, da einige superblocks beschädigt seien und ich landete in der GRUB-Shell. Beim erneuten hochfahren blieb das System im Bootscreen mit dem Manjaro-Logo hängen.

Nun einigen Versuchen dies zu fixen, habe ich mich dazu entschlossen, dass System neu aufzusetzen. Bei der Installation kommt dabei immer die folgende Fehlermeldung:

Ich habe sowohl die aktuellen Images für KDE und XFCE ausprobiert, Etcher und Rufus als Programme zum Brennen der Isos verwendet und die Partionierung manuell als auch automatisch machen lassen. Keine der Variationen war erfolgversprechend.

Hoffentlich hat einer von euch eventuell einen Lösungsansatz :slight_smile:

Neue SSD kaufen.

Das hört sich alles nach einer defekten Festplatte an. Du könntest die SMART Werte auslesen und auch die interne Test Funktion mit den smartmontools anstoßen.

1 Like

Hallo Xabbu,

erst einmal danke für deine Antwort.

Bevor ich mich für eine Neuinstallation des Systems entschied, habe ich übrigens diesen Ansatz ausprobiert, von dem ich in verschiedenen Quellen abgewandelt gelesen habe.

Mit Hibernation schreibe ich den Inhalt des Arbeitsspeichers min. einmal pro Tag (abends) auf die SSD. Zusätzlich habe ich noch eine kleine SWAP-Partition gehabt. Aber die Anzahl der Lese-/Schreibzyklen sollte aber wohl keinen großen Einfluss auf die Lebensdauer des Datenträgers haben.

Ich habe bereits Gnome Disks und die Diagnose Tools aus dem Bios drüberlaufen lassen und in beiden Fällen keine Warnung o.Ä. bekommen. Dann bleibst aber die Frage über dessen Aussagekraft.

Ergebnisse vom Selbsttest der Festplatte durch Gnome-Disks:

Ergbenisse von smartctl aus dem smartmontools Packet:

SMART aktiviert?  smartctl -i /dev/sda => ja

Gesundheitszustand mit smartctl -H /dev/sda =>  SMART overall-health self-assessment test result: PASSED

Ein Test sudo smartctl -a -t short /dev/sda ergab:
 
SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct   0x0003   100   100   000    Pre-fail  Always       -       0
  9 Power_On_Hours          0x0002   100   100   000    Old_age   Always       -       428
 12 Power_Cycle_Count       0x0003   100   100   000    Pre-fail  Always       -       4462
175 Program_Fail_Count_Chip 0x0003   100   100   000    Pre-fail  Always       -       0
176 Erase_Fail_Count_Chip   0x0003   100   100   000    Pre-fail  Always       -       0
177 Wear_Leveling_Count     0x0003   100   100   000    Pre-fail  Always       -       59
178 Used_Rsvd_Blk_Cnt_Chip  0x0003   100   100   000    Pre-fail  Always       -       0
179 Used_Rsvd_Blk_Cnt_Tot   0x0003   100   100   000    Pre-fail  Always       -       0
180 Unused_Rsvd_Blk_Cnt_Tot 0x0003   100   100   000    Pre-fail  Always       -       143
181 Program_Fail_Cnt_Total  0x0003   100   100   000    Pre-fail  Always       -       0
182 Erase_Fail_Count_Total  0x0003   100   100   000    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0003   100   100   000    Pre-fail  Always       -       0
195 Hardware_ECC_Recovered  0x0003   100   100   000    Pre-fail  Always       -       0
241 Total_LBAs_Written      0x0003   100   100   000    Pre-fail  Always       -       337050
242 Total_LBAs_Read         0x0003   100   100   000    Pre-fail  Always       -       166253

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%       172         -
# 2  Short offline       Completed without error       00%       172         -
# 3  Short offline       Completed without error       00%       172         -
# 4  Short offline       Completed without error       00%       172         -
# 5  Extended offline    Completed without error       00%       172         -
# 6  Short offline       Completed without error       00%       172         -
# 7  Short offline       Completed without error       00%       172         -
# 8  Short offline       Completed without error       00%       172         -
# 9  Short offline       Completed without error       00%       172         -
#10  Short offline       Completed without error       00%       131         -
#11  Extended offline    Completed without error       00%        80         -
#12  Short offline       Completed without error       00%        80         -
#13  Short offline       Completed without error       00%         0         -

Die ganzen PRE_FAILS im letzten Test mit smartctl sehen jedoch weniger gut aus, wenn man der Beschreibung des dazugehörigen Wiki-Eintrags durchliest.

Nach den SMART Werten ist die SSD top fit.

Der Type ( Pre-fail ) bedeutet, dass die Festplatte wahrscheinlich kaputt geht wenn der VALUE Wert nahe an den THRESH Wert herankommt.

Der Nachteil ist nun natürlich, dass nicht klar ist warum die SSD nicht mehr so funktioniert wie sie sollte.

Du könntest im Live System mit gparted eine neue Partitionstabelle anlegen und mehrere kleine ext4 Partitionen anlegen. Wenn es wieder einen Error gibt, schau auch ins journal. Es sollte eigentlich Kernel Mitteilungen geben wenn so etwas Grundlegendes schiefgeht.

Dein Versuch das ext4 Dateisystem zu retten war richtig. Der Ansatz aus dem Blog Post kann funktionieren. Allerdings ist ext4, meiner Erfahrung nach, recht widerspenstig wenn es darum geht gerettet zu werden.

Ich denke auch das Hibernation keinen so großen Einfluss auch die Haltbarkeit von SSDs hat. Natürlich sind das zusätzliche Schreiboperationen aber trotzdem sollte die TBW Grenze immer noch einen recht großen Zeitraum abdecken.

Ich habe mit Hilfe von GParted eine neue GPT-Partitionstabelle erstellt. Für die ersten Partionen lief das auch super, aber dann ist mkfs.ext4 wieder gescheitet. Den Fehlerbericht habe ich in einer Datei abgespeichert:

Siehe https://filebin.net/g5vxfvxmqant57ry

Nach dem Log sieht es so aus als ob im Bereich von /dev/sda6 keine Daten von der SSD gelesen/geschrieben werden können.

Wenn du noch in der Garantie Zeit bist würde ich mit dem Hersteller/Verkäufer Kontakt aufnehmen.

Wenn du alle kaputten Bereiche findest, kann man auch Partitionen drumherum anlegen und den defekten Bereicht ignorieren. Optional ist das natürlich nicht. Etwas besser ist, mit badblocks nach defekten Blöcken suchen. Dazu einfach den mkfs.ext4 Befehl mit -cc starten. Nur das musst du vorher per Hand machen. In Calamares dann ohne zu formatieren installieren.

Hatte bei meiner SSD letzte Woche auch I/O Fehler. Vermutlich ist deine SSD auch hardwareseitig defekt.

Da half nur Daten sichern und neue kaufen :frowning:

Ich habe gestern mit badblocks noch ein paar Tests durchlaufen lassen, was aber auch seine Zeit brauchte. Ob ein Hardwaredefekt vorliegt, kann ich aktuell nicht aussschließen. Die Garantie ist für die Festplatte leider schon ausgelafuen, sodass eine Kontaktaufnahme mit dem Hersteller nicht viel brigen wird. Aus pragmatischen Gründen habe ich jedoch eine neue SSD bestellt, da ich mit dem Laptop wieder arbeiten will.

Die "problematische" SSD werde ich mir die Tage nochmal genauer anschauen und wenn möglich als Zweitspeicher in einen anderen Rechner einbauen.

Danke trotzdem für die Hilfestellungen. Man hat wieder was dazugelernt. Zukünftig werde ich öfter mal die SMART-Werte der neuen SSD anschauen.

Frage: aufgrund guter Forum-Etiquette sollten die Rückmeldung mit einer Lösung des Problems makiert werden. Welchen Beitrag sollte ich hier am Besten makieren?

Hi! :smile:

@xabbu Eine qualitativ gute SSD sollte das eigentlich selber machen. Eine qualitativ gute SSD hat auch noch ein paar Speicherzellen in der Hinterhand, um ausgefallene Zellen zu ersetzen. Mir fällt jetzt allerdings der Fachbegriff dafür nicht ein. Und wenn dieser Speicher verbraucht ist, spätestens dann wird auch etwas im Smart erscheinen. Wahrscheinlich würde die dann sogar bereits Neuinstallationen sperren bzw. würde man entsprechendes im Smart finden.

Da gebe ich dir echt, aber aus welchen Gründen auch immer verhält sich der Controller in der SSD nicht so.
Eine Neuinstallation ist bereits gesperrt wenn man kein Dateisystem mehr anlegen kann. Aber in den SMART Werten sieht man trotzdem nichts.

Mein Tipp mit badblocks war aber eigentlich auch Schwachsinn. Es könnte zwar beim Anlegen des Dateisystems helfen, aber durch die ganzen Optimierungen des Controllers in der SSD gibt es keinen Zusammenhang von Blöcken im Dateisystem und den genutzten Speicherzellen in einer SSD. Bei einer HDD gibt es einen Zusammenhang von der Block Nummer im Dateisystem und dem Ort auf der sich drehenden Scheibe. Bei SSDs ist das nicht mehr der Fall. Und dann hilft badblocks auch nur noch temporär.

Wenn überhaupt. Es gibt bei ext4 diesen Befehl "fschk" ,habs hoffentlich richtig geschrieben, der kann manchmal noch helfen
Aber wenn die Daten murks sind, dann bekommt man auch nur noch Murks.

Und eine gute SSD weist den User per Smart ganz nett und freundlich darauf hin, dass man eine Datensicherung durchführen soll, weil sich die Disk in ein ein paar Lese/Schreibzugriffen selber zerstört. Das ist wie in dieser alten Serie aus den 70igern "Kobra übernehmen sie". "Wenn sie diese Nachricht gelesen haben, dann zerstört diese sich innerhalb der nächsten Minuten.". :smile:

Nachtrag: Der Befehl lautet "fsck". Speziell bei ext4 "fsck.ext4". Damit kann man Fehler im Dateisystem reparieren. Aber hilft nicht unbedingt. Bekommt man so ein System zum Laufen, dann sollte man schnellstens eine Datensicherung versuchen und bei mir war es dann meistens der Anfang vom Versagen der Disk. Aber es muss nicht immer sein! Wenn das Programm anfängt "Blöcke" und Inodes in Massen neu zu setzen, dann ist es aber wahrscheinlich. Ein Anwendungsfall wäre z.B. wenn der Kernel das "Initimage" lädt, aber dieses nicht funktioniert wegen Datenfehler. Dann könnte sich noch eine "ash" öffnen und in der könnte man das Programm mal starten. Das Programm gibt es auch für "Btrfs", aber da sollte man eigentlich die eigenen Tools von "Btrfs " verwenden. Das musste ich noch loswerden. :sweat_smile: Nobody is perfect!

Die neue SSD ist nun im Laptop verbaut und Manjaro wurde erfolgreich installiert. Die alte SSD werde ich mir aus Zeitgründen erst später näher ansehen. Nochmals Danke an alle für Ihre Antworten.