BTRFS check zeigt Fehler bei fs roots

Um es kurz zu fassen erzähle ich jetzt nur die nötigsten Infos.
Aktuell bindet es beim Startprozess das /home Verzeichniss nicht ein. Na4972ch langem recherchieren fand ich jetzt den Befehl
btrfs check
dieser zeigt mir bei checking fs roots
root 257 inode 8724972 errors 1040, bad file extent, some csum missing
leider brachte repair keinen Erfolg.
Kann mir jemand weiter helfen was ich noch machen kann?

btrfs check --repair

erfordert dass die Partition nicht gemountet ist, war das der Fall?

Bitte beachten Sie die folgende Seite → Btrfs Maintenance - Manjaro

Im Grunde bedeutet es, dass BTRFS nicht sicherstellen kann, dass die geschriebenen Dateien nicht beschädigt sind, da keine Prüfsumme vorhanden ist, deswegen wird angenommen, dass diese beschädigt sind. Wird wohl ein Stromausfall oder ähnliches gewesen sein?

Ich würde erstmal herausfinden wollen, um welche Datei es sich handelt:

  1. Nur lesbar einhängen:
sudo mount --mkdir -o ro /dev/sdXY /tmp/sdXY
  1. Datei herausfinden:
sudo btrfs inspect-internal inode-resolve 8724972 /tmp/sdXY

Wenn das jetzt eine eher unwichtige Datei ist, dann einfach löschen.

sudo umount /tmp/sdXY
sudo mount -o rescue=ignoredatacsums /dev/sdXY /tmp/sdXY

In den Datei-Manager gehen und die fehlerhafte/unvollständige Datei löschen.

Und wieder sudo umount /tmp/sdXY

Ansonsten, versuche es mit:

sudo btrfs check --repair /dev/sdXY

wie @Wollie vorgeschlagen, natürlich nicht eingehängt.

check --repair funktioniert leider nicht mehr
und wenn ich deinen 2ten Befehl ausführe bekomme ich einen Fehler:
ERROR: ino paths ioctl: No such file or directory

Leider startet seit gestern mein PC nicht mehr weil er aufgrund dieses fehlers das home verzeichniss nicht mounted

Natürlich ersetzt man sdXY mit dem richtigen Blockgerät, nicht? :wink:

Siehe: lsblk --fs

Was in meinem Fall sda2 ist

wurde es denn eingehängt?

mount -t btrfs

Ansonsten versuch mit rescue einzuhängen:

sudo mount -m -o rescue=all /dev/sdXY /tmp/sdXY

Dann weiter mit Punkt 2:

Wurde eingehängt
/dev/sda2 on /tmp/sda2 …
aber leider findet er es nicht
Schön langsam setze ich es neu auf

Wie bitte? Gut. Zumindest kannst du deine Daten jetzt sichern, wenn du neu aufsetzten willst.

Folgendes bekomme ich von dmesg

[  114.318276] BTRFS info (device sda2): using crc32c (crc32c-intel) checksum algorithm
[  114.318283] BTRFS info (device sda2): disk space caching is enabled
[  114.321762] BTRFS info (device sda2): bdev /dev/sda2 errs: wr 0, rd 0, flush 0, corrupt 3, gen 0
[  114.356315] BTRFS info (device sda2): enabling ssd optimizations
[  114.356317] BTRFS info (device sda2): auto enabling async discard
[  114.357806] BTRFS info (device sda2): checking UUID tree
[  115.115344] BTRFS error (device sda2): tree first key mismatch detected, bytenr=2210365440 parent_transid=224569 key expected=(13820547072,168,6144) has=(13820547072,168,4096)
[  115.115355] BTRFS: error (device sda2: state A) in __btrfs_free_extent:3109: errno=-5 IO failure
[  115.115358] BTRFS info (device sda2: state EA): forced readonly
[  115.115360] BTRFS error (device sda2: state EA): failed to run delayed ref for logical 13823881216 num_bytes 45056 type 184 action 2 ref_mod 1: -5
[  115.115362] BTRFS: error (device sda2: state EA) in btrfs_run_delayed_refs:2177: errno=-5 IO failure
[  351.889942] BTRFS error (device sda2: state EMA): Remounting read-write after error is not allowed

Hat evtl. jemand noch einen rat für mich?

Deutet stark auf einen Hardwarefehler hin. BTRFS schützt deine Daten hier, indem es nur lesbar einhängt. Prüfe deine SMART-Daten:

sudo smartctl -a /dev/sda
=== START OF INFORMATION SECTION ===
Model Family:     Crucial/Micron Client SSDs
Device Model:     CT250MX500SSD1
Serial Number:    2132E5BFC92F
LU WWN Device Id: 5 00a075 1e5bfc92f
Firmware Version: M3CR043
User Capacity:    250.059.350.016 bytes [250 GB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    Solid State Device
Form Factor:      2.5 inches
TRIM Command:     Available
Device is:        In smartctl database 7.3/5528
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.3, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Sep 12 11:25:27 2024 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x80) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever 
                                        been run.
Total time to complete Offline 
data collection:                (    0) seconds.
Offline data collection
capabilities:                    (0x7b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine 
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        (  30) minutes.
Conveyance self-test routine
recommended polling time:        (   2) minutes.
SCT capabilities:              (0x0031) SCT Status supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   100   100   000    Pre-fail  Always       -       0
  5 Reallocate_NAND_Blk_Cnt 0x0032   100   100   010    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       4510
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       3218
171 Program_Fail_Count      0x0032   100   100   000    Old_age   Always       -       0
172 Erase_Fail_Count        0x0032   100   100   000    Old_age   Always       -       0
173 Ave_Block-Erase_Count   0x0032   077   077   000    Old_age   Always       -       304
174 Unexpect_Power_Loss_Ct  0x0032   100   100   000    Old_age   Always       -       1203
180 Unused_Reserve_NAND_Blk 0x0033   000   000   000    Pre-fail  Always       -       34
183 SATA_Interfac_Downshift 0x0032   100   100   000    Old_age   Always       -       0
184 Error_Correction_Count  0x0032   100   100   000    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0022   062   041   000    Old_age   Always       -       38 (Min/Max 0/59)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_ECC_Cnt 0x0032   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   100   100   000    Old_age   Always       -       0
202 Percent_Lifetime_Remain 0x0030   077   077   001    Old_age   Offline      -       23
206 Write_Error_Rate        0x000e   100   100   000    Old_age   Always       -       0
210 Success_RAIN_Recov_Cnt  0x0032   100   100   000    Old_age   Always       -       0
246 Total_LBAs_Written      0x0032   100   100   000    Old_age   Always       -       26876622808
247 Host_Program_Page_Count 0x0032   100   100   000    Old_age   Always       -       256561569
248 FTL_Program_Page_Count  0x0032   100   100   000    Old_age   Always       -       725370500

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Completed [00% left] (0-65535)
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

The above only provides legacy SMART information - try 'smartctl -x' for more

Also neue Festplatte besorgen?
Kannst du mir eine gute marke empfehlen

1203 unerwartete Stromverluste innerhalb von 188 Tagen Betriebszeit. Ist schon recht häufig, aber in der Toleranzgrenze.

Was hat denn zu dem Fehler jetzt geführt, in BTRFS? Reine Neugier, da ich so einen Fehler nie gehabt habe.

Ansonsten wäre die einfachste Methode: Daten sichern mit der rescue Option und neu aufsetzten.

Nein kann ich nicht und es wäre gegen die Forum Regeln. Allgemein schau einfach hier: https://linux-hardware.org/?view=drive_ssd_vendor

Ich habe nur über pacman das paket jq installiert und anschließend neu gestartet.
Das mit den Stromverlusten muss ich nochmal nachgehen, den ich hab diese Festplatte in einem Wechselrahmen drin und nicht das dieses das Problem verursacht hat.
Kannst du mir das mit Rescue noch erklären, dachte mir ich baue jetzt die neue Platte ein und verschiebe die Dateien

1 Like

rescue ist hier die Option:

https://btrfs.readthedocs.io/en/latest/ch-mount-options.html

23% Lebensspanne aufgebraucht oder nicht?

Soviel ich weiß zählt der von 100% runter… und der ist jetzt bei 77% angekommen.

Haste Recht @Kobold, hab es nochmal schnell nachgeschlagen:

Attribut 202: Verbleibende Lebensdauer in Prozent (prozentuale Nutzungsdauer über PCIe)

Dieses Attribut entspricht exakt seinem Namen. Es gibt an, wie viel Prozent der voraussichtlichen Lebensdauer des Laufwerks zu einem bestimmten Zeitpunkt erreicht sind. Wenn die SSD brandneu ist, meldet das Attribut 202 „100“. Beim Erreichen der angegebenen Lebensdauer hat es den Wert „0“, was 0 Prozent restliche Lebensdauer bedeutet.
[…]
Dieses Attribut wird bei bestimmten älteren Crucial SSDs sowie bei NVMe-Modellen auch als „Percentage Lifetime Used“ (Genutzter Prozentsatz der Lebensdauer) angezeigt. Es gilt hier das gleiche Prinzip wie bei der verbleibenden Lebensdauer, nur in die entgegengesetzte Richtung. Das Attribut 202 einer neuen SSD hat zu Beginn den Wert „0“ an. Wenn die angegebene Lebensdauer erreicht ist, zeigt es „100“ an und meldet, dass 100 Prozent der Lebensdauer genutzt wurden. Bei diesen Modellen kann der Prozentsatz 100 übersteigen, da weitere Schreibvorgänge durchgeführt werden. Hinsichtlich der Datenhaltung sind jedoch dieselben Erwägungen zu berücksichtigen.
SSDs und SMART-Daten | Crucial DE

Bin mir da jetzt nicht so sicher… Ist die SSD jetzt “älter” oder “neuer”? Jedenfalls kann beides zutreffen.

Ich muß dazu sagen, das ich noch nie ne SSD hatte die auf 77% gefallen ist. Von meinen erfahrungswerten ist das schon ordentlich was die abnutzung angeht.

Aber ob das jetzt ein grund ist, die SSD zu ersetzen? :man_shrugging:

@trinity93142
Wie alt ist denn die SSD?

Ich habe den PC vor 3 Jahren zusammengestellt