Skip to content

TrueNAS: Storage alert (pool / disk / scrub)

Kdy to pípá

  • Alerty z TrueNAS: pool DEGRADED/FAULTED, SMART errors, scrub failed, checksum errors, vdev errors, disk removed.

Dopad

  • Riziko ztráty redundancy, možné zhoršení výkonu, riziko ztráty dat při dalším selhání disku.

Priorita

  • P0: Pool FAULTED, více disků offline, scrub se opakovaně nedaří, rychle rostou checksum errors.
  • P1: Pool DEGRADED (1 disk), SMART warning.
  • P2: Jednorázový scrub warning bez nárůstu chyb.

Rychlá kontrola (do 5 minut)

1) TrueNAS UI → Alerts: opsat přesné znění a timestamp. 2) TrueNAS UI → Storage → Pools → (pool) → Status: - který disk/vdev je problémový - zda roste READ/WRITE/CKSUM error count 3) TrueNAS UI → Reporting: - Disk temps, I/O, latency (zda nejde o transient problém)

Diagnostika

  • Pokud SMART:
  • UI → Storage → Disks → (disk) → S.M.A.R.T. Test Results / Attributes
  • Pokud scrub:
  • UI → Tasks → Scrub Tasks / History, případně logy scrubu v UI
  • Pokud checksum errors:
  • ověř, zda jde o disk, kabeláž, HBA, backplane, expander

Náprava

Pool DEGRADED – 1 disk vadný/offline

1) Identifikuj disk (serial) v UI. 2) Fyzicky ověř: kabel / pozice / backplane. 3) Pokud je disk skutečně špatný: - vyměň disk za stejný/lepší (kapacita ≥). - v UI proveď Replace / resilver. 4) Sleduj resilver a error count.

Pool FAULTED / více chyb

  • Okamžitě omez write workload (pokud jde).
  • Prioritně zajisti aktuální backup / export kritických dat.
  • Eskalace: pokud je to systémový pool / metadata v problému.

Ověření

  • Pool je ONLINE.
  • Error counts se nezvyšují.
  • Scrub projde bez chyb.
  • Výkon se vrátí k normálu.

Prevence / follow-up

  • Pravidelné scrub schedule.
  • SMART testy (short/long) a alerty.
  • Evidence výměn disků (datum, serial, důvod).

Odkazy

  • TrueNAS UI: Storage → Pools → Status
  • Dashboardy: (doplň linky)