TrueNAS: Storage alert (pool / disk / scrub)¶
Kdy to pípá¶
- Alerty z TrueNAS: pool DEGRADED/FAULTED, SMART errors, scrub failed, checksum errors, vdev errors, disk removed.
Dopad¶
- Riziko ztráty redundancy, možné zhoršení výkonu, riziko ztráty dat při dalším selhání disku.
Priorita¶
- P0: Pool FAULTED, více disků offline, scrub se opakovaně nedaří, rychle rostou checksum errors.
- P1: Pool DEGRADED (1 disk), SMART warning.
- P2: Jednorázový scrub warning bez nárůstu chyb.
Rychlá kontrola (do 5 minut)¶
1) TrueNAS UI → Alerts: opsat přesné znění a timestamp. 2) TrueNAS UI → Storage → Pools → (pool) → Status: - který disk/vdev je problémový - zda roste READ/WRITE/CKSUM error count 3) TrueNAS UI → Reporting: - Disk temps, I/O, latency (zda nejde o transient problém)
Diagnostika¶
- Pokud SMART:
- UI → Storage → Disks → (disk) → S.M.A.R.T. Test Results / Attributes
- Pokud scrub:
- UI → Tasks → Scrub Tasks / History, případně logy scrubu v UI
- Pokud checksum errors:
- ověř, zda jde o disk, kabeláž, HBA, backplane, expander
Náprava¶
Pool DEGRADED – 1 disk vadný/offline¶
1) Identifikuj disk (serial) v UI. 2) Fyzicky ověř: kabel / pozice / backplane. 3) Pokud je disk skutečně špatný: - vyměň disk za stejný/lepší (kapacita ≥). - v UI proveď Replace / resilver. 4) Sleduj resilver a error count.
Pool FAULTED / více chyb¶
- Okamžitě omez write workload (pokud jde).
- Prioritně zajisti aktuální backup / export kritických dat.
- Eskalace: pokud je to systémový pool / metadata v problému.
Ověření¶
- Pool je ONLINE.
- Error counts se nezvyšují.
- Scrub projde bez chyb.
- Výkon se vrátí k normálu.
Prevence / follow-up¶
- Pravidelné scrub schedule.
- SMART testy (short/long) a alerty.
- Evidence výměn disků (datum, serial, důvod).
Odkazy¶
- TrueNAS UI: Storage → Pools → Status
- Dashboardy: (doplň linky)