Kernel/hardware errors: различия между версиями

Материал из ALT Linux Wiki
Нет описания правки
(диски)
Строка 2: Строка 2:


= Проверка системы =
= Проверка системы =
== Проверка памяти ==
== Память ==
* '''Memtest86+''': как правило, доступен в меню {{menuitem|Advanced options for ALT Sisyphus Sisyphus}} при загрузке через grub. — https://www.memtest.org/
* '''Memtest86+''': как правило, доступен в меню {{menuitem|Advanced options for ALT Sisyphus Sisyphus}} при загрузке через grub. — https://www.memtest.org/
* '''efi-memtest86''': (при загрузке через EFI) — https://www.memtest86.com/ <br> Для использования необходимо:
* '''efi-memtest86''': (при загрузке через EFI) — https://www.memtest86.com/ <br> Для использования необходимо:
Строка 9: Строка 9:
*# В BIOS запустить EFI Shell и там запустить {{Cmd|memtest86}}.
*# В BIOS запустить EFI Shell и там запустить {{Cmd|memtest86}}.
Один прогон проверки памяти может занимать несколько часов.
Один прогон проверки памяти может занимать несколько часов.
== Диски ==
* '''smartmontools''': информация по состоянию дисков из S.M.A.R.T. Так же он позволяет запустить два теста - т.н. короткий и долгой (сканирует всю поверхность дисков).


= Мониторинг =
= Мониторинг =
== Мониторинг памяти ==
== Память ==
* '''mcelog''': (считается устаревшим и) не поддерживается в ядрах Альта (отсутствует {{Path|/dev/mcelog}} устройство). <br> ''"mcelog logs and accounts machine checks (in particular memory, IO, and CPU hardware errors) on modern x86 Linux systems."'' — https://mcelog.org/
* '''mcelog''': (считается устаревшим и) не поддерживается в ядрах Альта (отсутствует {{Path|/dev/mcelog}} устройство). <br> ''"mcelog logs and accounts machine checks (in particular memory, IO, and CPU hardware errors) on modern x86 Linux systems."'' — https://mcelog.org/
* '''edac-util''': рабочий вариант, но плохо поддерживается апстримом. <br> ''"Userspace helper for kernel EDAC drivers (Error Detection and Correction)"'' — https://github.com/grondo/edac-utils
* '''edac-util''': рабочий вариант, но плохо поддерживается апстримом. <br> ''"Userspace helper for kernel EDAC drivers (Error Detection and Correction)"'' — https://github.com/grondo/edac-utils
Строка 17: Строка 20:
   # apt-get install rasdaemon
   # apt-get install rasdaemon
   # systemctl enable --now rasdaemon
   # systemctl enable --now rasdaemon
== Диски ==
* '''smartmontools''': позволяет постоянно мониторить S.M.A.R.T. параметры через сервис '''smartd'''.


{{Category navigation|title=Kernel|category=Kernel|sortkey=*}}
{{Category navigation|title=Kernel|category=Kernel|sortkey=*}}

Версия от 22:10, 27 мая 2023

Перед тем, как заполнять баг-репорт, рекомендуется провести проверку аппаратных компонентов на наличие ошибок. Возникновение аппаратных проблем может привести к появлению "мистических глюков", которые никто не сможет исправить, так как они специфичны только для вашего устройства. Однако эти глюки будут отнимать время и вызывать ложные подозрения о наличии ошибок в ПО.

Проверка системы

Память

  • Memtest86+: как правило, доступен в меню Advanced options for ALT Sisyphus Sisyphus при загрузке через grub. — https://www.memtest.org/
  • efi-memtest86: (при загрузке через EFI) — https://www.memtest86.com/
    Для использования необходимо:
    1. установить пакет efi-memtest86 и скопировать /usr/lib64/efi/memtest86.efi в /boot/efi
    2. установить пакет edk2-efi-shell и скопировать /usr/lib64/efi/shell.efi в /boot/efi
    3. В BIOS запустить EFI Shell и там запустить memtest86.

Один прогон проверки памяти может занимать несколько часов.

Диски

  • smartmontools: информация по состоянию дисков из S.M.A.R.T. Так же он позволяет запустить два теста - т.н. короткий и долгой (сканирует всю поверхность дисков).

Мониторинг

Память

  • mcelog: (считается устаревшим и) не поддерживается в ядрах Альта (отсутствует /dev/mcelog устройство).
    "mcelog logs and accounts machine checks (in particular memory, IO, and CPU hardware errors) on modern x86 Linux systems."https://mcelog.org/
  • edac-util: рабочий вариант, но плохо поддерживается апстримом.
    "Userspace helper for kernel EDAC drivers (Error Detection and Correction)"https://github.com/grondo/edac-utils
  • rasdaemon: современное решение. Мониторит не только память, а любые доступные ему аппаратные ошибки.
    "Those tools provide a way to get Platform Reliability, Availability and Serviceability (RAS) reports made via the Kernel tracing events."https://github.com/mchehab/rasdaemon
 # apt-get install rasdaemon
 # systemctl enable --now rasdaemon

Диски

  • smartmontools: позволяет постоянно мониторить S.M.A.R.T. параметры через сервис smartd.