Перейти до

Слетел софтовый рейд, как починить ?


Рекомендованные сообщения

всем привет !

Сегодня РЕСовцы отключили подстанцию на пол дня, акумы стока не выдержали.

В итоге после включения сервака:

gmirror status

 

mirror /gm0 DEGRADED ad4

 

В системе два диска ad4 & ad6

 

как правильно восстановить рейд ???

Ссылка на сообщение
Поделиться на других сайтах

gmirror forget gm0

gmirror insert /dev/ad6

 

убедись что система загружена с ad4

спасибо, пошла синхронизация )))

Почему после нештатного выключения сервака запускается синхронизация ??? нужна ли она ???

Ссылка на сообщение
Поделиться на других сайтах

эм. у вас два винта. система вырубилась нештатно, значит винты в неизвестном состоянии. система принимает один из них за корректный и синхронизирует второй по первому.

Ссылка на сообщение
Поделиться на других сайтах

эм. у вас два винта. система вырубилась нештатно, значит винты в неизвестном состоянии. система принимает один из них за корректный и синхронизирует второй по первому.

понял, а почему в этот раз механизм синхронизации не запустился ???

Ссылка на сообщение
Поделиться на других сайтах

Возможно был сбой по недоступности жесткого диска и система его не смогла сразу примонтировать к рейду. возможно на втором диске слетели записи geom о том, что он входит в рейд.

Ссылка на сообщение
Поделиться на других сайтах

Возможно был сбой по недоступности жесткого диска и система его не смогла сразу примонтировать к рейду. возможно на втором диске слетели записи geom о том, что он входит в рейд.

ясно, спс.

 

Проблема осталась: синхронизация начинается, проходит порядка 16 % и все ....

Ссылка на сообщение
Поделиться на других сайтах

/usr/ports/sysutils/smartmontools поставь

 

Потом покажи.

smartctl -a /dev/ad4

smartctl -a /dev/ad6

 

Рейд лучше собирать с опцией -n Turn off autosynchronization of stale component

Чтобы в случае аварийного выключения сервака и последующего включения одновременно не запускался fsck и ребилд рейда

Ссылка на сообщение
Поделиться на других сайтах

что в этот момент выдает dmesg?

что находится в /var/log/messages?

на консоль что сыпет?

 

скорее всего битый винт/шлейф/контроллер

dmesg

ad4: 953869MB <WDC WD10EARS-00MVWB0 51.0AB51> at ata2-master SATA150

ad6: 953869MB <WDC WD10EARS-00MVWB0 51.0AB51> at ata3-master SATA150

SMP: AP CPU #1 Launched!

GEOM_MIRROR: Component ad6 (device gm0) broken, skipping.

GEOM_MIRROR: Device mirror/gm0 launched (1/2).

Trying to mount root from ufs:/dev/mirror/gm0s1a

re0: link state changed to UP

fxp0: link state changed to UP

GEOM_MIRROR: Device gm0: rebuilding provider ad6.

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=1742336

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=33148416

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=33533952

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=60017664

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=79320576

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=82239104

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=122780800

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=143059840

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=159810816

ad6: WARNING - WRITE_DMA UDMA ICRC error (retrying request) LBA=196045952

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=206939904

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=207898112

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=208259840

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=239852416

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=246993792

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=247476096

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=249883008

ad6: TIMEOUT - WRITE_DMA48 retrying (1 retry left) LBA=272965376

ad6: FAILURE - WRITE_DMA48 status=51<READY,DSC,ERROR> error=10<NID_NOT_FOUND> LBA=272965376

GEOM_MIRROR: Synchronization request failed (error=5). ad6[WRITE(offset=139758272512, length=131072)]

GEOM_MIRROR: Device gm0: provider ad6 disconnected.

GEOM_MIRROR: Device gm0: rebuilding provider ad6 stopped.

GEOM_MIRROR: Device gm0: rebuilding provider ad6.

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=1256448

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=3547904

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=18661504

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=19167104

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=34703360

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=36928384

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=57075072

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=68524288

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=85729408

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=97783936

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=97795456

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=110766208

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=120029184

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=122342784

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=152126336

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=179769728

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=180194944

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=192280704

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=208501376

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=211773824

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=217512064

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=222419328

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=238004608

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=257867648

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=259560832

ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=260504448

ad6: TIMEOUT - WRITE_DMA48 retrying (1 retry left) LBA=284915584

ad6: FAILURE - WRITE_DMA48 status=51<READY,DSC,ERROR> error=10<NID_NOT_FOUND> LBA=284915584

GEOM_MIRROR: Synchronization request failed (error=5). ad6[WRITE(offset=145876713472, length=131072)]

GEOM_MIRROR: Device gm0: provider ad6 disconnected.

GEOM_MIRROR: Device gm0: rebuilding provider ad6 stopped.

Ссылка на сообщение
Поделиться на других сайтах

меняй ad6.. сыпется :) смарт покажи его?

печалька, бл@#ь:

Oct 5 11:26:28 admin kernel: GEOM_MIRROR: Device gm0: rebuilding provider ad6.

Oct 5 11:27:00 admin kernel: ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=3399040

Oct 5 11:27:57 admin kernel: ad6: WARNING - WRITE_DMA UDMA ICRC error (retrying request) LBA=11470336

Oct 5 11:29:42 admin kernel: ad6: WARNING - WRITE_DMA UDMA ICRC error (retrying request) LBA=26513280

Oct 5 11:30:17 admin kernel: ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=30452224

Oct 5 11:31:34 admin kernel: ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=39585024

Oct 5 11:34:02 admin kernel: ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=59256320

Oct 5 11:35:19 admin kernel: ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=68687104

Oct 5 11:38:42 admin kernel: ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=96341376

Oct 5 11:41:00 admin kernel: ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=114364288

Oct 5 11:41:48 admin kernel: ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=119957248

Oct 5 11:44:08 admin kernel: ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=138565120

Oct 5 11:44:42 admin kernel: ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=142016000

Oct 5 11:46:09 admin kernel: ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=152721536

Oct 5 11:46:46 admin kernel: ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=156484864

Oct 5 11:48:29 admin kernel: ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=170295680

Oct 5 11:50:01 admin kernel: ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=181946368

Oct 5 11:50:44 admin kernel: ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=186494592

Oct 5 11:52:59 admin kernel: ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=204142464

Oct 5 11:53:14 admin kernel: ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=204697984

Oct 5 11:53:40 admin kernel: ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=206776704

Oct 5 11:54:27 admin kernel: ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=212818304

Oct 5 11:55:18 admin kernel: ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=219219200

Oct 5 11:57:50 admin kernel: ad6: TIMEOUT - WRITE_DMA retrying (1 retry left) LBA=239295232

Oct 5 12:02:48 admin kernel: ad6: TIMEOUT - WRITE_DMA48 retrying (1 retry left) LBA=282048384

Oct 5 12:02:48 admin kernel: ad6: FAILURE - WRITE_DMA48 status=51<READY,DSC,ERROR> error=10<NID_NOT_FOUND> LBA=282048384

Oct 5 12:02:48 admin kernel: GEOM_MIRROR: Synchronization request failed (error=5). ad6[WRITE(offset=144408707072, length=131072)]

Oct 5 12:02:48 admin kernel: GEOM_MIRROR: Device gm0: provider ad6 disconnected.

Oct 5 12:02:48 admin kernel: GEOM_MIRROR: Device gm0: rebuilding provider ad6 stopped.

Ссылка на сообщение
Поделиться на других сайтах

ad6 писец настал, иди в магазин за новым.

Совет - в фряхе, особенно в 9 есть очень классная штука - zfs, весьма рекомендую, на геом потом возвращаться не захочется

Ссылка на сообщение
Поделиться на других сайтах

ad6 писец настал, иди в магазин за новым.

Совет - в фряхе, особенно в 9 есть очень классная штука - zfs, весьма рекомендую, на геом потом возвращаться не захочется

про zfs почитал, но система уже установлена ???

Ссылка на сообщение
Поделиться на других сайтах

Ну это же не навсегда:)

Опять же вам все равно веник менять, разверните на него фрибсдс ЗФС, отключите ад4, загрузитесь с нового диска и добавите ад4 в миррор

Ссылка на сообщение
Поделиться на других сайтах

Ну это же не навсегда :)

Опять же вам все равно веник менять, разверните на него фрибсдс ЗФС, отключите ад4, загрузитесь с нового диска и добавите ад4 в миррор

так данные то на ad4 ???

Ссылка на сообщение
Поделиться на других сайтах

ну так а я о чем?

Ставите на ад6 ОС с ЗФС (можно на другой машине), подключаете его к серверу, сливаете данные на новый веник, грузитесь с нового, если все ок - старый форматируете в ЗФС и добавляете в зеркало

Ссылка на сообщение
Поделиться на других сайтах

ну так а я о чем?

Ставите на ад6 ОС с ЗФС (можно на другой машине), подключаете его к серверу, сливаете данные на новый веник, грузитесь с нового, если все ок - старый форматируете в ЗФС и добавляете в зеркало

хм, там на ad4 стоит directadmin (((

Ссылка на сообщение
Поделиться на других сайтах

ну так а я о чем?

Ставите на ад6 ОС с ЗФС (можно на другой машине), подключаете его к серверу, сливаете данные на новый веник, грузитесь с нового, если все ок - старый форматируете в ЗФС и добавляете в зеркало

хм, там на ad4 стоит directadmin (((

 

ты кроме зеркала еще отделил часть винта и подмонтировал ? :)

Ссылка на сообщение
Поделиться на других сайтах

ну так а я о чем?

Ставите на ад6 ОС с ЗФС (можно на другой машине), подключаете его к серверу, сливаете данные на новый веник, грузитесь с нового, если все ок - старый форматируете в ЗФС и добавляете в зеркало

хм, там на ad4 стоит directadmin (((

 

ты кроме зеркала еще отделил часть винта и подмонтировал ? :)

Cань, я в том плане, что ДА не поддерживает ZFS.

Ссылка на сообщение
Поделиться на других сайтах

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Вхід

Уже зарегистрированы? Войдите здесь.

Войти сейчас
  • Зараз на сторінці   0 користувачів

    Немає користувачів, що переглядають цю сторінку.

×
×
  • Створити нове...