morfey 82 Опубліковано: 2014-12-21 18:12:56 Автор Share Опубліковано: 2014-12-21 18:12:56 Хехе. А ты уверен что ядра по сокетам раскиданы подряд? Лучше проверь скриптом типа этого http://pastebin.com/RS8e23jd или утилитой i7z. Мля) Я так понял core-id отвечает за номер? Ссылка на сообщение Поделиться на других сайтах
KaYot 3 707 Опубліковано: 2014-12-21 18:17:40 Share Опубліковано: 2014-12-21 18:17:40 (відредаговано) Да, номер ядра это core-id. И работают они у тебя сейчас вперемешку, в этой утилите удобно смотреть реальное состояние ядер/сокетов. И да, у тебя активно энергосбережение. И оно легко может быть источником всех бед. Убивай cpuidle и сервис cpuspeed. Відредаговано 2014-12-21 18:19:01 KaYot Ссылка на сообщение Поделиться на других сайтах
KaYot 3 707 Опубліковано: 2014-12-21 18:20:23 Share Опубліковано: 2014-12-21 18:20:23 Частота должна быть стабильной 2533(с учетом турбо), и в С0 система уходить не должна. Ссылка на сообщение Поделиться на других сайтах
morfey 82 Опубліковано: 2014-12-21 18:29:19 Автор Share Опубліковано: 2014-12-21 18:29:19 Node #0 mask Core #0 - 1 Core #2 - 4 Core #4 - 10 Core #6 - 40 Core #8 - 100 Core #10 - 400 Node #1 Core #1 - 2 Core #3 - 8 Core #5 - 20 Core #7 - 80 Core #9 - 200 Core #11 - 800 eth0-1 70 00000001 71 00000001 72 00000001 73 00000004 74 00000004 75 00000004 76 00000010 77 00000010 79 00000040 80 00000040 81 00000040 82 00000100 83 00000100 84 00000100 85 00000400 86 00000400 eth2-3 88 00000002 89 00000002 90 00000002 91 00000008 92 00000008 93 00000008 94 00000020 95 00000020 97 00000080 98 00000080 99 00000080 100 00000200 101 00000200 102 00000200 103 00000800 104 00000800 Все то же.. Убивай cpuidle и сервис cpuspeedЧтото я такого не нашел... Ссылка на сообщение Поделиться на других сайтах
KaYot 3 707 Опубліковано: 2014-12-21 18:49:04 Share Опубліковано: 2014-12-21 18:49:04 Покажи ethtool -S eth0 | grep error Что за ошибки хоть идут? Ну и можно попробовать с другой стороны подойти. Оффлоады выключены? Может банально шейпер глючит? ethtool -K eth0 gro off gso off tso off Ссылка на сообщение Поделиться на других сайтах
KaYot 3 707 Опубліковано: 2014-12-21 18:50:21 Share Опубліковано: 2014-12-21 18:50:21 Добавь параметры ядра при загрузке системы intel_idle.max_cstate=0 processor.max_cstate=1 - рекомендуемые от hp/intel. Ссылка на сообщение Поделиться на других сайтах
morfey 82 Опубліковано: 2014-12-21 18:52:44 Автор Share Опубліковано: 2014-12-21 18:52:44 (відредаговано) Покажи ethtool -S eth0 | grep error Что за ошибки хоть идут? Ну и можно попробовать с другой стороны подойти. Оффлоады выключены? Может банально шейпер глючит? ethtool -K eth0 gro off gso off tso off Оффлоады выключены. Шейперы отключены. ethtool -S eth0 не показывает ошибок нигде, все по 0. Видно только по ifconfig. Ну и по страшным глюкам Відредаговано 2014-12-21 18:53:02 morfey Ссылка на сообщение Поделиться на других сайтах
martin 170 Опубліковано: 2014-12-21 18:55:01 Share Опубліковано: 2014-12-21 18:55:01 Саш, а это твой первый сервак ? )) Гипертрединг и энергосбережение проца в первую очередь в биосе выключаются ethtool -S на брыдкоме может ничего и не показать.. Поставь интеляки !!! Ссылка на сообщение Поделиться на других сайтах
KaYot 3 707 Опубліковано: 2014-12-21 18:55:37 Share Опубліковано: 2014-12-21 18:55:37 Тогда беда где-то совсем в другом месте. Ошибки даваемые сетевкой из-за аппаратных глюков/патчкордов/нехватки буферов/перегрузки прерываниями и т.п. видны в статистике ethtool. Может банально бонд разваливается после перегрузки модуля?)) Ссылка на сообщение Поделиться на других сайтах
morfey 82 Опубліковано: 2014-12-21 18:59:16 Автор Share Опубліковано: 2014-12-21 18:59:16 Саш, а это твой первый сервак ? )) Гипертрединг и энергосбережение проца в первую очередь в биосе выключаются ethtool -S на брыдкоме может ничего и не показать.. Поставь интеляки !!! Это мой первый линукс)) Тогда беда где-то совсем в другом месте. Ошибки даваемые сетевкой из-за аппаратных глюков/патчкордов/нехватки буферов/перегрузки прерываниями и т.п. видны в статистике ethtool. Может банально бонд разваливается после перегрузки модуля?)) Я раскидаю прерывания без перегрузки модуля. Ссылка на сообщение Поделиться на других сайтах
KaYot 3 707 Опубліковано: 2014-12-21 19:00:24 Share Опубліковано: 2014-12-21 19:00:24 (відредаговано) Тогда беда где-то совсем в другом месте. Ошибки даваемые сетевкой из-за аппаратных глюков/патчкордов/нехватки буферов/перегрузки прерываниями и т.п. видны в статистике ethtool. Может банально бонд разваливается после перегрузки модуля?)) Я раскидаю прерывания без перегрузки модуля. Я про включение/отключение очередей. Без очередей потерь нет, с очередями есть, я правильно понимаю? Відредаговано 2014-12-21 19:00:40 KaYot Ссылка на сообщение Поделиться на других сайтах
KaYot 3 707 Опубліковано: 2014-12-21 19:02:33 Share Опубліковано: 2014-12-21 19:02:33 Гипертрединг и энергосбережение проца в первую очередь в биосе выключаютсяНе, полностью энергосбережение выключать нет смысла. Параметрами ядра задается глубина сна С1 и пусть себе отдыхает в halt'e, без каких-либо накладных расходов. Ссылка на сообщение Поделиться на других сайтах
morfey 82 Опубліковано: 2014-12-21 19:05:35 Автор Share Опубліковано: 2014-12-21 19:05:35 (відредаговано) Тогда беда где-то совсем в другом месте. Ошибки даваемые сетевкой из-за аппаратных глюков/патчкордов/нехватки буферов/перегрузки прерываниями и т.п. видны в статистике ethtool. Может банально бонд разваливается после перегрузки модуля?)) Я раскидаю прерывания без перегрузки модуля. Я про включение/отключение очередей. Без очередей потерь нет, с очередями есть, я правильно понимаю? Сейчас очередя включены на карте. Работают обе карты на 1 сокете, минимум ошибок/глюков. Чем больше раскидаю по ядрам, тем больше ошибок.. Както так. Відредаговано 2014-12-21 19:06:18 morfey Ссылка на сообщение Поделиться на других сайтах
KaYot 3 707 Опубліковано: 2014-12-21 19:10:38 Share Опубліковано: 2014-12-21 19:10:38 ring buffer поднимал до 1024-2048? Отключай intel_idle, вероятно дело в нем. Ссылка на сообщение Поделиться на других сайтах
morfey 82 Опубліковано: 2014-12-21 19:12:31 Автор Share Опубліковано: 2014-12-21 19:12:31 ring buffer поднимал до 1024-2048? Отключай intel_idle, вероятно дело в нем. Поднял. Попробую отключить Ссылка на сообщение Поделиться на других сайтах
morfey 82 Опубліковано: 2014-12-22 08:43:19 Автор Share Опубліковано: 2014-12-22 08:43:19 (відредаговано) Пока наблюдаю, но intel_idle по ходу спас ситуацию. Я забыл удалить irqbalance, и он после ребута стартонул. Сейчас все успешно работает . # ifconfig bond1 |grep error RX packets:983946887 errors:0 dropped:3 overruns:0 frame:0 TX packets:759659907 errors:0 dropped:0 overruns:0 carrier:0 root@bras:/etc/bind/master# root@bras:/etc/bind/master# root@bras:/etc/bind/master# ifconfig bond0 |grep error RX packets:757366294 errors:0 dropped:0 overruns:0 frame:0 TX packets:977358097 errors:0 dropped:0 overruns:0 carrier:0 root@bras:/etc/bind/master# root@bras:/etc/bind/master# root@bras:/etc/bind/master# root@bras:/etc/bind/master# ethtool -S eth0 | grep error rx_error_bytes: 0 tx_error_bytes: 0 tx_mac_errors: 0 tx_carrier_errors: 0 rx_crc_errors: 0 rx_align_errors: 0 Відредаговано 2014-12-22 08:43:30 morfey Ссылка на сообщение Поделиться на других сайтах
Рекомендованные сообщения
Создайте аккаунт или войдите в него для комментирования
Вы должны быть пользователем, чтобы оставить комментарий
Создать аккаунт
Зарегистрируйтесь для получения аккаунта. Это просто!
Зарегистрировать аккаунтВхід
Уже зарегистрированы? Войдите здесь.
Войти сейчас