AoW 17 Опубликовано: 2011-10-10 16:46:24 Share Опубликовано: 2011-10-10 16:46:24 сдрассте! Ежедневно, по вечерам загрузка одного ядра из двух, на тачке на которой стоит СТГ, в пол. При этом растут пинги и уменьшаться пропускабельность канала. Трафик чуть более 250 Мб, сетевухи Dlink-530, 2 гб оперативки, в течении дня загрузка проца не более 2 %. время такого трабла все время разная. захват трафика отключил, если днем трафик доростает в пол - то все гуд, а вот вечером - халепа! В чем может быть проблема? Версия газера stg-2.407-p1.. Кто с таким сталкивался? Может меня досят со стороны локалки? Билинг проходящий! Ссылка на сообщение Поделиться на других сайтах
dan_aspire 81 Опубликовано: 2011-10-10 16:48:36 Share Опубликовано: 2011-10-10 16:48:36 Может просто сетевушки не справляются с количеством пакетов? Ссылка на сообщение Поделиться на других сайтах
AoW 17 Опубликовано: 2011-10-10 17:14:25 Автор Share Опубликовано: 2011-10-10 17:14:25 до них была е1000 двухпортовая, ситуация особо не поменялась Ссылка на сообщение Поделиться на других сайтах
nightfly 1 239 Опубликовано: 2011-10-10 17:18:45 Share Опубликовано: 2011-10-10 17:18:45 Таки сетевухи скорее всего. PPS какой? А да, метод захвата чисто случайно не divert? =) Ссылка на сообщение Поделиться на других сайтах
QI_Can9 3 Опубликовано: 2011-10-10 17:19:12 Share Опубликовано: 2011-10-10 17:19:12 сбалансируй нагрузку между процами. Ссылка на сообщение Поделиться на других сайтах
AoW 17 Опубликовано: 2011-10-10 17:21:21 Автор Share Опубликовано: 2011-10-10 17:21:21 сбалансируй нагрузку между процами. как? Таки сетевухи скорее всего. PPS какой? А да, метод захвата чисто случайно не divert? =) уже нет захвата, отключил вчера Ссылка на сообщение Поделиться на других сайтах
AoW 17 Опубликовано: 2011-10-10 17:23:49 Автор Share Опубликовано: 2011-10-10 17:23:49 много ресурсов в такой момент забирает ksoftirqd Ссылка на сообщение Поделиться на других сайтах
QI_Can9 3 Опубликовано: 2011-10-10 17:26:30 Share Опубликовано: 2011-10-10 17:26:30 своими руками я такого не делал (присутствовал ток), но как основное это постивить яндексовые дрова на сетевую с пересборкой ядра Ссылка на сообщение Поделиться на других сайтах
nightfly 1 239 Опубликовано: 2011-10-10 18:20:36 Share Опубликовано: 2011-10-10 18:20:36 своими руками я такого не делал (присутствовал ток), но как основное это постивить яндексовые дрова на сетевую с пересборкой ядра Яндексовые дрова на Dlink-530? под лЫнух? шутку понял много ресурсов в такой момент забирает ksoftirqd Оно еще и PCI же, правда? Купить нормальную сетевуху, с нормальным количеством очередей и нормально раскидать их по ядрам - помогает. ksoftirqd is a per-cpu kernel thread that runs when the machine is under heavy soft-interrupt load. Soft interrupts are normally serviced on return from a hard interrupt, but it's possible for soft interrupts to be triggered more quickly than they can be serviced. как-бы намекает Ссылка на сообщение Поделиться на других сайтах
Kucher2 122 Опубликовано: 2011-10-10 21:09:02 Share Опубликовано: 2011-10-10 21:09:02 Было такое у меня: дропались пакеты, "прыгали" пинги. Обсуждали тут где-то долго и упорно примерно с год назад. Были танцы с настройкой. В итоге всё решилось переходом на ядерный NAT, IPFW2 с оптимизацией таблиц и всё такое: банальная перегрузка железа всякими лишними задачами. Ссылка на сообщение Поделиться на других сайтах
Небесный 26 Опубликовано: 2011-10-11 05:52:07 Share Опубликовано: 2011-10-11 05:52:07 Сколько я полазил и начитался - поглядев проблемы с ksoftirqd. Это не проблема в одном месте, а сразу в нескольких. Возможные причины: 1. Драйвер сетевой карты, как и вообще сама сетевая карта возможно не справляется со своей работой. 2. Это всякие там шейперы на Linux и правила фаервола. Где выход один использовать Фрю под такие вещи, как шейпер, полисер и т.п. Ну и есно при большом колличестве правил юзать ipset (был бы рад, если кто-то составил внятный ман и где-то разместил). 3. Внимательно изучить вывод команды sysctl -a | grep conntrack и принять решения о каждом пункте, вчитываясь в гугл о каждом параметре, для чего он нужен. Потом еще AoW забыл вчера посоветовать вот это - http://notes.ghost.dn.ua/node/65 Что есть обезательным, где сервачок пропускает через себя траф. ЗЫ: Ну это то, что мне принес домовой ночью под подушку, пока как бы идей больше нету. Ссылка на сообщение Поделиться на других сайтах
DarkSpider 36 Опубликовано: 2011-10-11 05:58:07 Share Опубликовано: 2011-10-11 05:58:07 Уперся однажды с таким же - забивание проца в потолок. Небесный прав - сначала немного оптимизируем ядро, как в статье, а потом уменьшаем количество правил фаера. Например начинаем активно использовать ipset - не думаю, что открою Америку, но - http://spider.bsyteam.net/1500 Ссылка на сообщение Поделиться на других сайтах
madf 279 Опубликовано: 2011-10-11 06:31:11 Share Опубликовано: 2011-10-11 06:31:11 Я не понял, загрузка CPU продолжается с отключенным захватом трафика? Ссылка на сообщение Поделиться на других сайтах
Kucher2 122 Опубликовано: 2011-10-11 06:48:34 Share Опубликовано: 2011-10-11 06:48:34 захват трафика отключил, если днем трафик доростает в пол - то все гуд, а вот вечером - халепа! Угу. Но шейп-то остался. Похоже тазик не справляется с кол-вом пакетов. Кстати, советую автору темы поставить какой-нить мониторинг системы, вроде Zabbix - здорово помогает разобраться "откуда ноги растут" в таких ситуациях. Ссылка на сообщение Поделиться на других сайтах
Небесный 26 Опубликовано: 2011-10-11 07:07:27 Share Опубликовано: 2011-10-11 07:07:27 Я не понял, загрузка CPU продолжается с отключенным захватом трафика? Раньше при включенном захвате и дет. стат. процес stargazer - отжирал 60-70% - ну как бы при таком колличестве абонентов и при таком трафике относитльно нормально. Отключили захват, отключили дет. стат. - вылазит периодически процесс ksoftirqd, с нагрузкой на одно ядро в 100%. Короче лечение одно, настроить ядро и сделать балансировку по ядрам. И смотреть дальше, пока как бы одно мне на ум приходит. Ссылка на сообщение Поделиться на других сайтах
KaYot 3 708 Опубликовано: 2011-10-11 07:19:05 Share Опубликовано: 2011-10-11 07:19:05 ksoftirqd съедающий ресурсы намекает на проблемы с шейперами/NAT/firewall. Биллинг тут не при чем, скорее железо свое отжило и требует срочной модернизации(осенью хомячки ринулись в инет, pps ощутимо подрос). Ссылка на сообщение Поделиться на других сайтах
KaYot 3 708 Опубликовано: 2011-10-11 07:23:36 Share Опубликовано: 2011-10-11 07:23:36 Да, 250мбит днем, когда активно 50 человек и 250мбит вечером, когда активно 200 - две большие разницы. Описанная вами ситуация с 5% и 100% практически нормальна. Ссылка на сообщение Поделиться на других сайтах
Небесный 26 Опубликовано: 2011-10-11 07:49:12 Share Опубликовано: 2011-10-11 07:49:12 Для заметочки на будущее другим, как сделать прерывания между ядрами на сетевых платах http://habrahabr.ru/blogs/sysadm/108240/ Автору темы уже переданная сылка - работаем. ))) Ссылка на сообщение Поделиться на других сайтах
AoW 17 Опубликовано: 2011-10-11 13:10:08 Автор Share Опубликовано: 2011-10-11 13:10:08 если использовать транк из двух сетевых карточек - как это отразится? будет ли разделение по нагрузке? или нагрузка будет только на одну? Есть возможномть интернет и скрипты онконнект - ондисконект перенести на отдельный нас, и хочу подготовится к этому более основательно Ссылка на сообщение Поделиться на других сайтах
AoW 17 Опубликовано: 2011-10-12 11:55:03 Автор Share Опубликовано: 2011-10-12 11:55:03 очередное сдрассте! пока сделали только то что кидал Небесный, за что ему огромное спасибо! Результат на лицо, если раньше пинги росли на 60-70 мсек, а после тютинга только на 10 ))) В субботу ожидается переделка шлюза с использованием ipset: http://spider.bsyteam.net/1500 По завершении отпишусь! Ссылка на сообщение Поделиться на других сайтах
AoW 17 Опубликовано: 2011-10-31 10:05:06 Автор Share Опубликовано: 2011-10-31 10:05:06 Всем сдрассте! Наконец-то у меня получилось провести незабываемую ночь на работе и перейти на айписет+НАС+интеловские сетевухи. Пока все работает хорошо, загрузка проца упала в разы, в минуты загрузки ksoftirqd занимает только 7% мощей процессора. Переход можно назвать успешным! Остается открытым вопрос относительно сбора статистики с удаленного НАС-а. Кто-что знает - поделитесь если не жалко! Ссылка на сообщение Поделиться на других сайтах
nightfly 1 239 Опубликовано: 2011-10-31 10:08:21 Share Опубликовано: 2011-10-31 10:08:21 cap_nf + softflowd - установка/настройка меньше 5 минут. stargazer.conf <Module cap_nf> TCPPort = 42111 UDPPort = 42111 </Module> Пускаем на удаленном хосте softflowd softflowd -i em0 -n хост_старгейзера:42111 В более подробном варианте тут: http://habrahabr.ru/blogs/sysadm/130937/ Ссылка на сообщение Поделиться на других сайтах
AoW 17 Опубликовано: 2011-10-31 10:42:25 Автор Share Опубликовано: 2011-10-31 10:42:25 а cap_nf + softflowd - установка/настройка меньше 5 минут. stargazer.conf TCPPort = 42111 UDPPort = 42111 Пускаем на удаленном хосте softflowd softflowd -i em0 -n хост_старгейзера:42111 В более подробном варианте тут: http://habrahabr.ru/blogs/sysadm/130937/ будет собирать только информацию об объеме или и информацию о том, кто куда ходит? Ссылка на сообщение Поделиться на других сайтах
nightfly 1 239 Опубликовано: 2011-10-31 11:11:43 Share Опубликовано: 2011-10-31 11:11:43 softflowd собирает все. Старгейзер будет писать в зависимости от выставленного флага DisabledDetailStat. Ссылка на сообщение Поделиться на других сайтах
AoW 17 Опубликовано: 2011-11-02 07:11:34 Автор Share Опубликовано: 2011-11-02 07:11:34 Канал в 300 Мбит. Ночью 30-35 К Пакет. ждем что будет вечером! Ссылка на сообщение Поделиться на других сайтах
Рекомендованные сообщения
Создайте аккаунт или войдите в него для комментирования
Вы должны быть пользователем, чтобы оставить комментарий
Создать аккаунт
Зарегистрируйтесь для получения аккаунта. Это просто!
Зарегистрировать аккаунтВойти
Уже зарегистрированы? Войдите здесь.
Войти сейчас