Jump to content

Зависает сервер


Recommended Posts

dummynet не много жрет?

что там за правила, таблицы используются или на каждого абона свои правила натыканы?

Нет, 10% примерно в час пик. Таблицы.

atop

htop

dstat

iotop

?

Это в момент тормозов смотреть?

Link to post
Share on other sites

На em0 никто не флудит? :)

 

Да вот на это и грешу потому как на 100% грузит em0, но как проверить?

Вот сейчас опять началось.

b54272f98776.jpg

 

systat показывает что идет 50-60 мегабит. хотя по биллингу клиентам идет максимум 20 мегабит.

 

fca2e82b63bf.jpg

Link to post
Share on other sites

как проверить?

Статистику по pps в первом приближении посмотреть для начала.

А вообще - странно высокая загрузка при таком траффике, эдак характерная для системы класса 2xPII-400. Во всяком случае, судя по производительности линь-систем (с бздей дел не имел).

Link to post
Share on other sites

как проверить?

Статистику по pps в первом приближении посмотреть для начала.

А вообще - странно высокая загрузка при таком траффике, эдак характерная для системы класса 2xPII-400. Во всяком случае, судя по производительности линь-систем (с бздей дел не имел).

Дело не в мощности, вот спустя два с половиной часа все стало на свои места.

 

6e9d4cd82b21.jpg

 

и трафик стал рулить как и должен.

 

8616bf87fe0b.jpg

Link to post
Share on other sites

Дело не в мощности, вот спустя два с половиной часа все стало на свои места.

25% загрузки ядра сетевухой/шейпером/файрволом - "стало на свои места"?

Вот к примеру загрузка проца (2-головый феном 550) одного из бордюров, через который гуляет 500 мбит в каждую из сторон:

 

Mem: 358500K used, 1716300K free, 0K shrd, 0K buff, 45492K cached
CPU0:  0.0% usr  0.0% sys  0.0% nic 89.3% idle  0.0% io  0.0% irq 10.6% sirq
CPU1:  0.2% usr  0.0% sys  0.0% nic 87.9% idle  0.0% io  0.0% irq 11.8% sirq
Load average: 0.00 0.01 0.05 1/68 32614

Т.е. - аппаратные прерывания занимают менее 0.1% процессорного времени, а всяческие правила файрвола и т.п. - порядка 10-12%.

Link to post
Share on other sites

Дело не в мощности, вот спустя два с половиной часа все стало на свои места.

25% загрузки ядра сетевухой/шейпером/файрволом - "стало на свои места"?

Вот к примеру загрузка проца (2-головый феном 550) одного из бордюров, через который гуляет 500 мбит в каждую из сторон:

 

Mem: 358500K used, 1716300K free, 0K shrd, 0K buff, 45492K cached
CPU0:  0.0% usr  0.0% sys  0.0% nic 89.3% idle  0.0% io  0.0% irq 10.6% sirq
CPU1:  0.2% usr  0.0% sys  0.0% nic 87.9% idle  0.0% io  0.0% irq 11.8% sirq
Load average: 0.00 0.01 0.05 1/68 32614

Т.е. - аппаратные прерывания занимают менее 0.1% процессорного времени, а всяческие правила файрвола и т.п. - порядка 10-12%.

У меня старенький атлончик.

Link to post
Share on other sites

И что, что старенький?

Вот к прмиеру старый атлон 3600+, на тазике с пптп (сотня туннелей, сейчас порядка 70-80 мбит траффика, шейпер на вход и на исход на ifb на ~10000 классов, ессно с хешами), сетевуха - какой-то марвелл:

Mem: 423868K used, 546616K free, 0K shrd, 0K buff, 54676K cached
CPU0:  0.1% usr  0.3% sys  0.0% nic 92.2% idle  0.0% io  0.0% irq  7.1% sirq
CPU1:  0.7% usr  0.1% sys  0.0% nic 99.0% idle  0.0% io  0.0% irq  0.0% sirq
Load average: 0.00 0.01 0.05 1/267 1774

А ваша загрузка при таком траффике более характерна для очень старой машины. Или для криво настроеного тазика.

Link to post
Share on other sites

Хрустальный шар подсказывает, что ваша проблема как раз в том, что внезапно нагрузка возрастает всего в 3-3.5 раза (пример: клиент запускает uTorrent, который начинает сыпать мелкими пакетами, или у клиента начинает активно шуршать червь/спамбот), и из-за этого ваша система мгновенно скукоживается - по причине кривой конфигурации файрвола/шейпера к примеру. Или же, если цепочки линейные, то же может случиться, когда клиент, которому соответствует последнее правило цепочки, начинает активно качать/раздавать.

Так ли это или нет - вам виднее, pps интерфейсов озвучить вам религия не позволяет, провести ревизию правил файрвола/шейпера (или что там в softirq еще в бзде падает) - тоже.

Link to post
Share on other sites
  • 1 month later...

Правила.

 

${f} add 50 allow tcp from any to me 22

${f} add 51 allow tcp from me 22 to any

 

${f} add 100 allow ip from any to any via lo0

${f} add 110 deny ip from 127.0.0.0/8 to any

${f} add 120 skipto 1000 ip from me to any

${f} add 130 deny icmp from any to any in icmptype 5,9,13,14,15,16,17

${f} add 150 nat 10 ip from any to ${natip} in via ${ifOut}

${f} add 160 skipto 2000 ip from any to me

 

${f} add 200 skipto 500 ip from any to any via ${ifOut}

 

${f} add 350 skipto 4500 ip from any to any in

 

${f} add 450 tee 2 ip from any to any

${f} add 490 allow ip from any to any

 

${f} add 500 skipto 32500 ip from any to any in

${f} add 510 tee 1 ip from any to any

${f} add 520 nat 10 ip from 10.0.0.0/8 to any

${f} add 540 allow ip from any to any

 

Количество пакетов момент загрузки процессора уменьшаются в два раза.

Может кто то за денежку решит проблему?

 

Заметил что проблема начинается когда начинают качать определенный клиенты.

Link to post
Share on other sites

Количество пакетов идет 50-60к. Количество потоков примерно 20к. Трафик 100 мегабит.

Как только начинает качать один из клиентов, количистево пакетов и потоков уменьшается в два раза, канал проседает до 30 мегабит. Загрузка cpu с 20% поднимается до 100%.

Как понять что делает этот клиент, количество пакетов то не увеличивается. Да и потоков от него в этот момент идет всего то 400-500.

Link to post
Share on other sites

А нет, не проблема.

Написал на скорую руку, что бы приват не сыпали.

Несколько вирусных клиентов+торренты.

Пока подрезали количество соединений, ждем денег от начальства на что то типа i7.

Всем спасибо.

PS. Что странно, две Intel GT справлялись с трафиком лучше чем EM двух головая.

Link to post
Share on other sites

В любом случае, никто не собирает сервера которые могут работать только при нагрузке в 30% и виснут при 100%. Проблема скорее всего в нестабильном железе, которое для начала нужно попробовать поменять на такое же.

Link to post
Share on other sites

В любом случае, никто не собирает сервера которые могут работать только при нагрузке в 30% и виснут при 100%. Проблема скорее всего в нестабильном железе, которое для начала нужно попробовать поменять на такое же.

Согласен, тоже не очень верится что нагрузка с 10-20% может прыгать до 100.

Менять на такое же нет смысла, так не хочется менять бу на бу, лучше уж новый купить, и несколько лет быть уверенным.

Link to post
Share on other sites
  • 2 weeks later...

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
  • Recently Browsing   0 members

    No registered users viewing this page.

×
×
  • Create New...