Jump to content

Яку систему моніторингу мережі ви використовуєте?


Recommended Posts

Обновили сервер, поставили FreeBSD 9, 64 бит. Все работает нормально, но рвет графики и ростут процессы, кто подскажет где смотреть?

Те графики, что снимаются с сервера отображаются норм.

post-14719-0-93955600-1352840909_thumb.pngpost-14719-0-80098600-1352840923_thumb.png

Link to post
Share on other sites
  • Replies 74
  • Created
  • Last Reply

Top Posters In This Topic

Top Posters In This Topic

Popular Posts

ну ви точно не вмієте його готувати. Zabbix чудово працює з SNMP. І графіки нормальні.

Именно так)

Posted Images

но рвет графики и ростут процессы, кто подскажет где смотреть?

Ога, давайте угадаю - там где дырки должны были быть цифры больше 140-170Мбит/с? ;)

Link to post
Share on other sites

Хорошая темка. Использую Кактус.

Кстати вот и вопрос - раз уже в теме спецы собрались.

ПОчему может "рвать график" кактуса ?

Один график снимает показания по трафу с сетевушки аплинка, второй уже после сервера прямо со свитча.

Оба снимают по SNMP v2.

Со свитча снимает 32-бит, с сетевухи - 64-бит (менял на 32-бит. - все равно "рвет")

Графики прилагаю.

Система Ubuntu 10.04 Сервер.post-11063-001218200 1290240833_thumb.pngpost-11063-082284100 1290240842_thumb.png

 

Была такая проблема, Смотри нагрузку на винт. Пока не поставили SSD была такая хрень

Link to post
Share on other sites
но рвет графики и ростут процессы, кто подскажет где смотреть?

Ога, давайте угадаю - там где дырки должны были быть цифры больше 140-170Мбит/с? ;)

Именно так)

  • Haha 1
Link to post
Share on other sites
Именно так)

То-то смотрю распространенные дырки в графичках :)

 

У вас банально переполняются каунтеры. Если снимаете по snmp с FreeBSD - следует пересобрать net-snmp с включенной опцией WITH_MFD_REWRITES.

Также следует удалить все графички и датасорцы для текущего хоста и пересоздать их как In/Out Bits (64-bit counters). Тупое переключение не помогает.

Link to post
Share on other sites
Именно так)

То-то смотрю распространенные дырки в графичках :)

 

У вас банально переполняются каунтеры. Если снимаете по snmp с FreeBSD - следует пересобрать net-snmp с включенной опцией WITH_MFD_REWRITES.

Также следует удалить все графички и датасорцы для текущего хоста и пересоздать их как In/Out Bits (64-bit counters). Тупое переключение не помогает.

суть в том что счетчики изначально были 64битные, зависает поллер cacti и видимо из-за этого рвутся графики

Link to post
Share on other sites
суть в том что счетчики изначально были 64битны

net-snmp пересобрали? Полагаю, что нет.

То, что cacti полагает, что оно получит данные в нормальном виде - еще ничего не означает. Каунтеры snmpd перепоняться от этого не перестанут.

 

Просвещайтесь:

 

Starting with net-snmp 5.2 there's a new IF-MIB implementation that covers much more MIB objects (e.g. ifXTable with 64-bit ifHC* counters) than the old instrumentation.

 

http://www.net-snmp..../IF-MIB_rewrite

Link to post
Share on other sites
суть в том что счетчики изначально были 64битны

net-snmp пересобрали? Полагаю, что нет.

То, что cacti полагает, что оно получит данные в нормальном виде - еще ничего не означает. Каунтеры snmpd перепоняться от этого не перестанут.

 

Просвещайтесь:

 

Starting with net-snmp 5.2 there's a new IF-MIB implementation that covers much more MIB objects (e.g. ifXTable with 64-bit ifHC* counters) than the old instrumentation.

 

http://www.net-snmp..../IF-MIB_rewrite

Счетчик не при чем, поллер виснет

 

42003 ?? Ds 0:00.06 /usr/local/bin/php /usr/local/share/cacti/poller.php

44725 ?? Ds 0:00.20 /usr/local/bin/php /usr/local/share/cacti/poller.php

44949 ?? Ds 0:00.17 /usr/local/bin/php /usr/local/share/cacti/poller.php

46280 ?? Ds 0:00.14 /usr/local/bin/php /usr/local/share/cacti/poller.php

48944 ?? Ds 0:00.14 /usr/local/bin/php /usr/local/share/cacti/poller.php

52799 ?? Ds 0:00.06 /usr/local/bin/php /usr/local/share/cacti/poller.php

53443 ?? Ds 0:00.16 /usr/local/bin/php /usr/local/share/cacti/poller.php

 

 

http://i48.fastpic.ru/big/2012/1115/39/e4bda47720f515e86d1a4ff5fa785f39.jpg

Link to post
Share on other sites

Ну потыкайте "Rebuild Poller Cache" да и смотрите себе в tail -F log/cacti.log чем оно давиться при опросе.

Повисание поллера я видел только два раза, когда пытался увеличивать частоту опроса меньше чем раз в 5 минут, и когда колбаснулся самопальный скрипт мониторинга температуры опрашиваемый тем же поллером.

Link to post
Share on other sites

Ну потыкайте "Rebuild Poller Cache" да и смотрите себе в tail -F log/cacti.log чем оно давиться при опросе.

Повисание поллера я видел только два раза, когда пытался увеличивать частоту опроса меньше чем раз в 5 минут, и когда колбаснулся самопальный скрипт мониторинга температуры опрашиваемый тем же поллером.

 

Тыкал смотрел, ошибок ни каких нет. Зависают процессы и все.

post-14719-0-43015800-1353182776_thumb.png

post-14719-0-53823700-1353182791_thumb.png

post-14719-0-18408700-1353182804_thumb.png

Link to post
Share on other sites
  • 2 weeks later...

Исторически так сложилось, что используем Zabbix. Система всем хороша, но без тюнинга базы проживет не долго.

После настройки mysql на работу с партициями жить становится легче.

Link to post
Share on other sites

А можно не мучатся и сразу поставить PostgreSQL

Нет. Любая СУБД требует ухода и присмотра. А особенно PostgreSQL.

Да достаточно уже хотя бы того что в стандартной поставке она не рассчитана на сколько-нибуть большие объемы данных и сколько-нибуть существенную нагрузку. Об этом сами авторы пишут.

Link to post
Share on other sites

Смотря конечно что мониторить.

У нас например на виртуалке с 2Г оперативы крутятся 2 python скрипта, которые по snmp ежеминутно стягивают примерно 65000 параметров и там-же apache + еще 3 скрипта картинки рисуют....

 

zabbix сдох в такой конфигурации виртуалки примерно на 12000 параметрах (еще и железки буквально ДОСил по snmp), кактус долго мучали с созданием собственных темплейтов - забили...

Но тут специфика - тольк snmp...

Link to post
Share on other sites

Смотря конечно что мониторить.

У нас например на виртуалке с 2Г оперативы крутятся 2 python скрипта, которые по snmp ежеминутно стягивают примерно 65000 параметров и там-же apache + еще 3 скрипта картинки рисуют....

 

zabbix сдох в такой конфигурации виртуалки примерно на 12000 параметрах (еще и железки буквально ДОСил по snmp), кактус долго мучали с созданием собственных темплейтов - забили...

Но тут специфика - тольк snmp...

 

А чего это он досил? это Вы сами и досили, значения частоты опроса настраивали?

 

Скрипты это всё конечно хорошо, но когда есть какая-то инфраструктура ИТ нужны права доступа, разграничения, общий каталог авторизации и т.д. Сами писать скриптами будете долго и нудно )))

 

ЗЫ: единственный минус заббикса, это возня с нагрузкой на БД и переодически зависания/глюки пулеров. остальное особенно в версии 2.0 шикарно при условии бесплатного использования.

Link to post
Share on other sites

Смотря конечно что мониторить.

У нас например на виртуалке с 2Г оперативы крутятся 2 python скрипта, которые по snmp ежеминутно стягивают примерно 65000 параметров и там-же apache + еще 3 скрипта картинки рисуют....

 

zabbix сдох в такой конфигурации виртуалки примерно на 12000 параметрах (еще и железки буквально ДОСил по snmp), кактус долго мучали с созданием собственных темплейтов - забили...

Но тут специфика - тольк snmp...

 

А чего это он досил? это Вы сами и досили, значения частоты опроса настраивали?

 

Скрипты это всё конечно хорошо, но когда есть какая-то инфраструктура ИТ нужны права доступа, разграничения, общий каталог авторизации и т.д. Сами писать скриптами будете долго и нудно )))

 

ЗЫ: единственный минус заббикса, это возня с нагрузкой на БД и переодически зависания/глюки пулеров. остальное особенно в версии 2.0 шикарно при условии бесплатного использования.

 

железка на 700 портов и 15 параметров с каждого порта каждые 60 секунд.... вот и ДОСил он её.

и базу данных насиловал немилосердно...

 

Авторизация и протчая решается другим путем, для этого скрипты отдельные не нужны, а учитывая что управление всем этим производится из 2-х текстовых конфигов на сервере (т.е. web - только для просмотра, никакого мышиного управления)...

При нашем подходе - все 15 параметров считываются одним запросом и в rrd заливаются тоже одним запросом, а у кактуса насколько я понял каждый параметр - отдельный файлик в ФС.

 

Наша система узкоспециализированная - научить её чему-то другому кроме как читать 3 вагона параметров по snmp сложно :)

Link to post
Share on other sites

Ось нарив в інтернеті хороші відгуки про Zabbix - хтось таким користується, які враження?

Я пользуюсь. Система - громадный прожорливый монстр, зато умеет практически всё)

Link to post
Share on other sites

А можно не мучатся и сразу поставить PostgreSQL

Даже для постгреса нужно делать сегментацию.

Не обязательно. Иногда достаточно вдумчивой настройки.

Link to post
Share on other sites
  • 8 years later...

Всем бодрого и морозного дня! Одно время использовал КАКТУС, но чет не задалось, перешел на Забикс, в принципе с моей топологией и моими железками которых не много на предприятии, вполне устраивает. Единственное, что не получилось побороть в забиксе так это наименование интерфейсов, пытался что-то менять в шаблонах но увы, чет все через ж@. Снимал с сервера Dell R710 по snmp, возможно кто-то поборол, но мне не удалось, был бы благодарен за правильное направление или подсказку.

 

Что самое интересное, искал шаблон под сервант R710, сколько не перепробовал, но так получить температуру, напряжение, скорость винтелей у меня не получилось, возможно не было MIB полного или кривизна самого шаблона.  

Edited by Yalta2007
Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
  • Recently Browsing   0 members

    No registered users viewing this page.


×
×
  • Create New...