Jump to content

Stargazer Вылетает из процессов


Recommended Posts

Вот уже много версий подряд происходит такое:

Вылетает из процессов stargazer, stg-exec - остается.

Имеем: все пользователи которые были в это время подключены - имееют халявный инет (ибо авторизатор крассный и биллинг не считает). Новые подключится не могут.

Сейчас весрия 405я стоит. В логах пусто (все нормально). Машина - Core 2 DUO; E4600; 2.4GHz; 2M cache; 800MHz. Онлайн до 60 чел.

Что делать ? как и что включить в логировании что бы отследить проблему ???

Link to post
Share on other sites
  • Replies 135
  • Created
  • Last Reply

Top Posters In This Topic

проверяй по крону на живность.

это ликвидация последствий, тут я бы порекомендовал причину искать... включить дебаг, если возможно...

Link to post
Share on other sites

А из разработчиков никто ничего не посоветует ?

З.Ы. не поделитесь скриптами на крон, чего и как проверять ? Кстати как часто можно проверять ?

Link to post
Share on other sites
А из разработчиков никто ничего не посоветует ?

З.Ы. не поделитесь скриптами на крон, чего и как проверять ? Кстати как часто можно проверять ?

А тебе все правильно сказали - искать причину. Включить дебаг, поймать корку, получить бектрейс...

Link to post
Share on other sites
  • 4 weeks later...

Привет всем. Сразу признаюсь - в этом деле не шарю. ;)

СТГ 2.4.01, FreeBSD 6.2

Пытаюсь поднять СТГ при вылете из процессов - автоматом. Собрал скрипт из примеров на форуме (честно содрал):

 

#!/bin/sh

 

case "$1" in

 

# Vyborka iz processov

 

NUM='ps ax | grep stargazer | grep -v grep | wc -l'

 

if [ $NUM -lt 1 ]

then

 

# Esli ne nayden - restart

 

pid=$(ps -ax|grep stargazer|grep -v grep | awk '{print $1}')

kill ${pid} > /dev/null 2>&1

echo "Stop Billing Server..."

sleep 2

/usr/sbin/stargazer

echo "Starting Billing Server..."

sleep 1

 

fi

 

Ругается на "if [ $NUM -lt 1 ]" - говорит "syntax error: "if" unexpected" (expecting ")")

Почему?

 

И кстати, такая вот ситуация:

СТГ вылетел, правила остались - чел продолжает халявно юзать Инет.

СТГ рестартанул, но правила остались. Опять халява.

Если вместе с рестартом сбрасывать правила - юзвери это почувствуют. Неудобство.

Как с этим бороться?

Link to post
Share on other sites
Если вместе с рестартом сбрасывать правила - юзвери это почувствуют. Неудобство.

Как с этим бороться?

А что если после рестарта стг сервера и файрволла посылать пользакам сообщения в инетаццесс мол, просьба всем передернуть подключение - "профилактика" )).

Link to post
Share on other sites

Да просто хотелось бы, чтобы проходило это как можно более незаметно для юзверей.

Так что там по поводу автоподнятия СТГ (см. мой пост выше)?

Link to post
Share on other sites
А что если после рестарта стг сервера и файрволла посылать пользакам сообщения в инетаццесс мол, просьба всем передернуть подключение - "профилактика" )).

если профилактика будет каждые 5 часов, то юзеры охренеют от таковой)

Link to post
Share on other sites
...

Ругается на "if [ $NUM -lt 1 ]" - говорит "syntax error: "if" unexpected" (expecting ")")

Почему?

...

 

Там, во-первых, апострофы должны быть, а не одинарные кавычки (проверь).

Во-вторых посмотри что там у тебя в NUM попадает.

Link to post
Share on other sites
Там, во-первых, апострофы должны быть, а не одинарные кавычки (проверь).

Во-вторых посмотри что там у тебя в NUM попадает.

 

Ставил то и другое. Ничего не меняется.

Не могу глянуть что туда попадает, т.к. при попытке перенаправления значения в файл ($NUM >> file) - ругается на "word unexpected". Какая-то непонятная заковыка с этим $NUM. :/

 

Насколько я знаю - если в винде убить авторизатор, то через некоторое время СТГ удаляет allow-правила на этот комп.

Странно, что он не делает того же самого после своего рестарта, когда не видит авторизатора на конкретной машине. Или делает?

Link to post
Share on other sites

как и было - вылетает из процесов.

Но в данный момент обнаружил, что старгейзер - мертв

stg-exec - жив.

Старгейзер умер с ..........

stargazer[479]: segfault at 00001f5c eip b7f7b100 esp b5c5bdbc error 4

 

Мож это что-то дает? Корок немерянно есть.

Link to post
Share on other sites
Ставил то и другое. Ничего не меняется.

Не могу глянуть что туда попадает, т.к. при попытке перенаправления значения в файл ($NUM >> file) - ругается на "word unexpected". Какая-то непонятная заковыка с этим $NUM. :/

 

Насколько я знаю - если в винде убить авторизатор, то через некоторое время СТГ удаляет allow-правила на этот комп.

Странно, что он не делает того же самого после своего рестарта, когда не видит авторизатора на конкретной машине. Или делает?

Зачем в файл? Выведи в stdout.

Правилами занимается не Stargazer а скрипты.

Link to post
Share on other sites
как и было - вылетает из процесов.

Но в данный момент обнаружил, что старгейзер - мертв

stg-exec - жив.

Старгейзер умер с ..........

stargazer[479]: segfault at 00001f5c eip b7f7b100 esp b5c5bdbc error 4

 

Мож это что-то дает? Корок немерянно есть.

Какая версия?

Link to post
Share on other sites

madf, спасибо, заработало. Сделал так:

 

#!/bin/sh

 

# Vyborka iz processov

 

NUM='ps ax | grep stargazer | grep -v grep | wc -l'

 

if [ $NUM -le 1 ]

then

 

# Esli ne nayden - restart

 

pid=$(ps -ax|grep stargazer|grep -v grep | awk '{print $1}')

kill ${pid} > /dev/null 2>&1

echo "Stop Billing Server..."

sleep 2

/usr/sbin/stargazer

echo "Starting Billing Server..."

sleep 1

 

fi

 

Так же загляните сюда, кому интересно.

Link to post
Share on other sites
Какая версия?

2.4.405 за последнею неделю насобирал 60 корок. :lol:

Сегодня случился еще один принеприятный глюк:

Абонплата снимается 1го числа в 00:00.

Старгейзер снял абонплату, и в 00:01 отвалился, в итоге новые stat файлы на винт не записал.

Откатил время назад, снял абонплату и глюк повторился. В 00:01 старгейзер опять умер.

Link to post
Share on other sites

Зашли мне на faust@stg.dp.ua бинари (stargazer, библиотеки и модули), одну корку и лог. Посмотрим...

Данные храниш в мускуле?

Link to post
Share on other sites

завалялось. вот только корок нет.

Старые версии падали точно также регулярно, разве что 2007.01.20 относительно стабильно работала. Хотя тоже падения были, но не по 10 раз в день.

Link to post
Share on other sites

Я имею в виду - может старгейзер пользует старые модули или старые библиотеки при работе. Это может быть причиной очень нестабильной работы.

Link to post
Share on other sites

Короче, ничего я не увидел по твоим коркам. Система все-таки другая...

Предлагаю следующее:

- собрать в режиме отладки;

- запустить, указав путь к модулям ./modules и установив LD_LIBRARY_PATH=../../lib

- получить корку;

- запустить gdb ./stargazer;

- (gdb) core-file <имя_файла_с_коркой>;

- (gdb) bt;

 

И показать что оно выдаст.

Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
  • Recently Browsing   0 members

    No registered users viewing this page.

  • Similar Content

    • By ppv
      Після оновлення до 1.5.1 не відображаються сигнали на
      OLT BDCOM P3310B (Device version10.1.0B)

      та
      P3608-2TE (Firmware Version10.1.0E). 

      3310C та P3608B ніяких проблем немає, знімає все добре. 
      З GPON3600-8 все зрозуміло будуть виправлення в Ubilling: 1.5.2.
       
      Може в когось було щось подібне? Хочу знати куди копати.
    • By ppv
      Потрібно було витерти одну мережу, всі абоненти з неї були перенесені в іншу. Але світить що 6 IP зайняті, хоча вона повністю вільна.
       
      ID    Мережа/CID           RВсього IP        Використано IP ▾           Вільно IPСервіс
      6      172.16.70.0/23        506                    6                                       500
       
      Підкажіть як правильно це підчистити щоб видалити мережу.
    • By ppv
      Проглянув FAQ і Ubilling Wiki. Зацікавило питання чи є в Ubilling якась реалізація reCAPTCHA, чи потрібно додавати руцями, (для прикладу для форми подачі заявок чи для кабінету користувача)?
       
    • By ppv
      Доброго дня, не працює примусовий опит OLT. Якщо оновлювати дані для даного ОЛТ то все норм. Була версія білінгу 1.3.3, вчора оновив до 1.3.6 нічого не змінилось.
      Чи може я щось пропустив в оновленях що треба було доналаштувати? Підкажіть будь ласка, хочу знати на що звернути увагу.
      Через крон теж не згрібає сигнали, хоча бачу регламенти проходять. Олт BDCOM різного типу.
      До білінгу давно не дивився, незнаю точно коли проблема появилась.
    • By ppv
      Цікаво а чи реально, реалізація кучаген, тип підключення pppoe, nas на різних іп. Але якщо брати з одного пулу іп абонентам. Розумію що збочена реалізація але цікаво все ж).

×
×
  • Create New...