Jump to content

Stargazer Вылетает из процессов


Recommended Posts

Дело "примерно" в связке user - traffcounter - capturer. Может быть. Так как мы так и не нашли причину, почему может портиться ссылка на локально создаваемый обьект (или почему может портиться сам этот обьект). Я, конечно-же, имею в виду мьютекс юзера.

Основная проблема в том что мы не можем повторить падение у себя. Так что будем благодарны если вы найдете решение.

Link to post
Share on other sites
  • Replies 135
  • Created
  • Last Reply

Top Posters In This Topic

Основная проблема в том что мы не можем повторить падение у себя.

а какие скоростя вы гоняете через него ? пустите мегабит 10 на пару дней и я думаю глюк не застваит себя ждать....

Link to post
Share on other sites
а какие скоростя вы гоняете через него ? пустите мегабит 10 на пару дней и я думаю глюк не застваит себя ждать....

10 маловато, у меня при 15 стабильно работает уже пятые сутки.

думаю нада от 50 начинать.

Link to post
Share on other sites
10 маловато, у меня при 15 стабильно работает уже пятые сутки.

думаю нада от 50 начинать.

 

У меня вообще 2 Мбита. Так эта зараза начала вылетать с коркой уже почти каждый день. Раньше - раз в 3 дня, а ещё раньше - ни разу. Так что может ширина канала тут и ни при чём. Равно как и нагрузка. Вылетал и утром и ночью было. Но преимущественно утром, часов в 10, когда и народу не особо сидит - менее 10 человек, и скриптов никаких особо не крутится. Кроме скрипта простого копирования базы СТГ (каждые 3 часа).

 

И кстати, я вспомнил: вылеты начались после того, как я ввёл безлимитные пакеты и файлы логов юзеров возросли в несколько раз (ранее вся папка users весила в пределах 3МБ, сейчас где-то 30МБ).

Link to post
Share on other sites
У меня вообще 2 Мбита. Так эта зараза начала вылетать с коркой уже почти каждый день. Раньше - раз в 3 дня, а ещё раньше - ни разу. Так что может ширина канала тут и ни при чём. Равно как и нагрузка. Вылетал и утром и ночью было. Но преимущественно утром, часов в 10, когда и народу не особо сидит - менее 10 человек, и скриптов никаких особо не крутится. Кроме скрипта простого копирования базы СТГ (каждые 3 часа).

 

И кстати, я вспомнил: вылеты начались после того, как я ввёл безлимитные пакеты и файлы логов юзеров возросли в несколько раз (ранее вся папка users весила в пределах 3МБ, сейчас где-то 30МБ).

Попобуй эту сборку она на мускуле.

Работает нормально уже 5 суток.

И главное, там можно отключить детальную статистику. Без нее вроде стабильнее.

Link to post
Share on other sites
10 маловато, у меня при 15 стабильно работает уже пятые сутки.

думаю нада от 50 начинать.

У нас не так, а так как я описал выше!

Link to post
Share on other sites

Тестирование проводим с помощью cap_debug, т.к. мы не являемся провайдером. Генерируем трафик более 100 Мбит.

Возможно, проблемы появляются при определенных видах трафика. Например при активном использовании p2p.

Что более странно - у местного провайдера stg работает стабильно (cap_nf, radius, store_files), в т.ч. и на безлимитных тарифах и при нагруженности порядка 4000 юзеров на сервер.

Именно это я называю невозможностью воспроизведения ошибки.

Link to post
Share on other sites

сколько пакетов в секнду генерил cap_debug?

я понимаю нужны для выполнения всех условий нужен inetaccess_debug который будет подключать/отключать указонное кол-во пользователей случайным образом. т.к падение происходит именно при отключении случайного пользователя.

и почему то я не уверен что дело в связке user - traffcounter - capturer.

 

Так как мы так и не нашли причину, почему может портиться ссылка на локально создаваемый обьект (или почему может портиться сам этот обьект). Я, конечно-же, имею в виду мьютекс юзера.

распишите поподробней что происходит при падении.

Link to post
Share on other sites
2madf версия стг какая ?

Естественно, stg-2.405.9.8. У меня сейчас просто нет времени заниматься чужими разработками...

Link to post
Share on other sites
сколько пакетов в секнду генерил cap_debug?

я понимаю нужны для выполнения всех условий нужен inetaccess_debug который будет подключать/отключать указонное кол-во пользователей случайным образом. т.к падение происходит именно при отключении случайного пользователя.

и почему то я не уверен что дело в связке user - traffcounter - capturer.

 

 

распишите поподробней что происходит при падении.

Точных цифр сейчас уже не приведу.

Тестировали, так-же, и по inetacces - с помощью консольного авторизатора, случайными переконнектами. На форуме где-то даже есть скрин этого дела... Боря постил.

Если бы я знал что происходит при падении - я бы исправил уже, наверное ;) Бектрейсы выше в теме.

Link to post
Share on other sites

Консольный авторизатор только под 1 логином и с 1 ip, даже если под несколькими, то это не 4000 хаотично подкл./откл юзеров у каждого из которых есть свой вход. и исход. трафик.

Link to post
Share on other sites

Новая версия позволяет запускать несколько авторизаторов с одной машины. Проблему с IP решали алиасами. Тестировали на 600-800 рандомно переподключающихся "юзерах".

Link to post
Share on other sites

тут сейчас выяснилось что совершенно голый stg-2.405.9.8 падает у троих. с модулями mysql-store и file-store. + падает у меня на 2-х серверах

ос CentOS, Gentoo, FreeBSD 7 и 5.5

причина падений одна. не понимаю как работает на нем оператор с 4К юзеров, может можно получить тот код и сравинить что не так ?

или хотя бы узнать условия работы - OS, насторойки, используемые модули, опции компиляции, может еще что.

Link to post
Share on other sites
Новая версия позволяет запускать несколько авторизаторов с одной машины. Проблему с IP решали алиасами. Тестировали на 600-800 рандомно переподключающихся "юзерах".

Это 600-800 алиасов ? жесть, и всетаки что то тут не то.

Link to post
Share on other sites

что требуется для повтора глюка? могу выдать полный доступ к серваку, где данный глюк переодически повторяется.....

Link to post
Share on other sites
Сложно найти глюк, если его невозможно повторить.

он с легкость повторится на реально рабочем серваке, а не на эмуляторе! :)

Link to post
Share on other sites
он с легкость повторится на реально рабочем серваке, а не на эмуляторе! ;)

Видимо, не с легкостью. По крайней мере от местного прова жалоб не поступало...

Своего сервака нет.

Link to post
Share on other sites
что требуется для повтора глюка? могу выдать полный доступ к серваку, где данный глюк переодически повторяется.....

Можно попробовать. Свяжись со мной по почте (faust@stg.dp.ua) или через Jabber (JID: madf@jabber.kiev.ua)

Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
  • Recently Browsing   0 members

    No registered users viewing this page.

  • Similar Content

    • By camchatix
      Привіт!
       
      Є багато запитів, щоб інтернет не виключався у північ, а скажімо в день (сигналізації, камери під охороною і тд)
      При щоденній абонплаті - як знімати гроші не у 12:00 у північ, а наприклад у 11 годин дня ?
    • By ppv
      Після оновлення до 1.5.1 не відображаються сигнали на
      OLT BDCOM P3310B (Device version10.1.0B)

      та
      P3608-2TE (Firmware Version10.1.0E). 

      3310C та P3608B ніяких проблем немає, знімає все добре. 
      З GPON3600-8 все зрозуміло будуть виправлення в Ubilling: 1.5.2.
       
      Може в когось було щось подібне? Хочу знати куди копати.
    • By ppv
      Потрібно було витерти одну мережу, всі абоненти з неї були перенесені в іншу. Але світить що 6 IP зайняті, хоча вона повністю вільна.
       
      ID    Мережа/CID           RВсього IP        Використано IP ▾           Вільно IPСервіс
      6      172.16.70.0/23        506                    6                                       500
       
      Підкажіть як правильно це підчистити щоб видалити мережу.
    • By ppv
      Проглянув FAQ і Ubilling Wiki. Зацікавило питання чи є в Ubilling якась реалізація reCAPTCHA, чи потрібно додавати руцями, (для прикладу для форми подачі заявок чи для кабінету користувача)?
       
    • By ppv
      Доброго дня, не працює примусовий опит OLT. Якщо оновлювати дані для даного ОЛТ то все норм. Була версія білінгу 1.3.3, вчора оновив до 1.3.6 нічого не змінилось.
      Чи може я щось пропустив в оновленях що треба було доналаштувати? Підкажіть будь ласка, хочу знати на що звернути увагу.
      Через крон теж не згрібає сигнали, хоча бачу регламенти проходять. Олт BDCOM різного типу.
      До білінгу давно не дивився, незнаю точно коли проблема появилась.

×
×
  • Create New...