Maxaon 1 Опубліковано: 2011-05-05 21:58:54 Share Опубліковано: 2011-05-05 21:58:54 Пробую установить впервые Версия Stg v. 2.407 тренируюсь на кошках, ставлю в виртуальной машине на свежеустановленный и обновленный Debian Squeeze После доустановки нужных компонентов сервер собрался и установился нормально (build я перед этим не правил) пытаюсь запустить: устанавливал и пытался запускать рутом. В чем может быть причина, почему не видится файл конфигурации? А вы делали симлинк из conf-available.d в conf-enabled.d на модуль хранения? Ссылка на сообщение Поделиться на других сайтах
axl72 12 Опубліковано: 2011-05-06 08:06:42 Share Опубліковано: 2011-05-06 08:06:42 А вы делали симлинк из conf-available.d в conf-enabled.d на модуль хранения? нет конечно, я ведь делал все по инструкции, сначала раздел "2.2 Запуск сервера", а до раздела "3 Настройка системы" я еще не дошел Спасибо. Ссылка на сообщение Поделиться на других сайтах
Balu75 0 Опубліковано: 2011-10-18 13:44:56 Share Опубліковано: 2011-10-18 13:44:56 FreeBSD 8.2-p2, установлен Stargazer stg-2.407-p1. Периодически в конфигураторе выскакивает сообщение "Recv header answer error", а у пользователей inetaccess загорается красным и не реконнектится. Файлы монитора продолжают писаться. При попытке зайти телнетом на config порт соединение сбрасывается. В лог ничего военного не пишет. Что можно с этим сделать и какая статистика необходима по проблеме ? 2011-10-18 16:28:09 -- Stg v. 2.407-p1 2011-10-18 16:28:09 -- Message queue created successfully. msgKey=5555 msgID=524288 2011-10-18 16:28:09 -- Timer thread started successfully. 2011-10-18 16:28:09 -- Storage plugin: mysql_store v.0.67. Loading successfull. 2011-10-18 16:28:10 -- Users started successfully. 2011-10-18 16:28:10 -- Traffcounter started successfully. 2011-10-18 16:28:10 -- Module: 'bpf_cap v.1.0'. Start successfull. 2011-10-18 16:28:10 -- Module: 'InetAccess authorization plugin v.1.4'. Start successfull. 2011-10-18 16:28:33 -- Module: 'Always Online authorizator v.1.0'. Start successfull. 2011-10-18 16:28:33 -- Module: 'Pinger v.1.01'. Start successfull. 2011-10-18 16:28:33 -- Module: 'Stargazer RPC v. 0.2'. Start successfull. 2011-10-18 16:28:33 -- Module: 'Stg configurator v.0.08'. Start successfull. 2011-10-18 16:28:33 -- Stg started successfully. Ссылка на сообщение Поделиться на других сайтах
madf 279 Опубліковано: 2011-10-18 14:52:45 Share Опубліковано: 2011-10-18 14:52:45 Скорее всего решено в 2.408 Ссылка на сообщение Поделиться на других сайтах
Balu75 0 Опубліковано: 2011-10-19 10:53:51 Share Опубліковано: 2011-10-19 10:53:51 вытянул 2.408-rc2 и сегодня после очередного падения сегодня в срочном порядке поставил его. Итог: он даже не стартует полностью, виснет где-то в процессе авторизации пользователей с галочкой 'Always Online' Конфигуратор выдает ту же ошибку "Recv header answer error", авторизатор висит, у юзеров inetaccess горит красным. 2011-10-19 13:20:04 -- Stg v. 2.408-rc1 2011-10-19 13:20:04 -- Message queue created successfully. msgKey=5555 msgID=720896 2011-10-19 13:20:04 -- Timer thread started successfully. 2011-10-19 13:20:04 -- Storage plugin: mysql_store v.0.67. Loading successfull. 2011-10-19 13:20:05 -- Users started successfully. 2011-10-19 13:20:05 -- Traffcounter started successfully. 2011-10-19 13:20:05 -- Module: 'bpf_cap v.1.0'. Start successfull. 2011-10-19 13:20:05 -- Module: 'InetAccess authorization plugin v.1.4'. Start successfull. 2011-10-19 13:20:05 -- Module: 'Always Online authorizator v.1.0'. Start successfull. 2011-10-19 13:20:05 -- Module: 'Pinger v.1.01'. Start successfull. 2011-10-19 13:20:05 -- Module: 'Stargazer RPC v. 0.2'. Start successfull. 2011-10-19 13:20:05 -- Module: 'Stg configurator v.0.08'. Start successfull. 2011-10-19 13:20:05 -- Stg started successfully. 2011-10-19 13:20:05 -- +++++++++++++++++++++++++++++++++++++++++++++ после этого мы виснем, попытка корректного рестарта ни к чему не приводит, какой то из модулей не стопится, приходится убивать все по kill -9, запускаем снова и снова почти сразу виснем (через 3-5 секунд). После чего в спешке возвращаем старый 2.407, который запускается нормально и пока работает. вот кусок лога попытки останова 2.408-rc2 и последующий его рестарт, обращает на себя ошибка конфигуратора и полторы минуты его зависона перед тем как выдать ошибку 2011-10-19 13:21:47 -- +++++++++++++++++++++++++++++++++++++++++++++ 2011-10-19 13:21:48 -- Module: 'Stargazer RPC v. 0.2'. Stop successfull. 2011-10-19 13:23:08 -- Module 'Stg configurator v.0.08': Error: 2011-10-19 13:23:08 -- Module: 'Stg configurator v.0.08'. Stop successfull. 2011-10-19 13:24:34 -- Stg v. 2.408-rc1 2011-10-19 13:24:34 -- Message queue created successfully. msgKey=5555 msgID=786432 2011-10-19 13:24:34 -- Timer thread started successfully. 2011-10-19 13:24:34 -- Storage plugin: mysql_store v.0.67. Loading successfull. 2011-10-19 13:24:35 -- Users started successfully. 2011-10-19 13:24:35 -- Traffcounter started successfully. 2011-10-19 13:24:35 -- Module: 'bpf_cap v.1.0'. Start successfull. 2011-10-19 13:24:35 -- Module: 'InetAccess authorization plugin v.1.4'. Start successfull. 2011-10-19 13:24:35 -- Module: 'Always Online authorizator v.1.0'. Start successfull. 2011-10-19 13:24:35 -- Module: 'Pinger v.1.01'. Start successfull. 2011-10-19 13:24:35 -- Module: 'Stargazer RPC v. 0.2'. Start successfull. 2011-10-19 13:24:35 -- Module: 'Stg configurator v.0.08'. Start successfull. 2011-10-19 13:24:35 -- Stg started successfully. Ссылка на сообщение Поделиться на других сайтах
Balu75 0 Опубліковано: 2011-10-19 10:57:25 Share Опубліковано: 2011-10-19 10:57:25 (відредаговано) 2011-10-19 13:31:43 -- Stg v. 2.407 Відредаговано 2011-10-19 11:03:09 Balu75 Ссылка на сообщение Поделиться на других сайтах
madf 279 Опубліковано: 2011-10-19 11:39:57 Share Опубліковано: 2011-10-19 11:39:57 вытянул 2.408-rc2 и сегодня после очередного падения сегодня в срочном порядке поставил его. Итог: он даже не стартует полностью, виснет где-то в процессе авторизации пользователей с галочкой 'Always Online' Конфигуратор выдает ту же ошибку "Recv header answer error", авторизатор висит, у юзеров inetaccess горит красным. ... Занятно. 1. Есть ли уверенность в том что rc2 был корректно установлен? Что плагины, которые он подгружал, были именно его версии, а не остались от 2.407? 2. Есть ли возможность повторить это зависание и в момент зависания выполнить следующее: $ cat /var/run/stargazer.pid запомнить PID $ gdb /usr/sbin/stargazer (gdb) attach <PID> - тут указать запомненный PID (gdb) thread attch all bt вывод этой комманды сохранить и либо отправить мне по почте на faust@stg.dp.ua либо выложить на каком-нибуть pastebin. (gdb) detach (gdb) quit 3. Сколько примерно юзеров всего в базе и сколько из них имеют флаг alwaysOnline? Ссылка на сообщение Поделиться на других сайтах
Balu75 0 Опубліковано: 2011-10-19 11:57:57 Share Опубліковано: 2011-10-19 11:57:57 1. я собирал и ставил projects/stargazer, projects/sgconf, projects/sgconf_xml, в соответствии с инструкцией, остальное мною не используется. за последние несколько дней эту операцию я производил уже около десятка раз с разными версиями, всякий раз по крайней мере бинарники заменялись новыми версиями, насчет библиотек я не уверен на 100%, но сейчас все .so библиотеки от 2.407, а все .a - от 2.408-rc2 2. как только оно упадет, я соберу данные gdb c 2.407 и с 2.408 3. всего 728 юзеров, с always online - 270. Ссылка на сообщение Поделиться на других сайтах
DarkSpider 36 Опубліковано: 2011-10-19 13:07:00 Share Опубліковано: 2011-10-19 13:07:00 Я уже рапортовал о проблеме долго запуска СТГ. 2011-10-19 05:35:01 -- +++++++++++++++++++++++++++++++++++++++++++++ 2011-10-19 05:35:01 -- Module: 'Stg configurator v.0.08'. Stop successfull. 2011-10-19 05:35:02 -- Module: 'Pinger v.1.01'. Stop successfull. 2011-10-19 05:36:31 -- Stg v. 2.407-p1 2011-10-19 05:36:31 -- Message queue created successfully. msgKey=5555 msgID=163840 2011-10-19 05:36:31 -- Timer thread started successfully. 2011-10-19 05:36:31 -- Storage plugin: file_store v.1.04. Loading successfull. 2011-10-19 05:36:32 -- Users started successfully. 2011-10-19 05:36:32 -- Traffcounter started successfully. 2011-10-19 05:36:32 -- Module: 'Ether_cap v.1.2'. Start successfull. 2011-10-19 05:36:32 -- Module: 'InetAccess authorization plugin v.1.4'. Start successfull. 2011-10-19 05:38:59 -- Module: 'Always Online authorizator v.1.0'. Start successfull. 2011-10-19 05:39:03 -- Module: 'Pinger v.1.01'. Start successfull. 2011-10-19 05:39:03 -- Module: 'Stg configurator v.0.08'. Start successfull. 2011-10-19 05:39:03 -- Stg started successfully. 2011-10-19 05:39:03 -- +++++++++++++++++++++++++++++++++++++++++++++ Как видим запуск 2011-10-19 05:36:32 -- Module: 'InetAccess authorization plugin v.1.4'. Start successfull. 2011-10-19 05:38:59 -- Module: 'Always Online authorizator v.1.0'. Start successfull. Почти 2 минуты. База - файловая. Юзеров 1,5к всегда в онлайне около 70. Дебаг на продакшен сервере сделать не могу. При рестарте стг в новом авторизаторе (2.61-11.8) вылазит Dysconnect SYN. Авторизаторы подключаются в течении 5-ти минут после старта СТГ. Старые авторизаторы подключаются чуть быстрее. Ссылка на сообщение Поделиться на других сайтах
madf 279 Опубліковано: 2011-10-20 08:27:27 Share Опубліковано: 2011-10-20 08:27:27 1. я собирал и ставил projects/stargazer, projects/sgconf, projects/sgconf_xml, в соответствии с инструкцией, остальное мною не используется. за последние несколько дней эту операцию я производил уже около десятка раз с разными версиями, всякий раз по крайней мере бинарники заменялись новыми версиями, насчет библиотек я не уверен на 100%, но сейчас все .so библиотеки от 2.407, а все .a - от 2.408-rc2 ... В 2.408 больше не используются динамические библиотеки, по этому *.so остались от 2.407. МИеня больше интересуют файлы mod_*.so (которые плагины). Не получилось ли так что они остались от старой версии? Ссылка на сообщение Поделиться на других сайтах
madf 279 Опубліковано: 2011-10-20 08:28:47 Share Опубліковано: 2011-10-20 08:28:47 Я уже рапортовал о проблеме долго запуска СТГ. 2011-10-19 05:35:01 -- +++++++++++++++++++++++++++++++++++++++++++++ 2011-10-19 05:35:01 -- Module: 'Stg configurator v.0.08'. Stop successfull. 2011-10-19 05:35:02 -- Module: 'Pinger v.1.01'. Stop successfull. 2011-10-19 05:36:31 -- Stg v. 2.407-p1 2011-10-19 05:36:31 -- Message queue created successfully. msgKey=5555 msgID=163840 2011-10-19 05:36:31 -- Timer thread started successfully. 2011-10-19 05:36:31 -- Storage plugin: file_store v.1.04. Loading successfull. 2011-10-19 05:36:32 -- Users started successfully. 2011-10-19 05:36:32 -- Traffcounter started successfully. 2011-10-19 05:36:32 -- Module: 'Ether_cap v.1.2'. Start successfull. 2011-10-19 05:36:32 -- Module: 'InetAccess authorization plugin v.1.4'. Start successfull. 2011-10-19 05:38:59 -- Module: 'Always Online authorizator v.1.0'. Start successfull. 2011-10-19 05:39:03 -- Module: 'Pinger v.1.01'. Start successfull. 2011-10-19 05:39:03 -- Module: 'Stg configurator v.0.08'. Start successfull. 2011-10-19 05:39:03 -- Stg started successfully. 2011-10-19 05:39:03 -- +++++++++++++++++++++++++++++++++++++++++++++ Как видим запуск 2011-10-19 05:36:32 -- Module: 'InetAccess authorization plugin v.1.4'. Start successfull. 2011-10-19 05:38:59 -- Module: 'Always Online authorizator v.1.0'. Start successfull. Почти 2 минуты. База - файловая. Юзеров 1,5к всегда в онлайне около 70. Дебаг на продакшен сервере сделать не могу. При рестарте стг в новом авторизаторе (2.61-11.8) вылазит Dysconnect SYN. Авторизаторы подключаются в течении 5-ти минут после старта СТГ. Старые авторизаторы подключаются чуть быстрее. В 2.408 это тоже проявляется? Ссылка на сообщение Поделиться на других сайтах
Balu75 0 Опубліковано: 2011-10-20 14:26:39 Share Опубліковано: 2011-10-20 14:26:39 В 2.408 больше не используются динамические библиотеки, по этому *.so остались от 2.407. МИеня больше интересуют файлы mod_*.so (которые плагины). Не получилось ли так что они остались от старой версии? да нет, это очень врядли, во время инсталла они затираются новыми версиями, в любом случае теперь перед инсталлом я обязательно сделаю rm -f /usr/lib/stg/* пока жду, что оно упадет, пока не падает, 2.407-p1 падал где-то раз в сутки, сейчас крутится 2.407 Ссылка на сообщение Поделиться на других сайтах
DarkSpider 36 Опубліковано: 2011-10-20 14:28:42 Share Опубліковано: 2011-10-20 14:28:42 В 2.408 это тоже проявляется? 2.408 пока не ставил. Ссылка на сообщение Поделиться на других сайтах
madf 279 Опубліковано: 2011-10-21 08:57:33 Share Опубліковано: 2011-10-21 08:57:33 В 2.408 это тоже проявляется? 2.408 пока не ставил. В 2.408 существенно поменялся процесс авторизации. Может само исправилось... Ссылка на сообщение Поделиться на других сайтах
DarkSpider 36 Опубліковано: 2011-10-21 18:24:28 Share Опубліковано: 2011-10-21 18:24:28 2.407-p1 не падает работает нормально. Кроме вот такого небольшого бага при запуске больше не отловил. Ставить 2.408 пока нет желания. Возможно на него перейду вместе с Убиллингом после финала (: Ссылка на сообщение Поделиться на других сайтах
madf 279 Опубліковано: 2011-10-23 09:30:48 Share Опубліковано: 2011-10-23 09:30:48 Нет, ну так никуда не годится. Неужели негде смоделировать ситуацию? Хотя-бы на рабочей машине? Никто больше о таком не заявлял. Ссылка на сообщение Поделиться на других сайтах
DarkSpider 36 Опубліковано: 2011-10-24 06:29:13 Share Опубліковано: 2011-10-24 06:29:13 madf, маякнул тебе в jabber. Поднял виртуалку - могу дать полный доступ. Ссылка на сообщение Поделиться на других сайтах
madf 279 Опубліковано: 2011-10-24 07:14:45 Share Опубліковано: 2011-10-24 07:14:45 madf, маякнул тебе в jabber. Поднял виртуалку - могу дать полный доступ. В джаббере пусто Ссылка на сообщение Поделиться на других сайтах
Balu75 0 Опубліковано: 2011-10-25 18:08:04 Share Опубліковано: 2011-10-25 18:08:04 Прошу прощения за задержку с ответом, но до сегодняшнего дня выкладывать было нечего, 2.407 не падал. После общения с манагерами этой домосети выяснилось, что они научились прогнозировать его падения, в зависимости от своих действий в конфигураторе, те. например после заведения(изменения) юзера в определенном тарифе, и(или) с определенным набором опций, конфигуратор зависал, и вместе с ним зависал старгазер, причем последний зависал намертво и попытки подключиться к нему уже ни к чему уже не приводили. Причем завести юзера в другом тарифе и потом переключить на этот проблемный было вполне возможно. Прямо при мне это было продемонстрировано, 2.407 упал, и дамп был снят (http://pastebin.com/4zqdiqTB) После этого я снес все, что было в /usr/lib/stg, собрал и проинсталлил projects/stargazer из 2.408-rc2 projects/sgconf и projects/sgconf_xml я не трогал, и они остались от старого 2.407 В таком виде все запустилось и заработало, причем запустилось гораздо быстрее, чем 2.407, который обычно запускался больше минуты, этот секунды через 2 уже принимал соединения. Потом манагеры попробовали уложить его разными способами, но у них не получалось - конфигуратор либо выдавал ошибку "пользователь не был создан", либо падал с "invalid exception fault", либо отваливался от старгазера с "connection reset by peer", либо зависал сам по себе, но ни разу это не привело к падению или зависанию самого stg. Не знаю с чем это связано, то ли с тем, что я очистил /usr/lib/stg перед установкой нового stg, то ли с тем, что я использовал sgconf от старого релиза, но факт остается фактом, бектрейса упавшего 2.408-rc2 получить мне _пока_ не удалось, а в прошлую его установку он падал почти сразу.. сейчас работает 2.408-rc2, пока без нареканий. 2011-10-25 18:38:48 -- Stg v. 2.408-rc1 2011-10-25 18:38:48 -- Message queue created successfully. msgKey=5555 msgID=393216 2011-10-25 18:38:48 -- Timer thread started successfully. 2011-10-25 18:38:48 -- Storage plugin: mysql_store v.0.67. Loading successfull. 2011-10-25 18:38:49 -- Users started successfully. 2011-10-25 18:38:49 -- Traffcounter started successfully. 2011-10-25 18:38:49 -- Module: 'bpf_cap v.1.0'. Start successfull. 2011-10-25 18:38:49 -- Module: 'InetAccess authorization plugin v.1.4'. Start successfull. 2011-10-25 18:38:49 -- Module: 'Always Online authorizator v.1.0'. Start successfull. 2011-10-25 18:38:49 -- Module: 'Pinger v.1.01'. Start successfull. 2011-10-25 18:38:49 -- Module: 'Stargazer RPC v. 0.2'. Start successfull. 2011-10-25 18:38:49 -- Module: 'Stg configurator v.0.08'. Start successfull. 2011-10-25 18:38:49 -- Stg started successfully. 2011-10-25 18:38:49 -- +++++++++++++++++++++++++++++++++++++++++++++ Ссылка на сообщение Поделиться на других сайтах
Balu75 0 Опубліковано: 2011-11-11 16:12:05 Share Опубліковано: 2011-11-11 16:12:05 Доброго времени суток 2.408-rc2, простоял больше 2х недель, и вот снова начал падать, уже 2-й раз за 2 суток http://pastebin.com/SXy4996C какой-то кривой дамп с corrupt stack, это так и должно быть ? Ссылка на сообщение Поделиться на других сайтах
madf 279 Опубліковано: 2011-11-12 11:00:31 Share Опубліковано: 2011-11-12 11:00:31 Жесть какая. Судя по дампу, у вас обрушились одновременно аж 6 нитей с повреждением стека. У вас с hardware все в порядке? Память не битая, проц не перегревается? Ссылка на сообщение Поделиться на других сайтах
Balu75 0 Опубліковано: 2011-11-14 15:39:08 Share Опубліковано: 2011-11-14 15:39:08 Да нет, с железом там все в порядке, оно совсем новое, и выдержало стрестесты, после этого сервер даже не перегружался, его аптайм уже почти месяц, старгазер просто перестрелили и поехали дальше. Пока падать перестал. Ссылка на сообщение Поделиться на других сайтах
madf 279 Опубліковано: 2011-11-15 09:16:58 Share Опубліковано: 2011-11-15 09:16:58 Просто в представленных вами дампах вообще нет никакого смысла. Как будто все работало-работало, а потом бац - и перестало. Магическим образом. Я бы память все-таки проверил. Ссылка на сообщение Поделиться на других сайтах
madf 279 Опубліковано: 2011-11-15 09:24:05 Share Опубліковано: 2011-11-15 09:24:05 Вот взять, например, вот этот кусок стека: #9 0x080c9bbe in std::_Rb_tree<RAW_PACKET, std::pair<RAW_PACKET const, PACKET_EXTRA_DATA>, std::_Select1st<std::pair<RAW_PACKET const, PACKET_EXTRA_DATA> >, std::less<RAW_PACKET>, std::allocator<std::pair<RAW_PACKET const, PACKET_EXTRA_DATA> > >::_S_key () #10 0x28157b98 in pthread_mutex_getprioceiling () from /lib/libthr.so.3 #11 0x080a3583 in STG_LOCKER::STG_LOCKER () По нему выходит что конструктор класса STG_LOCKER (который только захватывает мьютекс) начинает вдруг заниматься разбором пакетов. В нем нет такого кода! Такое может произойти только если внутри вызова конструктора разрушается стек. Но внутри него происходят только вызовы функций из системной libpthread.so - а уж они-то точно не могут содержать ошибок, иначе весь сервер глючил бы. Есть, конечно, вариант, что сам вызов происходит при уже разрушенном стеке, но тогда непонятно кто его разрушает. TRAFFCOUNTER_IMPL::Process() что-ли? Патчи на код какие-нибуть накладывались? Ссылка на сообщение Поделиться на других сайтах
Balu75 0 Опубліковано: 2011-11-15 10:13:29 Share Опубліковано: 2011-11-15 10:13:29 нет, никаких патчей на код не было, мне самому непонятен этот дамп. Ссылка на сообщение Поделиться на других сайтах
Рекомендованные сообщения
Создайте аккаунт или войдите в него для комментирования
Вы должны быть пользователем, чтобы оставить комментарий
Создать аккаунт
Зарегистрируйтесь для получения аккаунта. Это просто!
Зарегистрировать аккаунтВхід
Уже зарегистрированы? Войдите здесь.
Войти сейчас