Перейти до

FreeBSD-13 для Ubilling. Проблемы с OS


Рекомендованные сообщения

Прошу помощи. 

Проблема такая: стоит тестовая сборка FreeBSD 13 для Ubilling. Спустя некоторое время, месяца 2-3 (не замерял время) зацокал винчестер. Компьютер стоит на рабочем столе, потому сразу обратил внимание, но значение не придал, т.к. комп старый, HDD ноутбучный тоже не первой свежести. В принципе, на работу не влияет, просто цокает винчестер головками и все. Тут подвернулся сервер IBM 3680 с аппаратным RAID и прочими радостями. Установил на него FreeBSD-13, Ubilling и продолжил тестить дальше, но спустя примерно 1 месяц сервер стал зависать с ошибкой системных дисков на RAID контроллере. И тут мне кажется проявляется закономерность - один и тот же образ на двух разных сборках - глючит HDD. 

Вопрос: как определить виновника проблемы? Интернет в части диагностики ведет только к FDISK и подобным. В моем кругу знакомых нет ни одного, кто б так глубоко закапывался в BSD системы. 

P.S. Система ставилась чистая, на нее ставился Ubilling, больше ни какие программы не ставились. Сейчас на том же железе стоит Ubuntu, работает без сбоев, но я устал ломать голову в попытках настроить Ubilling, т.к. авторы все настройки приводят к FreeBSD и работает ли данные рекомендации в Ubuntu не всегда ясно.

Ссылка на сообщение
Поделиться на других сайтах

В смысле системный диск. В первом случае он один HDD 2,5, а в случае сервера системный диск образован из двух дисков по 73 G, объединенных в RAID-1.

Ссылка на сообщение
Поделиться на других сайтах

Хочу пояснить: тестовая сборка - это компьютер, а не какой-то левый дистрибутив FreeBSD. Образ использую оригинальный, FreeBSD-13.0-RELEASE-amd64. Не думаю, что проблема системная, а то бы ее давно пофиксили, скорее всего что-то можно подстроить для конкретных применений. Какие логи можно посмотреть, может какие программы есть для мониторинга состояния системы?

Ссылка на сообщение
Поделиться на других сайтах

Это всё из-за несчастливого числа "13". Как вариант, можете попробовать Ubilling на debian, он пока что имеет версию "11".

Ссылка на сообщение
Поделиться на других сайтах
20 минут назад, KaYot сказал:

Которым лет по 15.

Согласен. Но, райд массив... и что бы все одновременно посыпались... Кстати, когда сервер отдавали, клялись-божились, что он новый лежал на складе, ни разу не работал. Охотно верю, потому, что в нем внутри ни пылинки. Правда, батарейка в RAID контроллере дохлая, но, думаю, она не должна влиять. 

Ссылка на сообщение
Поделиться на других сайтах
5 часов назад, Andy_K. сказал:

Согласен. Но, райд массив... и что бы все одновременно посыпались... Кстати, когда сервер отдавали, клялись-божились, что он новый лежал на складе, ни разу не работал. Охотно верю, потому, что в нем внутри ни пылинки. Правда, батарейка в RAID контроллере дохлая, но, думаю, она не должна влиять. 

а Вы купите один HDD только новый и без райдов и массивов поставьте.
и будет Вам ubilling верой и правдой лета долги ....

Ссылка на сообщение
Поделиться на других сайтах
1 минуту назад, RockManX сказал:

~300-500грн ssd на 60гиг и ничего не будет цокать

Дело не в цоканье. Цокает винт - значит дергает головками - какая-то программа заставляет их это делать - т.е. ошибка в какой-то программе, либо что-то не настроено. В случае с сервером - тормозить начинает случайно - может день отработать, а может и месяц, потом начинает тормозить и в конце концов зависает, на системных дисках горят светодиоды с восклицательным знаком, а после перезагрузки все снова работает. При чем, на старом тестовом компе до установки FreeBSD-13 крутилась Ubuntu-14, работала несколько лет в круглосуточном режиме и ни намека на неисправность hdd. Я и значения не придавал этому, списывая на усталость ЖД, но после первого зависания сервера с той же версией ОС задумался.

Ссылка на сообщение
Поделиться на других сайтах
35 минут назад, Andy_K. сказал:

Дело не в цоканье. Цокает винт - значит дергает головками - какая-то программа заставляет их это делать - т.е. ошибка в какой-то программе, либо что-то не настроено

Ну тут так прям совсем гонишь. Цокает головками HDD в одном случае - когда на нем появился битый сектор и он его пытается прочитать, повторяя попытку несколько десятков или сотен раз раз. В этот момент ОС впадает в ступор т.к. ждёт данные. Ну и если битый сектор в критичном месте - система может и повиснуть упав в панику.

Меняй диски срочно, могу пару ссд серверных на 100гб отправить недорого.

  • Like 1
Ссылка на сообщение
Поделиться на других сайтах

Не путайте писюн с пальцем. Цокает головками это когда каждое перемещение головок сопровождается характерным щелчком, был у меня когдато давно такой диск, кроме неприятных звуков проблем не было, работал без проблем не один год. А вот когда битые сектора на серводорожке от чего сбивается позиционирование и головка едет назад на нулевую дорожку появляется совсем другой звук, это уже похоже не на цокание а работу пилы когда головка туда-сюда ездит.

Ссылка на сообщение
Поделиться на других сайтах
27 минут назад, KaYot сказал:

Ну тут так прям совсем гонишь.

Возможно. Не совсем понимаю физику процесса, но установленный на то же железо Линукс работает без сбоев, а стоит установить FreeBSD и все начинается по новой.

Ссылка на сообщение
Поделиться на других сайтах

Хочу еще немного пояснить свои действия: на одно и то же железо сервера я ставил FreeBSD, потом, столкнувшись с зависанием я поставил Линукс, но с ним я замучился с настройкой Ubillinga. Потом, прикинув, что возможно просто звезды в тот момент не сошлись, я снова ставил FreeBSD и снова сталкивался с зависанием. Если тестовый простой комп стоит под ухом и я его постоянно слышу, то сервер кулерами воет так, что его пришлось вынести в другой кабинет и управлять им удаленно, потому изменения в звуке HDD я не слышу, но вижу как начинают зависать сессии по SSH. И вот это постоянное играние с установкой разных OS-ей привело к мысли, что я что-то не так делаю с FreeBSD.

Ссылка на сообщение
Поделиться на других сайтах
  • 4 weeks later...
В 17.01.2022 в 17:22, ssh911 сказал:

Если система на ZFS можно попробовать vfs.zfs.cache_flush_disable=1

Это не оно. У сабжа походу просто не отключены sendmail и логирование апача. А они таки нагружают HDD, особенно если он WD. Ну Вы поняли...

 

В 21.12.2021 в 11:29, KaYot сказал:

Ну так это первый признак отвала диска.

Это да, но... НО, даже с таким "первым признаком" некоторые винты умудряются работать годами, да! Только не WD, опять же...

Ссылка на сообщение
Поделиться на других сайтах

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Вхід

Уже зарегистрированы? Войдите здесь.

Войти сейчас
  • Зараз на сторінці   0 користувачів

    Немає користувачів, що переглядають цю сторінку.

  • Схожий контент

    • Від mac
      Глюк в тому, що один (так - тільки один) mac адрес onu існує в білінгу у вигляді строки. Це трохи заважає.
      olt - bdcom gepon.
      Наскільки зрозумів, це виключно проблема реалізації snmpwalk у freebsd, де snmpwalk може на свій розсуд віддати mac адресу не як hex-string, а як звичайний string.
      Можливо snmpwalk тригериться на якомусь символі, мені невідомо.
       
      # tcpdump -vv -i em0 udp port 161 and host olt and host ub | grep "3320.101.10.4.1.1.241 ... olt.snmp > ub.47940: [udp sum ok] { SNMPv2c C="*****" { GetResponse(44) R=93278354 E:3320.101.10.4.1.1.241="8LO"W*" } } ub.47940 > olt.snmp: [udp sum ok] { SNMPv2c C="*****" { GetNextRequest(34) R=93278355 E:3320.101.10.4.1.1.241 } } snmpwalk -c***** -v2c -t5 olt .1.3.6.1.4.1.3320.101.10.4.1.1 SNMPv2-SMI::enterprises.3320.101.10.4.1.1.241 = STRING: "8LO\"W*" snmpwalk -Ox -c***** -v2c -t5 olt .1.3.6.1.4.1.3320.101.10.4.1.1 SNMPv2-SMI::enterprises.3320.101.10.4.1.1.241 = Hex-STRING: 38 4C 4F 22 57 2A  
      Це стосується таких параметрів у snmp конфізі bdcom
       
      [signal] MACINDEX=".1.3.6.1.4.1.3320.101.10.4.1.1" [misc] ONUINDEX=".1.3.6.1.4.1.3320.101.11.1.1.3"  
      За для усунення глюку спробував трошки змінити код і завдати тип snmp параметру явно у ./api/libs/api.ponbdcom.php у function collect()
      Це працює. Мабуть станеться у нагоді:
       
      # diff api.ponbdcom.php{.new,.bak} 37c37 < $onuIndex = $this->snmp->walk('-Ox ' . $oltIp . ':' . self::SNMPPORT, $oltCommunity, $onuIndexOid, self::SNMPCACHE); --- > $onuIndex = $this->snmp->walk($oltIp . ':' . self::SNMPPORT, $oltCommunity, $onuIndexOid, self::SNMPCACHE); 91c91 < $macIndex = $this->snmp->walk('-Ox ' . $oltIp . ':' . self::SNMPPORT, $oltCommunity, $macIndexOID, self::SNMPCACHE); --- > $macIndex = $this->snmp->walk($oltIp . ':' . self::SNMPPORT, $oltCommunity, $macIndexOID, self::SNMPCACHE);  
      P.S. Створив тему, а зараз міркую: а може це глюк у ПЗ olt. Оновлю фірмваре olt та перевірю...
       

    • Від Plastilin
      Вітаю. Маю наступний комплект. Ubilling на Debian + Mikrotik CHR як маршрутизатор. Наче все запустилось, але виникло питання яке не вдається розрулити. Читав Wiki, ковиряв, читав знову Wiki, знову ковиряв - не допомогло.
      Чи можливо якось визначити конкретну IP адресу з пулу який видає Mikrotik клієнту через Radius? Мені пропонує обрати наступну вільну адресу з пулу при спробі зміни адреси?
      З цього з'являється додаткове питання, чи можливо контролювати доступ користувачам у яких IP назначений статично, тобто прописаний вручну? Наприклад при зміні статусу не активний - пхати до Firewall Mikrotik правила заборони доступу з IP адреси визначеної вручну, навіть якщо вона не отримана по DHCP.
       
      UPD: з першою частиною знайшов: IP_CUSTOM=1 в alter.ini 
    • Від ppv
      Потрібно було витерти одну мережу, всі абоненти з неї були перенесені в іншу. Але світить що 6 IP зайняті, хоча вона повністю вільна.
       
      ID    Мережа/CID           RВсього IP        Використано IP ▾           Вільно IPСервіс
      6      172.16.70.0/23        506                    6                                       500
       
      Підкажіть як правильно це підчистити щоб видалити мережу.
    • Від a_n_h
      Всем доброго дня и мирного неба!
        После многочисленных экспериментов выяснил, что на последних версиях freebsd  максимум удавалось прокачать до 14 ГБт суммарно трафика со 100% загрузкой процессора. На том-же железе но с установленной freebsd 11.2 прокачивается до 20-ти ГБт суммарно тестового трафика с загрузкой процессора около 50%. 
        Подскажите, что можно убрать или наоборот добавить в систему с freebsd 13,3 для получения аналогичного результата...
    • Від sanyadnepr
      Приветствую всех.
      Подскажите пожалуйста где копнуть и нет ли проблемы со стороны протокола взаимодействия сити24 или возможно не учтена необходимая проверка в модуле сити24 в Ubilling, пока писал понял что похоже в проверке payID, но это не точно.  
      Недавно обнаружилось с сити24 начали прилетать дубликаты платежей, в целом платежей мало, два одинаковых запроса Pay с одинаковым transactionID и payID в одну секунду одному платежному ID при этом биллинг "думает" примерно чуть больше минуты и отвечает одним ответом <result>0</result>, сити24 утверждает что ответ они не получили и по протоколу дальше повторяет запросы дублем, биллинг ответ и так по кругу, сити24 спрашивает каким образом с одинаковым payID от сити24 билл продолжает обрабатывать запросы и пополнять абоненту счет раз в 5 минут примерно, на одну и туже сумму, ведь этот payID уже был обработан предполагают сити24 согласно протоколу.
      Конечно есть вопрос к сити24 зачем они дублем присылают два запроса, но они отвечают что эта ситуация учтена в протоколе и проблема на стороне биллинга, потому что он пополняет счет по уже обработанному одинаковому payID.
      При этом transactionID в дублях одинаковый, но с каждым новым дублем разный.
      Если зафаерволить запросы от сити24, но оставить возможность отвечать то после блокировки билл отправляет 2-3 минуты 6 ответов <account>0001</account>  <result>0</result>.
      После снятия блокировки, дубли и платежи нескольких проблемных абонентов прилетают так же по кругу, при этом и с некоторыми новыми пополнениями происходит аналогичная ситуация.
      В openpayz в платежах transactionID и не видно payID.
×
×
  • Створити нове...