Jump to content

Странное поведение D-Link DGS-3120-24SC


Recommended Posts

Мы, к сожалению, иногда сталкиваемся с жалобами на нестабильную работу sfp-модулей, поскольку наше оборудование относится к эконом-сегменту, и многие провайдеры хотят "экономить" по полной - дополнительно к нашим коммутаторам покупают самые дешевые модули (например, Larex).

 

Пару дней назад нам прислали несколько sfp-модулей TKO на 3km, с которыми в наших коммутаторах ApplyNet наблюдаются такие же точно проблемы, как описывает автор этой темы - внезапно перестает ходить трафик на порту, причем линк на коммутаторе есть, MAC-адрес клиента на коммутаторе видно, а вот на стороне клиента трафика нет, иногда линк на стороне клиента есть, а иногда нет. Если отключить-включить порт или вытащить-вставить модуль или перезагрузить коммутатор - все начинает работать. Причем такая ситуация наблюдается именно в 100-мбитных портах, в 1000-мбитных проблемы ни разу не наблюдалось.

 

Провели тестирование. Выяснили, что проблема связана с тем, что в модуле внезапно меняется уровень излучаемого сигнала. Например, когда все работает, уровень излучаемой мощности -4.8dBm, когда трафик перестает ходить - мощность резко уменьшается и становится -8.5dBm. Скорее всего, "уходит" частота лазера в sfp-модуле. При этом модуль продолжает принимать пакеты от клиента, а отправить ничего не может. Поэтому и линк на стороне коммутатора есть, MAC-адрес клиента видно, а вот клиент ничего получить не может.

Поделитесь секретом, какие такие модули у вас давят -4.8 дбм. тут блин медики 100 бм 20 км -7.5 дбм давят в лучшем случае...

Link to post
Share on other sites

Поделитесь секретом, какие такие модули у вас давят -4.8 дбм.

Пару дней назад нам прислали несколько sfp-модулей TKO на 3km

-4.8dBm - ничего удивительного в этом уровне нет. Вообще по паспорту модуль на 3км может давать уровень от -3dBm до -12dBm. На практике большинство 3 километровых модулей "давит" около -6-7dBm.

Хотя, например, один из тех модулей, про тестирование которых я писала в прошлом сообщении, "давит" -1.85dBm :)

Но суть не в мощности, суть проблемы, про которую пишет автор темы, в том, что "лазер уходит" и мощность резко уменьшается.

 

тут блин медики 100 бм 20 км -7.5 дбм давят в лучшем случае...

Слабоватые у Вас медиаконверторы. На 20 км уровень должен быть от -4dBm до -7dBm, в большинстве случаев около -5-6dBm

 

Тут на форуме где-то тема была по тестированию мощности sfp-модулей и медиаконверторов. Поищите...

Link to post
Share on other sites

3 км модули когда я интересовался излучают как правило в диапазоне -9.. -12 дБм. При чувствительности порядка -18дБм этого за глаза хватает на 3 км линк при нормальных сварках.

5 км модули (3K, например) от них мало чем отличались, разве что разброс уровней более кучный около -9дБм.

Link to post
Share on other sites

3 км модули когда я интересовался излучают как правило в диапазоне -9.. -12 дБм. При чувствительности порядка -18дБм....

http://local.com.ua/forum/topic/26103-уровень-tx-в-sfp-модулях/

 

Похоже, с 2011 года многое изменилось. Китайцы оптимизировали sfp-модули и привели их характеристики в соответствие с потребностями провайдеров Украины.Мощность -7dBm превратилась в -9dBm, чувствительность с -23dBm стала -18dBm.

Link to post
Share on other sites

По паспорту и даташиту чувствительность китайцы пишут почти всегда -20дБм, но на практике уже на -18дБм появляются проблемы весьма часто.

Edited by passer
Link to post
Share on other sites

 

 

Провели тестирование. Выяснили, что проблема связана с тем, что в модуле внезапно меняется уровень излучаемого сигнала. Например, когда все работает, уровень излучаемой мощности -4.8dBm, когда трафик перестает ходить - мощность резко уменьшается и становится -8.5dBm. Скорее всего, "уходит" частота лазера в sfp-модуле. При этом модуль продолжает принимать пакеты от клиента, а отправить ничего не может. Поэтому и линк на стороне коммутатора есть, MAC-адрес клиента видно, а вот клиент ничего получить не может.
 

 

Уходит частота?  Ну и что, пусть уходит, у нас же не DWDM,  фильтров нет, почему бы вдруг фотодиоду вздумалось прекратить работу. Ни уровень ни частота (в реальных пределах) на работу никак не может повлиять.

Ваше версия несостоятельна не только потому, что она, извините, безграмотна, но и потому что опровергается практически: програмное выключение и включение SFP немедленно возобновляет нормальную связь. 

За такое время ни частота ни уровень ни температура SFP  просто не успеют значимо измениться.  

Link to post
Share on other sites

Уходит частота?  Ну и что, пусть уходит, у нас же не DWDM,  фильтров нет, почему бы вдруг фотодиоду вздумалось прекратить работу. Ни уровень ни частота (в реальных пределах) на работу никак не может повлиять.

Не надо цеплятся к "частота уходит". Из за какого то параметра свич или медик (вероятно) не могут согласовать скорость соединения, возможно что-то еще, это очевидно из корректной работы на 1G линках.

Отмечу, что на гигабите похожих проблем не наблюдается (на различных SFP и тех же свичах у меня более 200 линков, некоторые имеют аптайм годами)

  

Ваше версия несостоятельна не только потому, что она, извините, безграмотна, но и потому что опровергается практически: програмное выключение и включение SFP немедленно возобновляет нормальную связь.  За такое время ни частота ни уровень ни температура SFP  просто не успеют значимо измениться.

Дело не во времени, а в инициализации соединения. Проведи эксперимент, потуши порт, и подними через некоторое время, линк поднялся, трафик ходит, костыль найден, осталось понять кто из участников линка виновен в падении  :P

Link to post
Share on other sites

 

 

Проведи эксперимент, потуши порт, и подними через некоторое время, линк поднялся, трафик ходит, костыль найден, осталось понять кто из участников линка виновен в падении 

 

Ставлю вместо SFP медик - всё работает, возвращаю в SFP - не работает. 

 

disable и сразу enable  (или переставить SFP в гнездо) - и чудо,  заработало!

Link to post
Share on other sites

Ну вот, похоже что "на лету" слетает согласование параметров линка. Повторная инициализация на некоторое время проблему решает. А вот почему так происходит...

Link to post
Share on other sites

 

У меня комутатор видит подъем и падение линка при перезагруке медика, но трафик не ходит.

 

Аналогично было, не могли понять в чем дело т.к. на коммутаторе линк Up, а на медике сообщают что Down. Это как раз тот случай где проблема начала появляться после замены SFP.

 

Исходя из этих данных, Длинк не пытается реинициализировать соединение, он это уже один раз сделал 100Mfull, соответственно медик пытается согласовать скорость линка, и вероятно получается duplex mismatch. 

Link to post
Share on other sites

 

 

Исходя из этих данных, Длинк не пытается реинициализировать соединение, он это уже один раз сделал 100Mfull, соответственно медик пытается согласовать скорость линка, и вероятно получается duplex mismatch. 

 

Почему же это не происходит постоянно? Сбой происходит довольно редко, один и тот же порт может "замёрзнуть" где-то раз в пол-года а то и реже. Но если уже "замёрз" - то до перезагрузки работать не будет ни в какую, хоть 100 раз перезагружай медик. 

Link to post
Share on other sites

 

 

Почему же это не происходит постоянно? Сбой происходит довольно редко, один и тот же порт может "замёрзнуть" где-то раз в пол-года а то и реже. Но если уже "замёрз" - то до перезагрузки работать не будет ни в какую, хоть 100 раз перезагружай медик. 

 

А вот тут интересно подергать "ту" сторону.  

Link to post
Share on other sites

 

 

А вот тут интересно подергать "ту" сторону.  

 

Пишу же, перезагрузка медика ситуацию не исправляет. Д-Линк видит падение и поднятие порта, и даже маки с о стороны медика.

 

Исправить можно лишь:

- переподнимая порт

- перевстявляя SFP

- перезагружая весь свитч.

 

всё остальное не действует.

Link to post
Share on other sites

А передергивание медика на живом линке приводит к зависанию? А передергивание патчкорда (медь, оптика) без выключения медика - приводит?

Link to post
Share on other sites
А передергивание медика на живом линке приводит к зависанию?

 

Да, с вероятностю  менее 1%. Т.е если медик перезагружать бесчисленное число раз, то трафик в конце-концов перестанет бегать. 

Работа не возобновиться, пока не перезагрузить порт свитча.

 

 

А передергивание патчкорда (медь, оптика) без выключения медика - приводит?

 

Возможно, но это надо хорошо поиздеваться, ибо, возможно, надо будет и 1000 раз пачкорд перезасунуть. 

 

 

Обычно проблема массово появляется после пропадания электричества у клиентов, либо после перезагрузки свитча.

 

Например:

 

- пропало электричество в районе - из 100 клиентов несколько лишились связи.

- Упал узел с пачкой д-линков - после возобновления питания почти всегда у одного или нескольких клиентов связь не появилась.

 

Приходится переподнимать порт руками.

Edited by andryas
Link to post
Share on other sites

 

Если отключить-включить порт или вытащить-вставить модуль или перезагрузить коммутатор - все начинает работать.

Ваше версия несостоятельна не только потому, что она, извините, безграмотна, но и потому что опровергается практически: програмное выключение и включение SFP немедленно возобновляет нормальную связь. 

За такое время ни частота ни уровень ни температура SFP  просто не успеют значимо измениться.

 

Читайте внимательнее - про температуру SFP-модуля или частоту излучения речь не идет. Речь идет о передаче полезного сигнала. Возможно, что в SFP-модуле происходит что-то, что начинает препятствовать передаче сигнала. Например возникает джиттер или заваливаются фронты.

Измерить это, к сожалению, возможно только на глазковой диаграмме. Либо, косвенно увидеть измерителем оптической мощности.

Link to post
Share on other sites

Тогда до полного решения скрипт наваять. Если порт в админ ап но оперейшн даун напр. дольше 10 минут то делаем ему дизейбл енейбл по snmp. Я когда-то именно так лечил одну тупую поделку.

Link to post
Share on other sites

 

 

У меня комутатор видит подъем и падение линка при перезагруке медика, но трафик не ходит.

 

Аналогично было, не могли понять в чем дело т.к. на коммутаторе линк Up, а на медике сообщают что Down. Это как раз тот случай где проблема начала появляться после замены SFP.

 

Исходя из этих данных, Длинк не пытается реинициализировать соединение, он это уже один раз сделал 100Mfull, соответственно медик пытается согласовать скорость линка, и вероятно получается duplex mismatch.

 

А вот тут интересно подергать "ту" сторону.

Скорее всего, это не проблема коммутатора и не проблема медиаконвертора. Если перезагрузить медиаконвертор или даже вообще вытащить-вставить патчкорд из проблемного SFP-модуля - то связь не восстанавливается. Коммутатор видит падение линка, скорее всего при подключении патчкорда пытается переинициализировать соединение - но проблему решает именно операция с SFP-модулем.
Link to post
Share on other sites
  • 3 years later...

Апну тему если еще для когото актуальная. Вообщем решили проблему с тем что трафика на порту нет, а линк есть (перезагрузка свитча, дергание сфп модулей помогала частично) отключением DDM на портах. Отключили и проблем не знаем, это же касается и новых ревизий 3200-28F где есть уже поддержка DDM (для сравнения брали 3200-28F и 3120 старых ревизий, с ними проблем не наблюдалось, там DDM нет)

Link to post
Share on other sites
В 22.09.2018 в 08:55, idakrgm сказал:

Пепепрошивка так же не давала результата?

Отправлено с моего PRA-LA1 через Tapatalk
 

Не прошивали, так как перечитав кучу постов на форумах результата смены прошивки к нулю приближались. После отключения DDM на портах проблема ушла,в данный момент аптайм свитча 56 дней и отвалов портов нет. До отключения приходилось свитч дергать несколько раз в день

Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
  • Recently Browsing   0 members

    No registered users viewing this page.

×
×
  • Create New...