Jump to content

Проблема с LACP между FreeBSD и D-Link


Recommended Posts

Доброго здоровья!

Товарищи, подскажите может кто сталкивался с такой проблемой. Периодически происходит отвал LACP между сервером FreeBSD 12.1 и коммутатором D-Link DGS-3120-24TC

Когда происходит отвал, пропадает трафик на интерфейсах и в meesages пишет:


 

Цитата

 

Mar  1 19:45:41 BRAS kernel: igb1: Interface stopped DISTRIBUTING, possible flapping
Mar  1 19:45:44 BRAS kernel: igb0: Interface stopped DISTRIBUTING, possible flapping
Mar  1 19:47:49 BRAS kernel: igb0: Interface stopped DISTRIBUTING, possible flapping
Mar  1 19:48:18 BRAS kernel: igb1: Interface stopped DISTRIBUTING, possible flapping
Mar  1 19:49:25 BRAS kernel: igb0: Interface stopped DISTRIBUTING, possible flapping
Mar  1 19:51:00 BRAS kernel: igb0: Interface stopped DISTRIBUTING, possible flapping
Mar  1 19:51:21 BRAS kernel: igb1: Interface stopped DISTRIBUTING, possible flapping
Mar  1 19:53:49 BRAS kernel: igb1: Interface stopped DISTRIBUTING, possible flapping
Mar  1 19:55:22 BRAS kernel: igb0: Interface stopped DISTRIBUTING, possible flapping
Mar  1 19:55:32 BRAS kernel: igb0: Interface stopped DISTRIBUTING, possible flapping


 

 

Настройки на коммутаторе:


 

Цитата

 

DGS-3120-24TC:admin#show link_aggregation
Command: show link_aggregation

Link Aggregation Algorithm = IP-Source-Dest

Group ID      : 1
Type          : LACP
Master Port   : 1:1
Member Port   : 1:1-1:2
Active Port   : 1:1-1:2
Status        : Enabled
Flooding Port : 1:1
Trap          : Disabled

Group ID      : 2
Type          : LACP
Master Port   : 1:23
Member Port   : 1:23-1:24
Active Port   : 1:23-1:24
Status        : Enabled
Flooding Port : 1:23
Trap          : Disabled

Total Entries : 2

 

 

Настройки на FreeBSD:

 

Цитата

uname -a
FreeBSD BRAS 12.1-RELEASE FreeBSD 12.1-RELEASE r354233 GENERIC  amd64


 

Цитата

 

cat /etc/rc.conf
hostname="BRAS"

ifconfig_igb0="up -tso"
ifconfig_igb1="up -tso"

defaultrouter="195.5.153.X"

cloned_interfaces="vlan33 vlan101 vlan102 vlan500
vlan1001 vlan1002 vlan1003 vlan1004 lagg0"

create_args_lagg0="laggproto lacp laggport igb0 laggport igb1"
ifconfig_lagg0="up"

ifconfig_vlan33="vlan 33 vlandev lagg0 172.16.1.1/24"
ifconfig_vlan101="vlan 101 vlandev lagg0 10.1.0.1/24"
ifconfig_vlan102="vlan 102 vlandev lagg0 10.2.0.1/24"
ifconfig_vlan1001="vlan 1001 vlandev lagg0 10.0.1.1/24"
ifconfig_vlan1002="vlan 1002 vlandev lagg0 10.0.2.1/24"
ifconfig_vlan1003="vlan 1003 vlandev lagg0 10.0.3.1/24"
ifconfig_vlan1004="vlan 1004 vlandev lagg0 10.0.4.1/24"
ifconfig_vlan500="vlan 500 vlandev lagg0 45.15.2.X/30"

gateway_enable="YES"

 


 

Цитата

 

ifconfig igb0
igb0: flags=8943<UP,BROADCAST,RUNNING,PROMISC,SIMPLEX,MULTICAST> metric 0 mtu 1500
        options=e504bb<RXCSUM,TXCSUM,VLAN_MTU,VLAN_HWTAGGING,JUMBO_MTU,VLAN_HWCSUM,LRO,VLAN_HWFILTER,VLAN_HWTSO,RXCSUM_IPV6,TXCSUM_IPV6>
        ether 00:1b:21:45:da:ac
        media: Ethernet autoselect (1000baseT <full-duplex>)
        status: active
        nd6 options=29<PERFORMNUD,IFDISABLED,AUTO_LINKLOCAL>

ifconfig igb1
igb1: flags=8943<UP,BROADCAST,RUNNING,PROMISC,SIMPLEX,MULTICAST> metric 0 mtu 1500
        options=e504bb<RXCSUM,TXCSUM,VLAN_MTU,VLAN_HWTAGGING,JUMBO_MTU,VLAN_HWCSUM,LRO,VLAN_HWFILTER,VLAN_HWTSO,RXCSUM_IPV6,TXCSUM_IPV6>
        ether 00:1b:21:45:da:ac
        hwaddr 00:1b:21:45:da:ad
        media: Ethernet autoselect (1000baseT <full-duplex>)
        status: active
        nd6 options=29<PERFORMNUD,IFDISABLED,AUTO_LINKLOCAL>

ifconfig lagg0
lagg0: flags=8943<UP,BROADCAST,RUNNING,PROMISC,SIMPLEX,MULTICAST> metric 0 mtu 1500
        options=e504bb<RXCSUM,TXCSUM,VLAN_MTU,VLAN_HWTAGGING,JUMBO_MTU,VLAN_HWCSUM,LRO,VLAN_HWFILTER,VLAN_HWTSO,RXCSUM_IPV6,TXCSUM_IPV6>
        ether 00:1b:21:45:da:ac
        laggproto lacp lagghash l2,l3,l4
        laggport: igb0 flags=1c<ACTIVE,COLLECTING,DISTRIBUTING>
        laggport: igb1 flags=1c<ACTIVE,COLLECTING,DISTRIBUTING>
        groups: lagg
        media: Ethernet autoselect
        status: active
        nd6 options=29<PERFORMNUD,IFDISABLED,AUTO_LINKLOCAL>

 

 

Link to post
Share on other sites
Только что, rtrt сказал:

попробуйте за длинке порты зажать на одну скорость(100 или 1000), в вашем случае 1000

Т.е. вручную указать скорость на них? Думаете переходит на 100 Мбит? Тогда я думаю в логах увидел бы. 

Link to post
Share on other sites
5 минут назад, rtrt сказал:

да, указать непосредственно, у них частенько такое

Этого будет достаточно на мастер порте? 

config ports 1:1 speed 1000_full

Link to post
Share on other sites
51 минуту назад, NETOS сказал:

Этого будет достаточно на мастер порте? 

config ports 1:1 speed 1000_full

Болт там плавал. На каждом порту лага скорость прибивайте. 

Link to post
Share on other sites

Спасибо, завтра попробую. Может есть еще какие известные проблемы? Только на коммутаторе или на сервере что-то может не так быть? 

Link to post
Share on other sites
2 часа назад, NETOS сказал:

Спасибо, завтра попробую. Может есть еще какие известные проблемы? Только на коммутаторе или на сервере что-то может не так быть? 

На серваке тоже  в статику прибейте, и нетфлов проверьте на портах, нужно выключать, мне помогало но не с длинком а с екстримом. Все в статику.

Edited by maxx
Link to post
Share on other sites
20 минут назад, sanyadnepr сказал:

Покажи show lacp_port 

 

Command: show lacp_port


 Port     Activity

 -----    --------
 1:1      Passive
 1:2      Passive
 1:3      Passive
 1:4      Passive
 1:5      Passive
 1:6      Passive
 1:7      Passive
 1:8      Passive
 1:9      Passive
 1:10     Passive
 1:11     Passive
 1:12     Passive
 1:13     Passive
 1:14     Passive
 1:15     Passive
 1:16     Passive
 1:17     Passive
 1:18     Passive
 1:19     Passive
 1:20     Passive
 1:21     Passive
 1:22     Passive
 1:23     Passive
 1:24     Passive
 

Link to post
Share on other sites
1 час назад, sanyadnepr сказал:

Сделай актив и понаблюдай. Остальное что советовали выше не делай.

И тут я в ступоре, одни одно советуют другие другое. Проблема в том что может месяц работать, а может неделю, это не часто бывает. Если переведу а актив, линк не упадет? 

1 час назад, Dimkers сказал:

Вообще, если свич и сервак рядом и включены без свяких медиков - достаточно LAG.

Да они рядом, включены через медные патчи. Можно подробнее что значит достаточно LAG?

Link to post
Share on other sites
9 минут назад, NETOS сказал:

Да они рядом, включены через медные патчи. Можно подробнее что значит достаточно LAG?

Значит сделать статический LAGG, без LACP.

В таком виде у меня на длинке работали бондинги всю жизнь, без каких либо настроек.

  • Like 1
Link to post
Share on other sites
6 минут назад, KaYot сказал:

Значит сделать статический LAGG, без LACP.

В таком виде у меня на длинке работали бондинги всю жизнь, без каких либо настроек.

Вот так? 

create link_aggregation group_id 4 type static

Link to post
Share on other sites

Да, так. Вся разница в том, что LACP шлет LACPBPDU пакеты. Это полезно, когда к примеру сами линки построены через медиаконвертеры, что без сигналинга отвала опты. линк по опте рвется - а медик медным портом показывает что линк ОК, ну и свич шлет себе туда пакеты. А по сути линка нет. Для выхода из этой ситуации и стали слать проверочные LACPBPDU. Но в варианте, когда линк прямой - это излишество, которое еще и голову может неплохо проморочить в поисках проблемы.

  • Like 2
Link to post
Share on other sites

Были карусели. 

Проверьте состояние Лан портов на Длинке когда произойдет проблема ( они будут 1 гиге или 100тке? ) 

у меня когда была проблема с лагами, выяснилось что это дрочь была из-за патчкорда ( заменил на другой и все заработало)

Edited by Земеля
Link to post
Share on other sites
2 часа назад, Dimkers сказал:

Но в варианте, когда линк прямой - это излишество, которое еще и голову может неплохо проморочить в поисках проблемы.

Когда LAG собирается на много портов на двухволоконных модулях, LACP позволяет избежать полулинков или перепутанных rx патчей у соседних модулей. Многие свитчи тогда и говорят: "хазяина, тама линка имееца, но шо-то не то и в лаг я яво покудава не пущу! suspended пущай будет" ☺️

Edited by passer
  • Like 1
Link to post
Share on other sites
4 часа назад, passer сказал:

Когда LAG собирается на много портов на двухволоконных модулях

да на любых модулях. полулинки и на одноволоконках случаются. заломилось волокно - и, о чудо, на одной длине волны затухание выросло больше, чем на другой, итог - линк с одной стороны есть, с другой - нет. еще хуавеи с ддм ведут себя специфично, гася линк с одной стороны если внезапно им что-то не понравилось.

 

с медью - тут попроще конечно, полулинков не припомню, разве что какой-то патчкорд раздолбается (но там обычно начинаются ошибки задолго до того) либо воткнут патчкорд не туда...

Link to post
Share on other sites
18 часов назад, passer сказал:

LACP позволяет избежать полулинков или перепутанных rx патчей у соседних модулей

Это тоже да. Именно того я и написал про "прямые линки", имелось ввиду - безо всяких вот таких выепонов, когда порт АП, а по сути линка нет :)

А вот с тем же ЛАСПом встречается бида, когда LACPBPDU, например, шлется тупо в VID=1 и баста.

Edited by Dimkers
Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
  • Recently Browsing   0 members

    No registered users viewing this page.

  • Similar Content

    • By Tormato
      Всем привет,
      Скорее не вопрос как починить а узнать сталкивались ли с подобным.
      Модель особенного значения не имеет но ряд из 4100.
      Периодически, но конечно редко, виска просто перестаёт видеть lacp и линка переходят в режим suspended.
      Лечится ребутом edge core.
      Кто нибудь имел возможность оттебажить данную проблему?
    • By ISK
      Добрый день, уважаемые форумчане.
      Возник нетривиальный вопрос. Имеется 2 10G линка к сети одного клиента. Предложил объединить их в LACP чтобы получить 20, но админ клиента утверждает, что LACP на их микроте CCR1036 до путя работать не будет. Правда это, или ...деж? Сам с таким не работал, поэтому спрашиваю мнение окружающих.
    • By Jumpjet
      Посоветуйте РоЕ свич для домашнего использования, цена/качество, из требований - гигабитные порты (16-24, если не все, то большинство), РоЕ af/at и поддержка LACP
      Что можно посмотреть из такого?
    • By Darth Vader2
      Главные герои сюжета:
       
      1. WS-C3750G-24TS-1U  , SW Version 12.2(25)SED1
       
      2.
      VERSION : MA5600V800R013C00
      PATCH   : SPC101
      PRODUCT : MA5608T
       
      Задача в заголовке - LACP между CISCO и HUAWEI. Пока результат нулевой. Либо есть линк только со стороны  HUAWEI, либо есть линк с обеих сторон, на CISCO собирается etherchannel но обмена между устройствами нет. Ранее ни разу с подобной проблемой не сталкивался, взлетало сразу. А тут просидел несколько часов, перепробовал все возможные варианты - нет результата. Отдельно проверил каждый порт - всё исправно и работает, собрать LACP не получается.
       
      При этом LACP между CISCO и DLink, HUAWEI и DLINK взлетает без проблем. Хоть ставь между ними DLINK и запускай таким паровозиком. Требуется помощь сообщества, может кто сталкивался с подобной проблемой. Варианты настроек, наверное, предлагать не надо, всё пробовал - не работает. Нужна идейная мысль, к примеру замена прошивок на 100% рабочие и проверенные лично Вами в работе. Предположения и догадки тоже приветствуются.
       
      Спасибо.
    • By nedoinet
      Собственно сабж. Аплинк 10g, транзит во второй 10g и lacp из 4х портов в линуксовый такзик. Изначально lacp был на 3 порта. При трафике 1.6Г получаем возрастание latency, деградацию сервиса и упор в 1.8Г. После расширения лацпа до 4х портов ситуация не поменялась абсолютно. По 10г порту вопросов нет, льет трафик без проблем. Возможно у кого есть опыт с подобным мастодонтом. Или это пресловутая проблема маленького кеша? На сколько удалось выкурить - там 768кб на группу из 12 портов с непонятным разделением по портам.
       
×
×
  • Create New...