laffytaffy Posted February 18, 2011 Posted February 18, 2011 в течение дня падает NAS Feb 18 19:31:24 gw1 kernel: Fatal trap 12: page fault while in kernel mode Feb 18 19:31:24 gw1 kernel: cpuid = 0; apic id = 00 Feb 18 19:31:24 gw1 kernel: fault virtual address = 0x28 Feb 18 19:31:24 gw1 kernel: fault code = supervisor write data, page not present Feb 18 19:31:24 gw1 kernel: instruction pointer = 0x8:0xffffffff80af1057 Feb 18 19:31:24 gw1 kernel: stack pointer = 0x10:0xffffff803de8dae0 Feb 18 19:31:24 gw1 kernel: frame pointer = 0x10:0xffffff803de8db10 Feb 18 19:31:24 gw1 kernel: code segment = base 0x0, limit 0xfffff, type 0x1b Feb 18 19:31:24 gw1 kernel: = DPL 0, pres 1, long 1, def32 0, gran 1 Feb 18 19:31:24 gw1 kernel: processor eflags = interrupt enabled, resume, IOPL = 0 Feb 18 19:31:24 gw1 kernel: current process = 69 (dummynet) Feb 18 19:31:24 gw1 kernel: trap number = 12 Feb 18 19:31:24 gw1 kernel: panic: page fault Feb 18 19:31:24 gw1 kernel: cpuid = 0 Feb 18 19:31:24 gw1 kernel: Uptime: 1h59m20s Feb 18 19:31:24 gw1 kernel: Physical memory: 2036 MB 7.3-RELEASE CPU: Intel® Core2 Quad CPU Q9300 @ 2.50GHz igb0: <Intel® PRO/1000 Network Connection version - 1.9.5> есть идеи? в пике нагрузка до 400 мегабит pps input (igb0) output packets errs bytes packets errs bytes colls 27933 0 17549339 35141 0 36401589 0 28321 0 18768083 35124 0 35266157 0 29576 0 19515970 37557 0 38769149 0 30251 0 22880248 33325 0 32277713 0 31916 0 25776600 35261 0 33979802 0 33610 0 26394494 38084 0 36832471 0 30658 0 22516381 36474 0 35998845 0 29787 0 21185683 35442 0 35866656 0 28780 0 18422535 39178 0 40795963 0 30159 0 20578956 39864 0 40654908 0 30584 0 22770239 38367 0 38095561 0 28635 0 18549129 38947 0 40238189 0 периодичность ребута хаотичная, может раз в день, а может и раза три за час...
kvirtu Posted February 18, 2011 Posted February 18, 2011 Переходи на mpd+kernel nat - нагрузка на систему намного меньше
icecybe Posted February 18, 2011 Posted February 18, 2011 насколько понял надо обновлять ядро до 8-ой версий.
laffytaffy Posted February 18, 2011 Author Posted February 18, 2011 Переходи на mpd+kernel nat - нагрузка на систему намного меньше я не использую VPN, ip+mac ошибка через раз, то в дамминете, то в irq... и система в ребут
hellion Posted February 18, 2011 Posted February 18, 2011 У меня была похожая проблема с зависанием наса. На Вашем насе не стоит квага? У меня мпд5.4 на фрибсд 7,3 зависало по непонятным причинам. После обновление на фрю 8,1 и мпд5.5, мать серверная, сетвуха интел тоже, и проц ксеон, ната нету, и трафика тоже бывает до 400мбит. Полет нормальный без тюнинга. Обновил и забыл.
pavlabor Posted February 18, 2011 Posted February 18, 2011 Посмотри что предшествует падению. У меня подозрение что в 7.3 косяк с обработкой брадкастовых запросов, конкретно от левых ИП блоков на езернет уровне. При чем, брадкастовые арп опросы регистрировались часто, но не всегда машина падала. Но когда падала, то последние записи в логах фигурировали именно левые брадкасты. Кстати под нагрузкой, тоже в районе 400. Перешли на 8.2, все устаканилось.
laffytaffy Posted February 18, 2011 Author Posted February 18, 2011 У меня была похожая проблема с зависанием наса. На Вашем насе не стоит квага? стоит
laffytaffy Posted February 18, 2011 Author Posted February 18, 2011 Посмотри что предшествует падению. У меня подозрение что в 7.3 косяк с обработкой брадкастовых запросов, конкретно от левых ИП блоков на езернет уровне. При чем, брадкастовые арп опросы регистрировались часто, но не всегда машина падала. Но когда падала, то последние записи в логах фигурировали именно левые брадкасты. Кстати под нагрузкой, тоже в районе 400. Перешли на 8.2, все устаканилось. перед падением в логе только сообщение от dhcpd типа Feb 19 01:10:48 gw1 dhcpd: uid lease 10.10.1.248 for client 00:1d:60:20:08:92 is duplicate on 10.10/16 Feb 19 01:13:31 gw1 dhcpd: uid lease 10.10.1.205 for client 1c:bd:b9:b1:81:f3 is duplicate on 10.10/16 Feb 19 01:13:56 gw1 dhcpd: uid lease 10.10.1.249 for client 00:1b:fc:0a:e8:44 is duplicate on 10.10/16 Feb 19 01:15:19 gw1 dhcpd: uid lease 10.10.1.211 for client 00:13:77:65:c2:3f is duplicate on 10.10/16 Feb 19 01:15:48 gw1 dhcpd: uid lease 10.10.1.248 for client 00:1d:60:20:08:92 is duplicate on 10.10/16 Feb 19 01:18:31 gw1 dhcpd: uid lease 10.10.1.205 for client 1c:bd:b9:b1:81:f3 is duplicate on 10.10/16 Feb 19 01:18:57 gw1 dhcpd: uid lease 10.10.1.249 for client 00:1b:fc:0a:e8:44 is duplicate on 10.10/16 Feb 19 01:20:19 gw1 dhcpd: uid lease 10.10.1.211 for client 00:13:77:65:c2:3f is duplicate on 10.10/16 Feb 19 01:20:48 gw1 dhcpd: uid lease 10.10.1.248 for client 00:1d:60:20:08:92 is duplicate on 10.10/16 Feb 19 01:23:31 gw1 dhcpd: uid lease 10.10.1.205 for client 1c:bd:b9:b1:81:f3 is duplicate on 10.10/16
laffytaffy Posted February 18, 2011 Author Posted February 18, 2011 кстати, для проверки теории про дамминет, отключили вечером шейпер совсем, только нат, посмотрим с какой ошибкой упадет...
Neelix Posted February 19, 2011 Posted February 19, 2011 интернет говорит восновном про ipfw: ouch!, skip past end of rules, denying packet такое есть?
tech Posted February 19, 2011 Posted February 19, 2011 я не использую VPN, ip+mac Возможно ли ипользовать ip+mac без vpn на freeBSD + abills ?
kvirtu Posted February 19, 2011 Posted February 19, 2011 я не использую VPN, ip+mac Возможно ли ипользовать ip+mac без vpn на freeBSD + abills ? Легко, для привязки ip+mac использовать ipguard (интегрируется в abills). Ну а инет раздавать через ipfw.
hellion Posted February 19, 2011 Posted February 19, 2011 У меня была похожая проблема с зависанием наса. На Вашем насе не стоит квага? стоит это напряжно для сервера. а если два канала интеренета то вообще зависать будет. лучше разделить.
hellion Posted February 19, 2011 Posted February 19, 2011 я не использую VPN, ip+mac Возможно ли ипользовать ip+mac без vpn на freeBSD + abills ? Легко, для привязки ip+mac использовать ipguard (интегрируется в abills). Ну а инет раздавать через ipfw. можно на абилсе через ipn роздавать без vpn, как через ipfw pipe так и нг шейпер но тоже с ipfw. читайте на сайте абилса. http://abills.net.ua/wiki/doku.php/abills:docs:manual:ng_car
laffytaffy Posted February 19, 2011 Author Posted February 19, 2011 У меня была похожая проблема с зависанием наса. На Вашем насе не стоит квага? стоит это напряжно для сервера. а если два канала интеренета то вообще зависать будет. лучше разделить. так и есть, 2 канала, в одном "дефолт" в другом "Украина" и "пиринг", отрубили дамминет, ждем когда упадет с другой ошибкой, пока падений нет. В чем напряжность? Квага ресурсов почти не использует на общем фоне. интернет говорит восновном про ipfw: ouch!, skip past end of rules, denying packet такое есть? нет
adeep Posted February 19, 2011 Posted February 19, 2011 это напряжно для сервера. а если два канала интеренета то вообще зависать будет. лучше разделить. кто вам такую глупость сказал?
hellion Posted February 19, 2011 Posted February 19, 2011 это напряжно для сервера. а если два канала интеренета то вообще зависать будет. лучше разделить. кто вам такую глупость сказал? Оно то будет работать если работают каналы, а если упадет Украина, то все приведется ему перемаршрутизировать на дефаулт, при 100впн конектах все корректно будет, проверено, а при 500 впн интерфейсах мпд виснет и система тоже. Лично боролся с этой проблемой, вылечил установкой второго сервера и разделение мпд и бгп, и все сейчас как часы.
laffytaffy Posted February 19, 2011 Author Posted February 19, 2011 Оно то будет работать если работают каналы, а если упадет Украина, то все приведется ему перемаршрутизировать на дефаулт, при 100впн конектах все корректно будет, проверено, а при 500 впн интерфейсах мпд виснет и система тоже. Лично боролся с этой проблемой, вылечил установкой второго сервера и разделение мпд и бгп, и все сейчас как часы. возможно, но VPN не использую, об этом сразу и сказал...
imroot Posted February 19, 2011 Posted February 19, 2011 (edited) мне известно что 7.3 i386 и 7.3 amd64 немножечко разные и при обьемах от 120 мегабит трафика имеют место непонятные вылеты. Поставили amd64 всё как рукой сняло... возможно и Вам поможет ой и ещё свпомнил, как-то с оперативкай были траблы, fatal trap 12 давала Edited February 19, 2011 by imroot
laffytaffy Posted February 19, 2011 Author Posted February 19, 2011 мне известно что 7.3 i386 и 7.3 amd64 немножечко разные amd64 и стоит есть ребут за сутки после отключения дамминета Feb 19 20:25:37 gw1 kernel: Fatal trap 12: page fault while in kernel mode Feb 19 20:25:37 gw1 kernel: cpuid = 0; apic id = 00 Feb 19 20:25:37 gw1 kernel: fault virtual address = 0x0 Feb 19 20:25:37 gw1 kernel: fault code = supervisor read data, page not present Feb 19 20:25:37 gw1 kernel: instruction pointer = 0x8:0xffffffff80473d55 Feb 19 20:25:37 gw1 kernel: stack pointer = 0x10:0xffffff8000136920 Feb 19 20:25:37 gw1 kernel: frame pointer = 0x10:0xffffff0031cf8700 Feb 19 20:25:37 gw1 kernel: code segment = base 0x0, limit 0xfffff, type 0x1b Feb 19 20:25:37 gw1 kernel: = DPL 0, pres 1, long 1, def32 0, gran 1 Feb 19 20:25:37 gw1 kernel: processor eflags = interrupt enabled, resume, IOPL = 0 Feb 19 20:25:37 gw1 kernel: current process = 31 (igb0 que) Feb 19 20:25:37 gw1 kernel: trap number = 12 Feb 19 20:25:37 gw1 kernel: panic: page fault Feb 19 20:25:37 gw1 kernel: cpuid = 0 Feb 19 20:25:37 gw1 kernel: Uptime: 22h54m44s Feb 19 20:25:37 gw1 kernel: Physical memory: 2036 MB если еще раз упадет с такой же ошибкой попробуем обновить до 8.1
pavlabor Posted February 19, 2011 Posted February 19, 2011 мне известно что 7.3 i386 и 7.3 amd64 немножечко разные amd64 и стоит есть ребут за сутки после отключения дамминета Feb 19 20:25:37 gw1 kernel: Fatal trap 12: page fault while in kernel mode Feb 19 20:25:37 gw1 kernel: cpuid = 0; apic id = 00 Feb 19 20:25:37 gw1 kernel: fault virtual address = 0x0 Feb 19 20:25:37 gw1 kernel: fault code = supervisor read data, page not present Feb 19 20:25:37 gw1 kernel: instruction pointer = 0x8:0xffffffff80473d55 Feb 19 20:25:37 gw1 kernel: stack pointer = 0x10:0xffffff8000136920 Feb 19 20:25:37 gw1 kernel: frame pointer = 0x10:0xffffff0031cf8700 Feb 19 20:25:37 gw1 kernel: code segment = base 0x0, limit 0xfffff, type 0x1b Feb 19 20:25:37 gw1 kernel: = DPL 0, pres 1, long 1, def32 0, gran 1 Feb 19 20:25:37 gw1 kernel: processor eflags = interrupt enabled, resume, IOPL = 0 Feb 19 20:25:37 gw1 kernel: current process = 31 (igb0 que) Feb 19 20:25:37 gw1 kernel: trap number = 12 Feb 19 20:25:37 gw1 kernel: panic: page fault Feb 19 20:25:37 gw1 kernel: cpuid = 0 Feb 19 20:25:37 gw1 kernel: Uptime: 22h54m44s Feb 19 20:25:37 gw1 kernel: Physical memory: 2036 MB если еще раз упадет с такой же ошибкой попробуем обновить до 8.1 current process = 31 (igb0 que) Попробуй поставить карточку РТ. ps. Думаю понадежней перейти на восьмерку, мы тестим 8.2, пока без нареканий, а семерка, она какаято чудная от 7.0, до 7.3
laffytaffy Posted February 19, 2011 Author Posted February 19, 2011 мне известно что 7.3 i386 и 7.3 amd64 немножечко разные amd64 и стоит есть ребут за сутки после отключения дамминета Feb 19 20:25:37 gw1 kernel: Fatal trap 12: page fault while in kernel mode Feb 19 20:25:37 gw1 kernel: cpuid = 0; apic id = 00 Feb 19 20:25:37 gw1 kernel: fault virtual address = 0x0 Feb 19 20:25:37 gw1 kernel: fault code = supervisor read data, page not present Feb 19 20:25:37 gw1 kernel: instruction pointer = 0x8:0xffffffff80473d55 Feb 19 20:25:37 gw1 kernel: stack pointer = 0x10:0xffffff8000136920 Feb 19 20:25:37 gw1 kernel: frame pointer = 0x10:0xffffff0031cf8700 Feb 19 20:25:37 gw1 kernel: code segment = base 0x0, limit 0xfffff, type 0x1b Feb 19 20:25:37 gw1 kernel: = DPL 0, pres 1, long 1, def32 0, gran 1 Feb 19 20:25:37 gw1 kernel: processor eflags = interrupt enabled, resume, IOPL = 0 Feb 19 20:25:37 gw1 kernel: current process = 31 (igb0 que) Feb 19 20:25:37 gw1 kernel: trap number = 12 Feb 19 20:25:37 gw1 kernel: panic: page fault Feb 19 20:25:37 gw1 kernel: cpuid = 0 Feb 19 20:25:37 gw1 kernel: Uptime: 22h54m44s Feb 19 20:25:37 gw1 kernel: Physical memory: 2036 MB если еще раз упадет с такой же ошибкой попробуем обновить до 8.1 current process = 31 (igb0 que) Попробуй поставить карточку РТ. дык это не выход, ставить предыдущее поколение карт, тем более что нет свободной... хочется найти причину.... остался вариант о кол-ве мелких пакетов размеров в 50-100 байт
pavlabor Posted February 19, 2011 Posted February 19, 2011 Я когдато с радости накатил 7.1, так она с такой же ошибкой вылетала, при поднятии второй карточки, карточки были брадкомы. Ради интереса, ставил интелы пси-х, и тоже на одном интерфейсе работали, при поднятии второго вешалась, Ставил реалтеки, то же самое, Ставил винт на другие машины, мешал карточки, падала как часы. Плюнул, накатил 8.1 и все забылось. Потом чтото не срослось, нужн было откатиться на 7.3, за два дня, два падения с глухим звисанием, откатился на 8.2, опять нет проблем. И заметил, что железо не важно, конфигурация не важна, нагрузка не важна. То есть причины нет. Просто падает когда ей захочется.
laffytaffy Posted February 19, 2011 Author Posted February 19, 2011 Плюнул, накатил 8.1 и все забылось. видимо этим сегодня ночью и займемся...
laffytaffy Posted February 28, 2011 Author Posted February 28, 2011 обновили до 8.1-RELEASE FreeBSD 8.1-RELEASE #0: Sun Feb 20 17:02:28 EET 2011 root@:/usr/obj/usr/src/sys/GW1 amd64 4 дня "ребутов" не было, все гладко, но сегодня опять что-то непонятное, система виснет без перезагрузки, тупо висит ни на что не реагирует, только кнопка reset... после загрузки в логах чисто до "ступора" input (Total) output packets errs idrops bytes packets errs bytes colls 79586 0 0 83424516 66175 0 54511944 0 70826 0 0 70183816 61302 0 48712723 0 68303 0 0 68300243 58356 0 46195971 0 72591 0 0 73959017 61345 0 48902434 0 72839 0 0 74901501 60994 0 48539391 0 68571 0 0 70988338 56600 0 45816941 0 67263 0 0 67462718 57281 0 45381948 0 72662 0 0 75443880 61208 0 49142041 0 64497 0 0 64985021 54234 0 42896221 0 52296 0 0 51564065 44646 0 35414510 0 56631 0 0 54897734 48962 0 39895923 0 67628 0 0 67007553 57996 0 47182585 0 72153 0 0 74101866 60877 0 48984598 0 62158 0 0 60601173 53730 0 41534317 0 67693 0 0 66948657 57862 0 45194897 0 72156 0 0 71331588 61456 0 47548956 0 Прервано gw1# netstat -w1 -l igb0 input (Total) output packets errs idrops bytes packets errs bytes colls 71600 0 0 69241014 61346 0 48042094 0 75477 0 0 71972522 65001 0 50411770 0 74045 0 0 72446231 62996 0 50295410 0 71111 0 0 68378318 61907 0 49295880 0 76281 0 0 74507232 66225 0 53058864 0 Прервано gw1# netstat -w1 -l igb0 input (Total) output packets errs idrops bytes packets errs bytes colls 73103 0 0 71996330 62971 0 50314810 0 15185 0 0 14117394 11797 0 9846865 0
Recommended Posts
Create an account or sign in to comment
You need to be a member in order to leave a comment
Create an account
Sign up for a new account in our community. It's easy!
Register a new accountSign in
Already have an account? Sign in here.
Sign In Now