суббота, 24 июля 2010 г.

Slave_IO_State: Reconnecting after a failed master event read

Смотрю как-то криво работала репликация slave c master.

Пишет некоторое время 

Slave_IO_Running: Yes
Slave_SQL_Running: Yes

Статус :  Slave_IO_State: Waiting for master to send event


Потом секунд через 5-10 дохнет и уже получаю

Slave_IO_Running: No
Slave_SQL_Running: Yes


В состоянии вижу :

Slave_IO_State: Reconnecting after a failed master event read

Связь между слейвом и мастером стабильная, вообще никаких потерь и чего. Все нужные порты открыты на отдачу и на прием.


Рустартую репликаю mysql - 10 секунд нормально, все равботает, потом сбой, репликация сдохла, еще 10 секунд - все работает.


Как решилось: в файле my.cnf есть параметр server-id и если там указан левый id, то вот и получается такая хрень как у меня.

Меняю server-id на правильный, совпадающий в hostname и рестартую mysql и репликацию и все начинает работать отлично.


суббота, 17 июля 2010 г.

Neighbour table overflow.

Dmesg выдает кучу сообщений типа:

Neighbour table overflow.

Neighbour table overflow.

printk: 1952 messages suppressed. Neighbour table overflow.


При этом нету связи со многих точек с этим сервером.


Что это означает - Neighbour table overflow говорит о переполнении arp-таблицы сетевого устройства.

Это мы можем увидеть в выводе команды arp -n или arp -e или arp -a.


Пофиксить можно простой перезагрузкой сети -

/etc/init.d/networking restart (в зависимости от операционной системы имя сервиса может немного отличаться)

Если через некоторое время проблема начинает повторятся - нужно обратить внимание на топологию сети или проблемы с сетевым оборудованием.

Также возможной причиной может являться утечка памяти в ядре. В этом случае обновляем ядро или патчим.