Блог bitmanager

Молчаливый Bareos

Если вы думаете, что проблема умолчательности и неявного поведения одолевает только мегакорпорации с мировым именем, то вот вам свежий пример с другой стороны баррикад.

Есть у меня Bareos, занимается он бэкапом пары проектов, локального Git-а и всего такого, что мне могло бы потребоваться. Настроено все неплохо, работает стабильно, мониторится. Но я отметил, что бэкап журнала, который делается раз в день, занимает слишком много места и вообще делается не в тот пул. Ну есть проблема – будем резать. Бэкап решено сжимать, пул – заменить. Сжатие протестировано, Fileset поправлен, том пула увеличен на одно задание, директор перезапущен. Казалось бы, вот оно – счастье. Но если бы все было так просто, этой заметки бы не было.

Через несколько дней я прихожу в морду Bareos и вижу, что задание бэкапа журнала что-то ждет. В логах задания пусто, сервер резервирования не висит, мониторинг не орет. Тишь и гладь. Подумал, что затупили команды перед или после задания. Ждущих выгнал на мороз, зашел в консоль, запустил заново задание бэкапирования журнала, а сам по списку процессов смотрю, что там происходит. Команды до задания выполнились без сучка и задоринки, все создалось и в правильных местах. А потом тишина… Задание чего-то ждет. Чего – непонятно, в логах ничего нет.

Решил по наитию посмотреть логи директора, вот там-то все и стало ясно. В томе пула кончилось место и задание ждало создания нового тома. Хм, но я же расширял том… И тут до меня доходит, что bareos-sd тоже было бы неплохо перезапустить. И я его перезапускаю. И он тоже благополучно зависает. Видать, ждет окончания задания. Deadlock. Чтобы завершить задание надо перезапустить демон, чтобы перезапустить демон, надо завершить задание. Отменяю задание, демон перезапускается, том расширяется.

А представьте, если бы у меня не было доступа к консоли сервера. Есть только веб-интерфейс и все. Каким бы образом я узнал о проблеме? Телепатией, не иначе.
В общем, вечером посмотрим.
2018-04-06 20:44 Записки сисадмина резервное копирование