Блог bitmanager

Старый конь SPAWN-FCGI

Говорят, старый конь борозды не портит. Как бы не так, в IT обычно борозду не портит зрелый конь. А старые и молодые только и делают, что борозды узлами завязывают. После попытки переезда на PostgreSQL стал у нас падать один важный внутренний сервис. Он у нас на Nginx и бэкэндом fastcgi на spawn-fcgi. Ничего не менялось, ни один конфиг не правился, но теперь стабильно 2-3 раза в день master-процесс умирает и утаскивает потомков за собой, не оставляя ни строчки в логе.


А ведь upstart-у дано прямое указание параметром respawn, что в случае смерти процесса, его надо перезапустить. И не перезапускает. Я уже пару тонн логов скурил и пока ничего. Ну, то есть просто падение без видимых причин, хоть strace запускай. А вы же его знаете, от его лога может диск треснуть.


Я на такое пока не готов. Решил посмотреть, может, версия посвежее вышла? Ага, щазззз. Моя версия spawn-fcgi 1.6.3 была выпущена 6 лет назад, в следующей, выпущенной 3 года назад, закрыта пара небольших багов и все. То есть даже смысла нет напрягаться и пересобирать ее. Так вот и живем — в ожидании озарения, которое поможет закрыть этот странный баг.
Записки сисадмина