Блог bitmanager

Сюрпризы от Influx

Освоение новой системы мониторинга – всегда нелегкий хлеб. Вроде уже не первый день работаешь, не один триггер написал, а она все равно продолжает тебя удивлять. Вот и сегодня, настраиваю, казалось бы, простую вещь — мониторинг средней загрузки.

Настраиваю на TICK-стеке от InfluxData, с которым уже успел прилично поработать и, вроде, хорошо знаю, как он функционирует. Ан нет, все еще приходится удивляться. Оказалось, что если Telegraf передает две строки метрик для одного measurment (что само по себе является дискуссионным вопросом, но, вроде, как все привыкли), то Kapacitor считает их отдельными point-ами в stream и создает мерцающий alert. Который то есть, то его нет. И пока дяденьки-разработчики вот здесь вяло ругаются кому и где править код, чтобы исправить сие недостойное поведение, нам приходится отказываться от высокоскоростного stream и использовать медленный batch, который к тому же грузит Influxd расчетами среднего значения.
Записки сисадмина