Що таке Zabbix? Zabbix активно розробляється і підтримується компанією Zabbix SIA. Zabbix – це...
Моніторинг працездатності Syrve
Для попередження можливих проблем непрацездатності різних компонентів, їх своєчасного вирішення та подальшого аналізу слід використовувати моніторинг доступності та стану використовуваних комп'ютерів (POS-терміналів, серверів та ін.).
При ручному аналізі
- мережевої доступності зазвичай використовуються команди ping та telnet
- працездатності додатка/служби; - логи відповідної компоненти
- ресурсів комп'ютера - диспетчер завдань, монітор ресурсів та ін.
Але постійний ручний аназіз неможливий - в результаті отримання інформації про некоректну роботу компоненти отримуємо від клієнта. Для оперативного отримання інформації до інциденту слід використовувати систему безперервного моніторингу та оповіщення технічної підтримки. Які параметри відстежувати – у розділі Рішення.
Для моніторингу служби Tomcat – див. 476.
Параметри, які потрібно відстежувати для кожного з компонентів, наведено нижче.
Сервер:
Недоступність за адресою IP Недоступність порту 8080 Недоступність служби Tomcat http://host:8080 , де host - доменне ім'я сервера або його IP адресу, 8080 - порт, що змінюється для підключення до сервера. Недоступність сервера SyrveRMS http://host:8080/resto, де host - доменне ім'я сервера або його IP адресу, 8080 - порт, що змінюється для підключення до сервера. Наявність ] FATAL [ error.log (критична помилка сервера, при якій служба перестає працювати) Наявність Failed to flush data to database або Не вдалося зберегти дані в БД error.log (служба працює, але некоректно). Мало (менше 10 Гб) вільного місця на диску або різке його зменшення (для випадків аномального розростання балок). Фронт:
Для цілодобових закладів - недоступність головної каси за адресою IP Наявність ] FATAL [ в error.log Повна завантаженість одного ядра в CPU протягом тривалого періоду часу (наприклад, 25% для 4-х ядерного; потрібно налаштувати чутливість так, щоб уникати помилкових спрацьовувань). Мало (менше 1 Гб) вільного місця на диску. За наявності однієї з перелічених ознак непрацездатності має автоматично надходити оповіщення черговому спеціалісту технічної підтримки для ручної діагностики та усунення проблеми.
Коментар