Условия
-
Организация системы мониторинга, определение вместе с клиентом критических показателей по проекту.
-
Критические показатели аппаратного обеспечения (для примера: температура процессора, работа кулеров, «здоровье» жестких дисков в RAID-массиве, SMART-статус жестких дисков).
-
Критические показатели уровня операционной системы (для примера: нагрузка на CPU, загруженность оперативной памяти, нагрузка на дисковую подсистему).
-
Критические показатели серверного программного обеспечения (для примера: нагрузка на чтение/запись серверов БД, число запросов в секунду, активных соединений на веб-сервере, заполненность систем кэширования, число сообщений об ошибках в журналах веб-сервера за последнюю минуту).
-
Критические показатели уровня конечной системы (для примера: число сообщений в журналах конечной системы, время ответа, доступность системы).
-
Критические показатели уровня бизнес-логики (для примера: число определенных действий пользователя, время, прошедшее с момента оформления последнего заказа, автоматическое тестирование выполнений заданных действий пользователем).
-
Реагирование в течение 15 минут в случае достижения заданных критических показателей.
- Информирование клиента.
- В случае, если проблема документирована, последовательность действий зафиксирована и клиент одобрил наши самостоятельные действия — самостоятельное выполнение действий для решения проблемы.
- В случае, если проблема находится на стороне хостинг-площадки — выход на связь с хостинг-площадкой, локализация проблемы, контроль процесса решения.
- В случае, если проблемы на уровне серверного ПО — локализация проблем, по согласованию с клиентом — применение изменений для решения проблем.
- В случае, если проблемы на уровне приложения — связь с разработчиками, совместная работа по локалзиации проблемных мест.
- В случае, если проблемы на уровне бизнес-логики — информирование клиента, дальнейшее содействие в локализации проблем.
-
Аудит серверной инфраструктуры.
- Регулярный аудит корректности серверной конфигурации, серверного ПО.
- Организация эффективного резервного копирования, регулярная проверка возможности восстановления из резервной копии, оценка рисков потери данных.
- Содействие и консультации в организации систем отказоустойчивости, внедрение архитектуры отказоустойчивости, оценка рисков архитектуры.
- Консультации по применению эффективных решений в области производительности систем.
-
Дополнительное системное администрирование.
- До 10 часов системного администрирования в месяц (любые другие задачи, не упомянутые в 1-2-3 — установка программного обеспечения, его настройка).
-
Группа поддержки, взаимодействие с клиентом.
- На клиента выделяется 4 ведущих инженера и 20 дежурных администраторов, дежурные, не спят.
- Тикетная система для долгих задач.
- Прием заявок, e-mail, срочных — по телефону.
-
Документирование/отчетность.
- Ежемесячная отчетность о состоянии поддержки.
- Документирование серверной архитектуры клиента.
-
SLA.
- Реагирование на достижение критических показателей — до 15 минут.
- Реагирование на оповещения о критических проблемах — до 15 минут.
- Реагирование на регулярные задачи по администрированию — до 24 часов, час на оглашение срока исполнения задачи.
- Реагирование на срочные задачи по системному администрированию — до 1 часа на оглашение срока исполнения задачи.