KOBİ için server monitoring rehberi
Bir KOBİ neden server monitoring kurmalı, hangi metrikleri izlemeli, alarm eşikleri ne olmalı ve doğru izleme stack'i nasıl seçilir? Pratik bir başlangıç rehberi.
Server monitoring, yanlış adıyla "sunucu canlı mı?" kontrolü değil; uygulamalarınızın iş anlamında sağlıklı çalışıp çalışmadığını ölçen sistemdir. Bu rehberde KOBİ ölçeğinde nasıl kurulacağını, hangi metriklerin önemli olduğunu ve alarmlandırma için pratik eşikleri anlatıyoruz.
Neden monitoring şart?
Sunucularınız "çalışıyor görünüyor" olabilir ama:
- Disk %96 dolu — yarın muhasebe kayıt yapamayacak
- Yedekleme task'ı 5 gündür hata veriyor — kimse fark etmedi
- ERP veritabanı 45 saniyede yanıt veriyor — kullanıcılar şikayet ediyor ama şikayet IT'ye ulaşmıyor
- Ransomware aktif şifreleme yapıyor — disk IO patlamış ama uyarı yok
Bunların hepsi monitoring varken yakalanır, yokken görmezden gelinir.
İzlenmesi gereken temel metrikler
Altyapı seviyesi
- CPU kullanımı (5/15 dakika ortalaması). %70 üzerinde uzun süreli kalıcılık tehlikelidir.
- RAM kullanımı. %85 üzeri swap'a düşmeden önceki son uyarı.
- Disk doluluk oranı. %80 uyarı, %90 kritik. Trend analiziyle "kaç gün sonra dolar" hesabı.
- Disk IO ve latency. SSD'lerde latency 10ms üstü uyarıdır.
- Ağ trafiği. Anormal pattern (saatlik ortalamasının 5 katı) dikkat çeker.
Uygulama seviyesi
- HTTP yanıt süresi. ERP login sayfası 1 saniyenin altında olmalı.
- API hata oranı. 5xx response %1'i geçtiyse incele.
- Veritabanı sorgu süresi. Slow query log aktif olmalı.
- Mesaj kuyruğu uzunluğu (RabbitMQ, Redis). Birikme varsa servis durmuş demek.
- İş seviyesi metrikleri. "Son sipariş 5 dakika önce mi?", "Bugün kaç fatura kesildi?".
Güvenlik seviyesi
- Başarısız login denemeleri (brute force tespiti)
- Yeni açılan port veya servis
- Yetkisiz dosya değişikliği (file integrity monitoring)
- Anomali pattern (gece 03:00'te dış bağlantı)
Stack seçimi
KOBİ ölçeğinde önerimiz şu kombinasyonlardan biri:
Minimal stack
- UptimeRobot veya benzeri SaaS: dış erişimden HTTP/ICMP kontrol
- Netdata: sunucu üzerinde gerçek zamanlı metrik
- Maliyet: aylık 0-25 $
Standart stack
- Zabbix: altyapı izleme (agent tabanlı)
- Grafana: dashboard
- Maliyet: open source, sunucu maliyeti aylık 10-30 $
Modern stack
- Prometheus + Grafana: metrik
- Loki: log
- Alertmanager: alarmlandırma
- Uptime-kuma: dış erişim
- Maliyet: open source, ana yatırım kurulum ve yönetim
Çoğu KOBİ için Zabbix + Grafana hem öğrenme eğrisi düşük hem de kapsayıcı.
Alarm eşikleri ve sessiz saatler
Alarmları üç seviyeye ayırın:
- P1 / kritik: site / ERP down, veritabanı erişilemez. 7/24 anında telefon.
- P2 / yüksek: disk %85, yedek başarısız. Mesai içi telefon, mesai dışı sabah ilk iş.
- P3 / bilgi: yavaş sorgu trendi, yeni bir certificate expire 30 gün içinde. Günlük rapor.
Alarm yorgunluğu (alert fatigue) gerçek bir tehlikedir. Sürekli alarm alan ekip alarmları umursamaz hale gelir. Alarm sayısını az ve anlamlı tutun; gerekirse SLO bazlı alarmlandırmaya geçin.
Bildirim kanalları
- Slack / Teams: tüm alarmlar log için
- WhatsApp / SMS: P1 ve P2
- PagerDuty / OpsGenie / kendi nöbet botu: gece nöbetleri
- E-posta: günlük özet rapor
Acil olmayan alarmları telefonu çaldıracak kanaldan göndermek ekibinizi bitirir.
Yedekleme monitoring
Monitoring'in en sık unutulan ayağı: yedekleme job'ları. Her yedek job'ın:
- Başarılı tamamlandığı doğrulanmalı
- Süre normal aralıkta mı kontrol edilmeli (anormal kısa = boş yedek olabilir)
- Yedek dosyasının boyutu son haftadakilerle tutarlı mı
İdeali: yedek monitoring + aylık restore tatbikatı. Tatbikat olmadan "yedeğimiz var" demek tehlikeli rahatlamadır.
Iş seviyesi izleme örneği
Restoran zincirinde uyguladığımız tipik bir akış:
- Her şubedeki POS'tan dakikalık check-in alın
- Son 5 dakikada işlem yapmayan şube var mı sorgula
- Varsa yöneticiye anlık bildirim gönder
Bu altyapı, "POS down" anlık tespit edilmesini sağlar. Müşteri şikayet etmeden önce müdahale.
Sonuç
Monitoring; pahalı bir lüks değil, küçük yatırımla operasyonu güvene alan temel altyapıdır. Doğru kurgulandığında P1 olayların %80'i sizden önce yakalanır.
Bu konuda hizmet almak ister misiniz?
Aşağıda yazıyla en alakalı hizmetlerimiz var. Saha analizi ücretsiz, ilk görüşme 30 dakika.