Sunucu İzleme ve Log Yönetimi: Prometheus, Grafana ve ELK Rehberi
Sunucu İzleme ve Log Yönetimi: Prometheus, Grafana ve ELK Rehberi
Son Güncelleme: Mart 2026
Sunucu izleme ve log yönetimi, modern altyapıların güvenliği, kararlılığı ve performansı için kritik öneme sahiptir. Bu rehberde Prometheus, Grafana ve ELK (Elasticsearch, Logstash, Kibana) gibi yaygın çözümleri, mimari yaklaşımları, kurulum örneklerini ve pratik kullanım senaryolarını adım adım ele alacağız.
İçindekiler
- Giriş
- Neden Sunucu İzleme ve Log Yönetimi?
- Temel Kavramlar
- İzleme Mimarisi ve Bileşenler
- Araçlar Karşılaştırması
- Kurulum Örnekleri (Kısa Rehber)
- Pratik Kullanım Senaryoları
- Sıkça Sorulan Sorular
- Sonuç
Neden Sunucu İzleme ve Log Yönetimi?
Her üretim ortamında görünürlük eksikliği, olaylara müdahale süresini uzatır ve hizmet kesintilerine yol açar. Etkili bir izleme ve log yönetimi şu faydaları sağlar:
- Sürekli İzleme: Sunucu kaynak kullanımı, disk, ağ ve uygulama metriklerinin 7/24 takibi.
- Hızlı Olay Tespiti: Anormallikler, hata oranı artışları ve performans düşüşlerinin erken tespiti.
- Adli Analiz: Loglar aracılığıyla güvenlik olaylarının kök neden analizinin yapılabilmesi.
- Raporlama ve Kapasite Planlama: Geçmiş metriklerle kaynak ihtiyacının belirlenmesi.
Temel Kavramlar
Bu bölümde sürekli karşılaşacağınız terimleri ve Türkçe karşılıklarını bulacaksınız:
- Metrik (metric): Sayısal performans verisi, örn. CPU kullanım yüzdesi.
- Log: Uygulama veya sistem olaylarının metinsel kaydı (ör. /var/log/messages).
- Alert (Alarm): Belirli eşik aşımlarında çalışan bildirim mekanizması.
- Retention (Saklama Süresi): Metrik ve log verilerinin depolanacağı süre.
- Exporter (İhracatçı): Prometheus gibi sistemlerin okuyacağı metrikleri sunan küçük aracı program.
İzleme Mimarisi ve Bileşenler
İyi tasarlanmış bir izleme mimarisi genellikle şu bileşenlerden oluşur:
- Toplayıcı (Collector): Sunuculardan metrikleri toplayan ajanlar (örn. node_exporter).
- Depolama (Storage): Zaman serisi veritabanı (TSDB) veya Elasticsearch gibi arşivleme çözümleri.
- Görselleştirme: Grafana veya Kibana ile panolar (dashboard) oluşturma.
- Alarm ve Bildirim: Alertmanager, e‑posta, Slack veya webhook entegrasyonları.
- Log Pipeline: Logstash/Fluentd ile veriyi işleyip Elasticsearch'e gönderme.
Araçlar Karşılaştırması
Aşağıdaki tabloda en yaygın kullanılan monitoring/log araçlarının temel özelliklerini karşılaştırdık.
| Özellik | Prometheus + Alertmanager | Grafana | ELK (Elasticsearch, Logstash, Kibana) |
|---|---|---|---|
| Veri tipi | Zaman serisi metrikler | Görselleştirme katmanı (çoğu kaynağı destekler) | Metin tabanlı loglar ve arama |
| Depolama | TSDB (Prometheus kendi DB'si) | Kendi DB yok; veri kaynaklarına bağlanır | Elasticsearch (dağıtık arama/indeksleme) |
| Alert | Alertmanager ile güçlü kurallar | Datasource bazlı alarm desteği | Watcher/Alerting eklentileri (X-Pack veya alternatifler) |
| Kullanım kolaylığı | Başlangıçta konfigürasyon gerektirir | Kullanıcı dostu dashboard oluşturma | Log parsing pipeline karmaşık olabilir |
| Ölçeklenebilirlik | Büyük veri için ek çözümler gerekebilir | Ölçeklenebilir veri kaynaklarıyla uyumlu | Doğru tasarım ile yüksek ölçeklenir |
Kurulum Örnekleri (Kısa Rehber)
Bu bölümde hem metrik hem de log toplama için hızlı kurulum notları ve öneriler bulacaksınız. Örneklerde Linux sunucular (örn. Ubuntu, CentOS) hedeflenmiştir.
Prometheus + node_exporter (Temel kurulum)
- Sunucu: Prometheus ana sunucuda çalışır, hedef node'lar üzerinde node_exporter çalışır.
- Adımlar: Prometheus konfigürasyonunda hedefleri ekleyin, node_exporter'ı systemd ile başlatın ve firewall kurallarını kontrol edin.
Grafana ile Panolar
- Datasource: Prometheus'u datasource olarak ekleyin.
- Dashboard: Önceden hazırlanmış dashboard'ları import ederek CPU, disk, ağ izlemeye hızlıca başlayın.
ELK Pipeline (Kısa akış)
- Logstash/Fluentd: Logları toplayıp filtreleyin ve Elasticsearch'e gönderin.
- Elasticsearch: Endeksleri planlayın, saklama politikası (ILM - Index Lifecycle Management) belirleyin.
- Kibana: Arama, görselleştirme ve dashboard oluşturma için kullanın.
Pratik Kullanım Senaryoları
Aşağıda üretim ortamlarında sık karşınıza çıkacak örnek senaryolar ve çözüm yaklaşımları yer alıyor.
Senaryo 1: Ani CPU Tüketimi Artışı
- Tespit: Grafana'da CPU metrikleri ile anlık spike gözlemlenir.
- Analiz: İlgili zaman aralığındaki sistem ve uygulama loglarını Kibana'da sorgulayın.
- Çözüm: Kaynağı bulana kadar ilgili servisin trafik yönetimini veya yeniden başlatılmasını otomatikleştiren bir playbook hazırlayın.
Senaryo 2: Disk Dolumuna Bağlı Uygulama Hataları
- Tespit: Disk kullanım alarmı tetiklenir.
- Analiz: Büyük log dosyaları ve geçici dosyalar /var/log veya uygulama dizinlerinde kontrol edilir.
- Çözüm: Log rotasyonları, saklama süresi (retention) ve otomatik temizleme kuralları uygulanır.
Senaryo 3: Güvenlik Olayı ve Forensik
- Tespit: Anormal erişim denemeleri veya başarısız oturum açma sayısında artış.
- Analiz: Kibana üzerinden IP, user-agent ve zaman bazlı sorgularla olay trafiğini izleyin.
- Çözüm: Şüpheli IP'leri firewall/IPS ile engelleyin, gerekli ise forensik için logları arşivleyin.
En İyi Uygulamalar
- Etiketleme (Labeling): Prometheus metriklerini uygulama, ortam (prod/stage) ve bölge ile etiketleyin.
- Saklama Politikası: Metrikler ve loglar için farklı saklama süreleri belirleyin (örn. metrikler 90 gün, log özeti 365 gün).
- Gizlilik: Kişisel verileri loglarda maskeleyin ve GDPR/KVKK uyumluluğunu sağlayın.
- Yedekleme: Elasticsearch snapshot'ları ile düzenli yedek alın.
Corelux Hizmetleri ile Entegrasyon Önerisi
İzleme altyapınızı Corelux sunucularında çalıştırmayı düşünüyorsanız, uygun Türkiye VPS Sunucu veya yüksek performans için Kiralık Sunucu seçeneklerini değerlendirebilirsiniz. Log saklama ve SSL gereksinimleri için Corelux'un SSL Sertifikası ve Yedekleme Hizmeti sayfalarını inceleyin.
Sıkça Sorulan Sorular
Prometheus metriklerini ne kadar süre saklamalıyım?
Bu, kullanım amacınıza bağlıdır. Kısa dönem operasyonel analiz için 30-90 gün yeterli olabilir; uyumluluk veya uzun dönem trend analizi için 6-12 ay tercih edilebilir. Disk maliyetlerini ve sorgu performansını göz önünde bulundurun.
ELK mi yoksa daha hafif bir çözüm mü tercih etmeliyim?
Eğer yoğun metin arama ve kompleks sorgular yapacaksanız ELK güçlü bir tercihtir. Kaynak kısıtlıysa Fluentd + Loki gibi daha hafif log çözümleri değerlendirilebilir. Karar kullanım, ölçek ve bütçeye göre verilir.
Monitoring ajanları sunucuyu yavaşlatır mı?
Çoğu modern ajan (örn. node_exporter) düşük kaynak tüketimi ile çalışır. Ancak yanlış konfigürasyon veya çok sık veri toplama periyotları CPU/disk I/O üzerinde ek yük yaratabilir. Örnek periyotlar metrik için 15s-1m, loglar için streaming iyidir.
Alarm (alert) yönetiminde nelere dikkat etmeliyim?
Yanlış yapılandırılmış alarmlar (alert storm) ekipleri yorar. Deger eşikleri, süre (for duration) ve sessiz zamanlamalar kullanın; kritik ve uyarı seviyelerini ayırın ve bildirim kanallarını rol bazlı yönetin.
Veri gizliliği ve log arşivleme konusunda öneriler nelerdir?
Loglarda kişisel veri varsa şifreleme, maskeleme ve erişim kontrolleri uygulayın. Elasticsearch erişimini yetkilendirme ile koruyun ve arşivler için şifreli snapshot'lar kullanın.
Sonuç
Etkin bir sunucu izleme ve log yönetimi stratejisi, hizmet sürekliliği, performans optimizasyonu ve güvenlik için vazgeçilmezdir. Prometheus + Grafana kombinasyonu metrik takibi için, ELK ise detaylı log analizi için güçlü çözümler sunar. Kurulum ve ölçeklendirme sırasında saklama politikaları, alarm tasarımı ve gizlilik gereksinimlerini ön planda tutun. Corelux altyapıları üzerinde ölçeklenebilir bir izleme altyapısı kurmak isterseniz, uygun sunucu ve hizmet seçenekleri için Sanal Sunucu ve Hosting sayfalarımızı ziyaret ederek başlayabilirsiniz.
İlerlemek için öneri: İlk adım olarak bir test ortamında Prometheus + Grafana kurulumu yapın, ardından log akışını ELK ile entegre ederek gerçek trafik üzerinde doğrulama yapın. İhtiyaç halinde Corelux profesyonel destek ve ölçeklenebilir sunucu çözümlerinden faydalanabilirsiniz.
Yazar
Boran BAR