Sunucu İzleme ve Log Yönetimi: Prometheus, Grafana ve ELK Rehberi

Son Güncelleme: Mart 2026

Sunucu izleme ve log yönetimi, modern altyapıların güvenliği, kararlılığı ve performansı için kritik öneme sahiptir. Bu rehberde Prometheus, Grafana ve ELK (Elasticsearch, Logstash, Kibana) gibi yaygın çözümleri, mimari yaklaşımları, kurulum örneklerini ve pratik kullanım senaryolarını adım adım ele alacağız.

Neden Sunucu İzleme ve Log Yönetimi?

Her üretim ortamında görünürlük eksikliği, olaylara müdahale süresini uzatır ve hizmet kesintilerine yol açar. Etkili bir izleme ve log yönetimi şu faydaları sağlar:

Sürekli İzleme: Sunucu kaynak kullanımı, disk, ağ ve uygulama metriklerinin 7/24 takibi.
Hızlı Olay Tespiti: Anormallikler, hata oranı artışları ve performans düşüşlerinin erken tespiti.
Adli Analiz: Loglar aracılığıyla güvenlik olaylarının kök neden analizinin yapılabilmesi.
Raporlama ve Kapasite Planlama: Geçmiş metriklerle kaynak ihtiyacının belirlenmesi.

Temel Kavramlar

Bu bölümde sürekli karşılaşacağınız terimleri ve Türkçe karşılıklarını bulacaksınız:

Metrik (metric): Sayısal performans verisi, örn. CPU kullanım yüzdesi.
Log: Uygulama veya sistem olaylarının metinsel kaydı (ör. /var/log/messages).
Alert (Alarm): Belirli eşik aşımlarında çalışan bildirim mekanizması.
Retention (Saklama Süresi): Metrik ve log verilerinin depolanacağı süre.
Exporter (İhracatçı): Prometheus gibi sistemlerin okuyacağı metrikleri sunan küçük aracı program.

İzleme Mimarisi ve Bileşenler

İyi tasarlanmış bir izleme mimarisi genellikle şu bileşenlerden oluşur:

Toplayıcı (Collector): Sunuculardan metrikleri toplayan ajanlar (örn. node_exporter).
Depolama (Storage): Zaman serisi veritabanı (TSDB) veya Elasticsearch gibi arşivleme çözümleri.
Görselleştirme: Grafana veya Kibana ile panolar (dashboard) oluşturma.
Alarm ve Bildirim: Alertmanager, e‑posta, Slack veya webhook entegrasyonları.
Log Pipeline: Logstash/Fluentd ile veriyi işleyip Elasticsearch'e gönderme.

Araçlar Karşılaştırması

Aşağıdaki tabloda en yaygın kullanılan monitoring/log araçlarının temel özelliklerini karşılaştırdık.

Özellik	Prometheus + Alertmanager	Grafana	ELK (Elasticsearch, Logstash, Kibana)
Veri tipi	Zaman serisi metrikler	Görselleştirme katmanı (çoğu kaynağı destekler)	Metin tabanlı loglar ve arama
Depolama	TSDB (Prometheus kendi DB'si)	Kendi DB yok; veri kaynaklarına bağlanır	Elasticsearch (dağıtık arama/indeksleme)
Alert	Alertmanager ile güçlü kurallar	Datasource bazlı alarm desteği	Watcher/Alerting eklentileri (X-Pack veya alternatifler)
Kullanım kolaylığı	Başlangıçta konfigürasyon gerektirir	Kullanıcı dostu dashboard oluşturma	Log parsing pipeline karmaşık olabilir
Ölçeklenebilirlik	Büyük veri için ek çözümler gerekebilir	Ölçeklenebilir veri kaynaklarıyla uyumlu	Doğru tasarım ile yüksek ölçeklenir

Kurulum Örnekleri (Kısa Rehber)

Bu bölümde hem metrik hem de log toplama için hızlı kurulum notları ve öneriler bulacaksınız. Örneklerde Linux sunucular (örn. Ubuntu, CentOS) hedeflenmiştir.

Prometheus + node_exporter (Temel kurulum)

Sunucu: Prometheus ana sunucuda çalışır, hedef node'lar üzerinde node_exporter çalışır.
Adımlar: Prometheus konfigürasyonunda hedefleri ekleyin, node_exporter'ı systemd ile başlatın ve firewall kurallarını kontrol edin.

Grafana ile Panolar

Datasource: Prometheus'u datasource olarak ekleyin.
Dashboard: Önceden hazırlanmış dashboard'ları import ederek CPU, disk, ağ izlemeye hızlıca başlayın.

ELK Pipeline (Kısa akış)

Logstash/Fluentd: Logları toplayıp filtreleyin ve Elasticsearch'e gönderin.
Elasticsearch: Endeksleri planlayın, saklama politikası (ILM - Index Lifecycle Management) belirleyin.
Kibana: Arama, görselleştirme ve dashboard oluşturma için kullanın.

Pratik Kullanım Senaryoları

Aşağıda üretim ortamlarında sık karşınıza çıkacak örnek senaryolar ve çözüm yaklaşımları yer alıyor.

Senaryo 1: Ani CPU Tüketimi Artışı

Tespit: Grafana'da CPU metrikleri ile anlık spike gözlemlenir.
Analiz: İlgili zaman aralığındaki sistem ve uygulama loglarını Kibana'da sorgulayın.
Çözüm: Kaynağı bulana kadar ilgili servisin trafik yönetimini veya yeniden başlatılmasını otomatikleştiren bir playbook hazırlayın.

Senaryo 2: Disk Dolumuna Bağlı Uygulama Hataları

Tespit: Disk kullanım alarmı tetiklenir.
Analiz: Büyük log dosyaları ve geçici dosyalar /var/log veya uygulama dizinlerinde kontrol edilir.
Çözüm: Log rotasyonları, saklama süresi (retention) ve otomatik temizleme kuralları uygulanır.

Senaryo 3: Güvenlik Olayı ve Forensik

Tespit: Anormal erişim denemeleri veya başarısız oturum açma sayısında artış.
Analiz: Kibana üzerinden IP, user-agent ve zaman bazlı sorgularla olay trafiğini izleyin.
Çözüm: Şüpheli IP'leri firewall/IPS ile engelleyin, gerekli ise forensik için logları arşivleyin.

En İyi Uygulamalar

Etiketleme (Labeling): Prometheus metriklerini uygulama, ortam (prod/stage) ve bölge ile etiketleyin.
Saklama Politikası: Metrikler ve loglar için farklı saklama süreleri belirleyin (örn. metrikler 90 gün, log özeti 365 gün).
Gizlilik: Kişisel verileri loglarda maskeleyin ve GDPR/KVKK uyumluluğunu sağlayın.
Yedekleme: Elasticsearch snapshot'ları ile düzenli yedek alın.

Corelux Hizmetleri ile Entegrasyon Önerisi

İzleme altyapınızı Corelux sunucularında çalıştırmayı düşünüyorsanız, uygun Türkiye VPS Sunucu veya yüksek performans için Kiralık Sunucu seçeneklerini değerlendirebilirsiniz. Log saklama ve SSL gereksinimleri için Corelux'un SSL Sertifikası ve Yedekleme Hizmeti sayfalarını inceleyin.

Sıkça Sorulan Sorular

Prometheus metriklerini ne kadar süre saklamalıyım?

Bu, kullanım amacınıza bağlıdır. Kısa dönem operasyonel analiz için 30-90 gün yeterli olabilir; uyumluluk veya uzun dönem trend analizi için 6-12 ay tercih edilebilir. Disk maliyetlerini ve sorgu performansını göz önünde bulundurun.

ELK mi yoksa daha hafif bir çözüm mü tercih etmeliyim?

Eğer yoğun metin arama ve kompleks sorgular yapacaksanız ELK güçlü bir tercihtir. Kaynak kısıtlıysa Fluentd + Loki gibi daha hafif log çözümleri değerlendirilebilir. Karar kullanım, ölçek ve bütçeye göre verilir.

Monitoring ajanları sunucuyu yavaşlatır mı?

Çoğu modern ajan (örn. node_exporter) düşük kaynak tüketimi ile çalışır. Ancak yanlış konfigürasyon veya çok sık veri toplama periyotları CPU/disk I/O üzerinde ek yük yaratabilir. Örnek periyotlar metrik için 15s-1m, loglar için streaming iyidir.

Alarm (alert) yönetiminde nelere dikkat etmeliyim?

Yanlış yapılandırılmış alarmlar (alert storm) ekipleri yorar. Deger eşikleri, süre (for duration) ve sessiz zamanlamalar kullanın; kritik ve uyarı seviyelerini ayırın ve bildirim kanallarını rol bazlı yönetin.

Veri gizliliği ve log arşivleme konusunda öneriler nelerdir?

Loglarda kişisel veri varsa şifreleme, maskeleme ve erişim kontrolleri uygulayın. Elasticsearch erişimini yetkilendirme ile koruyun ve arşivler için şifreli snapshot'lar kullanın.

Sonuç

Etkin bir sunucu izleme ve log yönetimi stratejisi, hizmet sürekliliği, performans optimizasyonu ve güvenlik için vazgeçilmezdir. Prometheus + Grafana kombinasyonu metrik takibi için, ELK ise detaylı log analizi için güçlü çözümler sunar. Kurulum ve ölçeklendirme sırasında saklama politikaları, alarm tasarımı ve gizlilik gereksinimlerini ön planda tutun. Corelux altyapıları üzerinde ölçeklenebilir bir izleme altyapısı kurmak isterseniz, uygun sunucu ve hizmet seçenekleri için Sanal Sunucu ve Hosting sayfalarımızı ziyaret ederek başlayabilirsiniz.

İlerlemek için öneri: İlk adım olarak bir test ortamında Prometheus + Grafana kurulumu yapın, ardından log akışını ELK ile entegre ederek gerçek trafik üzerinde doğrulama yapın. İhtiyaç halinde Corelux profesyonel destek ve ölçeklenebilir sunucu çözümlerinden faydalanabilirsiniz.

Sunucu İzleme ve Log Yönetimi: Prometheus, Grafana ve ELK Rehberi

Sunucu İzleme ve Log Yönetimi: Prometheus, Grafana ve ELK Rehberi

İçindekiler

Neden Sunucu İzleme ve Log Yönetimi?

Temel Kavramlar

İzleme Mimarisi ve Bileşenler

Araçlar Karşılaştırması

Kurulum Örnekleri (Kısa Rehber)

Prometheus + node_exporter (Temel kurulum)

Grafana ile Panolar

ELK Pipeline (Kısa akış)

Pratik Kullanım Senaryoları

Senaryo 1: Ani CPU Tüketimi Artışı

Senaryo 2: Disk Dolumuna Bağlı Uygulama Hataları

Senaryo 3: Güvenlik Olayı ve Forensik

En İyi Uygulamalar

Corelux Hizmetleri ile Entegrasyon Önerisi

Sıkça Sorulan Sorular

Prometheus metriklerini ne kadar süre saklamalıyım?

ELK mi yoksa daha hafif bir çözüm mü tercih etmeliyim?

Monitoring ajanları sunucuyu yavaşlatır mı?

Alarm (alert) yönetiminde nelere dikkat etmeliyim?

Veri gizliliği ve log arşivleme konusunda öneriler nelerdir?

Sonuç

Kategoriler

Önerilen Yazılar

Postfix Mail Queue Yönetimi: Kuyruk İzleme ve Teslim Sorunları

2026 Ucuz Bulut Sunucu Rehberi: Fiyat-Performans Odaklı En İyi Seçenekler

CentOS Sistemlerde Kullanılan Disk Boyutu Öğrenmek

CloudLinux ve CageFS Rehberi

cPanel Lets Encrypt Eklentisi (Plugin) nasıl kurulur ?