Zor konu gerçekten…
Monitoring.World ekibinin tamamının yıllarca sahada büyük sistem grupları yönetmiş deneyimli uzmanlardan oluştuğunu ve her birimizin izleme ve ölçmeye fanatiklik düzeyinde inandığını daha önce de bu satırlarda yazmıştık. Bizlerin deneyimine göre, etkin sistem yönetiminin en önemli parçası, o sistemi düzenli olarak gözlemlemek ve ölçmektir. Ölçmediğimiz bir sistemin performansı hakkındaki fikirlerimizin dayanağı yoktur.
Sistem sağlığının kontrolü,
Performansının yönetimi, sorgulanması
Kapasite planlaması,
Yukarıdaki farklı bakış açılarıyla ölçmek, ölçmek ve tekrar ölçmek… Özünde disipline ve metodolojiye dayanan bir model bu. Bu sistemin disiplin bacağını (yani hiç atlamadan sürekli gözlemlemek) bizim için IT Monitoring çözümü hallediyor. Neyi izleyeceğini kararlaştırmak ve hangi durumda, hangi bildirimi alacağını tasarlamak ise Metodolojinin ve onu oluşturanın işi.
Bizce, sistem yönetim ekipleri ancak bu sayede yönetmekle sorumlu oldukları sistemleri “istikrarlı” bir şekilde açık ve çalışır durumda tutabilirler. IT sistem yönetim ekibinin var oluş amacı gayet nettir. Sistemleri olabildiğince uzun süre açık tutmak ve “istikrarlı" performans vermesini sağlamak.
Teoride, uygulanabilir gibi görünen bu fikrin, ne yazık ki sahada aynı şekilde uygulanamadığını sıkça görmekteyiz.
Büyük hevesler ve iddialı hedeflerle başlayan bir çok IT Monitoring projesi, kurulum ve yaygınlaştırma evrelerinin ardından IT ekibine teslim edildiğinde, başlangıçta üzerinde el sıkışılmış süreç ve uygulamalardan taviz vermeye başlarlar. Zamanla IT Monitoring sistemi, kapatıldığı halde sistemden kaldırılmamış zombi sistemler mezarlığına ya da planlı kesinti / olay yönetimi gibi süreçleri ihmal eden ekipler nedeniyle “geveze” , “önemsenmeyen” bir alarm kaynağına dönüşür. IT ekipleri de, nasıl olduğuna anlam veremedikleri bu değişimden şikayet ederken bulurlar kendilerini.
Peki neyden şikayet ediyoruz genelde ?
Çok fazla alarm geliyor. Tekrarlayan alarmlar, kapanmayan ticketler, zamansız ve aldatıcı alarmlar var. Sistem yalancı çoban oldu.
Sistem zamanla IT altyapısı ile senkronunu kaybediyor.
IT Monitoring ekibi / sistemi bizim iş yapma şeklimizi anlamıyor !
“Monitoring sistemi bize uysun...biz mi ona uyacağız…! ”
Neyi izleyeceğimizi bilmiyoruz ?
Biz bu sistemi pinglemek için mi aldık ?
Yukarıdaki tüm şikayetlerin her biri için ayrı bir yazı yazılabilir ve yine her biri için teknik düzeyde bir çok çözüm önerilebilir. Ancak biz bugün konunun başka bir yönüne değinmek istiyoruz. IT yönetim kültürünün değişime gösterdiği direnç ve Monitoring sisteminin iki arada bir derede kalan biçare durumu.
Düşünün ki, sistemlerinizin kapalı kalmasına tahammül edemeyecek bir iş yürütüyorsunuz ve bu bilgiyi size sağlayacak bir çözümü IT’ye entegre etmeye karar verdiniz. Araştırdınız, buldunuz, çözümü uyguladınız ve artık bir izleme sisteminiz var. Yani sizin için sistemleri her an izleyen, belirlediğiniz kurallara göre kapandığında veya performansı düştüğünde sizi uyaran, üstelik bunu 7x24 kesintisiz yapan bir sistem. Aynı zamanda açık-kapalı kalma sürelerini de raporluyor, siz de yöneticinize göğsünüzü gere gere gösteriyorsunuz. Harika, değil mi ?
Ancak sistem yöneticileriniz, günün herhangi bir anında, çeşitli nedenlerle sunucuları-donanımları sürekli kapatıp açıyorlar ; X-Y-Z yazılımlarını plansız güncelleyip, servisleri her an yeniden başlatabiliyorlar. Sonra da izleme sistemi bu kesintiyi algılayıp alarm verdiğinde "çok alarm geliyor !” diye şikayet ediyor, SLA değerlerimiz düştü diye mutsuz oluyoruz. Hatta bununla yetinmeyip, suçu Monitoring’den bilip, izleme kuralları üzerinde akla hayale gelmeyecek istisnalar yazmaya başlıyoruz. (Öyle ki, mesai saatlerinde prod sunucularından alarm gelmemesini talep edenlerle tanıştık…)
Bu, evrensel bir çözümü kendimize uydurmaktır lafın kısası… İş yapma şeklimizi (hatalı olsa bile) değiştirmeyip, yanlışla yaşamakta ısrar etmek, herkesin tersine Mersin’e gitmektir. Oysa ki elimizin altında, iş yapma şeklimizi basitçe değiştirip, sistemlerde bir kesintiye yol açacak işlemler yapmadan önce IT Monitoring çözümünü planlı kesinti moduna almak, bu sırada alarm gelmesini engellemek varken, neden zor olanı tercih ederiz bilinmez…
Bu nedenle, IT Monitoring sistemleri, IT’nin yönetim kültürü ile sürekli mücadele halindedir.
IT Monitoring çözümleri, kendisinden ne istenmişse onu bıkmadan, usanmadan yerine getirirler. Ancak hayatın her alanında olduğu gibi, sistem yönetimi oyununa da yeni bir kural veya faktör eklendiğinde (-ki burada Monitoring oluyor 😃 ) değişim kaçınılmazdır. Kurallar, taktikler, eski iş yapma şekilleri, her şey değişir. Değişmelidir.
Sorunsuz günler.