İş sürekliliği çalışmalarında kafa karıştıran bu kavrama dair BCI geçen ay bir makale yayınladı. http://www.bcifiles.com/CrisisManagementMarch2012.pdf Bu linkten erişilebilir.
Buraya kadar her şey güzel makale de titizce hazırlanmış fakat BCI’ın yazarlarının da kafası hala karışık gibi duruyor. Kendileri de makalede incident management ve event management ile crisis management arasında büyük benzerlik olduğunu bir satırda ifade etmişler. Ben biraz daha ileri götüreceğim ve diyeceğim ki kriz yönetimi diye birşey yoktur. Olayların kriz boyutuna gelmiş halleri için yepyeni bir süreç tasarlamanıza ve bir alt disiplin uydurmaya gerek yoktur. Olay yönetimi süreci yaklaşık 32 yıldır ITIL içersinde servislerin , sistemlerin, faaliyetleri yürümemesi durumlarının (kesinti, hata, arıza, bozulma, kriz, felaket, büyük sorun, küçük olay vs. tamamının) yönetimi için oluşturulmuş bir disiplindir.

Olayın boyutu büyüdükçe cevap verme süre ve seviyeleri değişecektir. Olayın etkisi büyükse elbette ki yönetim katmanı devereye girecektir. Bu zaten olay yönetiminde oluşturduğumuz eskalasyon yapısının yerine getirdiği bir durumdur.

Kriz durumlarına karşı önceden hazırlıklı olmak için sadece kriz yönetimi süreci oluşturup senaryolar üretmeye başladığınızda sonsuz sayıda olasılıkla mücadele etmekte olduğunuzu fark edeceksiniz. Bu durumda sadece kriz durumlarında kulanılmak üzere hazırladığınız bir dokümanın 300-400 sayfalara çıkması gerekeceğini tespit edeceksiniz.

Kriz anında bu dokümanın bir işe yaramayacağı ve Problem Yönetimi süreci bulunmuyorsa geçici çözüm ve bilinen hata veri tabanı uygulamaları , efektif bir konfigürasyon yönetimi ile desteklenmemişse zaten kriz anlarında başarılı olmak pek mümkün olmayacaktır.

Makalede bir de liderlik, takım ruhu vb. geyik konulardan bahsedilmiş. Etkin bir olay yönetimi zaten bu yapıyı kurmanız için konuşulur. Çok hızlı koordinasyon ve sonuca tam zamanında ulaşıp kesintiyi üzerinde sözleşme yapılmış koşullara uygun sürelerde durdurmak için zamanla yarışan bir ekip kurduğunuz için zaten olaylar krize dönüşmeden kapatılır.

Ayrıca kriz tanımında birdenbire olması ile ilgili bir tanım var ki bu da aslında yine tartışmalı. Bir çok sistem öğesi, bir çok komponent sizinle konuşur. Loglarını takip edip sinyallerini alarmlarını dikakte aldığınızda size gelecek olayla ilgili ipuçlarını verir. Doğal afetler ve saldırılar dışında hemen her tür kesinti sistem arızaları veya komponent bozulmalarından kaynaklanır. Bunlar ise proactive şekilde problem ve event management tarafından yönetilir.

Bu yazıyı paylaşmak mı istiyorsunuz? Ne duruyorsunuz: