مدیریت رویدادها در سرویس های مبتنی بر فناوری اطلاعات
در زمان ارائه سرویس های مختلف فناوری اطلاعات – یعنی دقیقا در فاز Service Operation – یکی از وظایف مستمر و اصلی عملیات، مدیریت رویدادها یا Event Management است. رویداد، الزاما وقوع اتفاقی مهیب یا حتی ناگوار نیست، بلکه به هر آنچه در روند اجرای سرویس رخ نشان دهد و قابل شناسایی و اعلان باشد، رویداد گفته می شود.
بنا بر تعاریف چارچوب ITIL، رویدادها از سه دسته بندی کلی تبعیت می کنند:
نخستین دسته از جنس Information است که صرفا حاوی اطلاعات بوده و بیانگر حصول نتیجه ای پیش بینی شده است. برای مثال، زمانی که در حال اجرای سرویس تهیه نسخه پشتیبان از اطلاعات یک پایگاه داده هستیم، اعلان ابزار پشتیبان گیری، مبنی بر پایان موفقیت آمیز این اقدام، یک رویداد از نوع نخست است.
دسته دوم Warningها هستند که اخطاری را نشان می دهند که وقوع رخدادی محتمل یا مخاطره ای مشکل آفرین در ادامه مسیر سرویس را به صورت پیگیرانه، اعلام می کنند؛ هنوز مشکلی رخ نداده است. در همان مثال قبلی، زمانی که حجم فضای ذخیره سازی اطلاعات از میزانی خاص کمتر می شود، ممکن است ابزار تهیه پشتیبان، این امر را گوشزد کند که برای دفعات آتی لازم است تمهیدات لازم برای تامین فضای ذخیره سازی، انجام پذیرد.
سر آخر اینکه دسته سوم Exception است که بیانگر رخ دادن حالت یا وضعیتی مستثنا از روال عادی است و در اثر آن روند سرویس، دچار اختلال یا توقف شده و تداوم خدمات مقدور و ممکن نیست. در همان مثال پیشگفت، زمانی که حجم حافظه در اختیار، کمتر از حجم اطلاعات مورد نظر برای پشتیبان گیری باشد یا اینکه به دلیل عدم برقراری ارتباطات سخت افزاری، امکان ادامه عملیات ذخیره سازی از سرویس مربوطه سلب شده باشد، به طور قطع فرایند مرتبط دچار توقف خواهد شد. هر گاه سرویس بر اثر بروز رخدادی از دسته Exceptionها دچار وقفه شود، بسته به نوع مشکل حادث شده، یکی از سه فرایند Incident Management (برای خطاهای شناخته شده)، Problem Management (برای خطاهای ناشناخته) یا Change Management (برای خطاهای نیازمند تغییر در اجزای سرویس) برای گذر از وضعیت رخداده به سمت شرایط پایداری خدمات، باید پیموده شود.
در هنگام بروز یک رویداد – فارغ از نوع آن – پیش از هر اقدامی باید حتما دسته بندی رویداد با فیلترهای مناسب و داشبوردها ابزاری متناسبی که پیش بینی می شود، مشخص و تعیین شود. همچنین لازم است تمامی رویدادها در سامانه های مدیریتی مرتبط برای تحلیل و بازنگری آتی ثبت (log) شوند.
در مثال مطرح شده، برای تداوم پایداری خدمات سرویس تهیه پشتیبان اطلاعات، لازم است در هر بار از اجرای این سرویس، نتایج مثبت (ناشی از اطلاعات)، توام با ملاحظات (منجر از اخطار) و غیرمترقبه (متاثر از استثنا) ثبت شود و حتی به ذینفعان سرویس، گزارش و اطلاع رسانی شود.
نویسنده: نیما میربابایی، هفته نامه عصر ارتباط , طراحی سایت
دیدگاه خود را بنویسید