مدیریت حوادث در فاز عملیات ITIL

مدیریت حوادث در فاز عملیات ITIL

فرهنگ لغات ITIL حوادث را به صورت زیر تعریف می‌کند :
هر رخدادی که جزئی از یک عملیات استاندارد سرویس نیست و به بروز وقفه یا کاهش کیفیت سرویس‌دهی منجر شده یا می‌شود. ‎(Steinberg,2011)‎‎
هدف مدیریت حادثه، بازگرداندن عملیات سرویس‌دهی به شکل معمول و نرمال، در کمترین زمان ممکن و به حداقل رساندن اثرگذاری مضرات ( ناسازگاری‌ها )‌در عملیات تجاری است. عملیات معمول سرویس در اینجا به‌عنوان یک عملیات سرویس در محدودیت‌های توافق‌نامه سطح سرویس تعریف می‌شود. به زبان دیگر مدیریت حادثه یک بخش فرآیند از مدیریت سرویس فن‌آوری اطلاعات است. هدف اول این فرآیند، بازگرداندن عملیات به شکل سرویس‌دهی طبیعی و نرمال در کمترین زمان ممکن و به حداقل رسانیدن تأثیرات منفی آن (‌عدم سرویس‌دهی ) در عملیات تجاری است.

منظور از حادثه هر اتفاقي است كه جزء كارهاي روتين يك سرويس نيست و ممكن است باعث توقف در اجراي سرويس شود ويا كيفيت سرويس را كاهش دهد. حوادث ممکن است به دلایل مشخص و یا نامشخصی به وقوع بپیوندند و نهایتاً به‌منظور کنترل کردن مدیریت مشکلات در پایگاه داده مشکلات شناخته‌شده، ثبت می‌شوند.
حوادث، نتایج مشکلات و خطای زیربناهای فن‌آوری اطلاعات هستند. علت بروز حادثه ممکن است پیدا و روشن باشد و نیازی به سرمایه‌گذاری (از نظر زمانی و هزینه‌ای) برای شناسایی علت بروز حادثه نباشد و منجر به درخواست برای یک bug fix، یک حضور فیزیکی در محل یا یک درخواست تغییر برای حذف خطا باشد. ‎(Steinberg,2011)‎‎
جایی که یک حادثه مطرح می‌شود تا به‌صورت جدی و قاطعانه پیگیری شود و یا چند پیشامد مشابه یک رخداد مشاهده می‌شود، یک مشکل می‌تواند به‌عنوان پاسخی برای حل همه موارد در سیستم ثبت شود. (همچنین ممکن است تا چند رخداد مشابه گزارش نشود, اصلاً مشکلی هم ثبت نشود.) مدیریت یک مشکل از فرآیند مدیریت یک حادثه متفاوت است و معمولاً توسط کارمندان متفاوت انجام می‌شود و به همین دلیل توسط فرآیند مدیریت مشکلات کنترل خواهد شد. وقتی‌که یک مشکل شناسایی می‌شود و محیط علت اصلی پیدا می‌شود، یک "مشکل شناخته‌شده" می‌شود. هنگامی‌که ریشه و علت بروز رخداد شناسایی می‌شود تبدیل به یک "خطای شناسایی‌شده"می‌شود و نهایتاً یک درخواست تغییر، ممکن است برای تغییر (اصلاح) سیستم یا رفع خطای شناسایی‌شده ایجاد شود. این فرآیند توسط فرایند مدیریت تغییرات، تحت پوشش قرار می­گیرد. ‎(Steinberg,2011)‎‎
باید توجه داشت که درخواست یک سرویس اضافی به‌عنوان یک رخداد شناخته نمی‌شود و آن را یک درخواست تغییر می‌نامند.
مدير اين فرآیند پردازش‌­ها را نظارت مي­‌كند، از به‌روزرسانی بانك اطلاعاتي اين فرآيند مطمئن است، استفاده كارآمد و نگهداری از ابزارها را انجام مي­‌دهد، برنامه‌ریزی و گزارش‌دهي نيز ازجمله وظايف اين مدير است.
فرآیندهای اصلی مدیریت حوادث عبارتند از:
شناسایی و ثبت حادثه
طبقه بندی و پشتیبانی اولیه
تحقیق و تشخیص
رفع مشکل و بازیابی
بستن حادثه
مالکیت حادثه، بازدید، پیگیری و ارتباطات

مزایایی که از پیاده‌سازی یک فرآیند مدیریت حوادث شامل حال سازمان می‌شود عبارت است از:
مانیتورینگ پیشرفته
بدست آوردن کارایی در مقابل توافق سطح سرویس برای به‌دست آوردن دقت
اطلاعات مدیریتی اصلاح‌شده درباره ظهور کیفیت خدمات
استفاده بهتر از کارکنان که باعث کارایی بهتر می‌شود
حذف حوادث نادرست یا گم‌شده (نادیده گرفته‌شده) و درخواست‌های خدمات
بازبینی اطلاعات پایگاه داده مدیریت پیکربندی با دقت و صحت بیشتر
افزایش رضایت مشتری و کاربر

گردآورنده: محمدمظفر مهرعلی