فرهنگ لغات ITIL حوادث را به صورت زیر تعریف میکند :
هر رخدادی که جزئی از یک عملیات استاندارد سرویس نیست و به بروز وقفه یا کاهش کیفیت سرویسدهی منجر شده یا میشود. (Steinberg,2011)
هدف مدیریت حادثه، بازگرداندن عملیات سرویسدهی به شکل معمول و نرمال، در کمترین زمان ممکن و به حداقل رساندن اثرگذاری مضرات ( ناسازگاریها )در عملیات تجاری است. عملیات معمول سرویس در اینجا بهعنوان یک عملیات سرویس در محدودیتهای توافقنامه سطح سرویس تعریف میشود. به زبان دیگر مدیریت حادثه یک بخش فرآیند از مدیریت سرویس فنآوری اطلاعات است. هدف اول این فرآیند، بازگرداندن عملیات به شکل سرویسدهی طبیعی و نرمال در کمترین زمان ممکن و به حداقل رسانیدن تأثیرات منفی آن (عدم سرویسدهی ) در عملیات تجاری است.
منظور از حادثه هر اتفاقي است كه جزء كارهاي روتين يك سرويس نيست و ممكن است باعث توقف در اجراي سرويس شود ويا كيفيت سرويس را كاهش دهد. حوادث ممکن است به دلایل مشخص و یا نامشخصی به وقوع بپیوندند و نهایتاً بهمنظور کنترل کردن مدیریت مشکلات در پایگاه داده مشکلات شناختهشده، ثبت میشوند.
حوادث، نتایج مشکلات و خطای زیربناهای فنآوری اطلاعات هستند. علت بروز حادثه ممکن است پیدا و روشن باشد و نیازی به سرمایهگذاری (از نظر زمانی و هزینهای) برای شناسایی علت بروز حادثه نباشد و منجر به درخواست برای یک bug fix، یک حضور فیزیکی در محل یا یک درخواست تغییر برای حذف خطا باشد. (Steinberg,2011)
جایی که یک حادثه مطرح میشود تا بهصورت جدی و قاطعانه پیگیری شود و یا چند پیشامد مشابه یک رخداد مشاهده میشود، یک مشکل میتواند بهعنوان پاسخی برای حل همه موارد در سیستم ثبت شود. (همچنین ممکن است تا چند رخداد مشابه گزارش نشود, اصلاً مشکلی هم ثبت نشود.) مدیریت یک مشکل از فرآیند مدیریت یک حادثه متفاوت است و معمولاً توسط کارمندان متفاوت انجام میشود و به همین دلیل توسط فرآیند مدیریت مشکلات کنترل خواهد شد. وقتیکه یک مشکل شناسایی میشود و محیط علت اصلی پیدا میشود، یک "مشکل شناختهشده" میشود. هنگامیکه ریشه و علت بروز رخداد شناسایی میشود تبدیل به یک "خطای شناساییشده"میشود و نهایتاً یک درخواست تغییر، ممکن است برای تغییر (اصلاح) سیستم یا رفع خطای شناساییشده ایجاد شود. این فرآیند توسط فرایند مدیریت تغییرات، تحت پوشش قرار میگیرد. (Steinberg,2011)
باید توجه داشت که درخواست یک سرویس اضافی بهعنوان یک رخداد شناخته نمیشود و آن را یک درخواست تغییر مینامند.
مدير اين فرآیند پردازشها را نظارت ميكند، از بهروزرسانی بانك اطلاعاتي اين فرآيند مطمئن است، استفاده كارآمد و نگهداری از ابزارها را انجام ميدهد، برنامهریزی و گزارشدهي نيز ازجمله وظايف اين مدير است.
فرآیندهای اصلی مدیریت حوادث عبارتند از:
شناسایی و ثبت حادثه
طبقه بندی و پشتیبانی اولیه
تحقیق و تشخیص
رفع مشکل و بازیابی
بستن حادثه
مالکیت حادثه، بازدید، پیگیری و ارتباطات
مزایایی که از پیادهسازی یک فرآیند مدیریت حوادث شامل حال سازمان میشود عبارت است از:
مانیتورینگ پیشرفته
بدست آوردن کارایی در مقابل توافق سطح سرویس برای بهدست آوردن دقت
اطلاعات مدیریتی اصلاحشده درباره ظهور کیفیت خدمات
استفاده بهتر از کارکنان که باعث کارایی بهتر میشود
حذف حوادث نادرست یا گمشده (نادیده گرفتهشده) و درخواستهای خدمات
بازبینی اطلاعات پایگاه داده مدیریت پیکربندی با دقت و صحت بیشتر
افزایش رضایت مشتری و کاربر
گردآورنده: محمدمظفر مهرعلی