5 najboljih praksi za automatizaciju upravljanja većim incidentima

Autor: Roger Morrison
Datum Stvaranja: 27 Rujan 2021
Datum Ažuriranja: 21 Lipanj 2024
Anonim
5 najboljih praksi za automatizaciju upravljanja većim incidentima - Tehnologija
5 najboljih praksi za automatizaciju upravljanja većim incidentima - Tehnologija

Sadržaj



Izvor: Pixtum / iStockphoto

Oduzeti:

Pomoću strategije pametne automatizacije možete reagirati na incident brže i jednostavnije nego ikad - minimizirajući stanke i potencijalna kršenja sigurnosti.

Veliki IT incidenti događaju se unutar kompanija svaki dan. Iako samo nekoliko naslova prave naslove, događaji poput prekida rada i narušavanja sigurnosti mogu ozbiljno osakatiti produktivnost zaposlenika, negativno utjecati na percepciju korisnika i, što je najvažnije, rezultirati izgubljenim prihodom.

Kada je riječ o upravljanju velikim IT incidentima, najbolje je usredotočiti se na poslovni utjecaj i suštinu rezultata. Prema Institutu Ponemon, prosječni troškovi stanke u 2016. bili su 8 851 USD po minuti - što je više od 500 000 USD na sat, a tipični prekidi u prosjeku su više od 90 minuta. A to je samo neposredni trošak! Dugoročni utjecaj poput oštećenja ugleda i oštećenja kupaca nepredvidiv je i potencijalno katastrofalan.

Iako ne možete u potpunosti izbjeći sve veće incidente, možete naoružati svoju organizaciju da bude što spremnija za rješavanje problema kad nastanu. A glavna komponenta vaše strategije trebala bi biti uključivanje automatizacije. Organizacije koje maksimalno koriste automatizaciju u svojim glavnim postupcima rješavanja incidenata postižu brže obnavljanje usluge i puno manje pogrešaka zbog ljudskih pogrešaka. To je zato što automatizacija izravno utječe na vašu sposobnost skraćivanja trajanja vremenskog okvira utjecaja na poslovanje - ili na to skupo razdoblje u kojem vaši korisnici i poslovne operacije zapravo osjećaju utjecaj incidenta. (Da biste saznali više o automatizaciji, pogledajte Automatizacija: Budućnost nauke o podacima i strojno učenje?)


Kako biste maksimalno iskoristili prednosti automatizacije, trebali biste ispitati koje se aktivnosti trebaju odvijati tijekom udarnog prozora i smisliti kako premjestiti sve ostale aktivnosti bilo prije početka incidenta ili nakon što se posao vrati u uobičajene operacije. Evo pet korisnih načina za započinjanje.

1. Razviti i definirati proces

Definiranje glavnog procesa upravljanja incidentima znači preciziranje onoga što se može planirati, koordinirati ili izvršiti tijekom incidenta. To može značiti, na primjer, identificiranje ključnih članova tima za podršku na temelju vještina i rasporeda, tako da ih vaš servisni stol može uključiti što je brže i efikasnije. To ujedno znači i smišljanje načina na koji ćete prenijeti relevantne informacije svom timu kako bi mogli početi rješavati problem odmah, kao i informiranje i ažuriranje pravih dionika.

Automatizacija je presudna za ključne aspekte ovog procesa. Na primjer, možete automatizirati uključivanje relevantnih informacija iz vašeg nadzornog alata u ulaznice vašeg servisnog stola ili uključiti informacije s servisnog stola u obavijesti razriješivačima incidenata. Također možete dokumentirati cijeli incident u jednom izvoru sveobuhvatne istine koji je svima dostupan. Imajte na umu da možete prakticirati ovaj postupak kako biste ga ispravili - ne morate čekati incident u stvarnom svijetu da biste testirali svoj pristup.


2. Ispravite svoju infrastrukturu ispravno

U ovom danu i dobi od umora upozorenja, važno je da ne nastavite bombardirati svoje timove nebitnim obavijestima i informacijama koje se ne odnose na njih. Primjena filtera na vaše upozorenja o nadzoru osnažit će vaše timove da lakše uđu u iglu u podnožju rutinske buke. Ovo je ključno za stvaranje svih uvida i podataka uistinu djelotvornim, a ne samo dodavanje preopterećenosti informacijama.

Dobri načini za automatizaciju uključuju korištenje APM rješenja za indeksiranje svih vaših aplikacija i sustava da proaktivno utvrde temeljne uzroke na mjestu bilo kakve degradacije performansi, prije nego što uzrokuju velike prekide u usluzi. Možete i integrirati svoj nadzorni, uslužni stol, aplikacije za suradnju i alate za chat da biste razmjenjivali zajedničke informacije u stvarnom vremenu.

Bez grešaka, bez stresa - Vaš korak po korak vodič za stvaranje softvera koji mijenja život bez uništavanja života

Ne možete poboljšati svoje programiranje kad nikoga nije briga za kvalitetu softvera.

3. Precizno izmjerite MTTR

Kako mjerite srednje vrijeme popravka (MTTR)? Je li to utemeljeno na ukupnom vremenu angažiranja IT timova ili na ukupnom vremenu na koji posao zapravo utječe? Ako je vaš odgovor potvrdan, trebali biste preispitati mjerenje utjecajnog prozora koristeći poslovnu perspektivu. To je mnogo precizniji problem za vaše napore na optimizaciji, jer je vaš cilj smanjiti učinak incidenata, a ne jednostavno predočiti bolja izvješća o odgovorima na vašu ploču. (Da biste saznali više o stankama i načinu kako se rješava, pogledajte što znači prosječno vrijeme između kvarova.)

Možete automatizirati pružanjem potpune vidljivosti u aplikacijama kako biste retroaktivno "pokrenuli sat" ako je potrebno i sačuvali cjelovitu evidenciju svojih aktivnosti razgovora i komunikacija radi analize i revizije kako biste poboljšali svoje procese.

4. Obavijestiti dionike - ali bez prekida rezolucije

Dionici očekuju učinkovitu i pravovremenu komunikaciju, a također očekuju da stručnjaci za teme ostanu fokusirani na rješavanje problema. Iako biste mogli odrediti kontaktnu točku za nadgledanje i angažiranje poslovnih korisnika, učinkovitija strategija bila bi stvaranje web stranice za samoposluživanje s ažuriranjima statusa. To omogućava dionicima da provjere sami bez bombardiranja vašeg tima s daljnjim pozivima. Dovoljno je upamtiti da redovito ažurirate svoje dionike kako bi oni uvijek dobili i znali očekivati ​​najnovije izvješće o stanju. Ne zaboravite da komunikacija ne bi trebala prestati samo zato što je usluga obnovljena! Važno je da dionici dobiju sažetak onoga što se dogodilo, što se saznalo i kako se situacija može spriječiti u budućnosti.

Automatizacija se u ovom slučaju može implementirati za stvaranje automatske stranice statusa u stvarnom vremenu za dionike, kao i izradu naredbi za slijede u vaš chat alat za ažuriranje te stranice.

5. Prikupite podatke za podršku rješavanju problema

Vraćanje usluge ne predstavlja kraj upravljanja incidentima! Zapravo, neke od najvrjednijih aktivnosti događaju se nakon rješavanja. Prikupljanjem dijagnostičkih podataka i podataka o utjecaju i analizom uzroka uzroka, možete izvršiti potpunu reviziju velikog incidenta koji uključuje postavljanje preventivnih mjera kako bi se izbjegli slični incidenti u budućnosti. Pored toga, čak i ako se ponovno dogodi prepoznatljivi incident, možete stvoriti definirani postupak za vrste podataka koje trebate prikupiti i korake koji se trebaju dogoditi za rješavanje pokreta. Na taj se način vaš tim jednostavno mora odnositi na kontrolni popis i usredotočiti se na svoj temeljni cilj obnove usluge, a ne brinuti se što im treba i kada.

Automatizacija ovdje može snimiti i sačuvati aktivnosti rješavanja, uključujući stvari poput prijepisa chat-a, u jedinstvenom sustavu zapisa za analizu. Uz to, pomoći će vam da sastavite katalog poznatih incidenata ili problema, učvrstite najbolje prakse za svaki od njih, a time i povećate brzinu rješavanja u budućnosti.

Zaključno: Automatizirajte pametnije, ne više

Budite oprezni da veća automatizacija nije nužno i bolji pristup! Važnije je shvatiti kada, gdje i kako povezati svoje IT sustave kako bi podržali upravljanje incidentima. Ne želite dodati nepotrebne složenosti radi povećanja automatiziranih procesa. Imajte na umu da je cilj što više pojednostaviti i objediniti operacije kako bi se vaši timovi osjećali osnaženima za učinkovito rješavanje problema. Riječ je o inteligentnom provođenju automatizacije kako bi se olakšao dobro koordiniran skup procesa, dobro znanje osoblja i učinkovite komunikacije dionika, kako bi se umanjio ukupni poslovni utjecaj većih incidenata.