Problem Management
Aus Wiki Itil
Inhaltsverzeichnis |
Einleitung
Die Hauptaufgabe des Problem Management ist das nachhaltige Lösen von Problemen sowie die proaktive Analyse aller Incidents unter dem speziellen Gesichtspunkt der Identifizierung der zugrunde liegenden Ursachen. Darauf basierend gehört auch die Empfehlung von Changes an Configuration Items (CI) durch das Stellen von Requests for Changes (RfC) an das Change Management zu den Aufgaben des Problem Management. Der Prozess Problem Management verwendet Informationen, die durch verschiedene andere Prozesse bereitgestellt werden, beispielsweise durch das Incident Management und Capacity Management.
Ziele des Problem Management Prozesses
Ziel des Problem Management, ist die Minimierung der negativen Auswirkungen auf die IT Services des Kunden. Dazu wird sowohl die Anzahl als auch der „Schweregrad“ von Incidents reduziert, es handelt es sich um eine intern gesteuerte Qualitätsverbesserung der IT-Services und IT-Infrastruktur.
Erreicht wird dieses Ziel durch das Verhindern von Incidents. Dabei werden zwei verschiedene Vorgehensweisen genutzt: Das Wiederauftreten eines oder mehrerer Incidents wird mit Hilfe der Ursachenermittlung und daraus resultierender Lösungsvorschläge verhindert. Diese Aktivitäten werden auch als „reaktiv“ bezeichnet, da auf Incidents reagiert wird.
Dagegen identifiziert der „proaktive“ Zweig Probleme und bekannte Fehler, bevor Incidents auftreten. Dies geschieht z.B. über die Analyse von Trends oder über die Auswertung von Herstellerinformationen und der daraus resultierenden Identifikation von Problemen.
Basiskonzepte
Formen des Problem Management: Problem Management besteht aus zwei Hauptprozessen:
- Reaktives Problem Management, das grundsätzlich zum Einsatz kommt und genereller Teil der Phase Service Operation ist.
- Proaktives Problem Management, das zwar durch die Service Operation initiiert wird, aber genereller Teil des Continual Service Improvement ist.
Definition des Begriffes "Problem": Ein Problem ist die unbekannte Ursache für ein oder mehrere Incidents.
Umfang des Problem Management Prozesses
Das Problem Management unterscheidet reaktive und proaktive Verfahren.
- Das reaktive Problem Management erforscht die Ursachen von Incidents und sorgt für eine nachhaltige Lösung. Davon abgegrenzt werden muss die Disziplin Incident Management, die dagegen eine schnellstmögliche Wiederherstellung von Services sicherstellt.
- Das proaktive Problem Management versucht Probleme und Incidents zu erkennen, bevor diese auftreten. Dazu werden Trends, Analysen von Extern, Reports, Internetforen, etc. genutzt.
Die Datenbasis wird vom Prozess Incident Management geliefert. Das Problem Management unterhält starke Kommunikationsschnittstellen zum Incident Management, dennoch ist es klar abzugrenzen. Eine fundierte Ursachenanalyse kann nicht unter dem Zeitdruck des Incident Managements / von SLAs entstehen.
Das Problem Management ist verantwortlich für die Bearbeitung von Problemen im Zusammenhang mit:
- Geschäftskritischen Services
- Hardware & Software
- Spezifische Fach- und Systemanwendungen
- System-Software
- Kommunikationsanlagen und -Software
- Netzwerken
Nutzen des Problem Management Prozesses
Eine strukturierte Ursachenanalyse reduziert Incidents und erhöht die Stabilität der IT-Services. Kombiniert mit einer gezielten Kommunikation trägt dieses zur Steigerung von Kunden- und Anwenderzufriedenheit bei. Durch die Reduzierung von Incidents werden Ausfallzeiten verkürzt, Service Desk und Incident Management entlastet. Dokumentierte Known Errors und Workarounds beschleunigen die Bearbeitung von Incidents.
Ohne Problem Management kann nur auf Störungen reagiert werden, die zumeist schon von Anwendern und Kunden bemerkt wurden. Ständig wiederkehrende Incidents beeinträchtigen das Vertrauen in den IT-Dienstleister.
Aktivitäten im Rahmen des Problem Management Prozesses
Die Aktivitäten im Problem Management sind in folgenden Gruppen zusammengefasst:
- Identifizierung von Problemen: Problem Identification oder auch Problem Detection (Problemidentifizierung)
- Erfassung von Problemen: Recording oder auch Problem Logging (Problemerfassung)
- Problem Categorization (Problemkategorisierung)
- Problem Priorization (Problempriorisierung)
- Problem Investigation and Diagnosis (Problemerforschung und -diagnose)
- Problem Solution (Problemlösung)
- Problem Closure (Problemabschluss)
- Management der KEDB
Um diese Aktivitäten effizient ausführen zu können, muss das Incident Management die notwendigen Informationen liefern und das Change Management muss etabliert sein, um die Lösungsvorschläge strukturiert umzusetzen.
Rollen innerhalb des Problem Management
Problem Manager
Für das Problem Management ist die Rolle Problem Manager verantwortlich. Kleinere Organisationen sind eventuell nicht in der Lage, eine Person Vollzeit hierfür abzustellen, und können den Problem Manager vielleicht mit einer anderen Rolle kombinieren. Hier gilt es jedoch zu beachten, dass er letztendlich nicht nur technische Aufgaben wahrnimmt. Der Problem Manager soll die koordinierende Person im Problem Management-Prozess sein. Diese Rolle koordiniert alle Problem Management-Aktivitäten und wird folgende Verantwortlichkeiten besitzen:
- Verbindung zu allen Problemlösungsgruppen, um eine schnelle Lösung innerhalb der SLA-Zeiten zu sichern.
- Besitz und Pflege der Known Error Database. Ansprechpartner für die Aufnahme aller Known Errors und Steuerung von Such- bzw. Lösungsalgorithmen.
- Formelle Schließung aller Problem Records.
- Vereinbaren, Initiieren, Dokumentieren und sonstige Aktivitäten bezogen auf Major Problem Reviews.
Problem-Solving Groups (Problemlösungsgruppen)
Die gegenwärtige Lösung von Problemen wird größtenteils von einer oder mehreren technischen Support-Gruppen und/oder Dienstleistern bzw. Support-Partnern unternommen – dies geschieht unter der Koordination des Problem Managers. Wo ein individuelles Problem schwerwiegend genug ist, um es zu rechtfertigen, wird ein dediziertes Problem Management-Team gegründet, um gemeinsam an diesem bestimmten Problem zu arbeiten. Der Problem Manager hat hier sicherzustellen, dass dem Team genügend Ressourcen und Skills zur Verfügung stehen, und entsprechende Eskalationen und Informationen in der Organisationshierarchie zu kommunizieren.
