Anda di halaman 1dari 42

Manejo de

incidentes, Gestin
de operaciones y
soporte a usuarios
Roberto Pinedo
Director
----------------------------------------------------Marco Vera
Jefe Divisin Tecnologa y Desarrollo

Agenda
1.

2.

3.

Manejo de incidentes y soporte de usuarios


a) Organigrama de Equipo Operaciones
b) Clasificacin de Incidentes
c) Flujo Incidentes y soporte Usuarios
d) Indicadores de incidentes y mantenciones 2012
e) Cola de mantenciones evolutivas - Correctivas
f)
Proyeccin de mantenciones
g) Comportamiento resolucin de incidentes
h) Promedio escalamiento incidentes
i)
Worflow de Incidentes
Gestin de operaciones
a) Ingeniera de Sistemas
b) Tipos de Incidentes tratados
c) Actividades realizadas
d) Sitios administrados
Plan de recuperacin de desastre
a) Metodologa de DRP
b) Metodologa de Riesgo
c) Definiciones bsicas de Riesgo
d) Definiciones avanzadas de Riesgo

Agenda
1.

2.

3.

Manejo de incidentes y soporte de usuarios


a) Organigrama de Equipo Operaciones
b) Clasificacin de Incidentes
c) Flujo Incidentes y soporte Usuarios
d) Indicadores de incidentes y mantenciones 2012
e) Cola de mantenciones evolutivas - Correctivas
f)
Proyeccin de mantenciones
g) Comportamiento resolucin de incidentes
h) Promedio escalamiento incidentes
i)
Worflow de Incidentes
Gestin de operaciones
a) Ingeniera de Sistemas
b) Tipos de Incidentes tratados
c) Actividades realizadas
d) Sitios administrados
Plan de recuperacin de desastre
a) Metodologa de DRP
b) Metodologa de Riesgo
c) Definiciones bsicas de Riesgo
d) Definiciones avanzadas de Riesgo

Manejo de Incidentes

/ Organigrama de Equipo Operaciones

Agenda
1.

2.

3.

Manejo de incidentes y soporte de usuarios


a) Organigrama de Equipo Operaciones
b) Clasificacin de Incidentes
c) Flujo Incidentes y soporte Usuarios
d) Indicadores de incidentes y mantenciones 2012
e) Cola de mantenciones evolutivas - Correctivas
f) Proyeccin de mantenciones
g) Comportamiento resolucin de incidentes
h) Promedio escalamiento incidentes
i) Worflow de Incidentes
Gestin de operaciones
a) Ingeniera de Sistemas
b) Tipos de Incidentes tratados
c) Actividades realizadas
d) Sitios administrados
Plan de recuperacin de desastre
a) Metodologa de DRP
b) Metodologa de Riesgo
c) Definiciones bsicas de Riesgo
d) Definiciones avanzadas de Riesgo

Manejo de Incidentes

/ Clasificacin de incidentes

TOP DE CLASIFICACION DE INCIDENTES


1. MODIFICACIN DE DATOS CRITIICOS
Razones Sociales
Nombres de Empresa
Rut
Tipos de Empresa [Naturales / Jurdicas]
Giros.
2. CLAVES O LOGIN
Desbloqueo Cuentas
3. ORDEN DE COMPRA
Errores en Flujo de Creacin y Recepcin del proceso por parte
del Proveedor y Comprador. Incluyen Errores por datos y Aplicativo
4. LICITACIONES
Errores en Flujo de Creacin y Recepcin del proceso por parte
del Proveedor y Comprador. Incluyen Errores por Datos y Aplicativo

Agenda
1.

2.

3.

Manejo de incidentes y soporte de usuarios


a) Organigrama de Equipo Operaciones
b) Clasificacin de Incidentes
c) Flujo Incidentes y soporte Usuarios
d) Indicadores de incidentes y mantenciones 2012
e) Cola de mantenciones evolutivas - Correctivas
f) Proyeccin de mantenciones
g) Comportamiento resolucin de incidentes
h) Promedio escalamiento incidentes
i) Worflow de Incidentes
Gestin de operaciones
a) Ingeniera de Sistemas
b) Tipos de Incidentes tratados
c) Actividades realizadas
d) Sitios administrados
Plan de recuperacin de desastre
a) Metodologa de DRP

Manejo de Incidentes

Proveedores
Compradores
Ciudadano

Vas:

/ Flujo incidentes y soporte usuarios


SLA
- SLA Mximo de 6 Hrs para aquellos
casos que se relacionan con la entrega
de claves, creacin/modificacin de
usuarios o Unidades de
Compra/Proveedora.
- SLA Mximo de 10 Hrs para el resto de
los incidentes.
- SLA Incidencia VIP atencin inmediata

Nivel 1
Mesa de Ayuda
Nivel 2
Divisin Clientes
Nivel 3
Operaciones

Telfono
Formulario
Correo
Transparencia

Base de
Datos
CIERRE DE INCIDENTE

NIVEL 1 (CALL CENTER)


- Dotacin de 40 personas.
- Resolucin de incidentes de baja complejidad o
usabilidad.
NIVEL 2 (AREA DE CLIENTES)
- Dotacin de 5 personas.
- Resolucin de incidentes de media y alta
complejidad mayormente asociados a procesos
comerciales (LC, Ofertas, OC)
NIVEL 3 (AREA DE OPERACIONES)
- Dotacin de 4 Analistas, 1 Supervisor, 4
Ingenieros de Sistemas, 3 Desarrolladores y Jefe
de Operaciones.
- Resolucin de incidentes por Base de Datos.
- Desarrollo de soluciones Express y Normales en
incidencias transversales por aplicativo.

.NET

SQL STUDIO
Ambiente Pruebas
SLA

VISUAL STUDIO
TFS
SHAREPOINT

QA

MANTENCION
CIERRE DE INCIDENTE

Desarrollo de Mantenciones
- Express.
- Despliegue
en
produccin
inmediata no dependiente.
- SCRIPT, SP, ASPX, WEB CONFIG,
HTML.
- Normal.
- Despliegue
en
produccin
dependiente
de
Mdulos
Transaccionales.
- .NET.

Agenda
1.

2.

3.

Manejo de incidentes y soporte de usuarios


a) Organigrama de Equipo Operaciones
b) Clasificacin de Incidentes
c) Flujo Incidentes y soporte Usuarios
d) Indicadores de incidentes y mantenciones 2012
e) Cola de mantenciones evolutivas - Correctivas
f) Proyeccin de mantenciones
g) Comportamiento resolucin de incidentes
h) Promedio escalamiento incidentes
i) Worflow de Incidentes
Gestin de operaciones
a) Ingeniera de Sistemas
b) Tipos de Incidentes tratados
c) Actividades realizadas
d) Sitios administrados
Plan de recuperacin de desastre
a) Metodologa de DRP

Manejo de Incidentes / Indicadores de incidentes y mantenciones

2012
70
60

60
50
38

40
30

36

20

27
12

10

41

27

25

MANTENCIONES DE DESARROLLO FINALIZADAS


- Peak mas alto Mantenciones en produccin es de 60.
- Promedio Mensual de Desarrollos es de mes es de 30.

57

0
1

60

54

50
40

11

50
45

38

10

38

45
35

34

31

30

23

20
9

10
0

10

MANTENCIONES DE DESARROLLO INGRESADAS


- Peak mas alto Mantenciones Ingresadas es de 54.
- Promedio Mensual de Mantenciones Ingresadas es de 36.
- Coordinacin (Comit) con Otras reas para Categorizar
Criticidad de Mantenciones.

11

INCIDENTES GESTIONADOS POR OPERACIONES


- Peak mas alto de incidentes corresponde a 1273
- Promedio Diario de Incidentes Gestionados es de 45.
- Promedio Mensual de Incidentes Gestionados es de 960.
- Comunicacin Directa con el rea de Mantenciones para
Reportar Incidencias Criticas y Vip.
- Gestin de Analistas Considera Solucin de errores por
Base de Datos.
- Gestin de Desarrolladores Considera Solucin Por Lneas
de Cdigo.

Agenda
1.

2.

3.

Manejo de incidentes y soporte de usuarios


a) Organigrama de Equipo Operaciones
b) Clasificacin de Incidentes
c) Flujo Incidentes y soporte Usuarios
d) Indicadores de incidentes y mantenciones 2012
e) Cola de mantenciones evolutivas - Correctivas
f)
Proyeccin de mantenciones
g) Comportamiento resolucin de incidentes
h) Promedio escalamiento incidentes
i)
Worflow de Incidentes
Gestin de operaciones
a) Ingeniera de Sistemas
b) Tipos de Incidentes tratados
c) Actividades realizadas
d) Sitios administrados
Plan de recuperacin de desastre
a) Metodologa de DRP

Manejo de Incidentes / Cola de mantenciones Evolutivas - Correctivas

60

50

40

30

20

10

- Grafico (1) indica la cantidad neta en espera de la


cola de mantenciones y segmentada por tipo
Evolutivo y Correctivo.
- Grafico (2) con indica cantidad de mantenciones
desde que se genero el proceso.
- Grafico (3) con diseo de barras indica la cantidad
neta en espera de la cola de mantenciones.
- Grafico (4) con diseo circular indica el detalle
porcentual de la cola de mantenciones diferenciando
los tipos Evolutivos (controles de cambio a la
aplicacin productiva) y Correctivos (errores de la
aplicacin productiva).
Mantenciones 2012
Ingresadas
409
Finalizadas
319
Pendientes
(*)
90

Agenda
1.

2.

3.

Manejo de incidentes y soporte de usuarios


a) Organigrama de Equipo Operaciones
b) Clasificacin de Incidentes
c) Flujo Incidentes y soporte Usuarios
d) Indicadores de incidentes y mantenciones 2012
e) Cola de mantenciones evolutivas - Correctivas
f)
Proyeccin de mantenciones
g) Comportamiento resolucin de incidentes
h) Promedio escalamiento incidentes
i)
Worflow de Incidentes
Gestin de operaciones
a) Ingeniera de Sistemas
b) Tipos de Incidentes tratados
c) Actividades realizadas
d) Sitios administrados
Plan de recuperacin de desastre
a) Metodologa de DRP

Manejo de Incidentes / Proyeccin de mantenciones

Agenda
1.

2.

3.

Manejo de incidentes y soporte de usuarios


a) Organigrama de Equipo Operaciones
b) Clasificacin de Incidentes
c) Flujo Incidentes y soporte Usuarios
d) Indicadores de incidentes y mantenciones 2012
e) Cola de mantenciones evolutivas - Correctivas
f)
Proyeccin de mantenciones
g) Comportamiento resolucin de incidentes
h) Promedio escalamiento incidentes
i)
Worflow de Incidentes
Gestin de operaciones
a) Ingeniera de Sistemas
b) Tipos de Incidentes tratados
c) Actividades realizadas
d) Sitios administrados
Plan de recuperacin de desastre
a) Metodologa de DRP

Manejo de Incidentes / Comportamiento resolucin de incidentes

Nivel 1
Mesa de Ayuda
Nivel 2
Divisin Clientes
Nivel 3
Operaciones

Base de
Conocimiento
(Base of

Knowledge)

Patrones de Comportamiento
(Indican Tendencias)
Lecciones Aprendidas
(Equipo de Trabajo)
Resolucin Equipo SWAT
(Mejora Continua)

Agenda
1.

2.

3.

Manejo de incidentes y soporte de usuarios


a) Organigrama de Equipo Operaciones
b) Clasificacin de Incidentes
c) Flujo Incidentes y soporte Usuarios
d) Indicadores de incidentes y mantenciones 2012
e) Cola de mantenciones evolutivas - Correctivas
f)
Proyeccin de mantenciones
g) Comportamiento resolucin de incidentes
h) Promedio escalamiento incidentes
i)
Worflow de Incidentes
Gestin de operaciones
a) Ingeniera de Sistemas
b) Tipos de Incidentes tratados
c) Actividades realizadas
d) Sitios administrados
Plan de recuperacin de desastre
a) Metodologa de DRP

Manejo de Incidentes /

Promedio escalamiento incidentes

Nivel 1
Mesa de Ayuda
Nivel 2
Clientes
Nivel 3
Operaciones

960 incidentes promedio al mes se escalan


entre el nivel 1 (mesa de ayuda) y
Operaciones.
45 incidentes promedio al mes se escalan
entre el nivel 2 (divisin de clientes) y
Operaciones.
15 incidentes promedio al mes, procesados
por operaciones son solucionados por el rea
de mantenciones.

Flujo de Ingreso de Incidentes


2012
Total
Escalados Escalados Incidente
Nivel 1 - 3 Nivel 2 - 3
s
Cantidad
10.050
490
10.540
Porcenta
je
95%
5%
100%

Agenda
1.

2.

3.

Manejo de incidentes y soporte de usuarios


a) Organigrama de Equipo Operaciones
b) Clasificacin de Incidentes
c) Flujo Incidentes y soporte Usuarios
d) Indicadores de incidentes y mantenciones 2012
e) Cola de mantenciones evolutivas - Correctivas
f)
Proyeccin de mantenciones
g) Comportamiento resolucin de incidentes
h) Promedio escalamiento incidentes
i)
Worflow de Incidentes
Gestin de operaciones
a) Ingeniera de Sistemas
b) Tipos de Incidentes tratados
c) Actividades realizadas
d) Sitios administrados
Plan de recuperacin de desastre
a) Metodologa de DRP

Manejo de Incidentes /

Worflow de Incidentes

Agenda
1.

2.

3.

Manejo de incidentes y soporte de usuarios


a) Organigrama de Equipo Operaciones
b) Clasificacin de Incidentes
c) Flujo Incidentes y soporte Usuarios
d) Indicadores de incidentes y mantenciones 2012
e) Cola de mantenciones evolutivas - Correctivas
f)
Proyeccin de mantenciones
g) Comportamiento resolucin de incidentes
h) Promedio escalamiento incidentes
i)
Worflow de Incidentes
Gestin de operaciones
a) Ingeniera de Sistemas
b) Tipos de Incidentes tratados
c) Actividades realizadas
d) Sitios administrados
Plan de recuperacin de desastre
a) Metodologa de DRP

Ingeniera de Sistemas

Windows 2008 Server


R2.
SQL SERVER 2008
R2
PHP, Joomla

Ingeniera de
Monitoreo
Aseguramiento de la
plataforma.

Servicios a
Usuarios

Servicios de
Monitoreo

Monitoreo

Proveedor de
Servicios

Plataforma

Servicio a Usuarios

Gestin de Operaciones /

Instalaciones a distintos
ambientes.
Actualizaciones
Mantenciones
Accesos

Ingeniera de Sistemas
Ambiente de QA
Servidor Web
Servidor de Aplicaciones

Ambiente de Pre-Produccin
Servidor Web
Servidor de Aplicaciones

Ambiente Productivo
Servidores Web (8)
Servidor de Aplicaciones (5)

Agenda
1.

2.

3.

Manejo de incidentes y soporte de usuarios


a) Organigrama de Equipo Operaciones
b) Clasificacin de Incidentes
c) Flujo Incidentes y soporte Usuarios
d) Indicadores de incidentes y mantenciones 2012
e) Cola de mantenciones evolutivas - Correctivas
f)
Proyeccin de mantenciones
g) Comportamiento resolucin de incidentes
h) Promedio escalamiento incidentes
i)
Worflow de Incidentes
Gestin de operaciones
a) Ingeniera de Sistemas
b) Tipos de Incidentes tratados
c) Actividades realizadas
d) Sitios administrados
Plan de recuperacin de desastre
a) Metodologa de DRP

Gestin de Operaciones /

Tipos de Incidentes tratados

TOP DE CLASIFICACION DE INCIDENTES


- Otros
1- Accesos de Datos
2- Problemas de Accesos a BBDD
3- Revisin de Sitio de QA
4- Actualizacin de BBDD.
5-Carga y Ejecucin de Script en Produccin
6- Ejecucin de Script de BBDD en Produccin
7 - Problemas de Accesos
8- Ejecutar Querys
9-Carga de Script en TestQA
-10- Despliege en TestQA

Subidas a Produccin
- Express.
- 139 Subidas de SCRIPT, SP,
ASPX, WEB CONFIG, HTML.
- Normal.
- 96 subidas a produccin de
Mdulos Transaccionales.

Agenda
1.

2.

3.

Manejo de incidentes y soporte de usuarios


a) Organigrama de Equipo Operaciones
b) Clasificacin de Incidentes
c) Flujo Incidentes y soporte Usuarios
d) Indicadores de incidentes y mantenciones 2012
e) Cola de mantenciones evolutivas - Correctivas
f)
Proyeccin de mantenciones
g) Comportamiento resolucin de incidentes
h) Promedio escalamiento incidentes
i)
Worflow de Incidentes
Gestin de operaciones
a) Ingeniera de Sistemas
b) Tipos de Incidentes tratados
c) Actividades realizadas
d) Sitios administrados
Plan de recuperacin de desastre
a) Metodologa de DRP

Gestin de Operaciones /

Actividades realizadas

Ingeniera de Sistemas
Soporte de Servicio
Asegurar, Alinear,
Mejorar, Solicitudes

Servicio TI a las reas de


la Institucin
Definicin y uso de SLAs.
Mejorar el rendimiento y la
rentabilidad de TI.
Alinear con los procesos
del negocio.

Monitoreo
Alertar, Analizar,
Elaborar Mtricas

Monitorear los procesos


transaccionales.
Monitorear los servicios
operacionales
del
proveedor.
Analizar las tendencias y
el uso real de ellas.
Prevenir posibles cadas
del sistema.
Elaborar mtricas que
permitan
evaluar
la
capacidad real y su
impacto en la calidad de
servicio.

Servicio a Proyectos
Planificar, Distribuir,
Subir

Supervisin
Medir, Asegurar,
Supervisar

Medir el rendimiento de
la infraestructura.
Uso de SLAs.
Supervisar al proveedor
de servicio.
Planes de Contingencia.
Disaster Recovery.
Mejora Contina

Racionalizar el uso de la
infraestructura TI.
Redistribuir los recursos,
para
asegurar
la
capacidad suficiente de
los servicios crticos, si
fuese necesario.
Planificar la demanda a
corto y largo plazo.
Puestas en marcha de
proyectos en los distintos
ambientes.

ISO 27000
Metodologa

Procesos

Mejora Continua

Continuidad
Operacional

Gestin de Operaciones
Directorio de Operaciones
Infraestructura
Tiempos de respuesta.
Uptime = 99,6
Bitcora de contingencias

520 Servidores Virtuales


+ 8 fiscos (32 Hojas Blade Matrix)
+ HP 3PAR Storage

Discos de Estado Solido


Discos de Fibra de
Canal
Discos SATA

TOTAL = 90 TeraBytes libres despus de redundancia.

Arquitectura de 3PAR

Desarrollo

DB

Email
corporativo

Notificaciones

Adjuntos

Q&A

Impresin
corporativa

Pre Produccin

DB

Fast

DB

TFS

Fast

Proxy

Administracin

Produccin

Fast
MP

CM

Fast

Active
Directory

Formacin

DB

Fast

Tiempos de respuesta, muestra 3


ltimos meses.
Aumento de
conexiones
concurrentes

Se agregan dos
nuevos servidores
web y uno
remoting.

Los tiempos de respuesta se mantienen


entre 0 y 1,5 segundos, a excepcin de
lo siguiente:
Interaccin

Tiempo
Tiempo
Respuest Respuesta
a
Mnimo
Mximo.

Accin

Ficha
Electrnica

2,4

Se mejor en 100% con la


programacin de la ficha ligth.

Ser precursores de nueva tecnologa


nos ha trado un costo. Tipos de
contingencia
Incidente
Impacto
Acciones para evitar que el
Cantidad de
evento ocurra nuevamente.
(LECCIONES APRENDIDAS)

Certificados
de
Indisponibilid
ad

Cada de
Plataforma

Down-Time

Cambio de diseo en
infraestructura de DC.

20

Falla en acceso

Down-Time

Eliminacin de redundancia
de balanceadores.

15

Problemas enlace Lentitud


Internet

Fail-Over enlace secundario

Error de
operacin de
firewall Synapsis.

Lentitud
general del
portal

Se reforz con Synapsis, que


estos trabajos deben ser
programados. El proveedor
restructur el equipo de
trabajo.

Error de
operacin
(Infraestructura

Lentitud en
adjuntar
archivos.

En anlisis de causa.
Synapsis escalo con
proveedor HP.

25

Gestin de Plataforma Transaccional,


certificados de indisponibilidad

Site de Respaldo
Modelo para catstrofes, que permite operar mientras se levanta el
site principal.
Implementacin en Windows AZURE.

Agenda
1.

2.

3.

Manejo de incidentes y soporte de usuarios


a) Organigrama de Equipo Operaciones
b) Clasificacin de Incidentes
c) Flujo Incidentes y soporte Usuarios
d) Indicadores de incidentes y mantenciones 2012
e) Cola de mantenciones evolutivas - Correctivas
f)
Proyeccin de mantenciones
g) Comportamiento resolucin de incidentes
h) Promedio escalamiento incidentes
i)
Worflow de Incidentes
Gestin de operaciones
a) Ingeniera de Sistemas
b) Tipos de Incidentes tratados
c) Actividades realizadas
d) Sitios administrados
Plan de recuperacin de desastre
a) Metodologa de DRP

Gestin de Operaciones /

Sitios administrados

Sitio

Descripcin

http://www.chilecompra.cl

Sitio Corporativo y de noticias.

http://www.mercadopublico.cl

Sitio de transaccional del estado.

http://www.analiza.cl

Sitio de inteligencia de negocios

http://cemanager.chilecompra.cl

Sitio de Centros Empresariales del


estado.

http://formacion.chilecompra.cl

sitio de cursos de capacitacin.

http://capacitacion.chilecompra.cl

sitio de capacitacin del porta

http://transparencia.chilecompra.cl

Sitio de solicitud ciudadana.

http://tribunaldecompras.cl

Sitio de demandas judiciales hacia los


organismos pblicos, referidos a compras
pblicas.

Agenda
1.

2.

3.

Manejo de incidentes y soporte de usuarios


a) Organigrama de Equipo Operaciones
b) Clasificacin de Incidentes
c) Flujo Incidentes y soporte Usuarios
d) Indicadores de incidentes y mantenciones 2012
e) Cola de mantenciones evolutivas - Correctivas
f)
Proyeccin de mantenciones
g) Comportamiento resolucin de incidentes
h) Promedio escalamiento incidentes
i)
Worflow de Incidentes
Gestin de operaciones
a) Ingeniera de Sistemas
b) Tipos de Incidentes tratados
c) Actividades realizadas
d) Sitios administrados
Plan de recuperacin de desastre
a) Metodologa de DRP

Plan de recuperacin de desastre /

Metodologa de DRP
Poltica DRP
DGSI-011

Anlisis y
Evaluacin de
Riesgo

Mantencin y
Mejora

DGSI-002

Anlisis de

Prueba de
Recuperacin

Impacto al
Negocio (BIA)

PGSI-003

PGSI-003

Identificacin de
Controles
Preventivos

Capacitacin
PRRHH-006

PGSI-003

Desarrollo de
Estrategia / Plan
PGSI-003

Agenda
1.

2.

3.

Manejo de incidentes y soporte de usuarios


a) Organigrama de Equipo Operaciones
b) Clasificacin de Incidentes
c) Flujo Incidentes y soporte Usuarios
d) Indicadores de incidentes y mantenciones 2012
e) Cola de mantenciones evolutivas - Correctivas
f)
Proyeccin de mantenciones
g) Comportamiento resolucin de incidentes
h) Promedio escalamiento incidentes
i)
Worflow de Incidentes
Gestin de operaciones
a) Ingeniera de Sistemas
b) Tipos de Incidentes tratados
c) Actividades realizadas
d) Sitios administrados
Plan de recuperacin de desastre
a) Metodologa de DRP

Plan de recuperacin de desastre /

Riesgo

Metodologa de

Gracias.