Averiguar la raíz del problema de redes y aplicaciones es cada vez más difícil y una pérdida de
tiempo en las redes empresariales de hoy. Las tecnologías como la virtualización, BYOD y
aplicaciones en la nube dificultan resolver los problemas de rendimiento en una organización
de TI aislada.
Introducción
La red de TI está en el corazón de la mayoría de las empresas, apoyando aplicaciones
críticas del negocio, proporcionando los datos en los cuales se toman las decisiones
económicas facilitando las comunicaciones con los clientes, socios, proveedores y
compañeros de trabajo. Ahora más que nunca, es un activo estratégico del negocio, y
cualquier tiempo de inactividad o degradación en rendimiento de la red o aplicaciones
afectará directamente el balance de la organización. Para entregar los niveles de servicio
acordados con el negocio, el reto es doble: por una parte, mejorar de forma dinámica y
optimizar el rendimiento para garantizar que la red proporciona lo que los usuarios y la
empresa necesitan, y resolver cualquier problema que pueda surgir tan rápido co mo sea
posible para minimizar el tiempo de inactividad. Este documento técnico explora la
metodología de solucionar problemas del funcionamiento de la red y de aplicaciones y
delinea una nueva estrategia para encontrar la causa de raíz de manera más rápida .
TABLA DE CONTENIDO
Introducción
Paso uno: monitorizar/alertar
Segundo paso: investigar
Paso tres: aislar
Paso cuatro: Análisis de la raíz del problema y resolución del problema
INTRODUCCIÓN
Averiguar la raíz del problema de redes y aplicaciones es cada vez más difícil y una pérdida de
tiempo en las redes empresariales de hoy. La virtualización se está ampliando desde el centro
de datos hasta el escritorio, los servicios en la nube están creciendo en popularidad y BYOD
(traiga su propio dispositivo) está aquí para quedarse, reflejando el cambio de patrones de
trabajo y cambio cultural.
La solución de problemas de rendimiento se vuelve más complicada y lenta por el desafío que
supone tener que determinar de quién es la responsabilidad, sobre todo cuando todos los
grupos indican KPI positivos.
Estas herramientas para ayudar a resolver problemas se dividen en dos categorías: sistemas de
gestión de redes (NMS) y herramientas de captura y análisis de paquetes.
Equipo no gestionado, que puedo haberse comprado porque es menos costoso, pero
costará más resolver problemas que se presenten, ya que no hay ninguna visibilidad del
estado de cada segmento de redes y los niveles de utilización no se pueden monitorizar.
En cambio, con un switch gestionado un ingeniero de redes puede ir a cualquier puerto
del switch y ver los errores, ver la utilización y ver quién está conectado a dicho puerto.
Redes indocumentadas, un problema continuo, dado los cambios frecuentes en una red
hacen cualquier documentación desactualizada poco después de la terminación.
Físicamente tratando de rastrear la ruta de acceso tardaría mucho tiempo, pero sin
documentación precisa el ingeniero no conoce el destino de los paquetes. Lo que se
necesita es un medio de descubrir la ruta de acceso en tiempo real a través de la red.
Demasiados datos, cuando el problema reside en pocos paquetes. Resolver problemas
sería mucho más rápido con un método automatizado para tamizar a través de los
paquetes capturados para encontrar los defectuosos, un análisis centrado en la aplicación
que toma un enfoque descendente.
Los problemas en el pasado, que solo llegan a la atención del ingeniero horas después de
haber ocurrido. Lo que se necesita es un medio de volver al pasado mediante la captura y
análisis de grandes cantidades de datos granulares durante un período prolongado de
tiempo, por ejemplo 24 horas, para recoger problemas intermitentes.
Problemas que residen fuera de la red, para que el ingeniero pueda identificarlas y
otorgar la evidencia del problema de rendimiento a otros equipos de TI o proveedores de
servicios externos, con información suficiente para permitir más investigación y una
solución rápida.
Una solución de rendimiento de redes y aplicaciones facilita todas las etapas del proceso de
resolución de problemas y proporciona la visibilidad necesaria para apoyar la optimización de
la red.
Los sistemas de rendimiento de redes y aplicaciones también se pueden integrar con los
sistemas de gestión de redes existentes como HP OpenView o Tivoli Netcool, y transmitir
información y alarmas a la gestión de servicios y a las soluciones del cuadro de mandos.
Para eficacia óptima el sistema debe proporcionar interfaces con conexiones de 1 Gbps y 10
Gbps y ser capaz de capturar datos en velocidad de línea con cables. Algunas soluciones
pueden trazar un camino a través de la red desde un cliente hasta un servidor que identifica
dispositivos de nivel 2 y 3 en el camino de acceso y proporcionar la granularidad necesaria
para identificar la fuente del problema.
Si el problema se encuentra con un cliente o grupo de clientes, el ingeniero debe llevar a cabo
una comprobación de respuesta de rendimiento o aplicación para identificar si el problema es
un problema de red cableada o inalámbrica. Proporcionando herramientas integradas
inalámbricas y por cable con el mismo interfaz de usuario, la red y la aplicación de usuario
permiten una sola comprobación para identificar la fuente del problema.
El malware también puede identificarse como parte de este proceso, que incluye la dirección
IP de origen, lo que le permite al ingeniero identificar la raíz del problema de tiempo de
inactividad que se les pasa a otras herramientas.
Una de las grandes ventajas de SNMP (Simple Network Management Protocol) es su capacidad
de ayudar a aislar dominios de errores. Usar SNMP para cada punto de conexión en el camino
de la consulta determinará si un cuello de botella de tráfico es la fuente de la desaceleración.
Esto es sencillo si los dispositivos en la ruta se gestionan y el ingeniero tiene las contraseñas o
cadenas de comunidad para interrogar los dispositivos. De lo contrario él o ella tienen que
conectar una herramienta en cada enlace sin interrumpir la red para ver los paquetes y las
estadísticas de tráfico. Esto puede ser una gran pérdida de tiempo si hay varios enlaces sobre
un área geográfica grande y puede requerir de varias herramientas en diferentes lugares.
Algunos problemas solo serán visibles al estar en el punto donde ha surgido el problema. Esto
requiere un dispositivo portátil con las capacidades de comprobación correctas y la interfaz
adecuada para conectarse al punto del problema, ya sea frente a un cliente o un enlace de 10
G en un centro de datos. Ya que varias personas trabajan de forma remota, contar con una
herramienta que da esta visibilidad es vital, y esto solo aumentará en importancia con el
crecimiento de BYOD.
Una herramienta portátil también puede enviarse a un sitio remoto para ver lo que está
sucediendo con el equipo no gestionado en la red sin la necesidad de un ingeniero
acompañante. Idealmente debe poder realizar un análisis de trayectoria, medir el estado de la
infraestructura de aplicaciones y flujos de aplicaciones y analizar el rendimiento de la WLAN,
así como revisar la itinerancia y la capacidad de reintento e investigar cualquier interferencia
desde dispositivos externos.
Si no hay enlaces que estén sobre-suscritos o tienen errores de tramos entonces es probable
que la red no sea el problema, pero esto solo puede confirmar si el ingeniero ha analizado los
enlaces en un tiempo razonable y el problema que él o ella está tratando de arreglar todavía
existe. Esto requiere que los datos históricos se capturen por el sistema de rendimiento de red
y aplicación.
Para llegar a la raíz del problema más rápidamente es mejor tomar un enfoque descendente
para el análisis, empezando por el nivel de la aplicación. Por ejemplo, si la ruta es buena, pero
el tiempo de respuesta es pobre, el problema podría ser un servidor virtualizado, una
aplicación que se ejecuta en varios niveles o un error en la aplicación.
Una opción es utilizar un analizador de paquetes que fácilmente puede mostrar el nivel de la
aplicación y el paquete de diagramas de escalera. Las conexiones tap en serie o duplicadas son
fáciles de configurar, pero pueden perder paquetes con cargas de tráfico pesado y no
muestran errores de nivel 1 ya que estas son bloqueadas por el switch de nivel 2
proporcionando el lapso.
Los tap pasivos son los mejores la conexión se pierde al conectarlos, lo que interrumpirá a los
usuarios de los servicios que ofrece este enlace. Si el rendimiento está siendo afectado, esto
generalmente no causa un problema, pero podría afectar aquellos que utilizan este enlace
para conectarse a otros servicios.
Una mejor solución es construir la red con taps ya colocados en una posición estratégica frente
a granjas de servidores, centros de datos, routers para enlaces externos y en el núcleo de la
red. Esto permite que las capturas se puedan tomar sin afectar la red. Si esto no es posible, el
ingeniero podría tener que recurrir a la creación de reflejos de puertos, teniendo en cuenta los
problemas y errores.
El ingeniero simplemente hace clic en esto para obtener y ver exactamente qué paquete o
paquetes tienen un problema. Esto puede asistido aún más al capturar paquetes en varios
puntos de la infraestructura para determinar donde existe el problema. Requiere la capacidad
de realizar análisis de varios segmentos, activando la captura de datos en varios puntos al
mismo tiempo y combinando los resultados para proporcionar toda la imagen.
El análisis efectivo de la raíz del problema puede realizarse en el centro de datos o en sitios
remotos para ver si los problemas están relacionados con el servidor o con la aplicación.
Algunas herramientas pueden extraer información de gestión de servidores físicos o virtuales
para revelar rendimiento y problemas de recursos.
Optimización redes
Una solución para el rendimiento de las aplicaciones y la red proporciona a los ingenieros la
visibilidad que necesitan para documentar y auditar el estado de la red corporativa.
Les permite detectar bajo rendimiento e identificar las rutas en las que las aplicaciones o
servidores funcionan con lentitud, para así poder centrarse en las rutas más críticas y lentas.
La información obtenida puede emplearse para dar prioridad a proyectos como las
actualizaciones de servidores, o para aportar argumentos para su aprobación. Puede también
servir de apoyo para la instalación de nuevos equipos y aplicaciones, pues permite demostrar
que lo que se ha hecho hasta ahora ha funcionado y garantiza además que no ha tenido un
impacto negativo en el rendimiento de cualquier otro componente.
Los datos pueden también demostrar (o negar) el impacto en la red de cambios como la
virtualización, la optimización de WAN o la consolidación del centro de datos.
Acerca de NETSCOUT
Fuente: http://enterprise-es.netscout.com/edocs/4-steps-improve-network-
performance?aliId=73539658