Anda di halaman 1dari 5

Universidad San Francisco de Quito

Procesos Estocsticos

Mean Time Between Failures (MTBF) Nota Explicativa preparada por Ren Jtiva Espinoza Definiciones:
Es importante notar que la definicin del Tiempo medio entre fallas (MTBF del ingls Mean Time Between Failures) se torna en muchos casos ambiguo si no se ha definido previamente la nocin de falla. A continuacin citamos dos definiciones de falla: 1) La terminacin de la habilidad de un producto entendido como un todo, para desarrollar la funcin que se le requiere. 2) La terminacin de la habilidad de cualquier componente individual para desarrollar su funcin pero no la terminacin de la habilidad de operacin del producto entendido como un todo. Se entiende entonces que el MTBF impacta tanto a la confiabilidad como a la disponibilidad, as que citamos las definiciones de estos trminos: La Confiabilidad es la habilidad de un sistema o componente para desarrollar sus funciones bajo condiciones pre-establecidas durante un perodo de tiempo especificado [IEEE 90]. En otras palabras, es la probabilidad de que los sistemas o componentes tengan xito durante el tiempo de la misin identificada, sin fallas. Una misin area es el perfecto ejemplo para ilustrar este concepto. Cuando una aeronave despega para su misin, hay un objetivo en mente: completar el vuelo, como se ha programado, con seguridad (sin fallas catastrficas). La Disponibilidad, por otro lado, es el grado al cual un sistema o componente es operacional y accesible cuando se requiere su uso [IEEE 90]. La disponibilidad puede verse como la probabilidad de que el sistema o componente se encuentre en estado de desarrollar su funcin requerida bajo ciertas condiciones en un instante dado. La disponibilidad se determina por la confiabilidad del sistema, as como tambin por el tiempo de recuperacin cuando una falla se produce. Cuando los sistemas tienen tiempos de operacin continua muy largo, las fallas son inevitables y entonces lo importante es recuperar la operacin del sistema lo ms pronto posible. El valor del MTBF es una medida bsica de la confiabilidad del sistema. Se la representa tpicamente en horas. Mientras ms alto es el valor del MTBF, mayor es la confiabilidad del producto. La siguiente expresin ilustra esta relacin:

Confiabilidad = e

tiempo MTBF

(1.1)

Universidad San Francisco de Quito

Procesos Estocsticos

Un malentendido comn respecto del MTBF es que es equivalente al nmero esperado de horas de operacin antes de que el sistema falle, es decir a la vida de servicio. Pongamos el siguiente ejemplo: En la muestra de nuestra poblacin disponemos de 500.000 personas de 25 aos de edad. En el trascurso de un ao, se recoge informacin sobre fallas (muertes) de los miembros de esta poblacin. La vida operacional de la poblacin es de 500.00 x 1 ao= 500.000 aos. Puesto que en el ao 625 personas fallaron (murieron), la tasa de fallas es de 625/500.000 aos= 0,125%/ao. El MTBF es el inverso de la tasa de fallas, es decir 1/0,00125=800 aos. Esto significa que aunque las personas de 25 aos tienen valores altos de MTBF, su expectativa de vida (vida de servicio) es mucho ms baja y no se correlacionan. Si lo que pretendemos es que el MTBF y la vida de servicio se relacionen, deberamos esperar a que toda la poblacin falle (muera) y entonces tendramos un valor de MTBF de entre 75 y 80 aos. Ambos valores son correctos, pero difieren en las asunciones realizadas. Lo cierto es que en general, se pretende disponer de un valor que sirva hoy, y no uno que se obtenga cuando el producto en cuestin haya sido ya superado tecnolgicamente por otro. Por otra parte el Tiempo Medio de Recuperacin o MTTR (siglas en ingls de Mean Time to Recover), es el tiempo esperado para recuperar un sistema de una falla y se representa tambin en horas. Como lo muestra la siguiente ecuacin, MTTR impacta sobre la disponibilidad y no sobre la confiabilidad. As tambin el MTBF afecta tambin a la disponibilidad. Mientras mayor es el MTBF mejor es la disponibilidad, y mientras mayor es el MTTR, peor es la disponibilidad del sistema. MTBF (1.2) Disponibilidad = MTBF + MTTR Las expresiones anteriores son vlidas bajo el supuesto que el sistema exhibe una tasa de fallas constante. Esto es cierto en componentes electrnicos nicamente en lo que se conoce como el perodo de operacin normal o el perodo de vida til del sistema en cuestin, como se observa de la figura 1.

Universidad San Francisco de Quito

Procesos Estocsticos

Mtodos para predecir y estimar el MTBF


En ocasiones los trminos prediccin y estimacin aparecen como sinnimos, pero en realidad tienen significados diversos. Los mtodos que predicen el MTBF calculan un valor en base al diseo del sistema, usualmente realizado en una etapa temprana dentro del ciclo de vida del producto. Los mtodos de estimacin por otro lado se consiguen de mediciones de fallas, y se calculan de la observacin de muestras de sistemas similares, usualmente despus de que una gran poblacin ha sido implementada en el campo. Su uso por tanto es el ms recomendado y el ms difundido en la industria. Mtodos de Prediccin de la Confiabilidad: MIL-HDBK 217.- Bajo este estndar, hay dos formas de predecir la confiabilidad: Prediccin por cuenta de Partes y Prediccin por Anlisis de Esfuerzos en Partes.

La Prediccin por cuenta de Partes implica que la tasa de fallas se calcula literalmente contando los componentes similares de un producto y agruparlos en varios tipos de componentes. El nmero de componentes en cada grupo se multiplica entonces por una tasa de fallas genrica, encontrndose as el factor de calidad. Finalmente, las tasas de falla de todos los diferentes grupos de partes se suman para conseguir la tasa de fallas final. La Prediccin por Anlisis de Esfuerzos en Partes se utiliza mucho ms tarde en el ciclo de desarrollo del producto, cuando el diseo de los circuitos actuales y el hardware estn cerca de la produccin. La tasa de falla para cada componente se calcula individualmente en base a los niveles de esfuerzo especficos a los cuales se sujeta al componente (por ejemplo humedad, temperatura, vibracin, voltaje). Esta metodologa generalmente conduce a una tasa de fallas menor que la anterior, y debido al nivel de anlisis requerido, este mtodo consume mucho ms tiempo en comparacin con otros. Telcordia.- Este mtodo originalmente basado en MIL 217, aadi posteriormente informacin de campo para posibilitar la estimacin de la confiabilidad de equipos de telecomunicaciones. Ha sufrido varias actualizaciones. Su ltima revisin corresponde a SR-332 Publicacin 1, lanzada en mayo de 2001. Esta metodologa contina aplicndose comu una herramienta de diseo de producto dentro de esta industria. HRD5 (Handbook for Reliability Data for Electronic Components).Desarrollada por British Telecom y usada exclusivamente en el Reino Unido, es similar a 217.

Universidad San Francisco de Quito

Procesos Estocsticos

RBD (Reliability Block Diagram).- Es un dibujo representativo y una herramienta de clculo que se usa para modelar la disponibilidad y confiabilidad de un sistema. La estructura del diagrama de bloques define la interaccin lgica de las fallas dentro de un sistema y no necesariamente sus conexiones lgicas o fsicas en conjunto. Puede modelar un sistema, un subsistema o un componente. Muestra el funcionamiento de un sistema y como la falla en un componente puede afectar la operacin de un sistema visto como un todo. Modelos de Markov.- Proveen la habilidad para analizar los sistemas complejos tales como arquitecturas elctricas. Se conocen tambin como diagramas de espacio de estados o grafos de estado. El espacio de estados se define como un conjunto de todos los estados en los cuales el sistema puede estar. A diferencia de los diagramas de bloques, los grafos de estado proveen una representacin ms exacta de un sistema. El uso de grafos de estado el til para mostrar dependencias de fallas a componentes, y varios estados que el diagrama de bloques no puede representar. Adems del MTBF, los modelos de Markov proveen varias medidas de un sistema que incluyen la disponibilidad, el MTTR, la probabilidad de estar en un estado dado en un tiempo especificado, etc. FMEA/FMECA.- El FMEA (Failure Mode and Effect Analysis) es un proceso usado en el anlisis de los modos de falla de un producto. El anlisis puede ir un paso hacia delante asignando un nivel de severidad a cada un de los modos de falla, en cuyo caso toma el nombre de FMECA (Failure Mode, Effects and Criticality Analysis). FMEA usa una aproximacin de abajo hacia arriba, es decir desde los componentes hasta el sistema completo. Adems de usarse como una herramienta de diseo de producto, puede usarse para calcular la confiabilidad del sistema completo. Requiere de informacin de probabilidad que puede ser difcil de obtener para ciertas partes del equipamiento. rbol de Fallas.- Es una tcnica que puede ayudar a detallar el trayecto de los eventos, tanto relacionados al funcionamiento normal como a eventos de falla, los cuales conducen hacia las fallas a nivel de componentes o hacia los eventos indeseados que se investigan (aproximacin de arriba hacia abajo). La confiabilidad se calcula convirtiendo un rbol de fallas completo en un sistema de ecuaciones equivalente, usando el lgebra de Boole. La informacin de probabilidad requerida por esta metodologa puede ser difcil de obtener. HALT (Highly Accelerated Life Testing).- Se usa para establecer cunto tiempo lleva alcanzar el punto de ruptura de un producto, sujetndolo a esfuerzos cuidadosamente medidos y controlados, tales como temperatura y vibracin. Utiliza un modelo matemtico para estimar el tiempo que habra tomado para que el producto fallara en el campo. Aunque HALT puede estimar el MTBF, su funcin principal es mejorar la confiabilidad del diseo del producto.

Universidad San Francisco de Quito

Procesos Estocsticos

Mtodos de Prediccin de la Confiabilidad: Mtodo de Prediccin de Artculos Similares.- Se basa en estimar la confiabilidad a partir de registros histricos de artculos similares. Su efectividad depende de cun similar es el nuevo equipamiento con respecto al existente y cuya informacin se encuentra disponible. La similitud debe entenderse en trminos de procesos de manufactura, funciones del producto y diseos. Las diferencias deben estudiarse cuidadosamente para la prediccin final. Mtodo de Medicin de Informacin en Campo.- Es posiblemente el mtodo ms utilizado por los fabricantes, y consiste en hacer seguimiento de una muestra de la poblacin de nuevos productos. Una vez que se recoge la informacin, se calculan la tasa de fallas y el MTBF. La tasa de fallas es el porcentaje de la poblacin de unidades que se espera que fallen en un ao calendario. Adicionalmente al uso de esta informacin para el control de calidad, se provee tambin a los clientes y socios con informacin al respecto de la confiabilidad de sus productos y procesos de calidad. Dado que este mtodo es tan ampliamente utilizado por los fabricantes, provee una referencia comn para comparar valores del MTBF. Esta informacin puede ser utilizada por los usuarios para valorar diferencias de calidad en el equipamiento ofrecido por los diversos fabricantes y tomar decisiones en consecuencia. Para efectuar dichas comparaciones, las variables crticas consideradas deben ser las mismas para asegurar que el proceso de decisin sea el correcto.

Conclusiones:
La palabra MTBF se utiliza comnmente en la industria como una alarma. Los nmeros se lanzan sin un entendimiento de lo que verdaderamente representan. Mientras el MTBF es una indicacin de la confiabilidad, no representa la vida media de servicio del producto. En ltimo trmino, un valor de MTBF no tiene significado si la falla es indefinida y las asunciones son confusas o no son realistas.

Referencias:
Las ideas de este artculo se han extrado de: Mean Time Between Failure: Explanation and Standards; Wendy Torrel, Victor Abelar; White Paper #78; American Power Conversio, 2004; www.apc.com.

Anda mungkin juga menyukai