Anda di halaman 1dari 94

2

MODELO PARA LA GERENCIA DE MANTENIMIENTO INDUSTRIAL

Centro de Altos Estudios Gerenciales


Instituto Superior de Investigacin y Desarrollo

Copyright, 2000. 2. Edicin Adaptada como herramienta computacional. Centro de Altos Estudios Gerenciales ISID Empresa de la Fundacin Educativa Mara Castellanos Femaca e-mail: femaca@telcel.net.ve En asociacin con Cybercentrum Las Mercedes C.A. y Edukami U.S.A.

AGRADECIMIENTO A todo el equipo de colaboradores que brindaron su valiosa cooperacin para la elaboracin y revisin del texto y la programacin del software de clculo de los parmetros de mantenimiento.

INDICE
Prlogo I Gerencia de los Sistemas de Mantenimiento 1.1. Consideraciones generales. ...........................................................................10 1.2. Costos asociados. ..........................................................................................11 1.3. Parmetros de mantenimiento. ......................................................................12 II Confiabilidad de componentes 2.1. Confiabilidad...................................................................................................14 2.1.1. Indices cuantitativos de confiabilidad. ..................................................16 2.1.2. Relaciones entre los ndices cuantitativos de confiabilidad. ......19 2.1.3. Variacin de la confiabilidad de los elementos en funcin del tiempo...................................................................................................22 2.2. Distribuciones de probabilidad de las fallas de los componentes de un sistema. ...................................................................................................23 2.2.1. Distribuciones de probabilidad de Fallas..............................................23 2.3. Bases de datos de confiabilidad.....................................................................34 2.3.1. El teorema de Bayes y la confiabilidad.................................................34 2.4. Tipos de componentes. Expresiones para la evaluacin de su confiabilidad. .................................................................................................37 III Confiabilidad de Sistemas 3.1. Tcnica de rboles de fallas...........................................................................47 3.2. Evaluacin cualitativa del rbol de fallas. .......................................................57 IV PARAMAN: SOFTWARE PARA EL CALCULO DE LOS PARAMETROS DE MANTENIMIENTO ......................................................................................75 BIBLIOGRAFIA .....................................................................................................91

PROLOGO
Dentro del marco de un convenio suscrito entre la Universidad Central de Venezuela y el Instituto Superior de Ciencias y Tecnologa Nucleares, de las Repblicas de Venezuela y Cuba respectivamente, se ha instrumentado un proyecto de investigacin y desarrollo tecnolgico en el rea de la Gerencia de Mantenimiento. Como consecuencia de dicho desarrollo, y dentro de los acuerdos de cooperacin institucional, se ha venido trabajando en un sistema de medicin para estimar los parmetros de mantenimiento, dentro del cual se destacan los aspectos tericos y aplicados de la teora de confiabilidad, as como algunos esquemas asociados a los sistemas gerenciales de mantenimiento industrial. Este trabajo sirvi de base para el desarrollo de un proyecto ms general, relacionado con el Anlisis Probabilistico de Seguridad, donde se requiere crear bases de datos sobre la confiabilidad y mantenibilidad de un gran nmero de componentes y equipos, integrados en sistemas complejos, utilizados regularmente en la industria petrolera, metal mecnica, y elctrica, como tambin en las plantas generadoras de energa, ya sean convencionales que nucleares. Los aspectos mencionados fueron conceptualizados y aplicados a una variada gama de sistemas industriales, dando origen a paquetes computacionales, preparados para la formacin profesional de los ingenieros en el campo del mantenimiento y de los aspectos probabilsticos de seguridad industrial. Sus aplicaciones condujeron a la creacin de un sistema preparado en ambiente de computadoras personales, soportados en un esquema interactivo. Su trabajo requiri la revisin de los aspectos conceptuales en el campo de la Ingeniera, Estadstica e Informtica, lo cual condujo a la preparacin de los manuales de operacin de los sistemas y a la elaboracin de textos que recogiesen los esquemas tericos con sus respectivas aplicaciones, cumpliendo el doble propsito de sistematizar las investigaciones y los desarrollos tecnolgicos y, al mismo tiempo, proporcionar una gua para el estudio como profesional de pregrado y postgrado, de un tema que adquiere enorme importancia en la industria moderna. Una vez culminado el esquema terico e incorporado los Mtodos de Estimacin de Parmetros para el Mantenimiento Industrial, se continu con el desarrollo de aplicaciones diseadas para medir todos los aspectos relativos al anlisis probabilstico de la fiabilidad de sistemas, basado en indicadores de importancia de los eventos susceptibles de ocasionar fallas, as como evaluar la sensibilidad de los sistemas por indisponibilidad media, instantnea y en puntos aislados del tiempo. Este esquema, condujo a establecer los mtodos para obtener la prioridad en los trabajos de mantenimiento, monitorear sistemas y estudiar el problema de la gerencia logstica de partes y repuestos. Luego de desarrollar la parte conceptual de estos aspectos, se construy un sistema computarizado denominado ARCON, abreviatura de Anlisis de Riesgo y Confiabilidad para sistemas industriales complejos, el cual permite realizar Anlisis Probabilsticos de Seguridad y estudiar los problemas relativos a los riesgos industriales. As mismo, 8

se cre un sub proyecto de investigacin referido a la medicin y anlisis de las Vibraciones Mecnicas y su impacto sobre el Mantenimiento Predictivo, adems de otro sub proyecto orientado a la identificacin y el estudio de las fallas humanas en los procesos de la gestin de mantenimiento. Este proyecto est en pleno desarrollo y el Consejo de Desarrollo Cientfico y Humanstico de la Universidad Central conoci de los textos elaborados dentro del convenio, los cuales someti al respectivo arbitraje y procedi a la publicacin de tres libros denominados: Anlisis de Riesgo Industrial; Anlisis de Fallas Dependientes y Errores Humanos, y Mantenimiento Predictivo por Vibraciones Mecnicas; Particularmente, en este trabajo se presentan los mtodos empleados para la estimacin de los parmetros de mantenimiento industrial, concebidos como una herramienta computarizada para estimar los coeficientes de confiabilidad, mantenibilidad y disponibilidad de componentes y de sistemas, proporcionando a estudiantes, profesores y profesionales en general, un instrumento que facilita la obtencin de indicadores que son necesarios para cuantificar la confiabilidad de los sistemas industriales y otros elementos asociados, y absolutamente imprescindibles para llevar a cabo un trabajo tcnico y gerencial adecuado a los requerimientos de control de sistemas en grandes y complejas instalaciones de la industria pesada como, por ejemplo, la industria petrolera. Finalmente deseo expresar sincero agradecimiento al Profesor Ing. Luis A Martnez, del Instituto Superior de Investigacin y Desarrollo, por su extremada cooperacin en el anlisis y desarrollo computarizado de los modelos matemticos, as como a los Profesores Asociados del Instituto Superior de Ciencias y Tecnologa Nucleares, Ingenieros y Doctores en Ciencias Tcnicas, Jos de Jess Rivero y Jess Salomn.

Caracas, mayo del 2000..

I. Gerencia de los sistemas de mantenimiento.


1.1. Consideraciones generales.
Las aplicaciones cientfico-tecnolgicas han derivado durante los ltimos aos en una proporcin significativa hacia la Gerencia, tomando un enfoque cuantitativo sustentado en el desarrollo de modelos estadstico matemticos. Dentro de este marco general, la Gerencia Tcnica ha adquirido un enorme impulso, apoyada particularmente por el procesamiento de datos a gran velocidad, utilizando los ordenadores electrnicos los cuales son hoy en da de gran versatilidad, especialmente las computadoras personales. La gerencia de mantenimiento ha venido transformndose en una actividad cada vez ms importante dentro de los complejos industriales y ha adquirido en los ltimos aos importancia vital, para lograr que las instalaciones y equipos sean mantenidos en las mejores condiciones operacionales dentro de un ambiente de ptimo costo. El anlisis y estudio de las relaciones globales dentro de una organizacin y de su entorno, requieren de experticias especficas examinando variados factores, entre los cuales est la misma organizacin estructural, el uso de los recursos materiales y financieros, la operacin de los sistemas, el control de los costos, y el soporte logstico y tcnico asociado. Dentro de ese marco referencial, y ante la diversificacin tcnica, producto de la variedad tecnolgica y organizacional de los complejos industriales, los sistemas de mantenimiento han adquirido un enfoque especializado, soportado sobre desarrollos tecnolgicos que los han convertido, para la Administracin del Mantenimiento, en herramientas absolutamente necesarias para la direccin global de dichas organizaciones. El perfil de las mismas se ha hecho cada vez ms complejo ya que la tendencia es la de estar integradas por equipos generalmente grandes, variados, ubicados en diferentes frentes de las cadenas de produccin, con operaciones automatizadas y vinculadas a sistemas logsticos para el reabastecimiento de insumos cada da ms sofisticados en su manejo y operacin. A estos aspectos se une la experticia profesional y artesanal, lo cual requiere programas de capacitacin y entrenamiento continuos. Los elementos mencionados hacen aparecer a la funcin de mantener como una actividad dinmica, donde actan gran cantidad de variables y relaciones funcionales, dentro de un esquema de aleatoriedad que caracteriza al sistema de mantenimiento. En 1967, el Dr. Howard Finley (1) introdujo el concepto de Efectividad de un Sistema como mtodo para modelar las actividades del mantenimiento a objeto de optimizar su gerencia; en este sentido lo defini como: "La probabilidad que un sistema opere a toda capacidad durante un perodo de tiempo determinado"

10

1.2. Costos asociados.


El concepto de efectividad de un sistema se encuentra asociado a las variables de costo involucradas en el sistema y, consecuencialmente, se requiere definir los conceptos de costo directo de mantener, costo redundante y costo de penalizacin. El concepto de costo directo de mantener se refiere a la totalidad de los costos necesarios para mantener los equipos operables, incluyendo los servicios, reparaciones, inspeccin y reparaciones mayores. Con relacin al costo redundante, ste se refiere a un costo adicional por la condicin de mantener equipos en espera, para ponerlos en funcionamiento cuando el equipo principal sale de servicio. Por ltimo el costo de penalizacin se refiere a las prdidas de produccin, cuando los equipos primarios salen de servicio y no existen equipos en espera que los substituyan. Las interacciones funcionales de los costos mencionados son sumamente complejas; pero, en todo caso, la gerencia define su esquema de actuacin conducente a identificar la mejor combinacin de los subsistemas asociados al sistema, a objeto de minimizar el costo total de la operacin y optimizar los esfuerzos de mantener un complejo industrial en particular en la mejor condicin operacional, dentro de un tiempo determinado. El esfuerzo de mantener, en primer lugar, est asociado de manera directa al tiempo fuera de servicio de una instalacin; al efecto, el costo total resultante de la operacin est en relacin directa con el esfuerzo de mantener. Por lo tanto, a mayor esfuerzo corresponde comprometer ms recursos econmicos y materiales, incrementndose funcionalmente el tiempo fuera de servicio. Se desprende de esta consideracin que por mucho esfuerzo realizado el costo no necesariamente ser el ptimo, es ms, podr incluso llegar a hacerse antieconmico. Por otro lado, la cada de un sistema por fallas del mismo o de sus componentes, implica un costo de penalizacin, como consecuencia de la prdida del valor de la produccin no colocada en los mercados o comprometida; as se desprende que este costo est exponencialmente asociado al tiempo fuera de servicio y al sumarizarse al costo de mantenimiento, determina que el costo directo de mantener se incremente. El costo total, funcin a su vez del esfuerzo de mantener, tendr un entorno ptimo, que habr que determinar tcnicamente con la ayuda del anlisis de los parmetros de mantenimiento, los cuales contribuyen a mantener la efectividad del sistema preparado para su operacin en un perodo de tiempo determinado. El concepto de sistema se define de la manera siguiente:

11

"el conjunto de elementos discretos o componentes que interactan para el cumplimiento de una funcin determinada".

1.3. Parmetros de mantenimiento.


La efectividad de un sistema, es funcin de un factor sumamente importante dentro de un enfoque cuantitativo de anlisis de la funcin de mantenimiento: se trata del concepto de disponibilidad. El concepto de disponibilidad se define como: "la probabilidad que un sistema, subsistema o equipo est disponible para su uso durante un tiempo dado". Esta probabilidad, asociada a la probabilidad de tener sistemas, sub-sistemas o equipos instalados con una redundancia determinada, al estar disponibles para su funcionamiento cuando el sistema, subsistema o equipo principal sale de servicio, permite obtener una relacin funcional que determina el comportamiento de la Efectividad del sistema. El concepto de disponibilidad, como medida probabilstica de que un sistema est disponible a requerimiento del sistema operativo, es de extraordinaria importancia para la gerencia de mantenimiento. El complemento de este concepto o indisponibilidad de un sistema, subsistema o equipo, se utilizar con frecuencia en los anlisis de mantenimiento por la forma prctica que toma el concepto en las aplicaciones computarizadas. La disponibilidad como parmetro de mantenimiento, a su vez, es funcin de dos elementos muy importantes: en primer lugar de la confiabilidad de un sistema, subsistema o equipo y en segundo lugar de su mantenibilidad. El primer elemento se define tcnicamente de variadas maneras. Conejero (2) la define como: "la caracterstica de un elemento expresada por la probabilidad que cumpla sus funciones especficas durante un tiempo determinado cuando, se le coloca en las condiciones del medio exterior". Finley (3) la define como: "la probabilidad que un equipo no falle mientras est en servicio durante un perodo de tiempo dado". Por ltimo, Valhuerdi y Quintero (4) la definen como:

12

"la propiedad de un sistema de cumplir las funciones para l previstas, manteniendo su capacidad de trabajo bajo los regmenes y condiciones de explotacin prescritos y durante el intervalo de tiempo requerido". El segundo elemento, es decir, mantenibilidad se define como: "la probabilidad que un sistema, subsistema o equipo que ha fallado pueda ser reparado dentro de un perodo de tiempo determinado". La determinacin de los parmetros confiabilidad y mantenibilidad son determinantes para calcular la disponibilidad de un sistema, sub-sistema, equipo, parte o pieza de una estructura industrial. Ello proporciona los datos fundamentales para el anlisis de la funcin de mantener y de una gerencia efectiva, dentro de un ambiente de sistema total que genera gran cantidad de informacin tcnica y que requerir de evaluacin permanente con la ayuda de sistemas computarizados. Este sistema total est conformado por multitud de factores gerenciales, entre los cuales destacan: la organizacin y las polticas, y procedimientos, tales como: control de trabajos, control de costos y emisin de reportes gerenciales. A un mayor esfuerzo en el conocimiento de los indicadores de la gestin de mantener, habr entonces correlativamente mayor efectividad del sistema, asociado a menores costos de penalizacin y costos totales mnimos; para tales propsitos, se desprende la necesidad de un monitoreo constante de los parmetros de mantenimiento mediante un sistema de informacin y de clculo de variables, utilizando modelos estadstico matemticos que sirva de apoyo tcnico para la planeacin y programacin de las acciones de mantener.

13

II. Confiabilidad de componentes.


2.1. Confiabilidad.
A modo de introduccin, se abordan brevemente los conceptos principales de la teora de confiabilidad de componentes y sistemas. y trminos

Sistema: Conjunto de elementos discretos o componentes que interactan para el cumplimiento de una funcin determinada. Subconjuntos de estos componentes pueden, a su vez, denotarse como subsistemas.

Los conceptos de sistema y subsistema son conceptos relativos y dependen de la funcin que sea objeto de estudio. De acuerdo con la funcin que se defina, pueden variar las fronteras de lo que se considera como sistema o subsistema. Lo que en un estudio es sistema, puede que en otro sea subsistema. De igual forma, la definicin de los elementos discretos o componentes de un sistema tambin es relativa y depende del grado de detalle con que se quiera descomponer el sistema para su estudio y, en ltima instancia, de las posibilidades que ofrezca la base de datos disponible. As, en el caso de un sistema de enfriamiento, uno de los componentes podra ser la bomba, mientras que si disponemos de los datos necesarios, la bomba podra en otro caso considerarse como sistema y sus piezas como componentes. Confiabilidad: Es la propiedad de un sistema (elemento, componente o pieza) de cumplir las funciones para l previstas, manteniendo su capacidad de trabajo bajo los regmenes y condiciones de explotacin prescritos y durante el intervalo de tiempo requerido. Dicho de otra forma, la confiabilidad es la propiedad del sistema de mantenerse sin experimentar un suceso de falla durante el tiempo y las condiciones de explotacin establecidos. Falla: Suceso despus del cual el sistema tecnolgico deja de cumplir (total o parcialmente) sus funciones. La falla es la alteracin de la capacidad de trabajo del componente o sistema.

Las fallas pueden ser clasificadas de acuerdo con una serie de ndices, que se recogen de manera general en la tabla 2.1.1. La falla catastrfica conduce a la alteracin de la capacidad de trabajo. A este tipo de falla corresponden la ruptura y el cortocircuito; las fracturas, deformaciones y atascamiento de las piezas mecnicas, etc. Las fallas paramtricas son fallas parciales que conllevan a una degradacin de la capacidad de trabajo, pero no a su interrupcin total. Las fallas, como hechos casuales, pueden ser independientes o dependientes. Si la falla de un elemento cualquiera de un sistema no motiva la falla de otros 14

elementos, ste ser un hecho o acontecimiento independiente. Si la aparicin de la falla en un elemento o si la probabilidad de ocurrencia de la falla ha cambiado con la falla de otros elementos, esta falla ser un hecho dependiente. Anlogamente se definen como dependientes o independientes las fallas de sistemas con respecto a las de otros sistemas.
Indice de clasificacin Segn el grado de influencia en la capacidad de trabajo Segn la influencia de fallas de otros elementos Segn el carcter de su proceso de aparicin Tipos de fallas catastrfica paramtrica independiente dependiente repentina gradual estable temporal Intermitente de interrupcin de bloqueo revelable oculta primaria secundaria comando modo comn

Segn el tiempo de permanencia del estado fallado Segn el momento en que se manifiesta Segn la forma de su deteccin Segn la naturaleza de su origen o causas

Tabla 2.1.1. Clasificacin de las fallas. Las fallas repentinas (inesperadas) aparecen como consecuencia de la variacin brusca (catastrfica) de los parmetros fundamentales bajo la accin de factores casuales relacionados con defectos internos de los componentes, con la alteracin de los regmenes de funcionamiento o las condiciones de trabajo, o bien con errores del personal de servicio, entre otras causas. En las fallas graduales se observa la variacin suave de los parmetros debido al envejecimiento y al desgaste de los elementos o de todo el sistema. Las fallas estables son aquellas que se eliminan slo con la reparacin o la regulacin, o bien sustituyendo al elemento que fall. Las fallas temporales pueden desaparecer espontneamente sin la intervencin del personal de servicio debido a la desaparicin de los motivos que la provocaron. Las causas de tales fallas son frecuentemente los regmenes y condiciones de trabajo anormales. Las fallas temporales que se repiten muchas veces se denominan intermitentes o alternantes. Ellas atestiguan la existencia de anormalidades en la calidad del equipamiento o en regmenes y condiciones de trabajo. Las fallas de interrupcin son las que se producen en el equipamiento en operacin, interrumpiendo su trabajo. Las fallas de bloqueo impiden el arranque o

15

puesta en funcionamiento de sistemas o componentes a la demanda, es decir, bloquean la puesta en funcionamiento de sistemas que estn a la espera. Las fallas revelables son aquellas que se exteriorizan al personal de operacin inmediatamente despus de su ocurrencia, porque sus efectos se manifiestan directamente en los parmetros de funcionamiento de la instalacin tecnolgica o son detectados a travs del sistema de control. Se trata de fallas de sistemas en funcionamiento, o a la espera con control de sus parmetros. Las fallas ocultas no se revelan al personal de operacin por ninguna va en el momento de su ocurrencia, pero la condicin de falla permanente est latente hasta ser descubierta por una prueba o sobre la demanda de operacin del sistema en cuestin. Se trata, por tanto, de fallas de sistemas que trabajan a la espera. Las fallas primarias son intrnsecas del elemento y responden a sus caractersticas internas. Las fallas secundarias son debidas a condiciones ambientales o tensiones operativas excesivas impuestas a un elemento desde el exterior. Las fallas comando son las originadas por la operacin indebida o la no operacin de un elemento iniciador (elemento que controla o limita el flujo de energa que llega al elemento considerado). Dentro de las fallas secundarias y comando se pueden definir las fallas modo o causa comn, que son aquellas en que fallan varios elementos, producto de una misma causa. 2.1.1. Indices cuantitativos de confiabilidad. Entre los parmetros fundamentales que caracterizan la confiabilidad de elementos y sistemas se tienen los siguientes: Probabilidad de trabajo sin fallas o probabilidad de supervivencia: es la probabilidad de que en un intervalo de tiempo prefijado (o en los lmites de las horas de trabajo dadas) con regmenes y condiciones de trabajo establecidos, no se produzca ninguna falla, es decir, la probabilidad de que el dispositivo dado conserve sus parmetros en los lmites prefijados durante un intervalo de tiempo determinado y para condiciones de explotacin dadas. La denotaremos por Ps(t).

De esta definicin se infiere que la probabilidad de supervivencia es el ndice a travs del cual se cuantifica la confiabilidad de un sistema o elemento tcnico. La cuantificacin de la confiabilidad como una probabilidad, est determinada por el carcter aleatorio del suceso al que est referida (aparicin de la falla). Dicho suceso, aunque aleatorio, est condicionado por factores de diseo, calidad de la ejecucin y explotacin, etc., cuya influencia se refleja en su probabilidad de ocurrencia. Por tanto, la influencia de estos factores sobre la confiabilidad tambin es susceptible de cuantificar.

16

Probabilidad de falla: es la probabilidad de que en un intervalo de tiempo prefijado se produzca al menos una primera falla. La denotaremos por Pf(t). Puesto que el trabajo defectuoso y el trabajo sin fallas son sucesos complementos, tendremos que: Pf(t) = 1 - Ps(t) [2.1.1]

Desde el punto de vista matemtico Ps(t) y Pf(t) constituyen funciones de distribucin acumulada. Densidad de fallas: es el nmero de fallas por unidad de tiempo, referido a la cantidad inicial de elementos de un lote o muestra dada N0. Se representa por f(t). As: dN/dt f(t) = -- N0

[2.1.2]

donde: N(t) es el nmero de componentes que no han fallado (se encuentran operables) al cabo de un tiempo t N0 es el nmero inicial de elementos de la muestra en estudio - dN es el diferencial de elementos que fallan en el intervalo (t, t+dt) Tomando en cuenta las definiciones anteriores de probabilidad de supervivencia y probabilidad de falla, resulta evidente que: N(t) Ps(t) = N0 N0 - N(t) Pf(t) = N0 [2.1.3]

[2.1.4]

Por tanto, la densidad de fallas puede expresarse en funcin de Ps(t) o Pf(t), de la forma siguiente: dPf(t) dPs(t) f(t) = = - dt dt [2.1.5]

17

La densidad de fallas representa as la funcin de densidad de probabilidad asociada a la funcin de distribucin acumulada Pf(t), por ello tambin se conoce como funcin de densidad de probabilidad de falla (o de la primera falla). Intensidad de fallas o rata de fallas: es el nmero de fallas por unidad de tiempo, referido al nmero de elementos que se encuentran operables en el instante t, y se denota por R(t). As: dN/dt R(t) = - -N(t) Si expresamos [2.1.2] como: dN/dt N(t) f(t) = - N(t) N0 resulta que f(t) R(t) = Ps(t) [2.1.7] [2.1.6]

Sustituyendo [2.1.5] en [2.1.7] y tomando en cuenta [2.1.1], la rata de fallas tambin puede expresarse como: Ps'(t) Pf'(t) f(t) R(t) = - = = Ps(t) 1 - Pf(t) 1 - Pf(t) [2.1.8]

La intensidad o rata de fallas se expresa cuantitativamente en unidades de tiempo inversas (por lo general horas inversas: 1/h) y se puede interpretar como la probabilidad de que el elemento falle por unidad de tiempo a partir de un instante de tiempo t dado, con la condicin de que no haya fallado hasta dicho instante. De ah que esta magnitud tambin se identifique como rata de fallas condicional. - Tiempo medio de operacin o servicio (tiempo medio de trabajo sin fallas): nmero medio de horas de trabajo de un componente hasta la primera falla. Lo denotaremos como TMS (tiempo medio de servicio). Este se puede hallar aproximadamente como:

18

ti
i=1

TMS = N Donde:

[2.1.9]

ti es el tiempo de trabajo sin fallas del i-simo elemento. N es el nmero de elementos del lote de componentes con que se experimenta.

Mientras mayor es el nmero N, ms calidad estadstica tiene la valoracin y mayor es la precisin del valor determinado para TMS. -Tiempo medio de reparacin o tiempo promedio para reparar: es el tiempo medio, en horas, de duracin de la reparacin de un elemento despus de experimentar una falla. El valor aproximado del tiempo promedio para reparar (TPPR) podemos hallarlo mediante la expresin:
K

ti
i=1

TPPR = K Donde:

[2.1.10]

K es el nmero de fallas del elemento dado durante el tiempo de ensayo u observacin ti es el tiempo de duracin de la reparacin despus de la falla i. La rata de reparacin se define como el inverso de TPPR: 1 = TPPR 2.1.2. Relaciones entre los ndices cuantitativos de confiabilidad.

- Relacin entre la rata de fallas R(t) y la probabilidad de supervivencia Ps(t). Si integramos la expresin [2.1.8] como funcin de Ps(t) en los lmites de 0 a t obtenemos: 19

R ( ) d = [ ln Ps ( t ) ln Ps ( 0 )]

considerando que para t=0, Ps(0)=1 (componente como nuevo), resulta:

ln Ps ( t ) = R ( ) d
0

o sea:

Ps ( t ) = Exp ( R ( ) d )
0

[2.1.11]

para:

R(t) = const. = R Ps(t) = EXP(-Rt) [2.1.12]

Por ltimo, aplicando [2.1.1] se obtiene: Pf(t) = 1- EXP(-Rt) [2.1.13]

- Relacin entre la densidad de fallas f(t) y la probabilidad de supervivencia Ps(t). Si integramos [2.1.5] se obtienen las siguientes expresiones:

Pf(t) = f ()d
0

[2.1.14]

Ps(t ) = 1 f ()d
0

[2.1.15]

- Relacin entre la densidad de fallas f(t) y la rata de fallas R(t). De [2.1.7] se obtiene: f(t) = R(t).Ps(t) 20

y sustituyendo Ps(t) por [2.1.11] f (t ) = R (t ).Exp( R( )d )


0 t

[2.1.16]

- Relacin entre el tiempo medio de servicio y la rata de fallas. El TMS se determina como el valor esperado del tiempo t hasta la falla, que sigue una funcin de densidad de probabilidad f(t). As pues, su expresin general ser: TMS = tf (t )dt
0

Sustituyendo f(t) en funcin de Ps(t) tomando en cuenta [2.1.5], resulta: TMS = tdPs(t )
0

Cuando esta expresin se integra por partes se obtiene:

TMS = Ps (t )dt
0

[2.1.17]

Consideremos el caso particular en que la rata de fallas es constante. Bajo estas condiciones Ps(t) viene dada por [2.1.12] y [2.1.17] se transforma en: TMS = Exp( Rt )dt
0

de donde se obtiene finalmente: TMS = 1/R [2.1.18]

Esta relacin entre TMS y R (constante) es muy importante y determina que en la prctica R y TMS sean usados indistintamente como datos de partida para los anlisis de confiabilidad.

21

2.1.3. Variacin de la confiabilidad de los elementos en funcin del tiempo. La curva de R(t) en funcin del tiempo para un elemento dado sigue en la mayora de los casos un comportamiento tpico como el mostrado en la figura 2.1.1, que por su forma caracterstica recibe el nombre de "curva de la baera". Esta curva puede dividirse en tres partes. La primera parte es el perodo inicial de trabajo del elemento donde pueden producirse fallas tempranas debido a deficiencias en el control de la calidad. Los fabricantes acostumbran someter a prueba los elementos durante este perodo para corregir tales fallas tempranas. La segunda parte se caracteriza por una rata de fallas aproximadamente constante. En esta parte de la curva podemos considerar las fallas como aleatorias e independientes del tiempo. Este es el perodo de vida til del elemento, al cual podemos asociar una distribucin de probabilidad de falla de tipo exponencial como la expresada por [2.1.13] La tercera parte de la curva, en la que se produce un aumento sostenido de R(t) corresponde a la salida de servicio acelerada de los elementos debido al desgaste y el envejecimiento.

Fig. 2.1.1. Comportamiento tpico de la rata de fallas de un elemento. Para el caso particular de sistemas de alta responsabilidad, como los sistemas de seguridad de industrias de alto riesgo, las fallas tempranas tienden a ser aleatorias (R constante) debido a los altos requerimientos del control de calidad, mientras que el mantenimiento y reposicin de componentes contribuyen a alargar el perodo de vida til, protegiendo los sistemas contra el desgaste y el envejecimiento. Por otro lado, cuando los dispositivos fallan de forma no frecuente y son complejos y costosos, no pueden ser realizadas muchas pruebas para caracterizar su confiabilidad. Solo se pueden realizar estimaciones de R(t). Por ello, lo usual en los anlisis de confiabilidad y de cuantificacin de la seguridad es asumir las fallas aleatorias, de modo que R(t) es igual a un valor constante R.

22

Ello determina que la distribucin de probabilidad ms usada para la modelacin de la confiabilidad de componentes sea la distribucin exponencial, caracterizada por las expresiones [2.1.12] y [2.1.13]. Esta es la que se emplea por lo general en los anlisis de confiabilidad mediante rboles de fallas. As, en la literatura internacional se acostumbra a caracterizar la confiabilidad de componentes mediante valores de ratas de fallas constantes expresadas en forma de fracciones simples o decimales que dan la probabilidad de fallas por hora de trabajo. En la tabla 2.1.2 se ilustran ratas de fallas tpicas para algunos componentes de sistemas industriales con ndices elevados de confiabilidad y seguridad.
Componente Bombas Tuberas Diesels Vlvulas Instrumentos [1/h] 3E-6 1E-9 8E-5 3E-6 3E-7

Tabla 2.1.2. Ratas de fallas para algunos tipos de componentes de sistemas industriales (5).

2.2. Distribuciones de probabilidad de las fallas de los componentes de un sistema.


2.2.1. Distribuciones de probabilidad de Fallas. A continuacin se describen las distribuciones de probabilidad ms frecuentemente utilizadas para la descripcin de fallas de componentes. 2.2.1.1. Distribuciones discretas. Dos de las distribuciones discretas de probabilidad ms tiles usadas en anlisis de fallas son las distribuciones binomial y de Poisson. Dos parmetros de inters para cualquier distribucin discreta de probabilidad P(x) de una variable aleatoria x son la media M y la varianza V(x). Para N salidas posibles, la media es definida como: M = x P(x) x=0
N

[2.2.1]

23

mientras la varianza, que mide la desviacin de los valores alrededor de la media, es: V(x) = (x-M)2 P(x) x=0 - Distribucin Binominal. En el ms simple de los sistemas hay slo dos salidas, o el sistema funciona a la demanda o falla. Estas dos probabilidades son complementarias por lo que: P(D) = 1 - P(D) [2.2.3]
N

[2.2.2]

donde D es el suceso que representa el xito y D la falla. Supongamos que la actuacin de un sistema no es conocida y que se va a realizar un experimento consistente de N demandas o ensayos. Se especifica que las demandas son independientes (ensayos Bernoulli) tal que P(D) es constante para cada ensayo. Para describir el experimento con la distribucin binominal es necesario que el orden de los sucesos no afecte el resultado del experimento. Los posibles resultados corresponden a los diferentes trminos del desarrollo binomial de la ecuacin. [P(D)+P(D)]N = 1 [2.2.4]

Sea q = P(D) la probabilidad de falla e introduzcamos la variable aleatoria discreta x, definida como el nmero de demandas para las que el sistema falla. Esta variable sigue la distribucin binomial, con parmetro q e ndice N. La probabilidad de que ocurran x fallas, es obtenida seleccionando al trmino apropiado del desarrollo binomial de la ecuacin [2.2.4] y tiene la forma: N! P(x) = qx(1-q)N-x x! (N-x)! [2.2.5]

Se puede demostrar que para la distribucin binomial M = Nq V(x) = Nq(1-q) [2.2.6] [2.2.7]

Otra distribucin de probabilidad obtenida de la [2.2.5] es la funcin de distribucin acumulada de que el sistema falle para Z o menos demandas. Se

24

obtiene por adicin de los trminos apropiados en el desarrollo de la Ecuacin [2.2.4]: P(x Z)= P(x) x=0
Z

[2.2.8]

As la probabilidad de que el sistema falle para Z+1 o ms demandas sera, el complemento de P(x>=Z), P(x > Z)= 1 - P(x) x=0
Z

[2.2.9]

La distribucin binomial es usada en ingeniera de confiabilidad para describir un componente nico que opera a la demanda y puede ser reparado quedando en un estado "como nuevo" inmediatamente despus de que falla. Entonces P(x) es la probabilidad de que el componente falle x veces en N demandas. Una segunda aplicacin de esta distribucin para anlisis de fallas se refiere al caso de N componentes idnticos, con una probabilidad de falla q igual para todos. Entonces P(x) describe la probabilidad de que fallen x de los N componentes del sistema.

- Distribucin de Poisson. La distribucin de Poisson es similar a la binomial en el hecho de que describe fenmenos para los cuales la probabilidad promedio de un suceso es constante e independiente del nmero de sucesos previos. En este caso, sin embargo, el sistema experimenta transiciones aleatoriamente desde un estado con N ocurrencias de un suceso a otro con N+1 ocurrencias, en un proceso que es irreversible. Es decir, el ordenamiento de los sucesos no puede ser intercambiado. Otra distincin entre las distribuciones binomial y de Poisson es que para el proceso de Poisson el nmero de sucesos posibles debe ser grande. La distribucin de Poisson puede ser deducida a partir de la identidad EXP(-M).EXP(M) = 1 [2.2.10]

donde el nmero ms probable de ocurrencias del suceso es M. Si el factor EXP(M) es expandido en un desarrollo de series de potencias, la probabilidad P(x) de que exactamente x ocurrencias aleatorias tengan lugar puede inferirse como el x-esimo trmino en la serie, de donde se obtiene: 25

EXP(-M).Mx P(x) = X!

x = 0,1,2,3,...

[2.2.11]

La media y la varianza de la distribucin de Poisson son ambas iguales a M. La funcin de distribucin acumulada de que un suceso ocurra Z o menos veces, viene dada por la expresin general [2.2.8], tomando en cuenta que P(x) en este caso se describe mediante [2.2.11]. As pues, EXP(-M).Mx P(x Z)= x=0 X!
Z

[2.2.12]

Por supuesto la probabilidad de que un suceso ocurra Z+1 o ms veces es el complemento de [2.2.12], es decir, 1 - P(x>=Z). La distribucin de Poisson es til para el anlisis de la falla de un sistema que consta de un nmero grande de componentes idnticos que al fallar causan transiciones irreversibles en el sistema. Cada componente se asume que falla independientemente y aleatoriamente. Entonces M es el nmero ms probable de fallas del sistema durante la vida til.

2.2.1.2. Distribuciones continuas. Para anlisis de fallas los valores de la variable aleatoria tiempo hasta la falla se encuentran en el intervalo [0,]. En este caso el valor medio de una distribucin est dado por: M = tf (t )dt
0

[2.2.13]

y la varianza

V = (t M ) 2 f (t)dt
0

[2.2.14]

- Las distribuciones de Erlang y Exponencial. La distribucin de Erlang es la forma dependiente del tiempo de la distribucin discreta de Poisson. Ella aparece frecuentemente en los clculos de ingeniera

26

de confiabilidad que consideran fallas aleatorias, esto es, aquellas fallas para las que la rata de fallas R(t) es una constante R. Su expresin puede deducirse a partir de la expresin [2.2.11] hasta obtener finalmente la distribucin de Erlang como: R.(Rt)x-1.EXP(-Rt) f(t)= (x-1)! R>0 , x>0 [2.2.15]

La distribucin de Erlang es vlida para un nmero entero de fallas x. El caso particular ms importante es para x=1, en el que se obtiene la distribucin exponencial. f(t)= R EXP(-Rt) La funcin de exponencial es: distribucin [2.2.16] acumulada [2.2.17] de fallas para la distribucin

Pf(t)= 1 - EXP(-Rt) y los dos momentos son: 1 M = , R 1 V(t) = R2

[2.2.18]

- Distribucin Logaritmo normal. La distribucin logaritmo normal de una variable t es una distribucin para la cual el logaritmo de t sigue una distribucin normal o gaussiana. La ecuacin que describe la distribucin de probabilidad de falla en este caso se puede escribir como: 1 ln2 (t/) f(t)= EXP(-) (2) t 2 2 El parmetro (adimensional) y el parmetro (en determinan la forma de f(t). [2.2.19]

unidades de tiempo)

La densidad de probabilidad de fallas se presenta en la figura 2.2.1 donde se puede apreciar que la distribucin es oblicua hacia la derecha comparada con la distribucin de Gauss, que es simtrica respecto a su valor medio. La oblicuidad se acenta con valores crecientes de .

27

La funcin de distribucin acumulada se halla [2.2.19], de donde se obtiene: 1 Pf(t) = [ 1 erf (z) ] 2 1 = [ 1 + erf(z) ] 2 donde Z se define como: ln(t / ) 2 la distribucin para t> para t<

integrando la expresin

[2.2.20]

Z=

[2.2.21] logaritmo normal, obtenidas a

La media y la varianza de partir de [2.2.13] y [2.2.14] son: M = EXP( 2/2 )

V(t) = 2 EXP(2 ) [ EXP(2 ) - 1 ]

[2.2.22]

Fig. 2.2.1. Densidad de probabilidad de fallas segn la distribucin logaritmo normal. La distribucin logaritmo normal aparece en procesos en los que el cambio en una variable aleatoria en el n-esimo paso es una proporcin aleatoria de la variable en el paso (n-1)-esimo. Es decir, la distribucin logaritmo normal se emplea cuando la variacin est caracterizada por factores o porcientos. As, si X

28

representa una cantidad que puede variar con un factor de error f, abarcando un rango de valores desde X0 /f hasta X0 f, donde X0 es un punto medio de referencia dado, la distribucin logaritmo normal es la distribucin adecuada para describir el fenmeno. La distribucin logaritmo normal se aplica con frecuencia para describir las fallas en los anlisis de confiabilidad y riesgo de sucesos raros (de baja probabilidad), en los que la informacin estadstica limitada hace que las ratas de falla varen por factores. Por ejemplo una rata de fallas estimada en 10-6/h puede variar de 10-5 a 10-7/h si el factor de error es 10. Cuando la rata de fallas se expresa como 10-x, donde x es un cierto exponente, el uso de la distribucin logaritmo normal implica que el exponente satisface una distribucin normal. As, se puede ver la distribucin logaritmo normal como apropiada para situaciones en las que hay incertidumbres grandes en los parmetros de fallas. Otra caracterstica de la distribucin logaritmo normal es que la oblicuidad para tiempos mayores considera el comportamiento general de los datos para fenmenos poco probables ya que la misma tiene en cuenta la ocurrencia de valores poco frecuentes pero con una gran desviacin, tales como ratas de fallas anmalas debido a defectos de lotes de produccin, degradacin ambiental y otras causas. - Distribucin de Weibull. La distribucin de Weibull es una distribucin de fallas muy general y ampliamente difundida por su aplicabilidad a un gran nmero de situaciones diversas. La densidad de fallas es: K t f (t ) = v v
k 1

t Exp v

[2.2.23]

La funcin de distribucin acumulada, el valor medio y la varianza, vienen dados por las siguientes expresiones: Pf(t) = 1 - EXP[-(t / v )K] M = v (1 + K-1) V(t) = v2 { (1 + 2K-1) - [ (1 + K-1)]2} [2.2.24] [2.2.25] [2.2.26]

donde representa la funcin Gamma, que aparece tabulada.

29

La forma de la distribucin depende primariamente del parmetro K, como se aprecia en la figura 2.2.2. Para K=1, se obtiene la distribucin exponencial, con rata de fallas R = v-1. Al incrementarse K la distribucin de Weibull tiende a la distribucin normal siendo ambas casi indistintas para K mayor que 4. Un caso particular es la distribucin de Rayleigh que se obtiene para K=2. Las aplicaciones de la distribucin de Weibull se pueden comprender ms fcilmente a partir de la expresin de la rata de fallas para esta distribucin: K t R (t ) = v v
k 1

[2.2.27]

As pues, el modelo de Weibull es el apropiado para el ajuste de datos en los que la probabilidad condicional de fallas R(t) satisface una ley de potencia del tiempo. Ratas de fallas de este tipo se ilustran en la figura 2.2.3. La aplicacin de la distribucin de Weibull est sujeta a la cuantificacin de los coeficientes "v" y "k" cuyas magnitudes dependen de la serie histrica de los tiempos de operacin o corrida de un equipo o componente.

Fig. 2.2.2. Densidad de probabilidad de fallas segn la distribucin de Weibull.

30

Fig. 2.2.3. Rata de fallas segn la distribucin de Weibull. La cuantificacin de los coeficientes o estimadores ha recibido importante atencin de Khirosi y Mieko, 1963; Johnson, 1964; C.Cohen, 1965; Weibull 1964 y Finley 1977 (6). A partir de los mtodos de Cohen y la aplicacin del Mtodo de Mxima Verosimilitud obtendremos soluciones aproximadas pero confiables de los coeficientes "v" y "k" y a partir de all derivar las estimaciones de la rata de fallas, probabilidades de supervivencia y probabilidades de falla. As mismo, evaluaciones matemticas del comportamiento de estos indicadores para diferentes perodos de tiempo. Sea la funcin de densidad de Weibull: K t K-1 f(t) = . t EXP [ - ()K ] vK v para t>0,K>0,v>0

Sea "L" la funcin de mxima verosimilitud, dependiente de una variable "A". La solucin de la ecuacin consiste en estimar el valor de "A" para el cual "L" asume un valor mximo. Como "Log L" presenta un mximo al mismo valor de "A", la ecuacin a resolver es: dLog L = 0 dA

31

Donde la funcin de verosimilitud, segn H. Kramer, de una muestra de n observaciones es: L(x1,x2,x3,...xn) = f(x1,A).f(x2,A).f(x3,A)...f(xn,A) Si los valores de la muestra han sido dados y la funcin de "L" es de una variable "A", la funcin de verosimilitud para la muestra completa utilizando la funcin de Weibull es: K ti K-1 L(t1,t2,...tn) = . ti. EXP [- () K] I=1 v K v N

[2.2.28]

tomando logaritmo y derivando con respecto a V y K e igualando a cero tenemos: Ln [L(ti,i=1...,n)] n.k k n ti = - + ()K = 0 v v v i=1 v

n ti ti Ln [L(ti,i=1...,n)] n n = - - nlnv+ ln ti + ln ()K = 0 i=1 i=1 K K v v

Eliminando V y simplificando: 1 n 1 n n ln ti = - + ti ln ti / ti K i=1 i=1 n i=1 K ti K v = [ ] 1/K i=1 n


n

[2.2.29]

Por iteraciones sucesivas, al efecto, una estimacin de "K" se puede obtener mediante el mtodo de Newton-Raphson cuya tcnica numrica permite encontrar la raz de una funcin F(x), y eliminar el error asegurando el valor de "K". Bajo estas condiciones si Ki es la aproximacin de una raz, una nueva estimacin est dada por:

32

F(Ki) Ki+1 = Ki - F'(Ki) la funcin queda definida por:

F(Ki) 0

[2.2.30]

1 1 K F(k) = (ti) .lnti - ti - lnti.ti K k n


K

1 1 K F'(x) = (ti) .(lnti) - lnti.ti + ti K -... K K2


K 2

1 - ln ti lnti.ti K n donde: Ki+1-Ki<e

[2.2.31]

siendo e=error de aproximacin.

Prefijado e se limita el proceso iterativo para el clculo de k, calculado ste se calcula v obteniendo la estimacin por mxima verosimilitud de la funcin de Weibull. Con los estimados correspondientes se obtienen la rata de fallas, probabilidad de falla, de supervivencia y los estimados del promedio y la varianza. Los clculos respectivos han permitido la construccin de un modelo para obtener los parmetros de confiabilidad, cuyo programa computarizado ha sido denominado PARAMAN. A continuacin definimos los datos de entrada, caracterizados por el tiempo de corrida al estado entre la base de la hora y fecha de arranque del equipo y la fecha y hora de parada caracterizando la razn de las fallas. Estos datos se convierten en variables xi de la muestra, se ordenan de manera creciente y finalmente se suavizan exponencialmente para mejorar en homogeneidad, logrado este aspecto se procede al clculo de los indicadores de confiabilidad y se disponen para la respectiva simulacin atendiendo a diferentes perodos de tiempo. El modelo matemtico computarizado PARAMAN, que forma parte de un Sistema de Informacin Gerencial de Mantenimiento, calcula la probabilidad que un equipo se encuentre en operacin o sea reparado en un lapso determinado, a partir del comportamiento mismo del equipo, el cual se caracteriza por los tiempos de operacin y los tiempos durante los cuales est detenido por 33

reparacin. La distribucin de los tiempos de operacin y de parada se asocian a funciones probabilsticas que permiten encontrar los parmetros de confiabilidad y mantenibilidad, cuya combinacin da origen a la disponibilidad y ofrece, adems la posibilidad de efectuar simulaciones sobre la base de diferentes perodos de tiempo. El modelo PARAMAN determina la rata de fallas, el factor "k" que establece el ciclo de vida del equipo, la edad caracterstica de corrida, y evala las probabilidades de supervivencia y de falla. Estos elementos entran en el clculo de los tiempos medios entre paradas y su respectiva varianza. En el caso de mantenibilidad, se define la funcin de probabilidades que calcula la posibilidad que un trabajo de mantenimiento se efecte en un tiempo determinado, la edad caracterstica para reparar, su varianza y los tiempos medios. Resumiendo, el modelo PARAMAN permite obtener: - Historial de un componente, equipo o planta ( arranques, paradas, causas de la parada) - Probabilidades de supervivencia y falla - Tiempos de operacin entre arranque y falla - Tiempos fuera de servicio - Disponibilidad para cada corrida - Tiempos medios entre fallas, fuera de servicio y disponibilidad total - Parmetros de Weibull (tiempo de corrida caracterstico "v", factor "k", desviacin estndar del tiempo medio entre fallas, rata de fallas) - Parmetros de Gumbel (Factor de forma "A", tiempo caracterstico de parada "U") - Probabilidades de falla y tiempos de reparacin (calculados por simulacin para diferentes valores de tiempo) En (7) podr encontrar una informacin ms detallada PARAMAN. sobre el sistema

2.3. Bases de datos de confiabilidad.


2.3.1. El teorema de Bayes y la confiabilidad. La determinacin experimental de datos de confiabilidad de componentes para una industria en especfico puede confrontar dificultades cuando las fallas son sucesos raros. Por ello en ocasiones es necesario recurrir a datos de

34

componentes similares en otras industrias donde se disponga de una mayor estadstica de fallas y hacer un proceso de "ajuste" de estos a la experiencia de explotacin de la instalacin que se analiza. Puede tambin darse el caso de datos genricos para industrias de una tecnologa dada que se quieren ajustar a los componentes anlogos de la tecnologa propia. Para ello juega un papel importante el llamado Teorema de Bayes de la Teora de las Probabilidades. - Teorema de Bayes. Sea un espacio muestral S, dividido en N sucesos A1...AN mutuamente excluyentes, tales que A1+A2+...+AN=S y otro suceso cualquiera B, subconjunto de S. Entonces, de acuerdo con la definicin de probabilidad condicional, tenemos que: P(Ai.B) = P(Ai/B).P(B) = P(B/Ai).P(Ai) Igualando el segundo y tercer miembros y despejando obtenemos: P(Ai) P(B/Ai) P(Ai/B) = P(B)

[2.3.1]

Si P(B) se expresa a partir de los sucesos A1...AN, se obtiene finalmente la expresin del Teorema de Bayes: P(Ai) P(B/Ai) P(Ai/B) =
N

[2.3.2]

P(Ai) P(B/Ai)
i=1

La aplicacin ms importante de la expresin [2.3.2] en anlisis de confiabilidad est dirigida al ajuste de datos genricos o de otras industrias, para ser utilizados en la instalacin propia, tomando en cuenta la estadstica de fallas acumulada en esta ltima. Esta aplicacin se ilustra en el siguiente ejemplo. Ejemplo 2.3.1: Supongamos que queremos estimar la rata de fallas de una bomba de baja presin empleada en un sistema de enfriamiento. De la literatura internacional conocemos que las ratas de fallas para bombas similares en otras industrias oscilan en los rdenes 10-3, 10-4, 10-5 [1/h] . De la experiencia de explotacin de la tecnologa propia se tiene que para una muestra dada de bombas del tipo analizado no se han producido fallas durante 500 horas de trabajo en regmenes de prueba.

35

En este caso, adoptamos como sucesos Ai las ratas de fallas encontradas en la literatura: A1 es el suceso rata de fallas igual a 10-3, A2 igual a 10-4 , A3 igual a 10-5, las que sern nuestras hiptesis de partida. El suceso B ser el que nos aporta la experiencia propia: 500 horas de trabajo sin falla. Si la rata de fallas fuese 10-3/h, la probabilidad de B (500 horas de trabajo sin fallas) sera: P(B/A1) = (1 - 10-3 . )500 Siendo 10-3 la probabilidad de falla en una hora, 1-10-3 es la probabilidad de supervivencia o de ausencia de fallas en una hora. Este ltimo trmino, elevado a la potencia 500, equivale a la probabilidad de que no se produzcan fallas en 500 horas, considerando independientes entre s los sucesos de no falla en cada hora, por lo cual, se obtiene: P(B/A1) =Exp(- 10-3 .500)= 0.6064 Clculos similares permiten obtener los valores restantes de P(B/Ai) que se presentan en la tabla 2.3.1. Estos valores contienen el dato de la experiencia propia que combinado con las probabilidades P(Ai) asumidas de otras fuentes conducen a las probabilidades condicionales P(Ai/B). Si para las probabilidades P(Ai) se asume una distribucin uniforme tal que P(Ai)=1/3, aplicando [2.3.2] podemos hallar las probabilidades de que la rata da fallas de la bomba de nuestra industria sea 10-3, 10-4 o 10-5 dada la evidencia B de que no se producen fallas en 500h de trabajo. Estas son las probabilidades condicionales P(Ai/B) de la tabla 2.3.1 para la distribucin previa uniforme. I Ai P(B/Ai) Distribucin previa uniforme P(Ai) P(Ai/B) 0.3333 0.2376 0.3333 0.3726 0.3333 0.3898 1 10-3 0.6064 2 10-4 0.9512 3 10-5 0.9950

36

Distribucin previa no uniforme P(Ai) P(Ai/B) 0.1 0.0643 0.3 0.3026 0.6 0.6330

Tabla 2.3.1. Clculos bayesianos para el ejemplo 2.3.1. Si hubisemos sido ms realistas en nuestra primera estimacin de P(Ai), como muestra la distribucin no uniforme de las probabilidades previas P(B/Ai) en la tabla 2.3.1, entonces, como puede apreciarse para el segundo caso de distribucin previa no uniforme, la introduccin de la informacin B tiene menor efecto sobre los valores previos P(Ai), pues se observa una mayor concordancia entre los valores de P(Ai) y P(Ai/B). Los resultados de la tabla 2.3.1 nos permiten concluir que para la bomba del ejemplo 2.3.1 debe adoptarse una rata de fallas entre 10-4 y 10-5, ms prxima a 10-5, como podra ser 3.10-5. Una mayor certeza inicial podra obtenerse con un mejor conocimiento de las caractersticas y condiciones de trabajo de las bombas cuyas ratas de falla se tabulan en la literatura, lo que permitira asociar mayores valores de probabilidad P(A) a las ratas de aquellas cuyas caractersticas y condiciones de trabajo se asemejen ms a la propia. As, el anlisis bayesiano puede utilizarse para el ajuste de listados genricos de datos de partida para los anlisis cuantitativos de confiabilidad y seguridad, lo cual es muy frecuente en la prctica de realizacin de estos anlisis.

2.4. Tipos de componentes. Expresiones para la evaluacin de su confiabilidad.


Para la cuantificacin de la confiabilidad de componentes nos basaremos en el modelo exponencial, para el cual la rata de fallas es constante. Al evaluar la confiabilidad de un componente es necesario tener en cuenta dos aspectos. En primer lugar el rgimen de trabajo bajo el cual se evala la confiabilidad, lo cual determina el parmetro que la caracteriza, y en segundo lugar, la posibilidad de restitucin de la capacidad de trabajo del componente despus de una falla, es decir, si el componente es o no reparable, lo cual determina la expresin a utilizar para el clculo del parmetro que corresponda.

37

En lo adelante al referirnos a la confiabilidad o al evaluarla, lo haremos en trminos de probabilidad de falla. Ello se debe a un problema prctico. Los valores de confiabilidad de componentes y sistemas de instalaciones de alta responsabilidad, y por tanto de altas exigencias en su calidad, son elevados, muy prximos a la unidad (decimales con varios 9 consecutivos), mientras que su complemento, la probabilidad de falla, son valores muy prximos a cero, fcilmente expresables como potencias negativas de 10. En cuanto al rgimen de trabajo de los componentes existen dos posibles: el rgimen de espera, durante el cual el componente permanece listo para entrar en funcionamiento cuando se le requiera, y el rgimen de operacin. El primero es tpico de los sistemas de seguridad o aquellos que permanecen como reserva, los cuales durante la operacin de la planta se mantienen a la espera de cualquier suceso accidental o falla que requiera su actuacin. El segundo es tpico de los sistemas de operacin normal y corresponde tambin a los sistemas de seguridad durante el perodo de tiempo que dure el cumplimiento de su funcin de seguridad despus que son demandados (sistemas de seguridad activos). Las ratas de fallas utilizadas para modelar los componentes deben estar diferenciadas de acuerdo con su rgimen de trabajo. As existen ratas de falla a la espera y ratas de fallas en operacin. Tambin debe tomarse en cuenta la correspondencia del rgimen de trabajo con el tiempo analizado. Para el rgimen de espera deber utilizarse, por tanto, la rata de fallas a la espera y el tiempo a la espera (tiempo durante el cual el componente se mantiene "listo" para entrar en funcionamiento) y para el rgimen de operacin se usar la rata de fallas en operacin y el tiempo analizado ser el perodo necesario de operacin del componente. Seguidamente se describen las expresiones para el clculo de la probabilidad de falla de componentes, segn su clasificacin en modos de falla a la espera y en operacin y de acuerdo a los tipos de componentes que emplea el algoritmo base para los modelos computarizados denominado Anlisis de Riesgo y Confiabilidad (sistema ARCON). - Componentes a la espera. Para la evaluacin de la probabilidad de falla de componentes a la espera definiremos una nueva magnitud que es la disponibilidad del componente. La disponibilidad se define como la probabilidad de que el componente est apto o listo para actuar u operar en el momento que sea requerido. Por razones similares a las planteadas para la fiabilidad trabajaremos no con la disponibilidad de los componentes sino con su complemento (1 disponibilidad) que llamaremos indisponibilidad y denotaremos por q(t). 38

As, la indisponibilidad q(t) se define como la probabilidad de que un componente est en estado fallado en el instante t y no sea posible su actuacin si es requerida (falla de bloqueo). Como se aprecia, se trata de una magnitud puntual que evala la probabilidad del estado fallado en un instante t, a diferencia de la probabilidad de falla para sistemas en operacin dada por [2.1.13], que es una funcin de distribucin acumulada que da la probabilidad de falla (falla de interrupcin) para un intervalo de tiempo de 0 a t. - Componentes tipo 1. Probabilidad de falla fija. En este caso la indisponibilidad del componente es un tiempo, de modo que: q(t) = q = cte. [2.4.1] valor constante en el

Los componentes tipo 1 se emplean para modelar aquellos modos de falla, cuya probabilidad es uniforme en el tiempo, as como en aquellos casos en que no se cuenta con informacin suficiente para determinar una ley de variacin de la indisponibilidad en el tiempo de acuerdo a otro modelo. Un modo de falla al cual se aplica este modelo es al error humano, por ejemplo, el suceso de una vlvula manual dejada en posicin incorrecta despus de un mantenimiento. En este caso un valor tpico es q=2.10-2, lo que representa que en 100 demandas al componente, ste se encontrar como promedio 2 veces en posicin incorrecta (indisponible), por el error humano. - Componentes tipo 2. No controlable. Se aplica a componentes cuyo estado no es controlado durante todo el tiempo en que el sistema se encuentra a la espera, y que al presentarse la demanda pueden fallar por mecanismos de fallas ocultas. El sistema ARCON da, adems, la posibilidad de adicionar a la indisponibilidad de este tipo de componentes una probabilidad adicional de falla a la demanda por carga de impacto sobre el componente en el momento que se requiere su actuacin. As, de la expresin [2.1.13], que corresponde a componentes no reparables cuyo tiempo hasta la falla sigue una distribucin exponencial, se obtiene adicionando la indisponibilidad por carga de impacto qad: q(t) = 1 - EXP(-Rt) + qad [2.4.2]

En ARCON tambin se incluye un tiempo previo Tpr que el componente haya estado a la espera con anterioridad, sin recibir ningn tipo de mantenimiento que permita considerarlo como nuevo al inicio de nuestro perodo de observacin. Esto modifica [2.4.2] de la siguiente manera:

39

q(t) = 1 - EXP[-R(Tpr+t)] +qad

[2.4.3]

La expresin [2.4.3] tiene un crecimiento exponencial con el tiempo, de modo que la indisponibilidad del componente ser una funcin del instante en que se produzca la demanda. En muchos casos se requiere hallar un valor de indisponibilidad medio, representativo del comportamiento del componente durante el tiempo a la espera T, tambin conocido como tiempo de observacin. Para el clculo de la indisponibilidad media del componente aplicamos la expresin general: q= 1 T

q(t )dt

Sustituyendo [2.4.3] e integrando, se obtiene finalmente: _ 1 q = 1 - {EXP[-RTpr] - EXP[-R(Tpr+T)]} + qad RT - Componentes tipo 3. Controlado de forma continua. Se aplica a los componentes cuya falla se detecta en cuanto se produce y son sometidos de inmediato a la reparacin. Para un sistema a la espera este puede ser un tanque, cuyo salidero se detecta inmediatamente por un medidor de nivel con indicacin o seal de alarma en un panel. Se trata por tanto de una falla revelable. En este caso la indisponibilidad del componente se determina a partir del balance entre los procesos de rotura y reparacin, dados por la ecuacin diferencial: q(t+dt)= [1 - q(t)].Rdt + q(t).[1 - dt] [2.4.5] [2.4.4]

En [2.4.5] se determina la indisponibilidad en t+dt correspondiente al miembro de la izquierda a partir de la indisponibilidad que haba en t mediante los dos trminos del miembro de la derecha. De ellos, el primero representa la probabilidad que tiene el componente de estar disponible en t y fallar en t+dt, mientras que el segundo corresponde a la probabilidad de estar fallado en t y no ser reparado en t+dt. Integrando [2.4.5] y teniendo en cuenta la condicin inicial q(0)=0, se obtiene finalmente:

40

R q(t) = { 1 - EXP[-( R + ) t ] } + qad R+

[2.4.6]

En [2.4.6] se incorpor adems la probabilidad de falla adicional que eventualmente puede tomar en cuenta posibles cargas de impacto sobre el componente en el instante de la demanda. El componente tipo 3 tiene una indisponibilidad inicialmente creciente en el tiempo, pero que se estabiliza rpidamente en su valor asinttico. Por ello, en el clculo de la indisponibilidad de este tipo de componentes se emplea habitualmente la expresin [2,4.7], que es el valor asinttico de [2.4.6]. _ R q = + qad R+ [2.4.7]

- Componentes tipo 4. Probado peridicamente. Este es el caso de los componentes cuyo estado se comprueba cada cierto tiempo Tp mediante una prueba o ensayo de duracin que permite detectar las fallas del componente. En los casos en que el componente se encuentra fallado se procede a su reparacin. La prueba puede tener una cierta ineficiencia, de modo que de la rata de fallas total slo se detecta una fraccin que llamaremos ineficiencia de la prueba y denotaremos por Inef. As, la rata de fallas se desdobla en dos componentes, la rata de fallas detectables Rdet y la rata de fallas no detectables Rno, cuyas expresiones son: Rdet = R.(1-Inef). Rno = R.Inef. [2.4.8] [2.4.9]

La indisponibilidad de un componente de este tipo tiene un carcter peridico, y puede dividirse en tres zonas principales: - Durante la prueba. La contribucin de la prueba a la indisponibilidad viene dada por la expresin: qp = pnt Tp [2.4.10]

41

donde el cociente representa la probabilidad de que al presentarse una demanda el componente este en prueba y pnt es la llamada probabilidad de notrnsito del estado de la prueba al estado del componente para el cumplimiento de su misin. La probabilidad pnt representa la indisponibilidad del componente durante la prueba. - Durante la reparacin posterior a la prueba (s se detecta fallado). Al realizar la prueba, el componente ha permanecido a la espera durante un tiempo Tp - . La probabilidad de llegar a la prueba fallado, ser, de acuerdo con [2.1.13]: 1-EXP[-Rdet(Tp-)], expresin que se aproxima a Rdet(Tp) para valores de Rdet(Tp- ) menores que 0.1, lo cual resulta completamente vlido en todos los casos de inters. Tomando en cuenta lo anterior, se puede establecer la siguiente expresin para la indisponibilidad por reparacin: Tr qr = Rdet(Tp- ) [ .( 1 - phe) + phe ] Tp- donde Tr es el tiempo medio de reparacin del componente(=1/); phe es la probabilidad de error humano total, que incluye tanto la probabilidad de no detectar la falla por error en la prueba phep como la probabilidad de que el componente quede indisponible por un error en la reparacin pher. phe = phep + ( 1 - phep ) pher En la expresin [2.4.11] el primer factor es la probabilidad de que el componente llegue fallado a la prueba. El primer sumando entre corchetes representa la probabilidad de que se produzca la demanda cuando el componente est en reparacin, dado que el componente se detecta fallado y se repara correctamente. El segundo sumando es la probabilidad total de error en la prueba o la reparacin, que hacen que el componente permanezca indisponible durante todo el tiempo Tp- que media hasta la prxima prueba. Si la expresin finalmente: [2.4.11] se transforma convenientemente, [2.4.12] se obtiene [2.4.11]

qr = Rdet [ Tr + phe.(Tp - - Tr) ]

Si la probabilidad de error humano fuera cero, la expresin se reduce a: qr = Rdet.Tr [2.4.13]

42

- Durante el tiempo (Tp- ) hasta la prxima prueba. En este intervalo el componente est sometido a fallas ocultas no controlables cuya funcin de distribucin acumulada viene dada por [2.1.13]. Si se tiene en cuenta la aproximacin q(t)= Rdet.t, vlida para valores de Rdet.t menores que 0.1, la indisponibilidad media por fallas ocultas en este intervalo ser: q OC = Tp 0 1
Tp

R det tdt

Integrando, se obtiene finalmente: 1 qoc = Rdet (Tp- ) 2 [2.4.14]

Por ltimo, la expresin de la indisponibilidad media de un componente tipo 4, se obtiene adicionando las expresiones [2.4.10],[2.4.12],[2.4.14]: _ q = pnt + Rdet [ Tr + phe .(Tp - - Tr) ] +... Tp 1 + Rdet(Tp - ) 2

[2.4.15]

Cuando la ineficiencia de la prueba es mayor que cero la expresin [2.4.15] slo nos da el aporte a la indisponibilidad media del componente debido a las fallas detectables en la prueba. La fraccin de las fallas que no se detecta en la prueba tiene un carcter no controlable y su aporte vendr dado por una expresin como [2.4.4], usando Tpr=0 y Rno como rata de fallas _ 1 q = pnt + Rdet[Tr + phe .(Tp - - Tr)] + Rdet(Tp- ) +... Tp 2 1 + 1 - { 1 - EXP[- Rno T] } + qad RnoT [2.4.16]

En [2.4.16] se incluy como ltimo trmino la probabilidad de falla adicional a la demanda por carga de impacto. Esta funcin tiene adems la posibilidad de ajustar las ratas de fallas de la frmula [2.4.16] para tomar en cuenta los casos en que la prueba degrada al

43

componente e incrementa su rata de fallas. Este es el caso tpico de los generadores diesel que se emplean en la industria para asegurar el suministro elctrico en condiciones de avera. Con este fin el sistema emplea un dato adicional para los componentes tipo 4, el factor de degradacin de la prueba, expresado como el % de incremento de la rata de fallas en cada prueba.. - Componentes tipo 6. Indisponibilidad por mantenimiento. Este modo de falla es la probabilidad de que el componente se encuentre fuera de servicio por mantenimiento en el momento que tiene lugar una demanda. Si Tm es el tiempo entre mantenimientos y m es la duracin del mantenimiento, la indisponibilidad por mantenimiento viene dada por: _ m q = Tm - Componentes tipo 7. Suceso desarrollado. Es un componente de probabilidad de falla fija, que a los efectos del clculo no se diferencia del componente tipo 1 y su indisponibilidad viene dada tambin por la expresin [2.4.1]. Se emplea para representar la falla de un subsistema, sistema de apoyo o elemento complejo, que en el momento del anlisis no se puede desarrollar en los modos de falla ms simples que lo componen por falta de informacin, o bien este desarrollo se ha hecho de forma separada para una integracin posterior, cuando se vaya a conformar el modelo de confiabilidad del sistema a partir de sus componentes en lo que se conoce como un rbol de fallas. - Componentes en operacin ( tipo 5 ). La probabilidad de que un componente falle en operacin, ser la probabilidad de que experimente al menos una falla cuando trabaja durante ese perodo, por lo que puede ser cuantificada mediante la funcin de distribucin acumulada de fallas Pf(t), dada por [2.1.13], para R=Rop y t=top : Pf(t) = 1 - EXP(-Rop . top) que puede ser aproximada como Pf(t) = Rop . top [2.4.18] [2.4.17]

44

para valores de Pf(t) menores que 0.1. Esta expresin se aplica al clculo de la probabilidad de falla de componentes no reparables en operacin, que a lo sumo pueden experimentar una falla. Sin embargo, para componentes redundantes reparables, es necesario tomar en cuenta la posibilidad de reparacin, pues mientras sta se realiza, la misin es cumplida por el otro componente y el sistema no falla. En este caso la falla se produce slo si el componente redundante tambin falla, antes de que el primero haya podido ser reparado. En estos casos la probabilidad de falla del componente en operacin se determina mediante una expresin anloga a la [2.4.7], empleada para componentes tipo 3: Rop Pop = Rop+ donde Pop Rop [2.4.19] es la probabilidad de falla en operacin del componente es la rata de fallas del componente en operacin es la rata de reparaciones del componente, igual al inverso del tiempo promedio para reparar.

45

III. Confiabilidad de sistemas.


La evaluacin de la confiabilidad de un sistema consiste en la cuantificacin de la probabilidad de falla en el cumplimiento de su funcin, a partir de las probabilidades de falla de sus componentes, que se combinan tomando en cuenta las interconexiones e interdependencias entre ellos. Estas interrelaciones vienen dadas por la estructura del sistema y sus procedimientos de trabajo. Con este fin, se requiere la construccin de un modelo que contemple tanto las fallas de equipo como las debidas a errores humanos, as como la influencia de los procedimientos de operacin, prueba y mantenimiento del sistema. Sin embargo, el inters fundamental del anlisis de confiabilidad no es exclusivamente el resultado global de la probabilidad de falla del sistema, para demostrar que ste satisface las exigencias planteadas al diseo. Los mayores dividendos se obtienen mediante un proceso sistemtico y bien estructurado para la determinacin de los contribuyentes ms importantes a dicho resultado global. Estos son los puntos del sistema que requieren mayor atencin. Consecuentemente, se considera el efecto de modificaciones en el diseo, as como en los procedimientos de operacin, prueba y mantenimiento, que an siendo simples, pueden conllevar a una mejora significativa de la confiabilidad. Para sistemas complejos e interdependientes el anlisis de rboles de fallas ha demostrado ser una herramienta poderosa que se aplica con xito en las industrias nuclear, aeronutica y aeroespacial. Se emplea de forma creciente en la industria qumica y, en general, resulta una tcnica con alto nivel de estructuracin, estandarizacin y universalidad, aplicable a industrias complejas que deben operar con elevada disponibilidad y seguridad. La tcnica de rboles de fallas tendra un alcance limitado si se aplicara solamente al anlisis de confiabilidad de sistemas aislados. El mayor beneficio se obtiene cuando se aplica de forma combinada con la tcnica de rboles de sucesos, para la construccin de un modelo integral de la industria, que caracteriza la respuesta de sus sistemas ante diversos sucesos iniciadores de avera (situaciones accidentales), que de no ser controlados o mitigados tienen un impacto negativo sobre el proceso productivo (paradas ms o menos prolongadas, dao a sistemas con prdidas econmicas de consideracin, dao al medio ambiente y a la poblacin circundante). Este estudio integral es lo que se conoce como un Anlisis Probabilista de Seguridad (APS). A partir del modelo bsico del APS se pueden realizar mltiples aplicaciones durante toda la vida til de la instalacin para garantizar una elevada disponibilidad, seguridad industrial y proteccin del

46

medio ambiente. Estas aplicaciones se basan en el conocimiento de los puntos dbiles del proceso, que permite la toma de medidas tcnicas y organizativas, muchas veces sencillas, pero que tienen un efecto importante sobre los ndices tcnico-econmicos de seguridad de la industria. El modelo de APS no permanece esttico, sino que se actualiza como resultado de la experiencia operacional y las modificaciones que se introducen en el diseo y los procedimientos de trabajo. Esto puede hacerse con facilidad a partir del modelo bsico y permite a la gerencia un mejor conocimiento de las caractersticas de seguridad y disponibilidad de la planta, para estar prevenidos frente a eventuales puntos dbiles y anticiparse a stos con la toma de medidas oportunas.

3.1. Tcnica de rboles de fallas.


El rbol de fallas es un modelo lgico deductivo, que parte del suceso tope para el cual se produce la falla del sistema. De una forma sistemtica se va desarrollando el suceso tope en los sucesos intermedios que conducen a ste, y a su vez los sucesos intermedios en otros de menor jerarqua, hasta llegar a los sucesos primarios, determinados por el nivel de resolucin del anlisis posible o deseable. Este se establece atendiendo a los datos de fallas de que se dispone y/o al alcance que se pretende lograr de acuerdo con los objetivos del estudio. Los sucesos intermedios y primarios se interconectan mediante compuertas lgicas, que bsicamente pueden ser de 3 tipos: Compuerta OR: El estado fallado de cualquiera de los sucesos que entran a ella produce el estado fallado a la salida. Compuerta AND: El estado fallado a la salida de la compuerta se produce cuando todos los sucesos que entran a ella estn en estado fallado. Compuerta n/m ("Majority"): El estado fallado a la salida de la compuerta se produce con cualquier combinacin de n sucesos en estado fallado del total de m que entra a la compuerta. En la figura 3.1.1 se muestran los smbolos de mayor utilizacin en la construccin de rboles de fallas.

47

Fig 3.1.1. Smbolos de mayor utilizacin en la construccin de rboles de fallas. Los sucesos primarios son puntos terminales del rbol que no se continan desarrollando. De ellos los sucesos bsicos corresponden generalmente a modos de falla propios de componentes (por ejemplo falla de una vlvula a la apertura o al cierre), mientras que el suceso desarrollado es un suceso complejo que no se desdobla en sucesos bsicos de menor jerarqua, por no contarse con la informacin necesaria o porque resulta conveniente desarrollarlo aparte como un rbol independiente. Este ltimo es el caso de los sistemas de apoyo (por ejemplo la falla de la alimentacin elctrica), que se acostumbra a modelar en rboles de fallas independientes para despus acoplarlos (integrarlos) a los rboles de los diversos sistemas a los cuales este sistema de apoyo presta servicio. El smbolo de suceso intermedio (rectngulo) se coloca antes de cada compuerta o suceso primario para describir con precisin el suceso de falla que se est representando. Los smbolos de transferencia permiten conectar un subrbol en varios puntos del rbol principal sin necesidad de repetir varias veces la misma informacin, as como establecer cortes y divisiones del rbol cuando por sus dimensiones no puede representarse completamente en una hoja de papel. Este es el caso del rbol de fallas que aparece posteriormente en la figura 3.1.4. La tcnica de rboles de fallas permite modelar los sistemas con un alto grado de flexibilidad, pero deben tenerse en cuenta las siguientes premisas fundamentales:

48

1. Los sucesos bsicos de un rbol de fallas tienen carcter binario, es decir, el componente est fallado o est operable, el modo de falla se produce o no se produce. No es posible modelar estados intermedios o degradados de los componentes. 2. Los sucesos bsicos tienen que ser estadsticamente independientes, lo cual es una exigencia del mtodo que se emplea para calcular la probabilidad de falla del sistema a partir de los resultados de la evaluacin cualitativa del rbol de fallas. La existencia de modos de falla dependientes se toma en cuenta cuando un mismo suceso intermedio o primario aparece repetido en el rbol de fallas, como contribuyente a varios sucesos intermedios. Para la construccin de un rbol da fallas se precisa ante todo comprender bien el funcionamiento del sistema y sus procedimientos operacionales, de prueba y mantenimiento. Al desarrollar el rbol desde el suceso tope hasta llegar a los sucesos primarios, es necesario identificar en cada paso todas las contribuciones o caminos que pueden conducir al suceso intermedio. De modo general, para la falla de cada componente existen al menos 5 posibilidades: 1. El equipo no recibi la seal que activa su operacin. 2. El equipo no recibe servicio de algn sistema de apoyo, necesario para su trabajo. (Ej. : alimentacin elctrica, enfriamiento, lubricacin, etc.). 3. El propio equipo experimenta algn tipo de falla que le impide operar. 4. Se produce un error humano que imposibilita la activacin del componente, debido a la no-intervencin del operador o su actuacin tarda, o por haberse dejado el componente en posicin incorrecta despus de un mantenimiento. 5. Algn suceso externo puede afectar al componente y evitar su funcionamiento. En este caso pueden presentarse fallas del tipo causa comn, que afectan simultneamente a varios componentes (por ejemplo, dao por incendio). Existe un grupo de reglas bsicas que se recomiendan para asegurar el desarrollo del rbol de fallas con la calidad requerida, lo que constituye un aspecto importante para su posterior revisin y fcil comprensin por parte de otros especialistas. A continuacin relacionamos las tres principales: 1. Describir de manera precisa los modos de falla dentro de los rectngulos que identifican el suceso tope, los sucesos intermedios y los sucesos primarios. 2. Todas las entradas de una compuerta deben estar completamente definidas antes de pasar a modelar otras compuertas.

49

3. No conectar compuertas con compuertas, ni sucesos primarios con compuertas directamente. Esto se hace siempre a travs del rectngulo donde se describe con detalle el suceso intermedio o primario correspondiente. Vase seguidamente algunos ejemplos sencillos que ilustran la construccin de rboles de fallas. En la figura 3.1.2 (a) se muestra el rbol de fallas del disparo de un circuito interruptor. La falla se produce por tres causas, cualquiera de las cuales, de modo independiente, puede dar lugar al suceso tope. Por esta razn se emplea una compuerta OR. Los sucesos primarios que entran a la compuerta OR son el desperfecto en el propio interruptor, la ausencia de la seal de disparo y, eventualmente, el dao por incendio, un suceso externo que provoca condiciones ambientales severas y conduce a la rotura del elemento. Este es un modo de falla del tipo causa comn, pues se trata de un suceso nico que suele afectar a varios componentes (todos fallan por una causa comn).

(a)

Fig. 3.1.2. Arbol de fallas del disparo de un circuito interruptor.

50

(b)

En la figura 3.1.2 (b) continua el rbol a partir del suceso B, que en la figura 3.1.2 (a) apareca como un suceso desarrollado. Para esto se toma en cuenta que la seal de disparo se produce por la apertura de uno de dos "relays" conectados en serie. Bajo estas condiciones, la falla de la seal de disparo tiene lugar cuando ambos "relays" B1 y B2 fallan cerrados, puesto que con slo uno que abra sus contactos, el circuito de control queda desenergizado y se produce la seal. Por ello al reemplazar el suceso B por B1 y B2 se ha empleado una compuerta AND. Ejemplo 3.1.1: La figura 3.1.3 muestra un sistema con un tanque a presin al cual se inyecta un gas desde un depsito mediante un compresor accionado por un motor elctrico. En cada ciclo el operador echa a andar un "timer" T y el tanque se llena durante un cierto tiempo hasta que abren los contactos del "timer", mucho antes de que se cree una condicin de sobrepresin. Despus de cada ciclo el gas comprimido se descarga abriendo la vlvula Vd destinada a este fin. Cuando el tanque queda vaco se cierra nuevamente Vd y todo est listo para dar inicio a un nuevo ciclo. Si en el proceso de llenado del tanque no se produce el disparo del "timer" T, el operador est instruido para verificar la presin del manmetro M y abrir los interruptores normalmente cerrados I1 e I2, lo cual desenergiza el motor del compresor, al interrumpirse la alimentacin elctrica tanto en el circuito de potencia como en el de control.

51

Fig. 3.1.3. Esquema simplificado del sistema de llenado de un tanque a presin.

(a)

52

(b)

Fig. 3.1.4. Arbol de fallas del sistema del ejemplo 3.1.1.

(c)

53

(d)

Fig. 3.1.4. Arbol de fallas del sistema del ejemplo 3.1.1. (continuacin).

(e)

54

(f)

Fig. 3.1.4. Arbol de fallas del sistema del ejemplo 3.1.1. (continuacin). En la figura 3.1.4 se muestra el rbol de fallas del suceso no deseado rotura del tanque en condiciones de carga normal o por sobrepresin. La rotura del tanque en condiciones de carga normal se representa mediante un suceso primario, pues con la informacin disponible no es posible desarrollarlo ms. En cambio, la rotura por sobrepresin puede tener lugar al combinarse la falla de la proteccin por sobrepresin del tanque (vlvula de alivio Va) con el suceso intermedio trabajo del compresor durante un tiempo excesivo. La necesidad de ocurrencia simultnea de ambos determina el empleo de una compuerta AND. A continuacin se describen brevemente dos de los sucesos intermedios que contribuyen a la ocurrencia del suceso trabajo del compresor durante un tiempo excesivo. - No se interrumpe la corriente en el circuito de potencia (figura 3.1.4 c y f). Se produce cuando el manmetro M se traba o indica por debajo del valor real de presin (el operador no se percata del peligro y no acta), o bien no se logra abrir el interruptor I2 por falla del equipo, o bien la accin del operador no se produce o resulta tarda. La falla del interruptor puede ser por un problema intrnseco o provocada por una sobrecorriente SC en el circuito que dejen "pegados" los contactos. Este ltimo suceso es una falla causa comn que deja "pegados" los contactos del "relay" R y adems inhabilita la accin mitigadora de apertura del interruptor I2. Por esta razn, la falla por sobrecorriente aparece como un suceso

55

primario repetido que contribuye a la ocurrencia de dos sucesos intermedios diferentes del rbol. - No se interrumpe la corriente en el circuito de control (figura 3.1.4 e). En este caso aparece tambin la falla del manmetro M que evita la accin del operador sobre el interruptor I1, luego vemos que este componente contribuye a la falla en dos sucesos intermedios, es decir, produce una interdependencia que se expresa como un componente repetido en el rbol de fallas. Los modos de falla del interruptor I1 son similares a los de I2, con excepcin de la falla por sobrecorriente que no es posible en el circuito de control. Cuando no se est acostumbrado al enfoque probabilista se puede pensar que algunos de estos modos de falla pueden ser rebuscados o imposibles. Esto puede ser cierto en algunos casos, pero debemos tomar en cuenta que, en efecto, si la aplicacin de esta tcnica se realiza en industrias con elevadas exigencias a la calidad de los equipos y a la calificacin del personal, los sucesos que estamos considerando son indudablemente de baja probabilidad. Sin embargo, la clave del anlisis de rboles de fallas radica precisamente, en no descartar de antemano ninguno de los modos de falla posibles y si esto resultara razonable o conveniente deben documentarse las consideraciones que fundamentan tal decisin. La resolucin del rbol de fallas y la evaluacin de las probabilidades de los modos de falla del sistema que surjan, es la que permite sobre bases objetivas descartar determinados modos de falla poco importantes y centrar nuestra atencin en otros que resulten los mayores contribuyentes a la indisponibilidad del sistema. Cuando se trata de sistemas complejos y, particularmente, cuando estas tcnicas se aplican a la modelacin integral de la industria, pueden aparecer combinaciones de fallas de equipo y errores humanos que hacen una importante contribucin a la probabilidad de falla del sistema especfico o de la industria y que no haban sido tomadas en cuenta con el peso que les corresponde en razn de su importancia. En todo caso, aunque dicha combinacin de fallas fuera conocida el mtodo permite cuantificar su aporte y fundamentar la toma de decisiones que corresponda. El rbol de fallas tiene, segn hemos visto hasta este punto, un carcter totalmente cualitativo. Sin embargo, an antes de realizar evaluacin numrica alguna, ya el propio rbol hace una contribucin significativa a nuestro conocimiento del sistema o de la industria. Buscando los posibles modos de falla, logramos dominar con profundidad sus caractersticas tcnicas de diseo, de funcionamiento y los procedimientos de operacin, pruebas y mantenimiento. El mtodo nos va conduciendo a los puntos dbiles, a las diversas formas en que puede fallar.

56

3.2. Evaluacin cualitativa del rbol de fallas.


La resolucin del rbol de fallas consta de dos etapas principales, la evaluacin cualitativa consistente en la determinacin de todas las combinaciones de sucesos primarios que hacen fallar el sistema y la evaluacin cuantitativa, paso en el cual se determina la probabilidad de falla del sistema a partir de las probabilidades de todos los caminos posibles que conducen al suceso tope no deseado. As pues, la evaluacin cualitativa tiene como objetivo central la determinacin de todos los llamados conjuntos mnimos de corte del rbol de fallas. Un conjunto mnimo de corte o simplemente conjunto mnimo (CM) es un conjunto de sucesos primarios que no puede ser reducido en nmero y cuya ocurrencia determina que se produzca el suceso tope. En el ejemplo de la figura 3.1.2 (b), las fallas {A} y {C} son CM de orden 1, pues con slo ocurrir la falla intrnseca del interruptor o el dao por incendio ya tiene lugar el suceso tope no deseado. El otro CM de este ejemplo sera {B1, B2}, en este caso de orden 2 pues se necesita que ambos "relays" fallen cerrados para que se produzca el suceso tope. {B1} no sera un CM, pues con esta falla nica no se produce el suceso tope. En cambio {A, C} aunque da lugar al suceso tope no es CM, pues puede ser reducido en nmero, es decir, slo es necesaria la falla de A o de C para que se produzca el suceso tope, no se requiere que fallen ambos. Es importante destacar que la presencia de CM de orden 1 en un rbol de fallas de un sistema indica su vulnerabilidad a esta falla nica, lo cual slo es aceptable si dicha falla es de muy baja probabilidad. En el caso del ejemplo de la figura 3.1.2 (b) esto es posible porque se trata de un dispositivo que normalmente cumple funciones como parte de un sistema ms complejo. El rbol de fallas es una estructura lgica integrada por sucesos primarios binarios. Esto hace que para su evaluacin cualitativa se requiera el empleo de las reglas del lgebra de Boole, que exponemos brevemente a continuacin, sobre la base de los sucesos de falla genricos X, Y, Z. Propiedad conmutativa Propiedad asociativa Propiedad distributiva Propiedad idempotente Ley de absorcin Leyes de Morgan XY=YX ; X+Y=Y+X X (YZ)=(XY)Z X+(Y+Z)=(X+Y)+Z X(Y+Z)=(XY)+(X.Z) X+(YZ)=(X+Y)(X+Z) XX=X ; X+X=X X(X+Y)=X ; X+X.Y=X ___ _ _ ___ _ _ XY=X + Y ; X+Y=XY

57

En las expresiones anteriores el signo "" significa la interseccin de dos sucesos de falla, es decir, su ocurrencia simultnea, mientras que el signo "+" representa la unin de dos sucesos de falla, es decir, la ocurrencia de uno o del otro. Los sucesos X, Y son los eventos complementos de la falla, es decir, representan el estado operable (xito) del componente. Existen diversos algoritmos para la determinacin de los conjuntos mnimos de un rbol de fallas.. El mtodo consiste en la sustitucin paulatina de las compuertas por sus entradas, desde la compuerta tope hasta llegar a los sucesos primarios, dando prioridad a las compuertas AND y n/m ("majority") con respecto a las compuertas OR, lo que contribuye a evitar una expansin excesiva del nmero de combinaciones de sucesos. En varias partes del proceso se realiza lo que se conoce como reduccin booleana, es decir, la eliminacin de combinaciones booleanas de fallas que no resultan mnimas. Esto asegura que al final del proceso se obtengan de forma explcita todos los conjuntos mnimos de corte, que constituyen los modos de falla del sistema. Para ilustrar la evaluacin cualitativa de un rbol de fallas nos basaremos en un caso sencillo, como el del ejemplo 3.1.1, cuyo rbol de fallas aparece en la figura 3.1.4. Si C1 representa el suceso tope, este puede representarse a partir de sus entradas como: C1=Tpn+C2 [3.2.1]

donde Tpn es el suceso primario rotura del tanque a presin normal y C2 es el suceso intermedio rotura del tanque por sobrepresin. Tpn es ya un suceso primario, luego corresponde ahora sustituir la compuerta C2, de donde resulta: C1=Tpn+Va.C3 [3.2.2]

Ntese como en la expresin [3.2.1] la sustitucin se hace como una unin(+) de los sucesos de falla Tpn y C2, interconectados en el rbol mediante una compuerta OR. En cambio, al sustituir la compuerta C2 en la expresin [3.2.1] para obtener la [3.2.2], Va y C3 se sustituyen como una interseccin de sucesos de falla, en correspondencia con la compuerta AND de la cual ambos son entradas en el rbol de fallas. Continuando el proceso, tendremos que: 58

C1=Tpn+Va.C4.C5 C1=Tpn+Va.C4.(R+SC+C6) C1=Tpn+Va.C4.(R+SC+T.C7) C1=Tpn+Va.(M+E+I2+SC).{R+SC+T.(M+E+I1)}

[3.2.3] [3.2.4] [3.2.5] [3.2.6]

Aplicando la ley distributiva de forma sucesiva, tendremos que: C1=Tpn+Va.(M+E+I2+SC).(R+SC+T.M+T.E+T.I1) [3.2.7]

C1=Tpn+Va.(M.R+M.SC+M.T.M+M.T.E+M.T.I1+E.R+E.SC+E.T.M+E.T.E+ +E.T.I1+I2.R+I2.SC+I2.T.M+I2.T.E+I2.T.I1+SC.R+SC.SC+ +SC.T.M+SC.T.E+SC.T.I1) [3.2.8] Si ahora aplicamos la propiedad idempotente, resulta: C1=Tpn+Va.(M.R+M.SC+M.T+M.T.E+M.T.I1+E.R+E.SC+E.T.M+E.T+E.T.I1+ +I2.R+I2.SC+I2.T.M+I2.T.E+I2.T.I1+SC.R+SC+SC.T.M+ +SC.T.E+SC.T.I1) [3.2.9] En la expresin [3.2.9] aparecen 21 trminos que representan combinaciones booleanas de fallas de componentes que conducen a la falla del sistema. Sin embargo, como veremos seguidamente, de estas 21 combinaciones booleanas slo 8 son CM. En efecto, si sometemos esta expresin a un proceso de reduccin booleana aplicando la ley de absorcin, resulta que: M.SC+E.SC+I2.SC+SC.R+SC+SC.T.M+SC.T.E+SC.T.I1=SC M.T+M.T.E+M.T.I1+I2.T.M=M.T E.T.M+E.T+E.T.I1+I2.T.E=E.T y por tanto [3.2.9] se transforma en: C1=Tpn+Va.(M.R+M.T+E.R+E.T+I2.R+I2.T.I1+SC) de donde, los CM que conducen a la rotura del tanque son: De orden 1: 1 De orden 2: 1 De orden 3: 5 Tpn Va.SC Va.M.R Va.M.T 59 [3.2.13] [3.2.10] [3.2.11] [3.2.12]

De orden 4: 1 Total :8

Va.E.R Va.E.T Va.I2.R Va.I2.T.I1

Se puede apreciar como las expresiones [3.2.10], [3.2.11] y [3.2.12] reducen 7, 3 y 3 combinaciones booleanas respectivamente en la expresin [3.2.9]. Resulta siempre conveniente, a modo de comprobacin, realizar un examen de los CM obtenidos. Si nos concentramos en los modos de falla del tanque por sobrepresin, veremos que en todos los CM aparece la falla a la apertura de la vlvula de alivio de presin del tanque Va combinada con otros sucesos de falla. An sin realizar el anlisis cuantitativo, la simple inspeccin cualitativa de los CM nos permite concluir, en principio, que este suceso bsico ser probablemente un punto dbil del sistema, es decir, debemos reforzar la proteccin por sobrepresin. La falla de Va puede combinarse con el suceso SC que hace fallar cerrados los contactos del "relay" y del interruptor I2 por una causa comn, o con la falla propia del "relay" R unida a la no-indicacin correcta del manmetro de presin M que evita la intervencin del operador, y as sucesivamente podemos continuar analizando el resto de los CM. El proceso realizado nos permite inducir generales: las siguientes consideraciones

1. La generacin de CM va produciendo una expansin paulatina del nmero de trminos de la expresin booleana, hasta llegar al resultado final en el que el suceso tope se expresa como la unin de todos los sucesos de falla, dados por los conjuntos mnimos de corte. La expresin [3.2.9] lleg a tener 21 trminos. 2. Durante el proceso se generan muchas combinaciones booleanas que no son CM, y requieren ser reducidas. En el ejemplo se redujeron 13 combinaciones booleanas y slo quedaron 8 CM. 3. Las cantidades de CM que se pueden derivar de un rbol de fallas de mediana complejidad, y con slo decenas o cientos de sucesos bsicos y compuertas pueden ser gigantescas, del orden de los millones y superiores. Cuando se resuelven rboles que modelan el comportamiento global de la industria ante un suceso iniciador de avera, el nmero de CM suele ser particularmente elevado, debido a que las secuencias accidentales que surgen involucran normalmente la falla de varios sistemas. 4. El elevado volumen de operaciones lgicas requerido por la determinacin de los CM, slo es posible con eficiencia y sin errores mediante el empleo de tcnicas de computacin. Debe tenerse en cuenta que el consumo de memoria y tiempo de mquina como funcin del nmero de componentes y la complejidad del rbol sigue una ley exponencial. 60

Para rboles de cierta complejidad, con cientos o miles de compuertas y sucesos bsicos, la determinacin de los CM slo es posible mediante un software potente y una computadora rpida con suficiente memoria operativa y en disco. La inmensa mayora de los programas de APS de uso actual estn soportados en computadoras "Mainframe" y una buena parte de los que trabajan en computadoras personales (PC) confronta serias limitaciones de memoria y velocidad. No obstante, el creciente desarrollo de los PC ha propiciado el surgimiento de algunos sistemas capaces de manejar rboles de fallas complejos en PC, como es el caso del modelo ARCON el cual ha sido desarrollado como consecuencia de este anlisis.

3.3. Evaluacin cuantitativa de las fallas.


La evaluacin cuantitativa de rboles de fallas consiste, bsicamente, en la determinacin de la probabilidad de ocurrencia del suceso tope que describe la falla del sistema, a partir de las probabilidades de los CM, que representan las contribuciones de todos los modos de falla posibles. Sean CM1 y CM2 dos CM del rbol de fallas. La probabilidad de que ocurra el modo de falla CM1 o el modo de falla CM2, es decir, la probabilidad de falla del sistema por una de estas dos vas ser: P(CM1+CM2)=P(CM1)+P(CM2)-P(CM1.CM2) [3.3.1]

donde el suceso CM1.CM2 representa la ocurrencia simultnea de ambos modos de falla, que de no restarse se estara sumando dos veces al resultado final y producira su sobreestimacin. Si ahora se tratara de tres conjuntos mnimos CM1,CM2 y CM3, la expresin de la probabilidad de falla del sistema por estas tres vas sera: P(CM1+CM2+CM3)=P(CM1)+P(CM2)+P(CM3)-P(CM1.CM2)-P(CM2.CM3)-P(CM1.CM3)+P(CM1.CM2.CM3) [3.3.2] En la expresin [3.3.2] se restan las combinaciones de CM de orden 2, pues de no hacerlo se estara considerando dos veces. Sin embargo, al restar estos tres trminos eliminamos completamente la contribucin CM1.CM2.CM3 que debe ser restituida adicionando el ltimo sumando. En el caso general de N conjuntos mnimos de corte, la probabilidad de falla del sistema viene dada por la siguiente expresin:

61

N i=1 N

N i=1 N N

P( CMi)= P(CMi) -

P(CMi) P(CMj) +

i=1 j=i+1

P(CMi) P(CMj) P(CMk) - ...

i=1 j=i+1 k=j+1

+(-1)

N+1

P(CMi)
i=1

[3.3.3]

Para industrias de elevada confiabilidad y bajos niveles de riesgo, la expresin [3.3.3] puede simplificarse notablemente tomando en cuenta que la probabilidad de un CM es un valor mucho menor que 1, lo que se conoce como aproximacin de sucesos raros. Bajo estas condiciones, en la expresin [3.3.3] los trminos de segundo orden y superiores pueden ser despreciados frente al primer sumando que har la contribucin fundamental, con lo que se obtiene la expresin: N N [3.3.4] P( CMi)= P(CMi) i=1 i=1

Esto equivale a suponer que los CM son mutuamente excluyentes, es decir, que se considera sumamente improbable la ocurrencia simultnea de varios CM (la ocurrencia de un CM excluye la posibilidad de ocurrencia de cualquiera de los otros). Si comparamos las frmulas [3.3.3] y [3.3.4] es fcil comprobar que el valor dado por [3.3.4] sobrestima el valor real, por cuanto los trminos que se desprecian van siendo menores en la medida que aumenta su orden y los signos alternos comienzan precisamente con una resta. De esta forma, la contribucin que se elimina al pasar de [3.3.3] a [3.3.4] tiene signo negativo y conduce a una sobreestimacin de la probabilidad de falla en [3.3.4]. Esta es una ventaja de la expresin, pues al aplicarla sabemos que estamos siendo conservadores. Sin embargo, para aquellos casos en que las probabilidades de falla son elevadas y deja de cumplirse la aproximacin de sucesos raros la sobreestimacin puede ser considerable hasta el punto de obtenerse probabilidades de falla del sistema mayores que 1. Veamos a continuacin otra expresin para evaluar la probabilidad de falla del sistema. En este caso se parte del supuesto de que los CM son sucesos independientes, es decir, se asume que la ocurrencia de un CM no modifica la probabilidad de ocurrencia de los restantes. Esta suposicin resulta vlida cuando los sucesos bsicos son independientes y de baja probabilidad, pues cada CM 62

contiene uno o varios componentes que lo diferencian del resto y bajo estas condiciones la modificacin de la probabilidad de un CM por la ocurrencia de otro resulta pequea. La frmula que se emplea en este caso para hallar la probabilidad de falla del sistema (Pf) es: N Pf= 1 - [ 1 - P(CMi) ] i=1 [3.3.5]

En esta expresin, el trmino 1- P(CMi) representa la probabilidad de que el conjunto mnimo CMi no ocurra. El producto de estos trminos para todos los CM desde 1 hasta N es la probabilidad de que no suceda ningn CM, suponiendo que ellos son independientes, es decir, la probabilidad de que el sistema no falle. El complemento de este suceso tiene una probabilidad igual a 1 menos el valor anterior, y es precisamente la probabilidad de que tenga lugar al menos un CM, es decir, la probabilidad de que el sistema falle. Aunque la expresin [3.3.5] es ms compleja de evaluar y su aplicacin tambin est limitada a sucesos de baja probabilidad para que sea vlida la suposicin de independencia entre CM, tiene una ventaja sobre la frmula [3.3.4] y es que nunca da valores de probabilidad superiores a la unidad. Cuando la aproximacin de sucesos raros es vlida y se calcula por las expresiones [3.3.4] y [3.3.5] se observa una diferencia despreciable entre ambas, con valores ligeramente superiores al emplear [3.3.4]. Al dejar de cumplirse la aproximacin de sucesos raros los resultados de ambas expresiones comienzan a diferenciarse notablemente, pues mientras [3.3.4] crece de manera sostenida cuando aumentan las probabilidades de los conjuntos mnimos, [3.3.5] comienza a saturarse y tiende a uno. Hagamos seguidamente el anlisis cuantitativo de las fallas del sistema del ejemplo 3.1.1, a partir de los CM dados por [3.2.13] mediante las frmulas de clculo [3.3.4] y [3.3.5]. Para ello tendremos que hallar primeramente las probabilidades de falla de cada uno de los sucesos primarios, determinar seguidamente las probabilidades de cada uno de los CM, y, finalmente, la probabilidad de falla del sistema. - Probabilidades de falla de los sucesos primarios. Con excepcin del suceso primario E, que representa un error humano por la no actuacin a tiempo del operador, todos los modos de falla se considerarn en esta fase del anlisis como no controlables, es decir, que durante 1 ao de trabajo (aprox. T=8000h ) los componentes se explotan ininterrumpidamente entonces

63

son sometidos a un mantenimiento anual que renueva sus propiedades y reduce la probabilidad de falla al valor inicial 0. 1) Tpn - Rotura del tanque a presin normal Modo de falla no controlado con rata de fallas 1E-8/h. Aplicando la expresin [2.4.4] y considerando T=8000h como el tiempo total de trabajo hasta que el sistema se somete a mantenimiento, as como tambin qad=0 y Tpr=0 se obtiene: qTpn = 1 - { 1 - EXP( -1E-8 x 8000 ) } / ( 1E-8 x 8000 ) = 4.00E-5 2) Va - No abre la vlvula de alivio del tanque Modo de falla no controlado, con rata de fallas 3E-4/h y T=8000h. De forma anloga al caso anterior, se obtiene: qVa = 1 - { 1 - EXP( -3E-4 x 8000 ) } / ( 3E-4 x 8000 ) = 6.21E-1 3) M - Manmetro del tanque trabado o indica por debajo Modo de falla no controlado, con rata de fallas 1E-5/h y T=8000h. De forma anloga a los casos anteriores, se obtiene: qM = 1 - { 1 - EXP( -1E-5 x 8000 ) } / ( 1E-5 x 8000 ) = 3.90E-2 4) E - El operador no responde ( error humano ) Probabilidad de falla fija, estimada en qE = 1E-2 5) R - Los contactos del "relay" fallan cerrados Modo de falla no controlado, con rata de fallas 2.7E-7/h y T=8000h. De forma anloga a los casos anteriores, se obtiene: qR = 1 - { 1 - EXP( -2.7E-7 x 8000 ) } / ( 2.7E-7 x 8000 ) = 1.08E-3 6) SC - Sobrecorriente en el circuito de potencia (falla causa comn que mantiene cerrados los contactos del "relay" y del interruptor I2) Modo de falla no controlado, con rata de fallas 1E-8/h y T=8000h. De forma anloga a los casos anteriores, se obtiene:

64

qSC = 1 - { 1 - EXP( -1E-8 x 8000 ) } / ( 1E-8 x 8000 ) = 4.00E-5 7) T - Los contactos del "timer" fallan cerrados Modo de falla no controlado, con rata de fallas 1E-4/h y T=8000h. De forma anloga a los casos anteriores, se obtiene: qT = 1 - { 1 - EXP( -1E-4 x 8000 ) } / ( 1E-4 x 8000 ) = 3.12E-1 8) I1 - Los contactos del interruptor fallan cerrados Modo de falla no controlado , con rata de fallas 8E-6/h y T=8000h. De forma anloga a los casos anteriores, se obtiene: qI1 = 1 - { 1 - EXP( -8E-6 x 8000 ) } / ( 8E-6 x 8000 ) = 3.13E-2 9) I2 - Los contactos del interruptor fallan cerrados Modo de falla no controlable, con rata de fallas 8E-6/h y T=8000h. De forma anloga a los casos anteriores, se obtiene: qi2 = 1 - { 1 - EXP( -8E-6 x 8000 ) } / ( 8E-6 x 8000 ) = 3.13E-2 - Probabilidades de falla de los CM. De orden 1: 1 De orden 2: 1 De orden 3: 5 Tpn Va.SC Va.M.R Va.M.T Va.E.R Va.E.T Va.I2.R Va.I2.T.I1 4.00E-5 2.48E-5 2.61E-5 7.54E-3 6.70E-6 1.94E-3 2.10E-5 1.90E-4 9.78E-3

De orden 4: 1 Total :8

La probabilidad de falla del sistema mediante la expresin [3.3.4] es 9.78E-3/ao. Esto significa que el tiempo medio hasta la falla del tanque por sobrepresin es aproximadamente de 102 aos. Si se emplea la frmula [3.3.5], se obtiene un valor ligeramente inferior, 9.76E-3/ao. La concordancia de ambos resultados demuestra la aplicabilidad de la aproximacin de sucesos raros a este ejemplo. Como ya habamos expresado, el inters principal del anlisis radica en la evaluacin de los modos de falla mayores contribuyentes a la probabilidad de falla 65

del sistema. Para esto resulta conveniente ordenar los CM segn su probabilidad de la siguiente forma: 1) Va.M.T 2) Va.E.T 3) Va.I2.T.I1 4) Tpn 5) Va.M.R 6) Va.SC 7) Va.I2.R 8) Va.E.R 7.54E-3 1.94E-3 1.90E-4 4.00E-5 2.61E-5 2.48E-5 2.10E-5 6.70E-6 9.78E-3 % 77.06 19.78 1.94 0.42 0.27 0.25 0.21 0.07 100.00 % Acum. 77.06 96.84 98.78 99.20 99.47 99.72 99.93 100.00

En estos resultados se aprecia como ms del 95% de las fallas del sistema se concentran en los 2 primeros CM. Como era de esperar, la falla de la vlvula de alivio, que aparece prcticamente en todos los CM es un suceso bsico clave para la falla del sistema. Sin embargo el CM #6, donde aparece la falla por sobrecorriente en el circuito de potencia, prcticamente no contribuye a la falla del sistema, a pesar de su condicin de falla causa comn. Esto se debe a su probabilidad de falla comparativamente menor que la de otros modos de falla del sistema. As pues, no siempre los CM de orden inferior son los mayores contribuyentes. A veces una secuencia ms compleja de varias fallas puede ser preponderante. En este ejemplo los CM de orden 1 y 2 aportan solamente un 0.67% de la probabilidad de falla del sistema, mientras que el nico CM de orden 4 aparece en la tercera posicin con un aporte de 1.94%. Es importante que notemos la importante contribucin que hace la falla de los contactos del "timer" a la apertura, que conjuntamente con la falla de la vlvula de alivio forma parte de los 3 CM ms importantes con un aporte del 98.78% de la probabilidad de falla total. El error humano por accin tarda del operador, aunque reviste cierta importancia pues forma parte del CM #2 que aporta el 19.78%, no constituye un foco de atencin vital para reducir la probabilidad de falla de este sistema. La va a seguir debe ser tratar de elevar la confiabilidad de la vlvula de alivio Va y del "timer" T. Una alternativa puede ser realizar una prueba mensual del estado de estos componentes para proceder al mantenimiento correctivo cuando la prueba detecte alguna insuficiencia. Realizando estas pruebas peridicas, slo a dichos componentes, podemos reducir sustancialmente la probabilidad de falla del sistema y el peligro de rotura del tanque.

66

Bajo estas condiciones, se recalculan las probabilidades de falla de la vlvula de alivio y el tanque, mediante la frmula [2.4.14], con tiempo entre pruebas de 720 horas (1 mes) y despreciando la duracin de la prueba (=0). Dado que durante la prueba el sistema no est en operacin, as como tampoco durante el mantenimiento correctivo que se requiera, no se han considerado las contribuciones a la probabilidad de falla dadas por [2.4.10] y [2.4.12]. En este caso, el efecto de la prueba mensual es un corte de los mecanismos de falla de estos dos componentes cada 720 horas y no al cabo del ao de trabajo, con lo cual sus probabilidades de falla se reducen sustancialmente. Las nuevas probabilidades de falla son: 2) Va - No abre la vlvula de alivio del tanque Modo de falla controlado peridicamente, con rata de fallas 3E-4/h y tiempo entre pruebas de 720h. qVa = ( 3E-4 x 720 ) / 2 = 1.08E-1 7) T - Los contactos del "timer" fallan cerrados Modo de falla controlado peridicamente, con rata de fallas 1E-4/h y tiempo entre pruebas de 720h. De forma anloga al caso anterior, se obtiene: qT = ( 1E-4 x 720 ) / 2 = 3.60E-2 Los resultados de la evaluacin cuantitativa en estas nuevas condiciones son: % % Acum. 1) Va.M.T 1.51E-4 61.11 61.11 2) Tpn 4.00E-5 16.14 77.25 3) Va.E.T 3.89E-5 15.69 92.94 4) Va.M.R 4.54E-6 1.83 94.77 5) Va.SC 4.32E-6 1.74 96.82 6) Va.I2.T.I1 3.82E-6 1.54 98.06 7) Va.I2.R 3.65E-6 1.47 99.53 8) Va.E.R 1.17E-6 0.47 100.00 2.47E-4 100.00

El efecto de la prueba mensual de los 2 componentes seleccionados reduce la probabilidad de falla del sistema en ms de un orden. El nuevo valor de tiempo medio hasta la falla es ahora de 4049 aos. En la nueva estructura de contribuciones de los CM vemos que aunque las fallas de la vlvula de alivio y del 67

"timer" continan siendo predominantes, su aporte relativo es menor. La falla del tanque a presin normal comienza a tener un aporte sustancial, lo que significa que la proteccin a la falla por sobrepresin se ha hecho ms efectiva. Otras posibles alternativas de mejora al sistema respecto a la variante inicial seran: - Usar componentes de mayor calidad y con menor rata de fallas. Por ejemplo, si empleamos un "timer" con rata de fallas inferior en un orden (1E5/h), la probabilidad de falla de este componente se reduce a 3.90E-2 y la del sistema disminuye, consecuentemente, al valor 1.32E-3/ao. El tiempo medio hasta la falla para estas condiciones es de 758 aos. La nueva estructura de los CM es: 1) Va.M.T 2) Va.E.T 3) Tpn 4) Va.M.R 5) Va.SC 6) Va.I2.T.I1 7) Va.I2.R 8) Va.E.R 9.43E-4 2.42E-4 4.00E-5 2.61E-5 2.48E-5 2.37E-5 2.10E-5 6.70E-6 1.32E-3 % % Acum. 71.03 71.03 18.23 89.27 3.01 92.28 1.97 94.25 1.87 96.12 1.79 97.91 1.58 99.49 0.51 100.00 100.00

- Utilizar un "timer" redundante idntico en serie con el que ya aparece en el circuito. Esta mejora incorpora un nuevo componente y, por tanto, modifica tanto los datos de confiabilidad como la propia estructura del rbol de fallas. Donde antes apareca el suceso bsico T (los contactos del "timer" fallan cerrados), ahora se incluye en su lugar una compuerta AND cuyas entradas son la falla por contactos cerrados de los dos "timers" en serie T1 y T2. Bajo estas condiciones, es necesario realizar la evaluacin cualitativa del nuevo rbol de fallas y determinar sus CM. Sin embargo, dada la simplicidad de la modificacin realizada en este caso especfico, resulta evidente que los nuevos CM pueden obtenerse de forma sencilla, reemplazando el suceso bsico original T, por el suceso compuesto T1.T2, que representa la falla simultnea de los dos "timers" en serie. Finalmente, si realizamos la nueva evaluacin cuantitativa partiendo de que qT1 = qT2 = qT , se obtiene:

68

1) Va.M.T1.T2 2) Va.E.T1.T2 3) Va.I1.I2.T1.T2 4) Tpn 5) Va.M.R 6) Va.SC 7) Va.I2.R 8) Va.E.R

2.35E-3 6.03E-4 5.92E-5 4.00E-5 2.61E-5 2.48E-5 2.10E-5 6.70E-6 3.13E-3

% % Acum. 75.05 75.05 19.27 94.32 1.89 96.21 1.28 97.49 0.83 98.32 0.79 99.12 0.67 99.79 0.21 100.00 100.00

Esta modificacin incrementa la confiabilidad en algo ms de 3 veces. El nuevo tiempo medio hasta la falla es de aproximadamente 320 aos. Hemos podido apreciar en un ejemplo ilustrativo muy simple, como la tcnica de rboles de fallas constituye una herramienta muy til para fundamentar cuantitativamente la toma de decisiones en materia de confiabilidad y seguridad de sistemas, las cuales pueden ser modificaciones pequeas en el diseo o tipo de equipos utilizados, ajustes en la estrategia de pruebas y mantenimiento, etc., y, sin embargo, pueden tener un impacto significativo y cuantificable. Con este propsito el APS se ha ido estructurando y fortaleciendo con numerosos indicadores y tcnicas de anlisis que cuantifican la importancia de diversos factores del diseo y la explotacin . 3.4. Tcnica de rboles de sucesos. Veamos, por ltimo, un nuevo enfoque del proceso que tiene lugar en el ejemplo 3.1.1. Hasta ahora consideramos de forma deductiva, mediante la tcnica de rboles de fallas, todas las combinaciones de sucesos primarios que conducen al suceso tope no deseado, rotura del tanque en condiciones de carga normal o por sobrepresin. Si analizamos los sucesos primarios considerados, llegaremos a la conclusin de que estos pueden ser de dos tipos: Iniciadores: Fallas de equipo, errores humanos o sucesos externos que crean una condicin de peligro de dao al sistema y requieren la accin de medios protectores o acciones del operador para contrarrestarlos o mitigar sus efectos. Facilitadores: Fallas de equipo o errores humanos que facilitan el desarrollo de la avera, a partir del iniciador, hacia un estado final no deseado de dao al sistema, al inhabilitar las acciones protectoras previstas. En el ejemplo existen 3 posibles iniciadores de una avera que conduzca a la rotura del tanque por sobrepresin, que es el estado final no deseado. Ellos son:

69

. R - Los contactos del "relay" fallan cerrados . SC - Sobrecorriente en el circuito de potencia . T - Los contactos del "timer" fallan cerrados Los facilitadores, que podran conducir a la rotura del tanque si ocurriera alguno de los iniciadores anteriores son: . Va - No abre la vlvula de alivio del tanque . M - Manmetro del tanque trabado o indica por debajo . E - El operador no responde ( error humano ) . I1 - Los contactos del interruptor fallan cerrados . I2 - Los contactos del interruptor fallan cerrados El nuevo enfoque a que hacemos referencia, consiste en una tcnica de anlisis inductivo, denominada rbol de sucesos, que partiendo de un iniciador particular, determina las posibles vas conocidas como secuencias, que conducen al suceso final no deseado ms general, en el ejemplo, la rotura del tanque por sobrepresin. En la figura 3.4.1 se muestran los rboles de sucesos para cada uno de los 3 iniciadores posibles. Los encabezamientos del rbol de sucesos son funciones necesarias para la proteccin del tanque contra la rotura por sobrepresin, que implican el funcionamiento de componentes, equipos o el xito de determinadas acciones del operador. En ocasiones una funcin se desdobla en varias acciones o en la actuacin de varios sistemas, como ocurre en la figura 3.4.1 a), donde la funcin desconexin por el operador se ha desdoblado en dos actividades, la desconexin del circuito de potencia y la desconexin del circuito de control. Para las acciones o sistemas en el encabezamiento del rbol de sucesos se producen, cuando corresponde, bifurcaciones en dos caminos posibles, el xito que va conduciendo a un estado final seguro, o la falla, que nos lleva al estado final no deseado. El rbol de sucesos se va ramificando para dar lugar a un conjunto de secuencias, que se diferencian por la condicin de xito o falla de las funciones protectoras en cada caso. En el rbol de sucesos se marcan con la letra D aquellas secuencias en que la combinacin de fallas de las funciones protectoras conducen al estado final no deseado (dao), mientras que con la letra E se sealan los estados finales exitosos. En el ejemplo, existe una sola secuencia de dao para cada rbol de sucesos, pues en las restantes secuencias se garantiza un estado final seguro del tanque. Sin embargo en los casos reales ms complejos, pueden ser varias las secuencias de dao en cada rbol de sucesos. 70

Por otra parte, no siempre se produce la bifurcacin del rbol en cada sistema o accin protectora. En el rbol de sucesos de la figura 3.4.1 a) se aprecia como, por ejemplo, si tiene xito la interrupcin de la corriente en el circuito de potencia no se da ninguna alternativa para las restantes acciones protectoras (interrupcin de la corriente en el circuito de control y alivio de presin en el tanque), pues la primera ya garantiza la integridad del tanque y no se requieren otras acciones. Existen otros casos en que determinadas funciones son alternativas a la falla de una funcin anterior y slo se modelan opciones para ellas en los casos en que la funcin precedente no ha sido exitosa. Para hallar la probabilidad del suceso final no deseado, es preciso hallar las probabilidades de todas las secuencias que conducen al dao y sumarlas, teniendo en cuenta las contribuciones de todos los iniciadores posibles. La evaluacin de la probabilidad de cada secuencia se realiza formando el rbol de fallas de la secuencia, que une con una compuerta AND a todos los rboles de fallas de las acciones protectoras que no tienen xito en la secuencia. En la figura 3.4.2 se muestra el rbol de fallas de la secuencia que conduce al dao del tanque por sobrepresin, para el iniciador T - Los contactos del "timer" fallan cerrados. La nica modificacin con respecto al rbol de fallas de la figura 3.1.4 es que no se incluye el suceso primario sobrecorriente en el circuito de potencia SC como modo de falla del interruptor I2, porque SC es otro iniciador y la probabilidad de ocurrencia simultnea de dos iniciadores (en este caso T y SC) es despreciable.

71

Fig. 3.4.2. Arbol de fallas de la secuencia que conduce al dao del tanque por sobrepresin, para el iniciador T - Los contactos del "timer" fallan cerrados. Si realizamos la determinacin de los CM de la secuencia y el clculo de su probabilidad, llegaremos a los siguientes resultados: CM T.M.Va T.E.Va T.I1.I2.Va Total Prob. 7.54E-3 1.94E-3 1.90E-4 9.67E-3

Anlogamente, se determinan los CM y las probabilidades de las secuencias que producen el dao al tanque, para los restantes iniciadores. - Iniciador R - los contactos del "relay" fallan cerrados CM R.M.Va R.I2.Va R.E.Va Total Prob. 2.61E-5 2.10E-5 6.70E-6 5.38E-5

72

- Iniciador SC - sobrecorriente en el circuito de potencia CM SC.Va Total Prob. 2.48E-5 2.48E-5

La probabilidad de dao al tanque por sobrepresin puede hallarse como la suma de las probabilidades de dao para cada uno de los iniciadores posibles, teniendo en cuenta que stos se consideran sucesos mutuamente excluyentes. Finalmente, esta probabilidad de falla PTsp ser: PTsp = 9.67E-3 + 5.38E-5 + 2.48E-5 = 9.75E-3/ao. Se puede apreciar como estos resultados concuerdan con los obtenidos por la tcnica de rboles de fallas para el suceso no deseado rotura del tanque por sobrepresin, que excluye el suceso primario Tpn - Rotura del tanque a presin normal. Para el anlisis de industrias complejas no resulta conveniente, como se ha hecho en el ejemplo 3.1.1, construir un rbol de fallas nico, que incluya todos los sucesos primarios, tanto iniciadores como facilitadores, que se deducen del suceso tope no deseado. Esto resultara demasiado complejo y dificultara el anlisis. Lo ms conveniente es partir de un estudio denominado Anlisis de Modos y Efectos de Fallas (FMEA en ingls), para identificar los posibles sucesos iniciadores de avera en la industria y estimar su frecuencia de ocurrencia. Para cada uno de los iniciadores se desarrollan los rboles de sucesos que conducen a un estado final de dao, previamente definido de acuerdo con los objetivos del estudio y que puede ser solamente de carcter econmico o incluir adems posibles efectos nocivos sobre el personal de la industria y/o el medio ambiente. En los rboles de sucesos se modela el comportamiento de las funciones protectoras previstas en cada caso y se determinan las secuencias cuyo estado final es el dao. Para evaluar la probabilidad de fallas de las funciones protectoras se aplica entonces la tcnica de rboles de fallas, es decir, se realiza el anlisis de confiabilidad del sistema o los sistemas que cumplen cada funcin. Para estimar la frecuencia esperada de ocurrencia del estado final no deseado (dao), es necesario resolver grandes rboles de fallas para cada secuencia de dao, que

73

resulta de la integracin de los rboles de fallas de los sistemas que no tienen xito en dicha secuencia. Esta es la esencia del APS y, para obtener todas las ventajas que l puede ofrecernos, el camino a seguir es la construccin de un modelo integral de la industria, aplicando de forma combinada las tcnicas de rboles de sucesos y rboles de fallas. Las herramientas desarrolladas en el APS permiten cuantificar la importancia de sucesos bsicos, sistemas, secuencias accidentales y sucesos iniciadores de avera. Con esta valiosa informacin se pueden dirigir todos los esfuerzos a los puntos dbiles identificados con un nivel de integracin que abarca toda la industria y toma en cuenta las interrelaciones e interdependencias entre sistemas, componentes y acciones humanas.

74

IV. Aplicaciones de los anlisis de confiabilidad.


PARAMAN: SOFTWARE PARA EL CALCULO DE LOS PARAMETROS DE MANTENIMIENTO 4.1- Consideraciones generales Las aplicaciones tecnolgicas han derivado gerencialmente hacia los modelos cuya base es esencialmente cuantitativa. En este sentido la Gerencia tcnica de mantenimiento ha venido transformndose en una actividad cada vez mas importante dentro de los complejos industriales y ha logrado una enorme significacin para lograr que las instalaciones y los equipos que la integran sean mantenidos en las mejores condiciones operacionales dentro de un ambiente de costo optimo. El estudio de las relaciones funcionales dentro de una empresa en particular requieren de experticias tcnicas de mantenimiento especficas combinadas con el uso de los recursos materiales y financieros dentro de un enfoque logstico apropiado. Dentro de este entorno, y ante la diversificacin tcnica, producto de la variedad tecnolgica y organizacional de los complejos industriales, los sistemas de mantenimiento y la medicin de la CONFIABILIDAD, DISPONIBILIDAD Y MANTENIBILIDAD de los sistemas han adquirido un enfoque especializado soportado en desarrollos tcnicos que han convertido a la administracin del mantenimiento en una herramienta necesaria para la gerencia integral de los complejos industriales. El perfil de las industrias especficas se hace cada vez mas complejo y la tendencia de los sistemas de mantenimiento se caracterizan por los siguientes elementos:

Empresas generalmente grandes, con muchos equipos Los equipos son grandes, complejos y frecuentemente son prototipos Los equipos estn localizados en amplios frentes de trabajo

Las operaciones generalmente se encuentran distantes de


los lugares de reabastecimiento de partes y repuestos

75

Los elementos mencionados caracterizan a la funcin de mantenimiento como una actividad dinmica, donde actan numerosas variables relacionadas funcionalmente dentro de un esquema de aleatoriedad que caracteriza a la actividad de mantenimiento y definida dentro de los conceptos de EFECTIVIDAD DE SISTEMAS. Howard Finley, pionero de la gestin tcnica del mantenimiento industrial dentro de la Industria Petrolera Venezolana e Internacional, defini este Concepto de Efectividad de Sistemas como un mtodo para modelar las actividades de mantenimiento a objeto de optimizar la gerencia, consistente en medir la probabilidad de que un sistema opere a toda capacidad dentro de un perodo de tiempo determinado. 2.- Costos de mantenimiento El concepto de efectividad de sistemas fue asociado a variables costo involucradas en los sistemas de mantenimiento y consecuencialmente definieron los conceptos de costo de mantener, costo redundante y costo penalizacin. Las interacciones de estos costos son sumamente complejas y pueden observar con mayor facilidad en el siguiente diagrama: de se de se

El concepto de costo directo de mantener se refiere a la totalidad de los costos necesarios para mantener los equipos operables incluyendo los servicios, reparaciones, inspeccin y reparaciones mayores.

76

El costo redundante se refiere al costo adicional por la condicin de mantener equipos en espera, para ponerlos en funcionamiento cuando fallen los principales. El costo de penalizacin se refiere a las prdidas cuando los equipos principales salen de servicio y no existen equipos de espera o no se pueden reparar en un tiempo determinado. Cuatro sistemas de carcter administrativo son importantes dentro de una poltica de mantenimiento optimo, ellos son: Control de Equipos, Control de trabajo, Control de materiales y reporte de los Costos. Estos sistemas forman parte de la gestin de gerencia el cual de manera general incluyen a los de reportes de proyectos, reportes de operacin, costos administrativos, pronsticos, presupuesto y control financiero. El tradicional control de los equipos consiste esencialmente en un reporte de control de fallas. Algunas organizaciones intentan reportar cada falla sin mucho xito, y otras nunca lo reportan por las dificultades metodolgicas que implican su obtencin. Ante estas situaciones extremas, una posicin intermedia consiste en reportar y analizar las fallas significativas de los equipos crticos los cuales, independientemente de su valor, son muy importantes ya que pueden poner fuera de servicio una planta; y los equipos mayores los cuales pueden causar altos costos de penalizacin al paralizar las instalaciones; as por ejemplo, en una refinera cuya capacidad de produccin est comprendida entre 500.000 y 1.750.000 barriles diarios, puede haber menos de 1000 equipos mayores, los cuales deben ser vigilados y analizados en lo que se refiere a la dinmica de las fallas En este sentido, tomando como referencia la secuencia de arranques y paradas, se estima el tiempo medio entre fallas, cuya tendencia se evala regularmente para controlar las probabilidades de falla y de supervivencia del sistema, unido obviamente al tiempo medio para reparar, el cual evala la mantenibilidad del sistema y consecuencialmente la disponibilidad y confiabilidad. .4.2.-- Parmetros de Mantenimiento La efectividad de un sistema es funcin de dos conceptos muy importantes dentro del enfoque cuantitativo. Se trata del concepto de DISPONIBILIDAD, es decir, la probabilidad que un equipo o componente este listo para operar dentro de un perodo de tiempo determinado. El complemento a este concepto es el de INDISPONIBILIDAD. La disponibilidad como concepto es funcin a su vez de dos elementos, la confiabilidad de un sistema, y la mantenibilidad. Finley define el primero como la probabilidad que un equipo o componente no falle en servicio dentro de un entorno de tiempo y el segundo como la probabilidad que un sistema, equipo o componente que ha fallado sea reparado en un tiempo determinado.

77

Las relaciones grficas de estos elementos se pueden observar en el siguiente diagrama:

La determinacin de los parmetros de mantenimiento es fundamental para calcular la disponibilidad de un sistema, subsistema, equipo, componente, etc.; ello entonces proporciona los datos fundamentales para el anlisis de la funcin de mantener y de una gerencia efectiva, dentro de un ambiente de sistema total que genera enorme cantidad de data. 4.3- Distribuciones de probabilidad y estimacin de los indicadores de Confiabilidad de Sistemas.Entre los parmetros fundamentales que caracterizan la confiabilidad se tienen los siguientes estimadores: Probabilidad de fallas y Probabilidad de supervivencia Densidad de fallas Tiempo medio entre fallas Tiempo medio fuera de servicios Rata de fallas

Los elementos anteriores se reflejan como estimadores de una data que esencialmente consiste en la medicin del tiempo transcurrido entre una parada por fallas y el reinicio de la operacin, una vez reparado el sistema. Las variables bsicas son el tiempo de inicio expresado como fecha, hora y minutos de ocurrencia de la parada y fecha, hora y minutos de restablecimiento de la operacin. El siguiente grfico permite apreciar estas relaciones:

78

La data obtenida con la dinmica de la operacin y sus tiempos de fallas se asocian a una distribucin de probabilidad. Generalmente, la mejor aproximacin es la distribucin de Weibull, cuyas expresiones funcionales permiten encontrar el tiempo medio entre fallas, la probabilidad de supervivencia, y en funcin de ellos encontrar una medicin correcta de la Confiabilidad del Sistema. El comportamiento de esta distribucin estadstica se puede observar en el siguiente grfico:

79

Bsicamente, estas expresiones funcionales se resuelven con el uso del PC mediante la solucin de un modelo probabilstico cuyo software fue desarrollado por el Centro de Estudios Gerenciales Instituto Superior de Investigacin y Desarrollo (ISID). La expresin analtica de esta distribucin de Weibull puede observarse a continuacin:

PARAMAN es la aplicacin computarizada diseada especialmente para realizar, en forma prctica e inmediata, el clculo de todos los indicadores requeridos para analizar el comportamiento de componentes y determinar los parmetros fundamentales para ejercer el control tcnico de la confiabilidad y la mantenibilidad. La solucin computarizada se basa en el procesamiento automatizado de las variables asociadas a la dinmica operativa de un sistema, equipo o componente. Tomando como referencia los datos histricos, se ejecuta el clculo automtico de los parmetros de mantenimiento, para obtener los tiempos de operacin por cada corrida y los tiempos fuera de servicio, tanto reales como suavizados exponencialmente, as como la disponibilidad del equipo en cada perodo de operacin, adems del clculo de la disponibilidad y su evolucin histrica

80

El anlisis de Confiabilidad pone en evidencia los indicadores funcionales caractersticos del equipo y permiten evaluar su fiabilidad en funcin del tiempo, para lo cual es posible utilizar las opciones de simulacin incorporadas en el sistema PARAMAN, De igual forma, se obtienen los indicadores relativos a la Mantenibilidad, entre los cuales se sealan los siguientes: Tiempo Medio entre Fallas, Tiempo Medio Fuera de Servicio y Disponibilidad, y Rata de Fallas. En este caso, la opcin de simulacin permite evaluar la probabilidad de reparar el equipo en intervalos de tiempo seleccionados por el usuario. El software proporciona, adems, salidas grficas que complementan los estudios analticos de los componentes. A conclusin de los clculos, se puede obtener un resumen impreso donde se incluyen los indicadores ms significativos, asociados a las distribuciones estadsticas de Weibull y Gumbell, que caracterizan la confiabilidad y la mantenibilidad de los equipos analizados. La evaluacin de la confiabilidad de un sistema consiste en la cuantificacin de la probabilidad de falla. A partir de all, se calculan tantos elementos como componentes se desee, los cuales se combinan mediante tcnicas probabilsticas para obtener la confiabilidad de un sistema y, finalmente, la efectividad del sistema total. Sin embargo, el inters fundamental del Anlisis de Confiabilidad es el resultado global de las probabilidades de falla, para demostrar que satisface las exigencias planteadas en el diseo. Las mayores ventajas se obtienen mediante procesos que conducen a encontrar los elementos ms importantes y de mayor contribucin a las fallas del sistema. Para sistemas complejos, el anlisis de los rboles de falla, sustentado en el anlisis probabilistico bayesiano, ha demostrado ser una poderosa herramienta que requiere como data bsica las probabilidades de falla y otros estimadores, como los calculados anteriormente. Su estudio integral se conoce como Anlisis Probabilstico de Seguridad (APS) mediante el cual se realizan mltiples aplicaciones durante la vida til de los equipos industriales, para garantizar una elevada disponibilidad y seguridad de las instalaciones. As mismo, el tratamiento de la historia de los equipos, sus partes, componentes, subsistemas o sistemas permiten monitorear las condiciones de disponibilidad, confiabilidad y de mantenibilidad. El Sistema de Clculo de Confiabilidad y Disponibilidad de Sistemas Industriales basado en las tcnicas del APS tambin fue desarrollado en ambiente computacional por el Centro de Estudios Gerenciales (ISID).

81

Los parmetros obtenidos mediante el modelo PARAMAN, constituyen una herramienta de gran utilidad para el profesional de mantenimiento, al permitirle evaluar con rapidez y precisin los coeficientes de confiabilidad, para introducirlos luego como parmetros fundamentales en el anlisis de los rboles de fallas y en los estudios de APS los cuales posibilitan, a su vez, hacer un seguimiento sistemtico a los sistemas de mantenimiento industrial.A ttulo de ejemplo, se presenta a continuacin una situacin tpica de la gestin ordinaria del mantenimiento industrial, en la cual se requiere determinar el valor actual de la Rata de Fallas de un componente, para poder evaluar la confiabilidad integral del sistema del cual ese componente forma parte integrante. Para calcular el valor de la Rata de Fallas, se emplea el modelo PARAMAN.

82

EJEMPLO DE APLICACION A objeto de ilustrar la aplicacin del modelo PARAMAN, se plantea el estudio de una instalacin tpica, simplificada, empleada para comprimir gases industriales, constituida por un grupo moto-compresor, un tanque de almacenamiento y los subsistemas de comando y control correspondientes, como se muestra en la Fig. 1.

Fig, 1 . Sistema de Compresin

Para el anlisis de confiabilidad global del sistema, se recurre al empleo de la tcnica de rboles de fallas, construyendo el modelo o diagrama lgico de fallas de la instalacin (Fig. N 2). La cuantificacin de la probabilidad de falla total del sistema requiere, como datos de entrada, la rata de fallas de cada uno de los componentes que lo integran.

83

Se conoce la rata de fallas de los componentes (segn la Tabla N 1) obtenida de la informacin tcnica suministrada por los fabricantes y de los datos de planta. Sin embargo, en lo que respecta al motor M, no se dispone sino de una relacin pormenorizada de la fecha y hora de arranque de esta instalacin, as como de las ocasiones en que fue detenida debido a fallas y otros inconvenientes imputables al motor.

FALLA DEL SISTEMA DE COMPRESION

FALLA DEL GRUPO MOTO-COMPRESOR

FALLA GRUPO DE ALMACENAMIENTO

+
FALLA DEL MOTOR FALLA DEL COMPRESOR FALLA INTERNA DEL TANQUE

+
FALLA DE COMANDO FALLA EXTERNA AL TANQUE

PERDIDA DE CONTROL PRIMARIO INTERRUPTOR A NO ABRE

FALLA DE CONTROL SECUNDARIO VALVULA SEGURIDAD VS NO ABRE

+
FALLA INTERNA DE IP FALLA COMANDO FALLA EXTERNA A IP FALLA INTERNA VS

+
FALLA COMANDO FALLA EXTERNA A VS

+
ERROR DE CALIBRACIN CIERRE DE VALVULA ERROR DE CALIBRACIN

+
CIERRE DE VALVULA

Fig. 2.- Arbol de Fallas del Sistema de Compresin

84

Tabla N 1 TIPO DE FALLA y COMPONENTE Falla interna del interruptor de presin A Falla del interruptor A por causas externas Falla de comando del interruptor (vlvula V1) Error de calibracin del interruptor Falla interna de la vlvula de seguridad VS Falla vlvula de seguridad VS por causas externas Falla vlvula de seguridad VS por obstruccin Error de calibracin de la vlvula de Seguridad VS Falla intrnseca del tanque T Rotura del tanque T por causas externas Falla del Compresor C

Rata de Fallas 1E-2 1E-7 1E-1 1E-2 1E-4 1E-7 1E-7 1E-4 1E-7 1E-8 1E-5

El historial de datos correspondiente a la operacin de la instalacin y las paradas imputables al motor elctrico, se presenta en la Tabla N 2, los cuales constituyen los datos de entrada del modelo PARAMAN, requeridos para calcular los parmetros fundamentales de mantenimiento del motor y su rata de fallas, entre otros indicadores tiles para caracterizar el comportamiento de este componente.

Tabla N 2HISTORIAL DE EQUIPO Componente: MOTOR ELECTRICO M Fecha Hora Arranque Fecha Parada Arranque 03/02/1999 03/05/1999 19/07/1999 23/08/1999 17/12/1999 13/06/2000 23/07/2000 12/08/2000 09/11/2000 3:20 PM 4:30 PM 8:15 AM 3:20 PM 11:00 AM 9:25 AM 9:40 PM 4:30 PM 6:25 AM 02/05/1999 17/07/1999 20/08/1999 13/12/1999 12/06/2000 21/07/2000 09/08/2000 07/11/2000

Hora Parada

Causa de la Parada

10:25 AM Corto Circuito 9:40 PM Eje desalineado 4:10 PM Soporte flojo 6:25 AM Corto circuito 7:30 PM Falla proteccin 8:15 PM Corto a tierra 3:45 PM Recalentamiento 9:20 PM Cojinete averiado (ltimo arranque)

85

Al realizar la carga de los datos de tiempo en el modelo PARAMAN, como se ilustra a continuacin, se obtienen automticamente los tiempos de operacin y de permanencia fuera de servicio del componente analizado, debidamente organizados segn su secuencia cronolgica.

Una vez concluida la carga, de datos, es posible obtener toda la informacin referente al comportamiento histrico del motor en estudio, mediante el clculo y despliegue de los tiempos de operacin registrados a lo largo del perodo analizado, as como las probabilidades de supervivencia y falla estimadas en correspondencia de cada corrida. Seguidamente, se muestran los resultados obtenidos para el componente en estudio.

86

De igual forma, se obtienen los resultados del clculo de los tiempos en que el motor ha permanecido fuera de servicio durante el perodo analizado, al cual se asocian las correspondientes probabilidades estimadas de falla, como se ilustra a continuacin.

Los tiempos de operacin y fuera de servicio asociados al componente, son sometidos a un proceso de suavizado exponencial, para descartar los valores extremos de la serie de datos originales y as obtener valores de disponibilidad del motor mejor ajustados. La secuencia de valores reales y suavizados se presenta seguidamente.

87

Los cmputos anteriores, proporcionan los elementos necesarios para calcular y presentar los indicadores resultantes del Anlisis de Confiabilidad, obtenindose de esta manera el tiempo medio entre fallas (o tiempo medio de operacin) la rata de fallas y los coeficientes de la distribucin estadstica (Weibull) caractersticos del equipo analizado. Estos resultados se presentan como se ilustra a continuacin.

Anlogamente, se realizan los clculos y se presentan los resultados del Anlisis de Mantenibilidad, donde se incluye el Tiempo Medio Fuera de Servicio, el valor actual de la Rata de Fallas del componente y los coeficientes de la distribucin estadstica de Gumbell, propios del motor estudiado.

88

Mediante el uso de las funciones de simulacin, se puede realizar pronsticos de comportamiento del motor en funcin del tiempo, mediante el clculo de las probabilidades de supervivencia y falla para un tiempo de operacin (u observacin) preestablecido. De la misma forma, se puede estimar la probabilidad de realizar los trabajos de reparacin del motor en menos de un tiempo dado, lo cual permite evaluar la efectividad de las operaciones de mantenimiento. Ambas opciones se presentan en los grficos a continuacin.

Los parmetros fundamentales de mantenimiento (Confiabilidad, Mantenibilidad Disponibilidad) se muestran tambin bajo la forma de curvas que evidencian la evolucin de los tiempos medios de operacin y fuera de servicio y la disponibilidad suavizada, a lo largo del perodo de anlisis.

89

Finalmente, es posible obtener un resumen impreso de los resultados de los Anlisis de Confiabilidad y Mantenibilidad, donde aparecen los indicadores, parmetros y coeficientes asociados a la evolucin operacional del equipo, adems del valor actual de la Disponibilidad y de la Rata de Fallas (5,63 E-5) que es el dato requerido para evaluar la confiabilidad integral del sistema MotoCompresor, obtenido a partir de la informacin sobre la dinmica operativa del sistema que se conserva en el Registro Histrico de Equipos de la planta.

90

BIBLIOGRAFIA

1- Maintenance Engineering Workshop, Houston, THFC, 1963, pg. 253. 2- Lozano Conejero, Antonio. Confiabilidad - Teora y Prctica. Buenos Aires, Editorial
Universitaria,1969, pg. 94.

3- Finley, Howard. Principios de Optimizacin de Mantenimiento, Howard Finley de


Venezuela C.A., 1975, pg. 525.

4- C. Valhuerdi, R. Quintero . Seguridad nuclear. Problemas y valoraciones. Seleccin de


temas. Instituto Superior de Ciencias y Tecnologa Nucleares, MES, La Habana, 1990.

5- IAEA-TECDOC-478. Component Reliability Data for Use in Probabilistic Safety


Assessment. IAEA, Vienna, 1988.

6- Finley, Howard. Ingeniera de Mantenimiento, Houston, 1977. 7- Mosquera, Genaro. Apoyo Logstico para el Mantenimiento Industrial, U.C.V.
C.D.C.H., Caracas, 1987.

8- Mosquera, Genaro. Gerencia de Logstica Industrial, Academia de Ciencias


Econmicas, Caracas, 1994.

9- J. Rivero, J. Salomn, M. Perdomo, A. Torres. Resultados ms significativos de los


estudios de anlisis probabilista de seguridad en Cuba. Revista CTN No 1, Brasil, 1993.

10- J. Rivero, J. Salomn, A. Torres, M. Perdomo. El programa ARCON 4.1 para anlisis
probabilista de seguridad de nivel I. Memorias del II Congreso Regional de ARCAL. Mxico, 1993.

11- NUREG/CR-4213. SETS Reference Manual. USNRC, Washington DC,U.S.A, 1985. 12- R. W. Randall. FTAP: Computer Aided Fault Tree Analysis. Operational Research
Center, University of California, Berkeley, ORC 78-14, 1978.

13- IAEA-TECDOC-480. J. B. Fussell, PRISIM - A Computer Program that Enhances


Operational Safety. JBFAssociates,Inc., Knoxville, Tennessee. U.S.A., 1988.

14- R. Nakai, Y. Kani. A Living PSA System LIPSAS for an LMFBR. Power Reactor and
Nuclear Fuel Development Corporation. Narita, O-arai,Ibaraki,311-13. Japan, 1991.

91

15- S. Haddad, S. Hirschberg. PSA in the Nuclear and Process Industry: Opportunities for
Interchange of Experience. International Atomic Energy Agency (IAEA). Vienna, Austria, 1991.

16- GDA/APS. Grupo de desarrollo y aplicaciones de APS. Manual de Usuario del Cdigo
ARCON versin docente. Cuba, 1993.

17- STI/PUB/759. IAEA, Safety Aspects of the Ageing and Maintenance of Nuclear Power
Plants. Viena, 1988.

18- IAEA-TECDOC-542. Use of Expert Systems in Nuclear Safety. Vienna. 1988. 19- N. J. Liparrulo, D. R. Sharp. B. D. Sloane, J. K. Chan. Developments in Living
Probabilistic Risk Assessment. Pittsburg. PA 15230. U.S.A, 1988.

20- GDA/APS. Grupo de desarrollo y aplicaciones de APS. Manual de instrucciones y


procedimientos de garanta de calidad del APS de la CEN Juragu. 1993.

21- Workshop "PSA based


Mexico, 1993.

optimization of tasks and procedures in NPP operation",

22- IAEA-TECDOC-480. Improving Operational Safety Management through Probabilistic


Safety Assessment on Personal Computers. Vienna, 1988.

23- Mc Cormick. Reliability and risk analysis. Methods and nuclear power applications.
1983.

24- 24-IAEA-TECDOC-590. Case study on the use of PSA methods: Determinig safety
importance of systems and components at nuclear power plants. April, 1991.

25- IAEA-TECDOC-508. Survey of Ranges of Component Reliability Data for Use in


Probabilistic Safety Assessment. IAEA, Vienna, 1989.

26- IAEA Safety Series No. 50-P-4. Procedures for Conducting Probabilistic Safety
Assessment of Nuclear Power Plants. IAEA, 1992.

27- NUREG/CR-4780. Procedures for Treating Common Cause Failures in Safety and
Reliability Studies. USNRC, 1988.

28- SRD Dependent Failures Procedures Guide. SRD, UKAEA, 1987. 29- Castillo Guilarte, Manuel. Sistematizacin del Departamento Tcnico de Continuidad
Absoluta, Caracas, 1981, pg. 92

30- Estava Moreno, Nicols. Mantenimiento y Subdesarrollo, Caracas, Editorial Principios,


pg. 233.

31- Foster, Caxton. Real Time Programming. Philippines, Editorial Addiso-Wesley,


Publishing Company, 1981, pg. 190.

92

32- Glass, Robert y Noiseux, Rolan. Software Maintenance Guidebook, New Jersey,
Editorial Prentice-Hall Inc., 1981, pg. 193.Goldeman, S.A. y Slattery, T.B., Maintainability: A mayor element of System Effectiveness, Newe York, Editorial John Wiley & Sons Inc., 1964, pg. 282.

33- Gumbel, Emil Julius, Statistics of Extremes, 3ra. Ed., Editorial Columbia University
Press, 1066, pg. 375.

34- Jelen, F.C., Const and Optimization Engineering, New York, Editorial Mc-Graw Hill
Book Company, 1970, pg. 490

35- Newbrough, E.T., Administracin de Mantenimiento Industrial, 2da. Impresin, Mxico,


Editorial Diana, 1976, pg. 413, traducido por Mario Bracamonte Cantolla.

36- Organizacin de la Aviacin Civil Internacional, Confiabilidad y Disponibilidad del


Equipo Electrnico, Montreal, 1968, pg. 20.

37- Bain, Lee y Antle, Charles, Estimation of Parameters in the Weibull Distribution,
Technometrics, Vol. 9, No. 4, Nov. 1967, pgs. 621-627.

38- Beichelt, F. Y Fisher, K., On a basic Equation of Reliability Theory, Microelectronics


Reliability, Vol.`19, No. 1979, pgs. 367-369.

39- Bosch, G., Model for Failure Rate Curves, Microelectronics Reliability, Vol.`19, No.
1979, pgs. 579-588.

40- Cohen, Clifford A., Maximum Likelihood Estimation in the Weibull Distribution based on
Censored and on Complete Data, Technometrics, Vol. 7, No. 4, Nov. 1965, pgs. 579588

41- Finley, Howard, Total Life Cycle Costs of Plant and Equipment, Canadian Society for
Chemical Engineering, 20th Conference, Paper 65, Oct. 1970. Processing, Enero 1972, pgs. 81-86.

42- Finley, Howard, How Cost-Effective is your Maintenance Organization?, Hydrocarbon 43- Finley, Howard, High Technology Maintenance Management, National Petroleum
Refiners Association, Atlanta, Sept. 1976.

44- Johnson, L.G., Statistical Treatment of Failure Experiments, Transactions of the 22nd
Technical Conference of Quality Control., pgs. 113-140.

45- Latour, P.R., On-Line Computer Optimization: What is it and where to do it,
Hydrocarbon Processing, Jun. 1979, pgs. 73-82.

46- Mosquera C., Genaro, Administracin y Mantenimiento, Universidad Central de


Venezuela, Caracas, 1979, pg. 18.

47- Qureisi, A.S., The Discrimination between two Weibull Processes, Technometrics, Vol.
6, No.1 Feb, 1964, pgs. 57-75.

93

48- Redding, J.H. y Maynard, H.B.,

Can a Computer Reduce your Maintenance?, Hydrocarbon Processing, January 1980, pgs. 78-91. January 1979, pgs. 133-140.

49- Trotter, J.A., Reduce Maintenance Costs with Computers, Hydrocarbon Processing, 50- Weibull, Waloddi, An Statistical Representation of Fatigue Failure in Solids,
Transactions of the Royal Institute of Technology, Stockholm, No. 27, pgs. 133-140.

94

Anda mungkin juga menyukai