CONCEPTOS FUNDAMENTALES.
Estos conceptos se introducen haciendo referencia al lenguaje y la terminologa de una
prueba de vida industrial.
Fiabilidad es un concepto con muchas connotaciones distintas. Cuando se aplica al ser
humano, normalmente se refiere a la habilidad de las personas para hacer ciertas tareas
de acuerdo con un estndar especificado. Por extensin la palabra se aplica a una pieza
de un equipo, o a un componente de un sistema, y significa la habilidad de un equipo o
componente para cumplir con la funcionalidad que se requiere de l. El origen del uso del
trmino era cualitativo.
En su aplicacin actual, la fiabilidad es casi siempre un concepto cuantitativo, y esto
implica la necesidad de mtodos para medirla.
Hay muchas razones por las que la fiabilidad necesita ser cuantificada. Quizs el ms
importante es el econmico ya que la mejora de la fiabilidad cuesta dinero, y esto puede
ser justificado slo si se puede evaluar la no fiabilidad de un equipo. Para un componente
crtico, del cual su operacin funcional es esencial en un sistema, la fiabilidad puede ser
medida como la probabilidad de que el componente opere con xito, y la esperanza del
costo de un componente no fiable se mide como el producto de la probabilidad de fallo y el
costo de fallo. En una aplicacin rutinaria, donde los componentes que fallan pueden ser
reparados, la media del tiempo entre fallos (Mean Time Failures) es un parmetro crtico.
En ambos casos, la necesidad de una definicin probabilstica de fiabilidad es evidente.
FIABILIDAD Y FALLO.
Funcin de fiabilidad:
La probabilidad de fallo como una funcin de tiempo puede ser definida como:
P(tt) = F(t), t > 0
Donde t es una variable aleatoria que denota el fallo tiempo. Entonces F(t) es la
probabilidad de que el sistema falle por un tiempo t. En otras palabras , F(t) es el fallo de la
funcin de distribucin. Si definimos fiabilidad como la probabilidad del suceso, o la
probabilidad de que el sistema realice su funcin deseada en un cierto tiempo t, podemos
escribirlo:
R(t) = 1 - F(t) = P(t > t) (TIEMPO DE VIDA)
Donde R(t) es la funcin de fiabilidad.
Si el tiempo de fallo es una variable aleatoria t entonces f(t) tiene una funcin de densidad:
La fiabilidad (Reliability) de un producto se define como la probabilidad de que un
dispositivo desarrolle su funcin con ciertas condiciones, durante un periodo de tiempo
establecido. El valor de esta probabilidad se denota por R.
Observacin:
La variable aleatoria duracin de un dispositivo a veces no se mide en tiempo sino en otra
magnitud que tiene un significado anlogo, por ejemplo la fiabilidad de un cable puede
referirse a la resistencia en Newton hasta la rotura, la de un neumtico a los kilmetros
rodados, la de una tostadora al nmero de ciclos, la de un motor al nmero de
revoluciones, la de un equipo elctrico a los kilovatios consumidos. De todas formas
mantendremos la notacin temporal para simplificar.
Para no tener ambigedades en la cuantificacin de la fiabilidad es importante tener bien
definido el concepto de tiempo de vida de un producto y tener identificado cundo ste
falla y de que clase de fallo se trata.
La vida de un producto es el perodo de tiempo durante el que puede ser utilizado, en
condiciones establecidas.
Fallo (failure) es la prdida de algunas de las propiedades del dispositivo que reduce, total
o parcialmente, su funcionamiento.
La manera en que se observa el fallo se denomina modo de fallo y el mecanismo de fallo
(failure mechanism) se refiere al proceso qumico-fsico que da lugar al fallo. Por ejemplo
nos puede interesar saber cundo una pieza de un motor deja de funcionar de manera
adecuada; en este caso debe precisarse muy bien cul es el fallo. Si el fallo se detecta por
el ruido del motor, se tendr que definir como medirlo (en decibelios por ejemplo) y definir
un lmite superior de tolerancia, y cuando se supere el lmite tenemos el fallo.
Los fallos se pueden clasificar segn la causa que lo provoca: fallo por uso
indebido (misuse failure) cuando la causa es extrnseca al dispositivo, y fallo por debilidad
inherente (inherent weakness failure) cuando la causa es intrnseca.
Un sistema es un dispositivo formado por partes, la fiabilidad de las cuales es conocida.
Estas partes se denominan componentes. En general, el fallo de un sistema se produce al
fallar uno o varios componentes. Segn sea el fallo, se denomina fallo primario (primary
failure) cuando no es causado ni directa ni indirectamente por el fallo de otro
dispositivo, fallo secundario cuando es causado por el fallo de otro dispositivo, y fallo por
desgaste (wear-out failure) cuando es un fallo con una probabilidad de aparicin que
aumenta a medida que el tiempo pasa, resultado de una serie de procesos caractersticos
del dispositivo.
La distribucin de probabilidad ser distinta si los componentes se reparan o no, puesto
que en un caso la variable aleatoria de inters es el tiempo entre fallos y, en el otro, el
tiempo hasta el fallo.
En los dispositivos que no se reparan, nicamente tiene sentido considerar tiempos de
vida hasta el primer fallo, y la variabilidad de una unidad a otra da una distribucin, que es
objeto de estudio de la fiabilidad.
Una caracterstica de fiabilidad de la variable aleatoria T: tiempo hasta el fallo es la vida
media hasta el fallo, MTTF ( mean time to failure).
Si los dispositivos son reparados tiene sentido considerar el tiempo entre fallos
consecutivos. La fiabilidad en este caso es ms complicada, a menos que la distribucin
de probabilidad de tiempo entre fallos sea independiente de la edad del dispositivo.
Una caracterstica de fiabilidad de la variable aleatoria T: tiempo entre fallos consecutivos
es el tiempo medio entre fallos MTBF (mean time between failure).
En las aplicaciones slo se dispone de un valor aproximado de estos parmetros, obtenido
por un procedimiento estadstico de estimacin ms o menos complejo. Estos valores
estn muchas veces incluidos en la especificacin de un producto, y pueden figurar en una
relacin contractual entre un cliente y un proveedor, o servir de criterio para una
homologacin. Es importante concretar de qu forma se obtiene una caracterstica de
fiabilidad. Un lenguaje preciso y preferiblemente normalizado ayuda a evitar malentendidos
cuando se utilizan valores de las caractersticas de fiabilidad.
Hay distintas formas de aproximar una caracterstica de fiabilidad. En general se
distinguen cuatro formas distintas: observada, evaluada, extrapolada y predicha.
Fiabilidad observada (observed reliability) de un dispositivo que no se repara en un tiempo
dado t, es la proporcin de dispositivos de una muestra que hacen su funcin de manera
satisfactoria una vez transcurrido este tiempo t. Puede expresarse en porcentaje.
Fiabilidad evaluada (assessed reliability) hace referencia a valores obtenidos a partir de
datos experimentales por un tratamiento estadstico. El resultado de este tratamiento
puede dar distinto a la fiabilidad observada.
Fiabilidad extrapolada (extrapolated reliability) se refiere a un valor obtenido al extrapolar o
interpolar una fiabilidad observada o evaluada para poder obtener un valor aplicable a
condiciones de estrs distintas, en que se van obteniendo resultados experimentales.
Habitualmente, los valores extrapolados se basan en pruebas de vida aceleradas.
Fiabilidad predicha (predicted reliability) designa un valor aplicable a un sistema, que se
obtiene a partir de los valores observados, evaluados o extrapolados de sus componentes.
La tasa de fallo (failure rate) es una caracterstica de la fiabilidad que se puede interpretar
como la velocidad a la que se producen los fallos, la fraccin de unidades de un producto
que fallan por unidad de tiempo.
Si la tasa de fallo es constante se designa por y si es funcin del tiempo t se designa por
h(t) y se llama funcin de riesgo (Hazard funtion).
Desde el punto de vista cualitativo las herramientas que se utilizan en la industria son el
Anlisis de modo de fallo y sus efectos (AMFE) y los anlisis por rboles de fallos FTA
(failure tree analysis).
Fue desarrollado por la NASA en el proyecto Apolo a mediados de los aos 70. Despus
de las aplicaciones en los viajes areos y espaciales as como en las centrales nucleares
se utiliz de inmediato en la industria de la automocin; actualmente es una herramienta
de uso habitual en la industria.
Es una tcnica de carcter preventivo que debe llevarse a cabo en las fases de diseo y
desarrollo de productos y servicios a lo largo del proceso de fabricacin para que se
puedan detectar y prevenir los posibles modos de fallo potenciales.
En el manual Potencial Mode and Effects Analysis de la QS 9000, normativa del sector de
la automocin Ford, Opel y General Motors, pueden encontrarse las ideas fundamentales
de esta tcnica y la manera de aplicarlas.
- La tasa de fallo (media de fallos por unidad de tiempo) es constante, as que no depende
del intervalo examinado en particular.
Cuando ambas hiptesis se cumplen, entonces el proceso de aparicin de fallos se llama
proceso de Poisson con tasa de fallo .
El proceso de Poisson tiene dos propiedades importantes:
- El nmero de fallos X en un intervalo de longitud t sigue una distribucin de Poisson con
media t, de tal forma que
k0
- Los tiempos entre fallos sucesivos son variables aleatorias independientes, cada una de
las cuales sigue una distribucin exponencial con parmetro , as que:
Pr(tiempo de fallo > t) = , 0<t<
El tiempo medio entre fallos (MTBF) es .
La primera propiedad est relacionada con la distribucin de Poisson de parmetro .
Adems el proceso de Poisson es un buen modelo para aquellos sistemas con muchos
componentes que pueden fallar, pero que la probabilidad de fallo de cada uno de ellos es
pequea. Este fenmeno es conocido con el nombre de sucesos raros.
La segunda propiedad sugiere la distribucin exponencial para tiempos de vida.
Muchos sistemas pueden mejorar o empeorar con e tiempo. En este caso se necesitan
modelos ms generales como los procesos de Poisson no homogneos
(Nonhomogeneous Poisson Process) donde la tasa de fallo no es constante. Este tipo de
modelos es particularmente importante en el anlisis de sistemas reparables.
MODELO EXPONENCIAL
El modelo exponencial es bien conocido. Su funcin de densidad es :
Sea T = Tiempo de vida de una unidad
Dada la funcin de densidad podemos obtener las funciones asociadas al Anlisis de
datos de supervivencia:
Probbilidad de supervivencia
Supervivencia :
Dado que la densidad de fallos es f (t), el tiempo T que se espera que transcurra hasta un
fallo viene dado por:
Tasa de fallos:
El modelo exponencial es el nico que tiene tasa de fallos constante: la probabilidad
de
fallar condicionada a que el elemento est en uso no vara con el tiempo. Esta propiedad
se
denomina falta de memoria.
Ejemplo:/
Durante el programa de mantenimiento anual que realiza una empresa se han recogido
los datos de fallos de un conjunto de 50 vlvulas mecnicas habiendo fallado 2 de
exp(-t1)=0,95
exp(-t2)=0,05
Invirtiendo: (es decir 1/0,95 y 1/0.05)
exp(t1)=1,06 de donde t1=0,05826aos
exp(t2)=20 de donde t2=2,9957aos
Luego, para un nivel de confianza del 90 %, la vida de la vlvula estar comprendida entre
0,05826 y 2,9957 aos.
MODELO DE WEIBULL
Muy utilizado en la prctica por su versatilidad
El modelo Weibull tiene la siguiente funcin de densidad
Dada la funcin de densidad podemos obtener las funciones asociadas al Anlisis de
datos de supervivencia:
Funcin de fiabilidad:
Tasa de fallos:
Funcin de riesgo
Donde * y * son parmetros positivos, el primero un parmetro de escala y el segundo un
parmetro de perfil o de forma
Segn sean los valores de beta puede representar tasas de fallo crecientes ,
decrecientes o constantes:
*<1: La funcin de riesgo o la tasa de fallo disminuye al aumentar el tiempo. Este
comportamiento es propio de los fallos prematuros. Productos con esta tasa de fallo suelen
ser verificados en fbrica para que los fallos nos e produzcan en el mercado
*=1: (modelo exponencial) La funcin de riesgo es constante. Una tasa de fallo constante
es una caracterstica de los fallos ocasionales. En esta situacin el nmero de fallos y el
momento en que ocurren no depende del tiempo que el dispositivo funciona.
Si > 1 la funcin de riesgo es creciente. Esto indica que los fallos son debidos al
envejecimiento, a la fatiga o al desgaste. En particular si 1 < < 2, la funcin de riesgo
crece rpidamente al principio y muy poco al final; para = 2 la funcin de riesgo crece
linealmente con el tiempo; para > 2 crece poco al principio y rpido posteriormente, es
decir, el intervalo de tiempo en el cual se produce un fallo es cada vez menor. Es
recomendable que los dispositivos con tasa de fallo creciente tengan un plan de
mantenimiento preventivo.
Ejemplo:
T = duracin de una marca de bombilla de bajo consumo en aos (20 datos):
1.53 0.30 1.87 0.08 1.67 1.48 3.41 2.95 1.71 3.20
0.22 2.31 0.45 3.79 2.76 0.73 0.92 2.81 3.03 2.41
Las duraciones varan de 0.08 a 3.79
Duracin media: 1.88
Desviacin tpica: 1.15
Resolucin:
cada subida de 10C. Puesto que estos componentes suelen ser muy fiables, se usan
temperaturas elevadas en combinacin con sobre tensiones, a fin de determinar tasas de
fallo en un tiempo razonable.
Los ensayos acelerados de nuevos productos es una tcnica comn y se usa para
detectar modos de fallo potenciales.
Las pruebas de vida aceleradas con fines de valoracin se restringen a las piezas y los
componentes, de los cuales se conocen las relaciones entre las tasas de fallo en
condiciones normales y de estrs. Un registro importante es que las condiciones de estrs
no puedan introducir nuevos modos de fallo.
Cuando las relaciones estn bien definidas, las pruebas de vida acelerada pueden dar
estimaciones de las caractersticas de fiabilidad a una fraccin del coste de las pruebas
ordinarias, y son ventajosas.
La relacin entre pruebas aceleradas y normales puede ser relativa a una tasa de fallo, a
una tasa de degradacin o cambio de una caracterstica, o al tiempo de desgaste. Siempre
que se conozca la relacin, los datos en condiciones aceleradas pueden reducirse a datos
en condiciones normales, generalmente multiplicados por algunas constantes apropiadas.
De todas formas, para ciertos componentes se conocen las constantes a partir de estudios
documentados. El manual MIL-HBK-217 es la fuente ms consultada en la industria
electrnica.
Hay otra aplicacin en que se usan las pruebas de vida aceleradas, las pruebas conocidas
como burn-in, de purga, que causan el efecto de eliminar las unidades potencialmente
infiables sin afectar a las unidades buenas. Un ejemplo de esta prueba es el ensayo de
aceleracin a 20.000 g, donde g es la aceleracin de la gravedad 9,81m/s, que se aplica a
los semiconductores (hay algn fabricante que ha aumentado incluso este nivel de g en un
50%, hasta 30.000 g en algunas unidades, sin observar efectos medibles sobre la
actuacin o longevidad de las unidad es que pasan la prueba). Tal ensayo sirve para
eliminar las unidades que tienen una debilidad mecnica en potencia y una fiabilidad
inferior. El ensayo puede tambin hacer que fallen ciertas unidades cuya fiabilidad hubiera
sido satisfactoria, pero, imponindolo a todas las unidades, la fiabilidad general resultante
del lote despus del ensayo es considerablemente superior a la que hubiera sido de no
haberse realizado el ensayo. Es importante que las unidades que superan la prueba no se
hayan degradado.
MODELOS DE PRUEBAS DE VIDA CON ESTRS CONSTANTE:
Modelo Arrhenius-Exponencial.
Suceso de fallo
PUERTAS LGICAS.
Suceso bsico
primario
Suceso bsico
secundario
Suceso interruptor
Los rboles de fallo utilizan puertas O (OR gates) y puertas Y (AND gates) la puerta O es
una conexin lgica entre un suceso combinado y diversos sucesos elementales, lo que
significa que el suceso combinado tiene lugar cuando se da al menos alguno de los
sucesos elementales. La puerta Y es una conexin lgica entre un suceso combinado y
diversos suceso elementales, lo que significa que el suceso combinado tiene lugar cuando
se dan simultneamente todos lo sucesos elementales.
Puerta O
22
Puerta Y