Anda di halaman 1dari 2

Universidad de las Fuerzas Armadas “ESPE”

Departamento de Ciencias Económicas, Administrativas y de Comercio

Nombre: Stephanie Michelle García Clerque Curso: A 306 NRC: 2741

Fecha: Martes, 16 de octubre de 2018 Docente: Msc. Luis Cando


Deber N° 4: Valores Perdidos
Valores Perdidos

Este tipo de valores es muy común tenerlos en el momento de realizar un experimento


estadístico porque en el historial no se los tiene por completo, puede que la persona que
estuvo realizando este tipo de reunión de datos no digitó alguno, en el historial se pueden
perder por generaciones.

La existencia de valores perdidos es algo prácticamente inevitable en la investigación en


Ciencias Sociales.

Diagnóstico de aleatoriedad de los valores perdidos

El primer procedimiento para establecer si los valores perdidos guardan o no un


patrón sistemático se basa en la lógica de la investigación. Si el patrón es sistemático, los
casos con valores perdidos deberán tener un comportamiento distinto respecto a otras
variables que en los casos sin valores perdidos.

El segundo procedimiento para evaluar la aleatoriedad de los valores perdidos


consiste en ver si existe una coincidencia significativa entre los casos concretos en que las
variables forman un valor perdido.

Cuando los valores perdidos responden a un patrón, nos encontramos ante un grave
problema pues, no hay medios estadísticos conocidos para reducir el número de valores
perdidos y se imposibilita la generalidad de los resultados. Sin embargo, ante una situación
de VPCA, sí que se dispone de estas estrategias, las cuales desarrollaremos a continuación.

Tratamiento de los valores perdidos

Básicamente, existen dos grandes procedimientos para tratar los valores perdidos:
la eliminación de los casos que contienen en o la imputación de un valor estimado a las
variables cuando toma un valor perdido.

La eliminación de todos los casos que tengan un valor perdió es el procedimiento,


as utilizado debido a que es el que la mayor parte de programas estadísticos tienen por
defecto. Esto provoca que, si el investigador no realiza una exploración previa de los datos,
el programa puede estar eliminando casos sin su conocimiento. Es más, se eliminan los
casos con valores perdidos, aunque éstos estén en variables que no se usan en el análisis.

Una alternativa distinta de eliminación es la eliminación de casos por parejas. LA


filosofía es la misma, solo que se elijan los casos únicamente en el supuesto en que
contengan un valor perdido en las variables que se están utilizando en un análisis
Universidad de las Fuerzas Armadas “ESPE”
Departamento de Ciencias Económicas, Administrativas y de Comercio

determinado. La limitación de este enfoque es que el tamaño muestra varia para cada uno
de los análisis efectuados, provocando serios problemas en algunas técnicas.

La alternativa a la eliminación es la imputación, es decir, sustituir el valor perdido por


alguna estimación de su valor. Probablemente lo más habitual es sustituir el valor perdido
por la media de la variable calculada con los casos disponibles. Uno de los atractivos de
este procedimiento es que es conservador; la media de la distribución no cambia. Sin
embrago, la varianza de la variable se reduce ya que la media está más próxima a si misma
que a los valores perdidos que sustituye, lo que hará que las correlaciones con el resto de
variables también caigan. Este procedimiento de la imputación es mucho más razonable que
la imputación simple de la media, por cuanto tienen en cuenta mucha más información. Sin
embargo, no está exento de limitaciones.

Outliers: Casos atípicos

Los outliers o casos atípicos son aquellos casos para los que una, dos o múltiples
variables toman valores extremos que los hace diferir del comportamiento de resto de la
muestra y permite al investigador sospechar que han sido generados por mecanismos
distintos al resto.

Las causas que generan la existencia de valores típicos en un fichero de datos


pueden ser diversas. Existen dos grandes grupos: los ocasionados por errores de los datos
y los ocasionados por la inevitable y necesaria variabilidad de esos datos.

Las causas pueden ser:

 Errores en los datos: tanto en su recogida como en la introducción de los mismos en


la base de datos
 Errores intencionados: en la contestación al cuestionario por parte del entrevistado
 Errores en el muestreo: que se concretan en introducir en la muestra a individuos
pertenecientes a una población distinta al objetivo
 Outliers legítimos: es decir, casos pertenecientes a la población objetivo que se
quería muestre pero que por la variabilidad inherente a las muestras difieren del
resto en su opiniones, actitudes o comportamientos.

Aunque nadie discrepa de la conveniente de eliminar los valores atípicos en caso de


error evidente, sin embargo, el debate es mucho más intenso cuando se trata de qué hacer
con un valor atípico legítimo.

Bibliografía:

Uriel, E., & Aldàs, J. (2009). Analisis Multivariante Aplicado. Paraninfo.

Anda mungkin juga menyukai