Anda di halaman 1dari 14

http://www.fsterra.com/mbe/investiga/grafcos/grafcos.

asp#top
Representacin grfica en el Anlisis de Datos
Autores:

Prtega Daz S., Pita Fernndez S.
Unidad de Epidemiologa Clnica y Bioestadstica. Complexo Hospitalario Juan Canalejo. A Corua
(Espaa)
Cad Aten Primaria (Pendiente de publicacin)

Tabla de contenidos:

Anlisis descriptivo

Comparacin de dos o ms
grupos

Relacin entre dos variables
numricas
Otros grficos
Bibliografa
Tablas y Figuras
Fig. 1. iagrama de sectores
Fig. !. iagrama de barras
"abla #. istribucin de frecuencias$ edad en
1%% pacientes
Fig. &. 'istograma
Fig. (. )olgono de frecuencias
Fig. *. iagrama de ca+a
Fig. ,. -rfico ).)
Fig. /. iagrama de barras agrupadas
Fig. 0. iagrama de barras de error
Fig. 1. -rfico de lneas
Fig. 1%. iagrama de dispersin
Fig. 11. iagramas de lneas superpuestos
Fig. 1!. iagrama de dispersin 2regresin
logstica3
Fig. 1&. Curvas ROC
4a reali5acin de los estudios clnico.epidemiolgicos implica finalmente emitir unos
resultados cuantificables de dic6o estudio o e7perimento. 4a claridad de dic6a
presentacin es de vital importancia para la comprensin de los resultados 8 la
interpretacin de los mismos. A la 6ora de representar los resultados de un anlisis
estadstico de un modo adecuado9 son varias las publicaciones :ue podemos
consultar
1
. Aun:ue se aconse+a :ue la presentacin de datos numricos se 6aga
6abitualmente por medio de tablas9 en ocasiones un diagrama o un grfico pueden
a8udarnos a representar de un modo ms eficiente nuestros datos.
;n este artculo se abordar la representacin grfica de los resultados de un estudio9
constatando su utilidad en el proceso de anlisis estadstico 8 la presentacin de
datos. <e describirn los distintos tipos de grficos :ue podemos utili5ar 8 su
correspondencia con las distintas etapas del proceso de anlisis.
Anlisis descriptivo.
http://www.fsterra.com/mbe/investiga/grafcos/grafcos.asp#top
Cuando se dispone de datos de una poblacin9 8 antes de abordar anlisis estadsticos
ms comple+os9 un primer paso consiste en presentar esa informacin de forma :ue
sta se pueda visuali5ar de una manera ms sistemtica 8 resumida. 4os datos :ue
nos interesan dependen9 en cada caso9 del tipo de variables :ue estemos mane+ando
!
.
Para variables categricas
&
9 como el se7o9 estadio "=>9 profesin9 etc.9 se :uiere
conocer la frecuencia 8 el porcenta+e del total de casos :ue ?caen? en cada categora.
@na forma mu8 sencilla de representar grficamente estos resultados es mediante
diagramas de barras o diagramas de sectores. ;n los grficos de sectores9 tambin
conocidos como diagramas de ?tartas?9 se divide un crculo en tantas porciones como
clases tenga la variable9 de modo :ue a cada clase le corresponde un arco de crculo
proporcional a su frecuencia absoluta o relativa. @n e+emplo se muestra en la Figura
1. Como se puede observar9 la informacin :ue se debe mostrar en cada sector 6ace
referencia al nAmero de casos dentro de cada categora 8 al porcenta+e del total :ue
estos representan. <i el nAmero de categoras es e7cesivamente grande9 la imagen
proporcionada por el grfico de sectores no es lo suficientemente clara 8 por lo tanto
la situacin ideal es cuando 6a8 alrededor de tres categoras. ;n este caso se pueden
apreciar con claridad dic6os subgrupos.
4os diagramas de barras son similares a los grficos de sectores. <e representan
tantas barras como categoras tiene la variable9 de modo :ue la altura de cada una de
ellas sea proporcional a la frecuencia o porcenta+e de casos en cada clase 2Figura 23.
;stos mismos grficos pueden utili5arse tambin para describir variables numricas
discretas :ue toman pocos valores 2nAmero de 6i+os9 nAmero de recidivas9 etc.3.
)ara variables numricas continuas9 tales como la edad9 la tensin arterial o el
ndice de masa corporal9 el tipo de grfico ms utili5ado es el istograma. )ara
construir un grfico de este tipo9 se divide el rango de valores de la variable en
intervalos de igual amplitud9 representando sobre cada intervalo un rectngulo :ue
tiene a este segmento como base. ;l criterio para calcular la altura de cada rectngulo
es el de mantener la proporcionalidad entre las frecuencias absolutas 2o relativas3 de
los datos en cada intervalo 8 el rea de los rectngulos. Como e+emplo9 la Tabla !
muestra la distribucin de frecuencias de la edad de 1%% pacientes9 comprendida entre
los 10 8 (! aBos. <i se divide este rango en intervalos de dos aBos9 el primer tramo
est comprendido entre los 10 8 11 aBos9 entre los :ue se encuentra el (C1%%D(E del
total. )or lo tanto9 la primera barra tendr altura proporcional a (. )rocediendo as
sucesivamente9 se constru8e el 6istograma :ue se muestra en la Figura ". @niendo
los puntos medios del e7tremo superior de las barras del 6istograma9 se obtiene una
imagen :ue se llama pol#gono de frecuencias. ic6a figura pretende mostrar9 de la
forma ms simple9 en :u rangos se encuentra la ma8or parte de los datos. @n
e+emplo9 utili5ando los datos anteriores9 se presenta en la Figura $.
Otro modo 6abitual9 8 mu8 Atil9 de resumir una variable de tipo numrico es utili5ando
el concepto de percentiles9 mediante diagramas de ca%as
(9*
. 4a Figura & muestra un
grfico de ca+as correspondiente a los datos de la "abla #. 4a ca+a central indica el
rango en el :ue se concentra el *%E central de los datos. <us e7tremos son9 por lo
tanto9 el 1
er
8 &
er
cuartil de la distribucin. 4a lnea central en la ca+a es la mediana. e
este modo9 si la variable es simtrica9 dic6a lnea se encontrar en el centro de la
http://www.fsterra.com/mbe/investiga/grafcos/grafcos.asp#top
ca+a. 4os e7tremos de los ?bigotes? :ue salen de la ca+a son los valores :ue delimitan
el 1*E central de los datos9 aun:ue en ocasiones coinciden con los valores e7tremos
de la distribucin. <e suelen tambin representar a:uellas observaciones :ue caen
fuera de este rango 2outliers o valores e7tremos3. ;sto resulta especialmente Atil para
comprobar9 grficamente9 posibles errores en nuestros datos. ;n general9 los
diagramas de ca+as resultan ms apropiados para representar variables que
presenten una gran desviacin de la distribucin normal. Como se ver ms
adelante9 resultan adems de gran a8uda cuando se dispone de datos en distintos
grupos de su+etos.
)or Altimo9 8 en lo :ue respecta a la descripcin de los datos9 suele ser necesario9 para
posteriores anlisis9 comprobar la normalidad de alguna de las variables numricas de
las :ue se dispone. @n diagrama de ca+as o un 6istograma son grficos sencillos :ue
permiten comprobar9 de un modo puramente visual9 la simetra 8 el ?apuntamiento? de
la distribucin de una variable 89 por lo tanto9 valorar su desviacin de la normalidad.
;7isten otros mtodos grficos especficos para este propsito9 como son los grficos
'(' o )(). ;n los primeros9 se confrontan las proporciones acumuladas de una
variable con las de una distribucin normal. <i la variable seleccionada coincide con la
distribucin de prueba9 los puntos se concentran en torno a una lnea recta. 4os
grficos F.F se obtienen de modo anlogo9 esta ve5 representando los cuantiles de
distribucin de la variable respecto a los cuantiles de la distribucin normal. ;n la
Figura * se muestra el grfico ).) correspondientes a los datos de la "abla # :ue
sugiere9 al igual :ue el correspondiente 6istograma 8 el diagrama de ca+as9 :ue la
distribucin de la variable se ale+a de la normalidad.
+omparacin de dos o ms grupos.
Cuando se :uieren comparar las observaciones tomadas en dos o ms grupos de
individuos una ve5 ms el mtodo estadstico a utili5ar9 as como los grficos
apropiados para visuali5ar esa relacin9 dependen del tipo de variables :ue estemos
mane+ando.
Cuando se traba+a con dos variables cualitativas podemos seguir empleando
grficos de barras o de sectores. )odemos :uerer determinar9 por e+emplo9 si en una
muestra dada9 la frecuencia de su+etos :ue padecen una enfermedad coronaria es ms
frecuente en a:uellos :ue tienen algAn familiar con antecedentes cardiacos. A partir
de dic6a muestra podemos representar9 como se 6ace en la Figura ,9 dos grupos de
barras$ uno para los su+etos con antecedentes cardiacos familiares 8 otro para los :ue
no tienen este tipo de antecedentes. ;n cada grupo9 se dibu+an dos barras
representando el porcenta+e de pacientes :ue tienen o no alguna enfermedad
coronaria. =o se debe olvidar :ue cuando los tamaBos de las dos poblaciones son
diferentes9 es conveniente utili5ar las frecuencias relativas9 8a :ue en otro caso el
grfico podra resultar engaBoso.
)or otro lado9 la comparacin de variables continuas en dos o ms grupos se
reali5a 6abitualmente en trminos de su valor medio9 por medio del test t de <tudent9
anlisis de la varian5a o mtodos no paramtricos e:uivalentes9 8 as se 6a de refle+ar
en el tipo de grfico utili5ado. ;n este caso resulta mu8 Atil un diagrama de barras
http://www.fsterra.com/mbe/investiga/grafcos/grafcos.asp#top
de error9 como en la Figura -. ;n l se compara el ndice de masa corporal en una
muestra de 6ombres 8 mu+eres. )ara cada grupo9 se representa su valor medio9 +unto
con su 1*E intervalo de confian5a. Conviene recordar :ue el 6ec6o de :ue dic6os
intervalos no se solapen9 no implica necesariamente :ue la diferencia entre ambos
grupos pueda ser estadsticamente significativa9 pero s nos puede servir para valorar
la magnitud de la misma. As mismo9 para visuali5ar este tipo de asociaciones9 pueden
utili5arse dos diagramas de ca+as9 uno para cada grupo. ;stos diagramas son
especialmente Atiles a:u$ no slo permiten ver si e7iste o no diferencia entre los
grupos9 sino :ue adems nos permiten comprobar la normalidad 8 la variabilidad de
cada una de las distribuciones. =o olvidemos :ue las 6iptesis de normalidad 8
6omocedasticidad son condiciones necesarias para aplicar algunos de los
procedimientos de anlisis paramtricos.
)or Altimo9 seBalar :ue tambin en esta situacin pueden utili5arse los 8a conocidos
grficos de barras9 representando a:u como altura de cada barra el valor medio de la
variable de inters. 4os grficos de l#neas pueden resultar tambin especialmente
interesantes9 sobre todo cuando interesa estudiar tendencias a lo largo del tiempo
2Figura .3. =o son ms :ue una serie de puntos conectados entre s mediante rectas9
donde cada punto puede representar distintas cosas segAn lo :ue nos interese en cada
momento 2el valor medio de una variable9 porcenta+e de casos en una categora9 el
valor m7imo en cada grupo9 etc3.
Relacin entre dos variables num/ricas.
Cuando lo :ue interesa es estudiar la relacin entre dos variables continuas9 el
mtodo de anlisis adecuado es el estudio de la correlacin. 4os coeficientes de
correlacin 2)earson9 <pearman9 etc.3 valoran 6asta :u punto el valor de una de las
variables aumenta o disminu8e cuando crece el valor de la otra. Cuando se dispone de
todos los datos9 un modo sencillo de comprobar9 grficamente9 si e7iste una
correlacin alta9 es mediante diagramas de dispersin9 donde se confronta9 en el
e+e 6ori5ontal9 el valor de una variable 8 en el e+e vertical el valor de la otra. @n
e+emplo sencillo de variables altamente correlacionados es la relacin entre el peso 8
la talla de un su+eto. )artiendo de una muestra arbitraria9 podemos construir el
diagrama de dispersin de la Figura 10. ;n l puede observarse claramente como
e7iste una relacin directa entre ambas variables9 8 valorar 6asta :u punto dic6a
relacin puede modeli5arse por la ecuacin de una recta. ;ste tipo de grficos son9 por
lo tanto9 especialmente Atiles en la etapa de seleccin de variables cuando se a+usta
un modelo de regresin lineal.
1tros grficos.
4os tipos de grficos mostrados 6asta a:u son los ms sencillos :ue podemos
mane+ar9 pero ofrecen grandes posibilidades para la representacin de datos 8 pueden
ser utili5ados en mAltiples situaciones9 incluso para representar los resultados
obtenidos por mtodos de anlisis ms complicados. )odemos utili5ar9 por e+emplo9
dos diagramas de lneas superpuestos para visuali5ar los resultados de un anlisis de
la varian5a con dos factores 2Figura 113. @n diagrama de dispersin es el mtodo
adecuado para valorar el resultado de un modelo de regresin logstica 2Figura 123.
http://www.fsterra.com/mbe/investiga/grafcos/grafcos.asp#top
;7isten incluso algunos anlisis concretos :ue estn basados completamente en la
representacin grfica. ;n particular9 la elaboracin de curvas ROC 2Figura 1"3 8 el
clculo del rea ba+o la curva constitu8en el mtodo ms apropiado para valorar la
e7actitud de una prueba diagnstica.
'emos visto9 por lo tanto9 como la importancia 8 utilidad :ue las representaciones
grficas pueden alcan5ar en el proceso de anlisis de datos. 4a ma8ora de los te7tos
estadsticos 8 epidemiolgicos
(
6acen 6incapi en los distintos tipos de grficos :ue se
pueden crear9 como una 6erramienta imprescindible en la presentacin de resultados 8
el proceso de anlisis estadstico. =o obstante9 es difcil precisar cundo es ms
apropiado utili5ar un grfico :ue una tabla. >s bien podremos considerarlos dos
modos distintos pero complementarios de visuali5ar los mismos datos. 4a creciente
utili5acin de distintos programas informticos 6ace especialmente sencillo la
obtencin de las mismas. 4a ma8ora de los pa:uetes estadsticos 2<)<<9
<"A"-RA)'#C<9 <.)4@<9 ;-R;"9...3 ofrecen grandes posibilidades en este sentido.
Adems de los grficos vistos9 es posible elaborar otros grficos9 incluso
tridimensionales9 permitiendo grandes cambios en su apariencia 8 facilidad de
e7portacin a otros programas para presentar finalmente los resultados del estudio.
Figura 1. 2%emplo de grfico de sectores. Distribucin de una muestra de pacientes seg3n el
bito de fumar.
Figura 2. 2%emplo de grfico de barras. 2stadio T45 en el cncer gstrico.
http://www.fsterra.com/mbe/investiga/grafcos/grafcos.asp#top
Tabla !. Distribucin de frecuencias
de la edad en 100 pacientes.
2dad 46 de pacientes
10 1
11 &
!% (
!1 /
!! *
!& 0
!( 1%
!* 0
!, 1
!/ ,
!0 ,
!1 (
&% &
&1 (
&! *
&& &
&( !
&* &
http://www.fsterra.com/mbe/investiga/grafcos/grafcos.asp#top
&, 1
&/ !
&0 &
&1 1
(1 1
(! 1
Figura ". 2%emplo de un istograma correspondiente a los datos de la Tabla !.
Figura $. 'ol#gono de frecuencias para los datos de la Tabla !.
http://www.fsterra.com/mbe/investiga/grafcos/grafcos.asp#top
Figura &. 2%emplo de un diagrama de ca%a correspondiente a lo datos en la Tabla !.
http://www.fsterra.com/mbe/investiga/grafcos/grafcos.asp#top
Figura *. 7rfico '(' de normalidad para los datos de la Tabla !.
Figura ,. Diagrama de barras agrupadas. Relacin entre la presencia de alguna enfermedad
coronaria y los antecedentes cardiacos familiares en una muestra.
http://www.fsterra.com/mbe/investiga/grafcos/grafcos.asp#top
Figura -. 8arras de error. 9ariacin en el #ndice de masa corporal seg3n el se:o.
Figura .. 7rfico de l#neas. 43mero de pacientes trasplantados renales en el +omple:o
;ospitalario <=uan +anale%o< durante el periodo 1.-1(1..,.
http://www.fsterra.com/mbe/investiga/grafcos/grafcos.asp#top
Figura 10. Diagrama de dispersin entre la talla y el peso de una muestra de individuos.
Figura 11. Dos diagramas de l#neas superpuestos. 9ariacin en el peso medio de una
muestra de reci/n nacidos seg3n el control ginecolgico del embara>o y el bito de fumar
de la madre.
http://www.fsterra.com/mbe/investiga/grafcos/grafcos.asp#top
Figura 12. Diagrama de dispersin ?regresin log#stica@. 'robabilidad de padecer cirrosis
epticaA seg3n un modelo de regresin log#stica a%ustando por el B de protrombina y el
presentar o no epatomegalia.
http://www.fsterra.com/mbe/investiga/grafcos/grafcos.asp#top
Figura 1". +urva R1+ para el porcenta%e de protrombina en la prediccin de cirrosis.
8ibliograf#a
1. 4ang "A9 <ecic >. 'oG to report statistics in medicine. Annotated
-uidelines for aut6ors9 ;ditors9 and revieGers. )6iladelp6ia$ )ort Cit8
)ressH 111/.
!. Altman -9 Bland I>. <tatistics =otes$ )resentation of numerical data.
B>I 111,H &1!$ */!. J>edlineK J"e7to completoK
&. <inger )A9 Feinstein AR. -rap6ical displa8 of categorical data. I Clin
;pidemiol 111&H (,2&3$ !&1.,. J>edlineK
(. <impson RI9 Io6nson "A9 Amara #A. "6e bo7.plot$ an e7plorator8 anal8sis
for biomedical publications. Am 'eart I 1100H 11, 2, )art 13$ 1,,&.*.
J>edlineK
*. Lilliamson F9 )arMer RA9 NendricM I<. "6e bo7 plot$ a simple visual
met6od to interpret data. Ann #ntern >ed 1101H 11% 2113$ 11,.!1.
J>edlineK
,. Altman DA. Practical statistics for medical research. 1th ed., repr. 199. !ondon:
"hapman # $all% 199.
Arriba
http://www.fsterra.com/mbe/investiga/grafcos/grafcos.asp#top
O !%%0
fisterra.com
>is atos P Contacto.<ugerencias P FAFQs PCondiciones de uso P
)oltica de privacidad P Aviso legal

Anda mungkin juga menyukai