Manual
ECOLOGÍA NUMÉRICA Y ESTADÍSTICA APLICADA
A LA BIOLOGÍA DE LA CONSERVACIÓN CON
PAST 2.17
Héctor Aponte Ubillús
2013
Sin entrar a los detalles técnicos matemáticos, el presente manual intenta que los estudiantes den
un vistazo rápido a los test estadísticos presentados, así como al procesamiento y al análisis de los
resultados a partir de ejemplos enmarcados en la Biología de la Conservación. Como
consecuencia, en esta guía usted encontrará los pasos seguidos para hacer los análisis, más no la
base matemática de los mismos. Para mayor detalle de los mismos recomiendo la lectura de
algunos textos (citados en la bibliografía) que le permitirán adquirir conocimientos más profundos
de estadística y modelamiento, si así lo desea (Norman et al. 1996, Dytham 2011, Emden 2012).
Invito también a los interesados en aprender más sobre el PAST a revisar la página web del
programa (http://folk.uio.no/ohammer/past/) donde encontrarán tutoriales, manuales e información
adicional.
Presentación ........................................................................................................................ 3
Análisis de correspondencia........................................................................................... 23
La Barra de herramientas (de izquierda a derecha) contiene todas las pestañas mostradas
en la figura 2, de las cuales utilizaremos:
Usted cuenta con la base de datos de las parcelas analizadas (EJ1 ASTROCARYUM) y
se le pide responder a las siguientes preguntas:
Los análisis descriptivos utilizan algoritmos básicos para tener una idea de lo que está
sucediendo con la o las especies en estudio. Para iniciar este análisis procederemos de la
siguiente manera.
Una vez que los datos han sido introducidos, procederemos con el análisis univariado de
la siguiente manera:
PAST realiza los análisis únicamente en las casillas seleccionadas, por ello es muy
importante seleccionar las casillas antes de demandar un análisis. Puede hacerlo
haciendo click sobre los títulos de las columnas que desea evaluar (figura 5a) o
dando click en la celda de la esquina superior izquierda (figura 5b), esto último si
lo que se desea es evaluar todas las columnas presentes en la hoja.
Ahora vamos a pedir al PAST que nos dé un análisis univariado de los datos. Siga la
siguiente ruta: Statistics > Univariate. PAST nos dará una tabla que indica las principales
características de cada columna, incluyendo el promedio, valores máximos y mínimos,
desviación estándar y otros estadísticos descriptivos útiles (figura 6). Los datos pueden ser
copiados (para pegar en Excel o en cualquier programa de Office) o impresos
directamente con las opciones de la barra de herramientas debajo de las tablas.
Otro gráfico muy útil cuando se hacen comparaciones es hacer histogramas con los dos
juegos de datos al mismo tiempo. Para ello, seleccione los datos y siga la ruta
Plot>histogram. Obtendrá un gráfico en dos colores al cual usted puede añadirle una curva
normal para cada grupo de datos (Figura 8).
Uno de los primeros pasos para saber que tipo de prueba estadística utilizar consiste en
verificar que los datos sigan una distribución normal. Para ello se utilizan diferentes
pruebas estadísticas que te indican si los grupos de datos cumplen con este requisito.
PAST da el resultado y un valor p para cinco pruebas estadísticas. Para realizar este
análisis siga la ruta Statistics>Normality tests (figura 9).
Frente a esta situación no podemos aplicar el clásico test de ANOVA, ya que no cumple
con la normalidad, lo que nos obliga a utilizar test no paramétricos como los de Mann
Wittney (para dos muestras) o el de Kruskall Wallis (para más de dos muestras). Para ello,
seleccione los datos y siga la ruta: Statistics>Mann Whitney o Statistics>Kruskal Wallis
según sea el caso.
Ahora que ya comprobó que existen diferencias significativas en los adultos, intente
comprobar si en los otros estadios de la población se cumple el mismo patrón.
El p valor (p value) es la probabilidad de que dos valores sean iguales habiendo hecho un
análisis estadístico cualquiera. Permite rechazar o aceptar las hipótesis. Por ejemplo en
una prueba de Normalidad (Normality test) si el p valor es menor que 0.05 significa que
no sigue una distribución normal (se compara la distribución normal con la variable). Si
en una comparación de dos tratamientos (prueba de hipótesis con ANOVA, Mann
Wittney, Kruskal Wallis o cualquier otro test) el p valor es menor de 0.05 significa que los
tratamientos son diferentes (se comparan ambos tratamientos).
Otro de los efectos de la deforestación sobre las especies vegetales es el cambio de las
condiciones ambientales donde estas viven, y la consecuente expresión de estos cambios
en los caracteres morfológicos.
Con la finalidad de estudiar la variabilidad morfológica de los adultos, fueron medidos los
caracteres morfológicos de 60 adultos (30 en pastizales y 30 en zonas de bosque a las
cuales se les midió dentro de los caracteres el número de hojas y largo de la hoja). Usted
cuenta con parte de la base de datos de las palmeras medidas (EJ2 Astrocaryum) y se le
pide responder:
Por inspección del gráfico, se puede apreciar que no hay relación alguna entre las
variables. Para cerciorarse de ello es importante hacer un test de correlación. Para ello
siga la ruta Statistics>Correlation table. La Tabla de Correlación le permitirá tener los
resultados del análisis de correlación (valor bajo la curva) acompañados de un valor p
(valor sobre la diagonal) para cada análisis (Figura 12).
Asimismo, puede usted realizar una regresión lineal y obtener el coeficiente de regresión
(R2=r^2), la pendiente (slope a) y la constante de la curva (interc b) (figura 13).
Los análisis de correlación te indican si hay una correlación entre dos variables. Cuando
los valores son negativos, significa que la relación es inversamente proporcional. Cuando
los valores son positivos indica que la relación es directamente proporcional. Siempre
verificar el p valor (si p valor < 0.05 hay una correlación estadísticamente significativa, si
no se verifica, no hay correlación).
Los tillandsiales (formaciones vegetales dominadas por plantas de género Tillandsia) son
ecosistemas permanentes que se encuentran en la costa peruana y chilena. Los
tillandsiales son ecosistemas que se encuentran afectados en nuestra costa principalmente
por contaminación con basura, su uso para deportes de aventura y la construcción de
carreteras, tal y como se ha observado en el área de estudio. El uso de estos ecosistemas
para deportes de aventura ha sido también reportado para algunas localidades de Chile
donde se indica de el grave peligro que corren estos ecosistemas debido a estas
actividades (Pinto et al. 2006). Con el objetivo de estudiar la densidad y distribución
espacial de Tillandsia latifolia en el Cerro Piedra Campana (Lima, Perú) y su relación con
la topografía y el sustrato, fueron realizadas 72 parcelas cuadrangulares de 100 m2
cuantificando la cobertura (ubicadas sistemáticamente en toda el área de estudio). Usted
cuenta con esos datos (Ej3 Tillandsia). Responda las siguientes preguntas:
PAST automáticamente realiza las pruebas Post Hoc cuando la variable tiene más de tres
formas. Cuando se aplica un estadístico paramétrico (Anova) realiza el análisis de Tukey.
Cuando la prueba es no paramétrica aplica la U de Mann Whitney (Figura 14). Las
diferencias entre los grupos son arrojadas como p-valores sobre la diagonal.
Las pruebas Post-Hoc son pruebas que permiten (una vez realizada la prueba de hipótesis
inicial) revisar entre cuál de las formas de las variables (tratamientos, zonas, en nuestro
caso orientación) existe diferencias significativas. Ello nos permite inclusive formar
grupos, los mismos que se representan usualmente con una letra como subíndice (a por
ejemplo). Los valores p en las pruebas post Hoc reciben la misma interpretación que los
valores p para las pruebas de hipótesis (cuando es < 0.05 hay diferencias estadísticamente
significativas).
Los estudios de biología nos levan a tomar muchos datos acerca de nuestras estaciones
biológicas, entre ellos, parámetros abióticos (temperatura, humedad, profundidad, entre
otros). Muchas veces estos datos son tomados en el tiempo y se tiene una progresión
temporal en la cual resulta difícil discernir la característica más importante en un
determinado momento. Entender qué parámetro es el que determina las características de
mi estación biológica en determinada fecha es fundamental para tener una idea del
componente abiótico más importante en un determinado momento y poder relacionarlo a
las características de los componentes bióticos.
El ACP permite reconocer el parámetro que caracterizó una estación en una progresión de
tiempo. Utilice los datos del ejemplo 4 para realizar un análisis de componentes
principales Siga la ruta Multivar>Principal Components. Probablemente tenga que
convertir los datos para que estén en una misma escala (la conversión a logaritmo es una
buena opción, pero los ceros no serán reconocidos por el programa).
Basado en Aponte & Ramírez (2011): Los Humedales de La Costa central del Perú:
Comunidades Vegetales y Conservación. Rev. Ecol. Apl. 10(1): 31–39.
Los humedales de Lima son parte de un corredor biológico a lo largo de la costa desértica
del Perú. La mayor parte de estos ambientes coexiste con poblaciones humanas, quienes
hacen uso de los recursos que los humedales les proporcionan, por ejemplo
Schoenoplectus americanus (Pers.) Volkart ex Schinz & R. Kéller (conocido como
« junco ») es utilizado para la fabricación de productos artesanales (León et al. 1998).
Otras actividades en estos ecosistemas son la pesca artesanal y la crianza de ganado
vacuno y ovino. En ese sentido, la relación hombre-naturaleza tiene un lado productivo
positivo. Sin embargo, esta relación también presenta un aspecto negativo, la extracción
del junco en algunos humedales genera desechos que promueven la presencia de plagas
(por ejemplo, la polilla y la quereza del junco) las cuales dañan diversas especies nativas
(Aponte 2009). Otros humedales reciben aguas servidas y desechos orgánicos de
poblaciones humanas aledañas, afectando la calidad del agua en estos ambientes (Young
1998). Asimismo, la ganadería es una actividad frecuente en los humedales costeros y que
puede afectar la estructura de las comunidades vegetales. Usted cuenta con datos de dos
Análisis de correspondencia
Figura 17. Ejemplo de Análisis de Correspondencia para Los Humedales de Santa Rosa
IMPORTANTE: Recuerde que para hacer este tipo de análisis las muestras (parcelas)
deberán estar en las filas; de no estarlo las puede transponer directamente en el PAST
siguiendo la ruta Edit > Transpose.
Entendemos por diversidad al conjunto de especies, sus genes y los hábitats donde viven
estas especies. Dado que esto es prácticamente inmedible se utilizan los datos disponibles
para tratar de comprender mejor la diversidad biológica que hay en un determinado lugar.
Una de las formas de abordarlo es a partir de la cuantificación de índices de diversidad
alfa. La diversidad alfa se concentra en medir la riqueza, abundancia y equitabilidad de las
especies en un determinado lugar; en consecuencia, los índices de diversidad alfa medirán
estos parámetros. Para ello, estos índices se basan en la teoría de las probabilidades.
Veamos un ejemplo. Imaginemos que tenemos tres bolsas con canicas de diferentes
colores (A, B y C en la figura 19). Es posible apreciar que, si yo metiera mi mano a la
bolsa A y sacara una canica al azar, podría salir cualquiera de los colores (existe
equitabilidad, la misma abundancia de cada color).
Utilice los datos de diversidad total en cada tipo de zona (crioturbado o hábitat asociado)
para obtener los índices de diversidad para cada zona. Puede hacerlo también Por cada
parcela por separado y obtener un promedio. La ruta es Diversity>Diversity índices.
Obtendrá una tabla con todos los índices para cada parcela o para el total según el análisis
que haga usted (Figura 20). Para hacer el análisis simultáneamente entre dos columnas
debe tener todas las casillas llenas (las puede rellenar con ceros).
Figura 21. Perfiles de diversidad para las parcelas evaluadas en Suelos Crioturbados y
Asociados.
Otra forma de hacer esta comparación es haciendo un Test-T de diversidad con el índice
de Shanon-Wienner. Se puede realizar fácilemente con la opción Diversity T-Test 8Figura
23).
Figura 24. Ejemplo de análisis SHE con los datos de las parcelas hechas en suelos
crioturbados.
PAST también calcula la riqueza por parcela a partir de datos de presencia/ausencia (0/1)
en una localidad. Para ello deberá transformar los datos de crioturbado (o asociado) a
presencia/ausencia (Transform>Abundance to presence/absence) y aplicar el análisis de
Quadrat Richness (Figura 25).
Los índices de diversidad Beta, a diferencia de los alfa, se encargan de medir el recambio
de especies. Dicho de otra manera, estos índices medirán cuantas especies se ganan y
cuantas se pierden por cada parcela realizada en una localidad (o tipo de ecosistema). Este
recambio será mayor en zonas con mayor diversidad. A mayor recambio, mayor será la
diversidad beta.
PAST calcula 8 índices de diversidad Beta y los muestra en una tabla. Para ello es
necesario una matriz con datos de presencia y ausencia. Luego siga la ruta Diversity>Beta
Diversity (figura 26). Es posible pedirle al PAST que haga comparaciones por pares
seleccionando el índice que se desea (lado superior derecho de la pantalla emergente).
Usar los índices de diversidad es muy sencillo (los cálculos se obtienen de inmediato con
PAST), pero, al mismo tiempo, tiene sus límites. No es necesario depender de los índices
de diversidad para hacer los análisis de diversidad. Por ejemplo, intente comparar la
riqueza entre suelos crioturbados y hábitat asociados: ¿Hubiera tenido el mismo
resultado? ¿Se hubiera discutido de la misma forma?
El uso de los índices de diversidad está ampliamente difundido aunque muchas veces
pocos entienden los resultados, o inclusive lo calculan de diferente manera (por ejemplo,
el logaritmo no siempre usa la misma base en cada paquete estadístico); por ello es muy
importante comprender no solo el valor, sino ir más allá y averiguar el algoritmo utilizado
para el cálculo.
Aún así los índices de diversidad son muy útiles, pero deben ser considerados como
relativos para la toma de decisiones de conservación y deben evaluarse de la mano con
datos de importancia ecosistémica de las especies o, inclusive, listado de especies
endémicas o invasoras.
Curvas de Rarefacción
Las curvas de rarefacción tienen diferentes usos. Uno de ellos es comparar la diversidad
en dos muestras de diferente tamaño. Las curvas de rarefacción permiten analizar el
número mínimo de parcelas que se deben realizar para poder hacer un muestreo
suficientemente exhaustivo (por ejemplo en un monitoreo constante. Hay dos clases de
curvas:
Permite medir el número de individuos que debo muestrear como mínimo para monitorear
toda la diversidad. Para preparar esta curva se requieren datos de abundancia total. La ruta
es Diversity>Individual Rarefaction (figura 27).
Esta curva permite calcular el número mínimo de parcelas que se deben realizar para
muestrear la diversidad total de una localidad. Para ello se necesitan datos de presencia y
ausencia en una localidad. Luego seguir la ruta Diversity>Sample Rarefaction (Figura
28). Inclusive los datos obtenidos para la curva de rarefacción pueden modelarse
siguiendo el modelo de Mikaelis-Menten.
Existen múltiples índices de similaridad que permiten construir dendogramas entre los
puntos muestreados en una misma localidad. Para ello se requieren de datos de presencia
y ausencia (0/1). Siga la ruta Multivar>Cluster Analysis (figura 29). Recuerde que para
realizar este análisis las parcelas deben estar ubicadas en el lado de las filas, no en las
columnas (puede usar el comando edit>transpose).
Figura 29. Dendrogramas de Similaridad entre las parcelas muestreadas en los suelos
crioturbados con el índice de Jaccard.
Las especies crípticas (también denominadas especies gemelas) son especies muy
semejantes a nivel morfológico y fisiológico, pero que están separadas por barreras
reproductivas(Mayr 1996). Un análisis exhaustivo de los anfibios de la Reserva Nacional
de Pacaya Samiria (Loreto) permitió la colecta de una muestra (muestra X) que pertenece
a un grupo de anfibios crípticos. Dentro de este grupo la especie S corresponde a un grupo
Figura 30. Cladograma obtenido con los datos de las muestras de las especies S, E y X