Tesis RGM

UNIVERSIDAD COMPLUTENSE DE MADRID FACULTAD DE CIENCIAS BIOLGICAS DEPARTAMENTO DE BIOLOGA VEGETAL I
MODELOS PREDICTIVOS DE RIQUEZA DE DIVERSIDAD VEGETAL. COMPARACIN Y OPTIMIZACIN DE MTODOS DE MODELADO ECOLGICO.
MEMORIA DE TESIS DOCTORAL
PRESENTADA POR:
MANUEL RUBN GARCA MATEO
V. B DIRECTOR: Dr. JESS MUOZ FUENTE V. B CODIRECTOR: Dr. NGEL MANUEL FELICSIMO PREZ
MADRID 2008
UNIVERSIDAD COMPLUTENSE DE MADRID FACULTAD DE CIENCIAS BIOLGICAS DEPARTAMENTO DE BIOLOGA VEGETAL I
MODELOS PREDICTIVOS DE RIQUEZA DE DIVERSIDAD VEGETAL. COMPARACIN Y OPTIMIZACIN DE MTODOS DE MODELADO ECOLGICO
Memoria para optar al grado de DOCTOR en CIENCIAS (Seccin Biolgicas) que presenta el Licenciado: MANUEL RUBN GARCA MATEO Este trabajo ha sido dirigido por JESS MUOZ FUENTE (Real Jardn Botnico, CSIC). NGEL MANUEL FELICSIMO PREZ (Universidad de Extremadura).
MADRID 2008
Don Jess Muoz Fuente, Doctor en Biologa y Cientfico Titular del Real Jardn Botnico (CSIC) y Don ngel Felicsimo Prez, Doctor en Biologa y Profesor de la Universidad de Extremadura, informan de que:
La memoria titulada Modelos predictivos de riqueza de diversidad vegetal. Comparacin y optimizacin de mtodos de modelado ecolgico, que presenta Manuel Rubn Garca Mateo, Licenciado en Biologa, para optar al grado de Doctor, ha sido realizada en el Real Jardn Botnico (CSIC) bajo nuestra direccin, reuniendo todas las condiciones exigidas a los trabajos de tesis doctoral.
Madrid, 2 de septiembre de 2008
Fdo. Jess Muoz Fuente
Fdo. ngel Manuel Felicsimo Prez
A mis padres
If we knew what it was we were doing, it would not be called research, would it? Albert Einstein (1879 - 1955)
NDICE
NDICE
AGRADECIMIENTOS ...................................................................................... 15 ABREVIATURAS ............................................................................................. 17 APLICACIONES INFORMTICAS INTRODUCCIN GENERAL
...................................................................... 19
............................................................................. 21
1.1. El problema a investigar ................................................................... 23 1.2. Biogeografa y biodiversidad ............................................................. 25 1.3. El rea de estudio ............................................................................ 27 1.4. Sistemas de Informacin Geogrfica (SIG)........................................... 30 1.5. Modelado ecolgico .......................................................................... 31 1.5.1. Tipos de datos utilizados en modelado ecolgico ........................ 32 Variable dependiente .............................................................. 32 Variables independientes......................................................... 34 1.5.2. Modelos de distribucin de especies ......................................... 36 Algoritmos genticos ............................................................. 45 Distancia mtrica de Gower .................................................... 46 Envuelta medioambiental ....................................................... 48 Mxima entropa ................................................................... 48 Regresin logstica mltiple .................................................... 50 rboles de clasificacin y regresin .......................................... 51 MARS .................................................................................. 52 MARS-Multirrespuesta ............................................................ 54 1.5.3. Evaluacin y comparacin de mtodos ..................................... 54 Curva ROC ........................................................................... 57 1.6. Objetivos y estructura de la tesis ....................................................... 58
11
Modelos predictivos de riqueza de diversidad vegetal
PRIMERA PARTE: estudiando los efectos del tamao de muestra en los

modelos de distribucin de especies (MDE) ........................................... 61
2.1. Resumen ....................................................................................... 63 2.2. Introduccin ................................................................................... 64 2.3. Material y mtodos .......................................................................... 66 2.3.1. Variables dependientes .......................................................... 66 Datos con elevado nmero de presencias, ausencias
verdaderas y prevalencia desequilibrada ................................. 66 Datos con pocas presencias, sin datos de ausencias y prevalencia equilibrada.......................................................... 68 2.3.2. Variables independientes ....................................................... 69 2.3.3. Mtodo de modelado ecolgico ................................................ 69 2.3.3. Comparacin entre MDE ......................................................... 70 2.4. Resultados ..................................................................................... 70 2.5. Discusin ....................................................................................... 74
SEGUNDA PARTE: generando pseudo-ausencias y ausencias de grupo

fiables. Comparacin de tcnicas descriptivas y discriminantes ............ 81
3.1. Resumen ....................................................................................... 83 3.2. Introduccin ................................................................................... 84 3.3. Material y mtodos .......................................................................... 86 3.3.1. rea de estudio .................................................................... 86 3.3.2. Variable dependiente ............................................................. 87 3.3.3. Variables independientes ....................................................... 88 3.3.4. Mtodos de modelado ecolgico .............................................. 88 Tcnicas discriminantes .......................................................... 88 Tcnicas descriptivas .............................................................. 89 Tcnicas mixtas .................................................................... 89 3.3.5. Validacin de mtodos ........................................................... 89
12
NDICE
3.3.6. Diseo experimental .............................................................. 89 3.4. Resultados ..................................................................................... 92 3.4.1. Comparacin de los resultados de mtodos y tcnicas ................ 92 3.4.2. Comparacin entre ausencias de grupo y pseudo-ausencias ........ 95 3.4. Discusin ....................................................................................... 95 3.4.1. Comparacin de los resultados de mtodos y tcnicas ......................... 95 3.4.2. Comparacin entre ausencias de grupo y pseudo-ausencias .................. 95 3.4.3. Delimitacin de reas tampn al generar pseudo-ausencias al azar ............................................................................................. 98 3.4.4. Comparacin de los resultados entre especies ........................... 98 3.4.4. Conclusiones ........................................................................ 99
TERCERA PARTE: modelando patrones de diversidad. Comparacin de

diferentes mtodos, estrategias, aproximaciones y corrientes ............ 101
4.1. Resumen ..................................................................................... 103 4.2. Introduccin ................................................................................. 104 4.2.1. rea de estudio .................................................................. 104 4.2.2. Diseo de Espacios Naturales Protegidos (ENP) ...................... 104 4.2.3. La utilizacin de datos de herbario ......................................... 105 4.2.4. Opciones y mtodos de modelado ecolgico ............................ 105 4.2.5. Objetivos ........................................................................... 107 4.3. Material y mtodos ........................................................................ 107 4.3.1. rea de estudio .................................................................. 107 4.3.2. Variable dependiente ........................................................... 107 4.3.3. Variables independientes ..................................................... 108 4.3.4. Mtodos de modelado ecolgico a nivel de especie ................... 108 4.3.5. Opciones de modelado ecolgico a nivel de comunidad ............. 109 Estrategias ......................................................................... 109 Aproximaciones y corrientes ................................................. 110
13
4.3.6. Mapas de riqueza especfica (diversidad ) potencial ................ 111 4.3.7. Patrones altitudinales de biodiversidad ................................... 112 4.4. Resultados ................................................................................... 113 4.4.1. Evaluacin de la consistencia de los MDE a nivel de especie ...... 113 4.4.2. Correlacin a nivel de comunidad .......................................... 116 4.4.3. Patrones altitudinales de biodiversidad ................................... 117 4.5. Discusin ..................................................................................... 121 4.5.1. Evaluacin de la consistencia de los MDE a nivel de especie ...... 121 4.5.2. Correlacin a nivel de comunidad .......................................... 123 4.5.3. Patrones altitudinales de biodiversidad ................................... 123 4.5.4. Principales conclusiones aplicables al modelado ecolgico ......... 127 4.5.5. Principales conclusiones para la conservacin en Ecuador ......... 128 4.6. Anexos ........................................................................................ 131 4.6.1. Anexo I: Tabla de resultados de AUC ..................................... 131 4.6.2. Anexo II: Flujo de trabajo .................................................... 139
RESUMEN Y CONCLUSIONES FINALES ........................................................... APNDICE .................................................................................................. REFERENCIAS BIBLIOGRFICAS
157 165
.................................................................... 169
14
AGRADECIMIETOS
AGRADECIMIENTOS
Quiero expresar mi ms profundo agradecimiento a todos los que han contribuido de alguna manera en la consecucin de este trabajo. A la Fundacin BBVA, cuyo patrocinio econmico ha hecho posible la realizacin de la presente tesis doctoral. A los doctores Jess Muoz y ngel M. Felicsimo por dirigir este trabajo de investigacin y por la confianza que depositaron en m, a la que espero haber respondido. Me ensearon bastante sobre los SIG, especialmente en la programacin y automatizacin de procesos. A las personas que me recibieron con los brazos abiertos en el Missouri Botanical Garden (Ivn Jimnez, Mary Merello, Olga Marta Montiel, T. Patricia Feria, Trisha Consiglio, Sandra Arango, etc.); y por supuesto en Ecuador: Universidad Central del Ecuador (Ivn Morillo, Lorena), CLIRSEN, Herbario Nacional (Carlos Morales, Edison, David Neill, etc.), Fundacin Jatun Sacha, etc. Tener la oportunidad de viajar a estos lugares ha sido toda una experiencia personal por la que me considero afortunado, sobre todo por conocer a estas personas, que incluso pusieron a nuestra disposicin sus hogares. Al Dr. Antoine Guisan (Universidad de Lausanne) por el inters y la confianza mostrados hacia m. Al Dr. Miguel B. Arajo (Museo Nacional de Ciencias Naturales, CSIC) por atenderme tan amablemente y por el inters mostrado por mi trabajo. A la Dra. Jane Elith (Universidad de Melbourne) que tan amablemente nos cedi las sintaxis para poder ejecutar MARS-Multiresponse. A los Drs. Federico Fernndez y Jos Manuel Moreno (Universidad de Castilla-La Mancha) por la confianza depositada en m. A la Dra. T. Patricia Feria (Universidad Panamericana de Texas) por su apoyo y participacin en diferentes colaboraciones. A los Drs. Barbara Mackinder (Kew Royal Botanical Garden) y Jan Wieringa (Universidad de Wageningen) por el inters mostrado por mi trabajo y la participacin en diversas colaboraciones. Al Dr. Mario Sanz Elorza por las colaboraciones en las que permiti participar. Al Dr. Santiago Pajarn (Universidad Complutense de Madrid) por el apoyo mostrado en todo momento. Me gustara hacer una mencin especial a tanta gente sin cuyas contribuciones esta tesis no hubiera sido posible. Especialmente a los recolectores de todas las colecciones empleadas en el presente estudio, pero tambin a los especialistas y taxnomos que las identificaron y clasificaron. Sin el arduo y laborioso trabajo de
15
ambos (colectores y taxnomos) la realizacin de esta tesis no hubiera sido posible. A todos los desarrolladores de las tcnicas y el software empleado, por el gran trabajo que llevan a cabo. Especialmente a mis padres y a mi hermana, por el apoyo que he tenido en ellos. A mis compaeros del Real Jardn Botnico por su inestimable ayuda. A todos ellos les agradezco su apoyo, simpata y compaerismo, especialmente a Manuel de la Estrella. Y aquellos que soportaron escucharme y supieron aconsejarme en los momentos ms difciles: Alberto, Alejandro, Alicia, Andrea, Beatriz lvarez, Beatriz Guzmn, Elena, Emilio, Gema, Ins, Juan, Katia, Manuel Maca, Mara Romeralo, Rafa, Tania y, cmo no, Mara. A mis nuevos compaeros de la Universidad de Castilla-La Mancha, que me han recibido con una gran simpata y compaerismo: ngel, Antonio, Amparo, Blanca, Carlos, Celia, Dani, David, Gonzalo, Ivn, Mara, etc. Especialmente a Csar e Itziar que revisaron detenidamente este trabajo. A todas las personas que he tenido la oportunidad de conocer en congresos, cursos, conferencias, etc., que convirtieron en algo mucho ms ameno y divertido estas actividades. Me hicieron pasar muy buenos momentos que guardar con un buen recuerdo. A todos mis amigos, cuya lista afortunadamente sera interminable (bilogos y no bilogos, sevillanos, ecuatorianos, madrileos, garciotuneros, bayoleros, toledanos, serranos, talaveranos, compaeros de viajes en el AVE, etc.). Muy especialmente a aqullos que supieron soportarme en los malos momentos y darme su apoyo: Beatriz, Carol, Cristina, David, Elena, Fabio, Fernando, Gema, Hctor, Manuel, Mara, Mario, Meme, Nacho, Raquel, Salud, Susana, Sandra, Tere, etctera. A todos los compositores y msicos, que sin saberlo, me hicieron ms amenas las interminables horas de trabajo. Casi cinco aos de trabajo suponen una extensa lista de gracias, espero que los que no estn reflejados aqu sepan perdonar mi olvido.
16
ABREVIATURAS
ABREVIATURAS
A continuacin presentamos un listado de las abreviaturas empleadas en esta tesis, su definicin y explicacin aparecen en el texto. ABREVIATURAS AG AML AUC CART CHN DMG ENP GAM GARP GIS GLM IPCC MARS MAXENT MDE NDVI P/A PA PS-A RLM ROC SIG TDES TDIS WGS84 SIGNIFICADO ausencia de grupo arc macro language area under the ROC curve classification and regression trees colecciones de historia natural distancia mtrica de gower espacio natural protegido generalised additive models genetic algorithm for rule set production geographical information systems generalised linear models Intergovernmental Panel on Climate Change multivariate adaptive regression splines maximum entropy modelo de distribucin de especies normalized difference vegetation index mapas de presencia/ausencia pseudo-ausencia regresin logstica mltiple receiver operating characteristic sistemas de informacin geogrfica tcnicas descriptivas tcnicas discriminantes world geodetic system 1984
17
APLICACIONES INFORMTICAS
APLICACIONES INFORMTICAS
A continuacin presentamos un listado de las diferentes aplicaciones informticas y su versin empleadas en el desarrollo de modelos de distribucin de especies.
SOFTWARE ArcCatalog ArcInfo ArcMap ArcView CART Desktop Garp Diva-GIS MARS
VERSIN 9.1 9.1 9.1 3.2 5.0
INFORMACIN SIG con licencia educativa (http://www.esri.com/) SIG con licencia educativa (http://www.esri.com/) SIG con licencia educativa (http://www.esri.com/) SIG con licencia educativa (http://www.esri.com/) Classification and regression trees (http://www.salford-systems.com/) Modelizador libre (http://www.nhm.ku.edu/desktopgarp/) SIG libre (http://www.esri.com/) multivariate adaptive regression splines (http://www.salford-systems.com/) Modelizardor libre
(http://homepages.inf.ed.ac.uk/s0450736/maxent.html)
1.1.6 5.2 2.0
MAXENT R Simtest
2.1 2.4.1
Entorno de programacin libre (http://www.r-project.org/) Programa de estadstica de libre difusin

(http://www.wsl.ch/staff/niklaus.zimmermann/programs/progs/simtest.f90)
SPSS
13.0
Programa de anlisis estadstico (http://www.spss.com/es/)
19
INTRODUCCIN GENERAL
INTRODUCCIN
1. Introduccin general
Esta tesis trata sobre el empleo de los modelos de distribucin de especies (MDE) en la investigacin de patrones de diversidad vegetal y su aplicacin en el diseo de zonas protegidas para la conservacin del medio natural. Para abordar este trabajo hemos querido basarnos en la enorme cantidad de datos almacenados en los herbarios y sus bases de datos asociadas. Tambin se busca una optimizacin de los distintos mtodos y opciones de modelado ecolgico con el objetivo de conseguir resultados fiables y aplicables a problemas concretos. Esta introduccin no pretende ser una revisin exhaustiva, sino que su objetivo es presentar la informacin necesaria para comprender el desarrollo de esta Tesis Doctoral. Nos hemos basado en los estudios de revisin ms importantes publicados hasta la fecha (Guisan & Zimmermann, 2000; Lobo, 2000; Elith, 2002; Guisan & Thuiller, 2005; Arajo & Guisan, 2006) y que pueden ser consultados para ampliar la informacin. Tambin se presentan los datos y la metodologa empleados.
1.1. El problema a investigar

El hombre ha ejercido una presin y perturbacin sobre el medio desde tiempos remotos. En la actualidad las actividades humanas estn provocado uno de los conflictos ambientales ms graves a los que ha tenido que enfrentarse la humanidad (Hoekstra et al., 2005; Loreau et al., 2006). La extincin de especies es un proceso natural. Sin embargo, en las ltimas dcadas hemos elevado la velocidad de desaparicin de especies de una forma exponencial. En toda la historia planetaria tan slo se han producido cinco procesos de prdida de biodiversidad tan rpidos como el actual, el ltimo de los cuales fue la desaparicin de los dinosaurios (Chapin et al., 2000), por lo que este proceso actual de perdida de especies ha sido denominado la sexta extincin (Leakey & Lewin, 1996). Este proceso puede significar la desaparicin de la mitad de especies que existen en la Tierra a finales de este siglo (Pimm et al., 1995; Jenkins, 2003). Se trata de un problema de mxima importancia al que tenemos que enfrentarnos y buscar soluciones. El procedimiento ms adecuado parece ser la creacin de espacios protegidos donde se asegure la persistencia de esta biodiversidad. Aunque por s solas estas reservas no son adecuadas para la conservacin de la naturaleza, s que deben ser el eje principal sobre el que giren las estrategias de conservacin regionales (Margules & Pressey, 2000). Estas reservas deben representar la biodiversidad a nivel regional y asegurar su permanencia (Margules & Pressey, 2000). Sin embargo, como veremos posteriormente, el
23
concepto de biodiversidad es muy complejo, y la comunidad cientfica slo posee una vaga idea sobre los patrones de diversidad biolgica y los factores que influyen en su conservacin (Lobo, 2000; Sarkar & Margules, 2002). Parece ineludible que una buena red de espacios naturales protegidos debe estar basada en el conocimiento de los patrones espaciales de diversidad biolgica, y para solventar esta falta de conocimiento se emplean varias aproximaciones o abstracciones de la realidad: cartografas de tipos de vegetacin, sustratos geolgicos, datos climticos, imgenes de satlite, criterio de expertos, etc. (Ferrier, 2002; Sarkar & Margules, 2002). En los ltimos aos, con el desarrollo de potentes tcnicas estadsticas y los sistemas de informacin geogrfica (SIG), ha progresado rpidamente una nueva herramienta: los modelos de distribucin de especies (MDE) (Guisan & Zimmermann, 2000). Como veremos de forma ms detallada posteriormente, son modelos no subjetivos que predicen lo adecuada que es un rea para el desarrollo de una determinada especie en relacin con las condiciones ambientales (p. ej. clima, suelo, topografa, etc.). Estos modelos se han convertido en una herramienta muy potente y cada vez estn ms presentes en la bibliografa cientfica, siendo una de sus principales aplicaciones los trabajos relacionados con los patrones de biodiversidad y la biologa de la conservacin. Los MDE son una herramienta en pleno desarrollo y expansin; continuamente surgen nuevos mtodos, estrategias, aproximaciones, corrientes, etc., tanto a nivel especfico (Elith et al., 2006), como a nivel de comunidad (Wilson et al., 2005; Ferrier & Guisan, 2006). Todas estas opciones necesitan una evaluacin objetiva que compruebe si sus resultados son lo suficientemente fiables para su aplicacin en el mundo real. Uno de los objetivos de esta tesis es comparar y optimizar una gran variedad de opciones a la hora de realizar MDE fiables y aplicarlos a la investigacin de los patrones de biodiversidad y biologa de la conservacin. Sin duda, el otro gran problema que afecta a la conservacin de la biodiversidad, en la actualidad, es el efecto del cambio climtico. Este proceso supone una variacin del clima global, que puede deberse a procesos intrnsecos (por ejemplo grandes erupciones volcnicas), externos (por ejemplo variaciones en la radiacin solar), y ms recientemente la actividad humana. En la actualidad, la comunidad cientfica no duda de la existencia de un cambio en los patrones climticos del planeta, debido en gran parte a la actividad humana. En las conclusiones presentadas por el Panel Intergubernamental sobre el Cambio Climtico (IPCC, Intergovernmental Panel on Climate Change) en su cuarto informe (noviembre, 2007), se ofrecen datos clarificadores sobre las emisiones globales de gases de efecto invernadero y su relacin con el calentamiento global del planeta. Desde
24
INTRODUCCIN
pocas pre-industriales hasta la actualidad se ha registrado un aumento superior al 70% en la emisin de estos gases (1970-2000), lo que muy probablemente ha provocado el aumento global de temperatura observado en los ltimos aos: en once de los ltimos doce aos se han registrado los valores ms elevados de temperaturas medias de los que se tiene constancia desde 1850. Uno de los efectos ms inmediatos de este cambio son los desajustes en los sistemas biolgicos (Walther et al., 2002): desincronizacin entre los ciclos de especies relacionadas; cambios en las rutas y pocas en las migraciones; cambios drsticos en las condiciones ambientales, tan rpidos que no permiten la adaptacin de las especies a esta nueva situacin, o la migracin a zonas que presenten condiciones ms favorables para su desarrollo, etc. Todos estos procesos pueden llegar a suponer una enorme prdida en la biodiversidad global (Parmesan & Yohe, 2003; Thomas et al., 2004; Arajo & Rahbek, 2006). Es necesario una gestin de este cambio, evaluar sus efectos en la biodiversidad y un plan para estabilizar las emisiones de carbono que estn influyendo en este proceso (Pacala & Socolow, 2004). Esta tesis est integrada dentro de un amplio proyecto de investigacin titulado: Evolucin de las zonas de alta biodiversidad y endemicidad en Ecuador bajo un escenario de cambio global. Este proyecto considera los efectos del calentamiento global sobre los patrones de biodiversidad. El objetivo principal de este proyecto es la comparacin de zonas de mxima diversidad en la actualidad y en un escenario de cambio climtico en el ao 2080, de la cual surgirn diferentes tipos de actuacin y proteccin de la biodiversidad. Con este objetivo los mapas de diversidad potencial obtenidos en este trabajo para la actualidad sern comparados con modelos futuros (escenario de cambio climtico) y de esta forma definir las zonas de cambio y estabilidad en cuanto a la biodiversidad, datos que sern muy tiles para generar una nueva propuesta de Espacios Naturales Protegidos en Ecuador. Los modelos obtenidos en este trabajo, derivados de variables bioclimticas, tambin sern comparados con modelos obtenidos mediante la combinacin de dos tipos variables independientes: bioclimticas e imgenes de satlite, en particular el ndice de Vegetacin Normalizado (NDVI).
1.2. Biogeografa y biodiversidad

Dos conceptos importantes a lo hora de desarrollar este trabajo, en los que queremos hacer especial hincapi, son el de biogeografa y el de biodiversidad.
25
La biogeografa es la ciencia que describe la distribucin de los organismos en el espacio y el tiempo y estudia los factores de los que depende. Uno de los objetivos de esta disciplina es el estudio de las reas potenciales para el desarrollo de especies, dentro del cual se encuadra esta tesis. Esta dimensin de la biogeografa tiene un inters intrnseco, pero adems tiene un inters aplicado en la gestin de espacios naturales y la conservacin de la biodiversidad, entre otros muchos, como veremos posteriormente. La biogeografa es una herramienta indispensable a la hora explicar la distribucin espacial de la biodiversidad. Esta disciplina aborda el estudio de cmo las especies han respondido a los diferentes cambios en las condiciones ambientales a lo largo de la historia geolgica del planeta (estado de no-equilibrio). Una de estas respuestas es la adaptacin espacial (Lobo, 2000), que consiste en el desplazamiento hacia lugares donde las condiciones ambientales son ms favorables. Esta respuesta es ms frecuente en especies que presentan una tasa de evolucin poco flexible. Como veremos posteriormente, este concepto nos ser til a lo hora de interpretar los modelos de distribucin de especies. Debemos considerar estos modelos como una primera aproximacin, una instantnea de la vida evolutiva de una especie. Cuando hablamos de biodiversidad no podemos referirnos exclusivamente al nmero de especies que habitan un rea determinada (riqueza de especies). Se trata de un concepto ms amplio que engloba otras caractersticas como la abundancia relativa de cada una de ellas. Las especies en general se distribuyen segn jerarquas de abundancia, desde muy abundantes hasta raras. Cuanto mayor es el grado de dominancia de unas y rareza de otras, menor es la biodiversidad de la comunidad. La biodiversidad tambin depende del grado de relaciones que se establecen entre todas las especies y de stas con el biotopo. La biodiversidad se muestra como heterogeneidad a otros niveles: gentico (variabilidad gentica de cada una de las especies), geogrfico (variabilidad de ecosistemas que existen en un determinado rea) y dentro de cada ecosistema (variabilidad espacial y temporal de la riqueza). El trmino biodiversidad surgi en 1985 como una contraccin de biological diversity, e inmediatamente adquiri relevancia: al ao siguiente se emple en un simposio, y en 1988 se public un libro titulado BioDiversity (Wilson, 1988), que le dio popularidad. Desde entonces se han dado multitud de definiciones para este concepto. La definicin aportada por Solbrig (1991) nos parece la ms apropiada en el contexto de este trabajo: propiedad de las distintas entidades vivas de ser variadas. Cada nivel de organizacin biolgico (gen, clula, individuo, comunidad o ecosistema) tiene ms de una manifestacin, siendo la diversidad una caracterstica
26
INTRODUCCIN
fundamental de todos los sistemas biolgicos, que tambin incluye la diversidad de las interacciones y procesos vivos que acontecen en cada uno de estos niveles (Sarkar & Margules, 2002). Por lo tanto, podemos decir que hay varios niveles de diversidad (Ricklefs & Schluter, 1994). En un primer nivel encontramos la diversidad alfa, o riqueza especfica, que es una funcin de la cantidad de especies presentes en un hbitat determinado. La diversidad beta, o diversidad diferencial, indica la variacin en diversidad en una serie de hbitats, y se estudia normalmente como la variacin encontrada a lo largo de un gradiente. Finalmente, la diversidad gamma, o diversidad regional, cuantifica la heterogeneidad de una regin dada. Existe tambin un componente gentico, o intraespecfico, reflejado mediante la cantidad de alelos diferentes que posee una especie (variabilidad genotpica) y los caracteres que codifiquen en el organismo (variabilidad fenotpica). La diversidad gentica es un componente muy importante de la diversidad; sin variacin gentica la evolucin a travs de la seleccin natural no sera posible. Como vemos la biodiversidad es un concepto muy amplio, imposible de abarcar en todos sus variantes. En este trabajo nos centramos en dos niveles: especie y comunidad (diversidad alfa) (Pereira & Cooper, 2006). Un concepto importante en la conservacin de la biodiversidad son los denominados puntos calientes de biodiversidad (biodiversity hot spots), concepto acuado por Myers (1988). Se trata de aquellos lugares en los que existe una gran cantidad de especies endmicas y un elevado grado de amenaza para su conservacin. En su conjunto representan una superficie inferior al cinco por ciento de la superficie terrestre y sin embargo albergan el 50% aproximadamente de las especies conocidas (Myers et al., 2000). Por tanto, deben representar una prioridad en las polticas de conservacin a nivel global. Dentro de uno de estos puntos calientes para la biodiversidad se encuentra Ecuador. Este trabajo se presenta como una aportacin a los planes estratgicos que se estn llevando a cabo a una escala regional y que en el futuro pueden suponer el establecimiento de una red efectiva de reservas para la conservacin de la biodiversidad (Margules & Pressey, 2000).
1.3. El rea de estudio

El rea de estudio es la Repblica de Ecuador, pas situado en Amrica del Sur, entre las longitudes 75 20 W y 81 W y las latitudes 1 30 N y 5 S, con una extensin aproximada de 283.000 km2. Administrativamente se divide en 22
27
provincias (Fig. 1.1). Geogrfica, ecolgica y climatolgicamente podemos dividir Ecuador en cuatro reas naturales: La regin de la Costa es la zona ms occidental del pas. En general son zonas poco elevadas a excepcin de Cordillera Costera, cuyos picos varan entre los 400-600 m de altitud. Esta rea se ve sometida al efecto de El Nio, que produce alternancias entre pocas secas y fras, y otras hmedas y clidas. La zona andina, en el tercio central del pas, incluye las dos cordilleras paralelas que recorren el pas de Norte a Sur. Hay varios volcanes que superan los 5000 m, el ms alto de los cuales es el Chimborazo (6310 m). La regin amaznica es una penillanura con una orografa complicada de numerosos cerros. En esta zona la lluvia es constante durante prcticamente todo el ao. Las islas Galpagos, que no han sido incluidas en este estudio, conforman un archipilago de origen volcnico situado en el ocano Pacfico, 1.000 kilmetros al Oeste del continente formado por 13 islas principales, 17 islotes y decenas de rocas.
Figura 1.1. Mapa poltico del Ecuador continental.
La seleccin de este pas como zona de estudio se bas en los siguientes criterios: En uno de los pases con ms diversidad de todo el planeta, uno de los puntos calientes (hot spots) de la biodiversidad mundial, en donde de acuerdo con algunos autores se deben priorizar los objetivos para la conservacin para obtener una mayor rentabilidad de los fondos invertidos (Myers et al., 2000). En este pas habitan ms de 2.400 especies de
28
INTRODUCCIN
vertebrados y ms de 16.000 de plantas vasculares (Jrgensen & LenYnez, 1999; Kareiva & Marvier, 2003), algunos autores estiman que pueden existir ms de 20.000 especies de plantas vasculares (Balslev & Renner, 1989), de las que ms de 4.000 son endmicas del pas (Valencia et al., 2000). Se trata del pas con mayor diversidad florstica de todo el mundo en relacin a su tamao (Jrgensen et al., 1992). La elevada biodiversidad que posee este pas se ve seriamente amenazada por un gran nmero de factores (Dodson & Gentry, 1991; Best & Kessler, 1995; Mecham, 2001; Ulloa Ulloa & Jrgensen, 2004). Como, por ejemplo, deforestacin, incendios provocados, explotacin petrolera de la Amazona, presin de la poblacin rural, plantacin de palma africana, instalacin de camaroneras en el golfo de Guayaquil, etc. Es uno de los pases tropicales de los que mejor se conoce su diversidad vegetal. La cantidad de colecciones por unidad de superficie es muy elevada si lo comparamos con otros pases tropicales (Loiselle et al., 2008). Esta enorme cantidad de informacin se debe, en gran parte, al esfuerzo realizado por el Missouri Botanical Garden (St. Louis, EEUU) en este pas, representado en su base de datos TROPICOS (con 228.997 colecciones y 8.096 localidades, lo que representa 0,89 colecciones/km2) (Loiselle et al., 2008). La gran variedad medioambiental y orogrfica convierten a este pas en un lugar ideal para el desarrollo de modelos de distribucin de especies (Skov & Borchsenius, 1997). Se trata de un pas situado en reas tropicales, donde se han llevado a cabo pocos trabajos de esta ndole, la mayor parte de las aplicaciones relacionadas con los MDE se han llevado a cabo en zonas templadas. Adems, en los trpicos se pueden registrar las mayores tasas de prdida de biodiversidad a causa del cambio climtico (Deutsch et al., 2008) y por lo tanto deben ser el principal objeto de estudio. Adems, en reas tropicales es muy complicado conseguir datos sobre la distribucin de especies, y por lo tanto la modelizacin es realmente necesaria y prioritaria. Hasta la fecha, en este pas se han llevado a cabo varios trabajos enfocados hacia el modelado ecolgico (Skov & Borchsenius, 1997; Anderson & Martinez-Meyer, 2004; Vargas et al., 2004; Peralvo et al., 2005; Cuesta-Camacho et al., 2006a; Cuesta-Camacho et al., 2006b; Cuesta-Camacho et al., 2006c; Montenegro Armijos, 2006; Loiselle et al., 2008) pero en ninguno de ellos se trabaja con un nmero tan
29
elevado de especies como en este estudio (397 especies y 17.064 colecciones de herbario).
1.4. Sistemas de Informacin Geogrfica (SIG)

Para un tipo de trabajo como el presente son indispensables los SIG (Sistemas de Informacin Geogrfica) o GIS (Geographical Information Systems) en su acrnimo en ingles. Permiten almacenar, ver, manipular y analizar una gran cantidad de datos georreferenciados de una forma eficaz y rpida. En la enciclopedia libre (http://es.wikipedia.org/wiki/Sig) encontramos la
siguiente definicin para los SIG: una integracin organizada de hardware, software, datos geogrficos y personal, diseado para capturar, almacenar, manipular, analizar y desplegar en todas sus formas la informacin geogrficamente referenciada con el fin de resolver problemas complejos de planificacin y gestin. Tambin puede definirse como un modelo de una parte de la realidad referido a un sistema de coordenadas terrestre y construido para satisfacer unas necesidades concretas de informacin. Los SIG presentan dos formatos diferentes a la hora de representar la informacin: vectorial o rster. El formato rster presenta la informacin en forma de celdas regulares, cada una de las cuales contiene un valor determinado reflejo de la realidad. Se centra en las propiedades del espacio ms que en la precisin de la localizacin. El formato vectorial representa digitalmente una entidad determinada mediante tres tipos diferentes de caractersticas: puntos, lneas o polgonos. En este segundo tipo el inters se centra en la precisin de localizacin de los elementos. En este trabajo se han empleado ambos formatos: el vectorial para las variables dependientes (se trata de los puntos de presencia de la especie, basados en las coordenadas geogrficas) y el rster para las variables independientes (se trata de variables continuas de las que existen valores para todo el rea de estudio). Todos los datos empleados en este trabajo han sido proyectados en WGS84 (World Geodetic System 1984). Se trata de un sistema de coordenadas mundiales, que data de 1984, en la que por ejemplo se basan los sistemas de posicionamiento globales como el GPS. Un concepto esencial, que no debemos olvidar cuando trabajemos con un SIG y datos georreferenciados, son los metadatos. Se trata de una informacin anexa a los datos principales, como por ejemplo su extensin, autores, metodologa, proyeccin, datum, etc. Esta informacin siempre debe estar presente a la hora de
30
INTRODUCCIN
generar cualquier informacin georreferenciada. En este trabajo hemos generado sus correspondientes metadatos para cada uno de los modelos utilizados.
1.5. Modelado ecolgico (Ecological modelling)

Podemos definir el modelado como la generalizacin, mediante simulacin o formulacin matemtica, de una realidad que slo conocemos parcialmente. En los ltimos aos las tcnicas de modelado cada vez se aplican ms en campos diversos de la biologa ecologa, evolucin, biogeografa, biologa de la conservacin, etc., en lo que se conoce como modelado ecolgico (ecological modelling). Como veremos posteriormente, consiste en buscar una relacin estadstica o matemtica entre los datos disponibles sobre la distribucin de una especie y diferentes variables que describen las condiciones ambientales, extrapolando esta relacin al resto del rea de estudio. Por lo tanto, para poder llevar a cabo estos modelos necesitamos datos georreferenciados de la distribucin de la especie que queremos modelizar, variables ambientales que cubran todo el rea de estudio y uno o varios mtodos que establezcan una relacin entre ambos. A continuacin examinaremos las distintas posibilidades que existen para cada uno de ellos y explicaremos detalladamente las seleccionadas para este trabajo. La importancia del clima para explicar la distribucin de animales y plantas se conoce desde hace mucho tiempo (von Humboldt & Bonpland, 1807), la combinacin del clima y otros factores se emplea para explicar la distribucin de la vegetacin en todo el planeta (Salisbury, 1926; Cain, 1944; Good, 1953; Holdridge, 1967; McArthur, 1972; Box, 1981; Walter, 1985; Woodward, 1987; Akin, 1991). El anlisis de estas relaciones es uno los objetivos centrales en ecologa y su cuantificacin es el punto central de los modelos de distribucin de especies (Guisan & Zimmermann, 2000). Antes de continuar, debemos saber que se trata de una herramienta compleja, que requiere integrar nociones de campos muy diversos: biologa (biogeografa, ecologa, botnica, zoologa, etc.), estadstica (inferencia, mtodos, validacin de mtodos, etc.), cartografa (georreferenciacin, proyecciones geogrficas, sistemas de coordenadas, etc.), bases de datos, informtica (manejo de una gran variedad de programas, programacin, etc.), teledeteccin, climatologa, sistemas de informacin geogrfica, etc. Muchas de estas materias o herramientas no estn incluidas en los planes de estudios de muchas universidades (Soberon & Peterson, 2004), a pesar del gran nmero de aplicaciones en el que pueden verse involucradas, lo que dificulta an ms su aprendizaje y puesta en marcha.
31
1.5.1. Tipos de datos utilizados en modelado ecolgico

Variable dependiente (variable respuesta) La variable dependiente en este tipo de anlisis son los datos referentes a la distribucin de especies. Puede incluir slo datos de presencias (Zaniewski et al., 2002; Ottaviani et al., 2004; Olivier & Wotherspoon, 2006; Tsoar et al., 2007), de presencias y ausencias (Manel et al., 2001; Elith et al., 2006; Graham et al., 2008) o datos de abundancia (Guisan et al., 1998; Guisan & Harrell, 2000; Leathwick, 2001; Pearce & Ferrier, 2001; Cawsey et al., 2002). La procedencia de los datos es variada. Lo ms comn es que provengan de colecciones de historia natural derivadas de muestreos no dirigidos (Soberon et al., 1996; Graham et al., 2004a), aunque tambin los hay derivados de muestreos aleatorios o estratificados (Guisan et al., 1998; Cawsey et al., 2002), as como de observaciones oportunistas como la monitorizacin de animales (Brotons et al., 2007). La mayor parte de la informacin est disponible en las colecciones de historia natural (CHN). Por el contrario en muy pocas ocasiones existen datos tomados en el campo con un diseo experimental encaminado a la elaboracin y validacin de MDE (Feria et al., En revisin). Los datos procedentes de colecciones de historia natural presentan una serie de inconvenientes (Margules & Pressey, 2000; Soberon & Peterson, 2004; Rowe, 2005; Edwards et al., 2006; Pape & Gaubert, 2007b) (vase Tercera Parte), aunque debe sealarse que algunos de estos problemas no son especficos de este tipo de datos: 1) slo registran datos sobre la presencia de las especies y no sobre su ausencia; 2) estn colectados con diferentes fines y por diferentes recolectores y no presentan una estrategia de muestreo; 3) como consecuencia del punto anterior, pueden reflejar una distribucin medioambiental sesgada de la especie; y 4) pueden presentar errores en la georreferenciacin e identificacin de las colecciones. Algunos autores sugieren remuestrear los datos para superar estos inconvenientes (Arajo & Guisan, 2006), pero en la mayora de las ocasiones dispondremos de un nmero muy pequeo de datos y remuestrear los datos resulta inviable. Un punto importante, por el que los MDE realizados con datos procedentes de herbarios han recibido un gran nmero de crticas, es que estas colecciones no representan un muestreo aleatorio del rea de estudio, y estn altamente correlacionados con carreteras, ros, localidades, puntos interesantes desde el punto de vista botnico, etc. (Reddy & Dvalos, 2003; Soberon & Peterson, 2004; Hopkins, 2007; Pape & Gaubert, 2007b; Schulman et al., 2007). Podra suceder que estas carreteras supusiesen un muestreo aleatorio, ya que su trazado recorre las diferentes regiones climticas del rea de estudio y por lo tanto no afectara a la
32
INTRODUCCIN
fiabilidad de los modelos, o bien que sucediera todo lo contrario, es decir, que los datos almacenados en las colecciones de historia natural muestren un sesgo climtico. Dos trabajos, realizados en Israel (Kadmon et al., 2004) y Ecuador (Loiselle et al., 2008), analizaron en detalle este hecho. En ambos se lleg a la misma conclusin, que los resultados finales de los MDE generados a partir de colecciones de historia natural pueden ser absolutamente fiables a pesar de no haber sido obtenidos mediante muestreos aleatorios, y que el factor realmente limitante es el nmero mnimo de presencias con el que se generen los modelos (vase Primera Parte). Una correcta georreferenciacin (latitud/longitud) de los datos es muy
importante a la hora de realizar trabajos de modelado ecolgico, ya que estas localizaciones se emplearn para muestrear las variables independientes y por tanto definirn las caractersticas ambientales en las que vive el organismo cuya distribucin se pretende modelizar. Curiosamente, hay algunos mtodos (por ejemplo MAXENT), que parecen ser particularmente robustos a un error moderado en la georreferenciacin de las localidades (Graham et al., 2008). En nuestro trabajo los datos proceden de la base de datos TROPICOS (Missouri Botanical Garden, Saint Louis, EEUU). Es una base de datos en la que figuran las colecciones georreferenciadas de diferentes herbarios. Trabajar con la totalidad de datos almacenados en TROPICOS para Ecuador sera inviable por lo que seleccionamos varias familias como grupos indicadores (Flather et al., 1997; Howard et al., 1998) de la biodiversidad vegetal de este pas. Los criterios para seleccionar estas familias fueron los siguientes: 1) estar revisadas recientemente por su especialista, lo que garantiza las identificaciones y lo apropiado del tratamiento taxonmico utilizado; 2) las especies incluidas son nativas de Ecuador; 3) consideradas en su conjunto incluyen representantes de todas las zonas biogeogrficas del pas, as como de sus condiciones medioambientales (Fig. 1.2); 4) en su mayora estaban georreferenciadas; y 5) en su conjunto, incluyen una amplia diversidad de formas de vida (biotipos). Teniendo en cuenta estos parmetros, las seis familias elegidas fueron Araceae (slo el gnero Anthurium), Bignoniaceae, Bromeliaceae, Gesneriaceae, Lauraceae, y Papilonaceae. En total se seleccionaron 397 especies (Tabla 1.1) para las que haba un mnimo de 15 presencias (vase Primera Parte). Lo que supuso manejar la informacin relacionada con 17.064 colecciones.
33
Figura 1.2. Distribucin en Ecuador de las colecciones de las diferentes especies y familias empleadas en este trabajo.
TAXON Anthurium Gesneriaceae Lauraceae Bromeliaceae Bignoniaceae Leguminosae Total
ESPECIES 53 11 89 93 28 123 397
COLECCIONES 2513 415 3030 4977 1122 5007 17064

Tabla 1.2. Nmero de especies y colecciones para cada uno de los taxones analizados en este trabajo.
Variables independientes (indicadores medioambientales) Los factores medioambientales tienen un efecto sobre la distribucin de la especie, ya sea de una forma directa o indirecta (Guisan & Zimmermann, 2000). Estas relaciones entre organismos y el medio abitico son la causa de los patrones espaciales que pueden observarse a diferentes escalas. Por ejemplo, si nuestro objetivo es estudiar la distribucin de un organismo en una extensin amplia y con una escala de trabajo grosera, seguramente dicha distribucin estar controlada principalmente por factores limitantes, como puede ser algn parmetro climtico. Sin embargo, si nuestro objetivo es estudiar una especie que presenta una distribucin desigual en un pequeo rea de estudio y en una escala de trabajo detallada, lo ms probable es que esta distribucin sea resultado de una distribucin desigual de los recursos debido a una variacin micro-topogrfica (Guisan &
34
INTRODUCCIN
Zimmermann, 2000). Por lo tanto, a la hora de seleccionar las variables con las que vamos a trabajar es muy importante tener en cuenta tanto la escala espacial como la resolucin de nuestro anlisis. Cada vez tenemos a nuestra disposicin un mayor nmero de posibilidades a la hora de seleccionar las variables potencialmente tiles, de las que las siguientes son un ejemplo. No obstante, cada estudio debe buscar las que sean apropiadas a sus objetivos: Variables climticas desarrolladas a partir de interpolacin de datos de estaciones climatolgicas utilizando un modelo digital del terreno como covariable. Mapas digitales de suelos, sustratos, geologa, vegetacin, formaciones forestales, usos del suelo, etc. Modelos digitales del terreno, de los que adems puede derivarse otras variables topogrficas (p. ej., pendiente, aspecto, orientacin, rugosidad, radiacin solar, curvatura, etc.). Variables obtenidas mediante teledeteccin, como ndices de vegetacin (NDVI), temperatura en superficie, etc. Los datos derivados de satlites han sido muy poco empleados en el modelado ecolgico, aunque producen resultados ptimos (Muoz et al., 2004; Zimmermann et al., 2007). Variables de tipo demogrfico y de ocupacin del espacio, como ndices de poblacin, accesibilidad, vas de comunicacin, etc., que pueden ser muy tiles para evaluar el grado de perturbacin de un ecosistema. Etctera. El rea de estudio en este trabajo es relativamente grande, ya que abarca casi 300.000 km2. Por lo tanto, tal y como vimos anteriormente, los patrones espaciales a esta escala estarn regulados principalmente por factores directos, especialmente el clima. En este estudio hemos utilizado las variables bioclimticas de la base de datos WorldClim 1.3 (http://www.worldclim.org/) (Hijmans et al., 2005) por los siguientes motivos: 1) esta base de datos presenta cobertura mundial y permite comparaciones y extrapolaciones con otros trabajos realizados en otros lugares del planeta; 2) es un recurso libre y gratuito; 3) sus 19 variables tienen un sentido biolgico como factores limitantes a la hora de explicar los patrones de diversidad de los organismos (Tabla 1.2); 4) su resolucin de 30 (equivalente a ~1 km2 en el ecuador) es coherente con la escala de nuestro estudio; y 5) son variables que tiene una influencia directa sobre la distribucin de plantas (Elith, 2002; Austin, 2007), ya
35
que no solo reflejan precipitacin y temperatura, si no que tambin reflejan sus variaciones a lo largo del ao (Walter, 1997). VARIABLE
B1 B2 B3 B4 B5 B6 B7 B8 B9 B10 B11 B12 B13 B14 B15 B16 B17 B18 B19 SIGNIFICADO Temperatura media anual Rango medio diurno (media mensual (t mx.- t min.)) Isotermalidad (B2/B7) (* 100) Temperatura Estacional (desviacin estndar *100) Temperatura mxima del mes ms clido Temperatura mnima del mes ms fro Rango de Temperatura Anual (B5 - B6) Temperatura media del mes ms hmedo Temperatura media del mes ms seco Temperatura media del trimestre ms clido Temperatura media del trimestre ms fro Precipitacin anual Precipitacin del mes ms hmedo Precipitacin del mes ms seco Precipitacin estacional (Coeficiente de variacin) Precipitacin del trimestre ms hmedo Precipitacin del trimestre ms seco Precipitacin del trimestre ms clido Precipitacin del trimestre ms fro
Tabla 1.2. Variables bioclimticas de WorldClim.
Estas variables bioclimticas estn calculadas mediante la interpolacin de los datos de temperatura y precipitacin medios mensuales de estaciones climatolgicas repartidas a nivel global y un modelo digital terrestre del planeta. Los datos utilizados corresponden al periodo 1960-1990, amplindose en algunas circunstancias dicho periodo de 1950 a 2000, como es el caso de la Amazona. Muchas de las variables bioclimticas empleadas en este trabajo estn fuertemente correlacionadas entre s. Esta correlacin no tiene por que ser necesariamente un problema, aunque si lo fuese podra emplearse una tcnica estadstica de reduccin de variables (Elith, 2002) (vase Tercera Parte).
1.5.2. Modelos de distribucin de especies

Como vimos anteriormente, un modelo es una idealizacin de la realidad a la que se llega mediante un proceso. En el caso de los modelos de distribucin de especies se siguen los siguientes pasos: 1) partimos de los datos conocidos sobre la
36
INTRODUCCIN
distribucin del organismo; 2) asociamos matemtica o estadsticamente estos datos con diferentes variables independientes que describen las condiciones ambientales (variables explicativas, p. ej.: tipo de suelo, variables climticas, topografa, etc.); 3) extrapolamos esta relacin al resto del rea de estudio y obtenemos un mapa de idoneidad o probabilidad de presencia de la especie, es decir, un ndice de lo adecuado que es un determinado lugar para el desarrollo de la especie en relacin con las condiciones ambientales. Por lo tanto, los modelos son generalizaciones objetivas y repetibles que nos indican lo adecuado que es un determinado rea para el desarrollo de una especie. A lo largo de su evolucin en la bibliografa cientfica estos modelos han recibido denominaciones muy diferentes: modelos de nicho (niche models), modelos de idoneidad (suitability models), modelos predictivos del hbitat (predictive habitat distribution models). ltimamente se empiezan a unificar criterios y la mayora de las publicaciones hacen referencia al trmino modelos de distribucin de especies MDE (species distribution models SDM) y su resultado final recibe el nombre de mapas de idoneidad de hbitat o de hbitat potencial (habitat suitability maps). Este debate en torno a la denominacin de los modelos est fundamentado en la interpretacin ecolgica que reciben por los diferentes autores: Algunos autores consideran que estamos trabajando con modelos de idoneidad, que representan la distribucin potencial de una especie. Entendemos por distribucin potencial aquel espacio donde podra estar presente la especie objeto de estudio en funcin de sus caractersticas ambientales. Se trata de modelos cartogrficos que nos indican lo adecuado que es cada punto del rea estudiada en funcin de unas determinadas variables de entrada (Lobo, 2000; Felicsimo et al., 2005). Otros autores prefieren emplear el trmino modelo del nicho ecolgico (p. ej., Vetaas, 2002; Arajo & Guisan, 2006). El nicho fundamental (Grinnell, 1917) de una especie es la distribucin potencial global de la especie. Es decir la combinacin de las condiciones ecolgicas que la especie puede tolerar, expresada como un espacio multidimensional ambiental. Cuanto este espacio est limitado por las interacciones con otras especies (por ejemplo competencia), hablamos de nicho realizado (Hutchinson, 1957). La distribucin actual observada de la especie depende de otros factores, como la influencia humana, los factores histricos, las limitaciones en la capacidad de dispersin, etc. Hay que tener en cuenta que la modelizacin es en la mayora de los casos del nicho realizado, pero utilizando variables que slo son oportunas para definir el nicho fundamental.
37
Por ltimo, otros autores optan por describirlos como modelos del hbitat potencial, afirmando que el concepto de hbitat puede ser aplicado a la descripcin de la asociacin entre los organismos y los factores ambientales. Entienden por tanto que la mayora de las aproximaciones empleadas en el modelado ecolgico son ejercicios descriptivos de modelado del hbitat de una determinada especie (Kearney, 2006).
La discusin anterior no carece de sentido a la hora de interpretar el resultado final y de su aplicacin al mundo real. Los MDE son una herramienta con innumerables aplicaciones que pueden variar en funcin de la interpretacin que hagamos de su resultado. Entre sus campos de aplicacin podemos destacar el estudio de la riqueza de especies (Cumming, 2000b; Lehmann et al., 2002; Hortal et al., 2004), de la distribucin potencial de comunidades (Felicsimo et al., 2002; Felicsimo et al., 2003), de la distribucin de especies en el pasado (Benito Garzn et al., 2007), de los patrones de diversidad (Ortega-Huerta & Peterson, 2004; Ferrier et al., 2007), del riesgo asociado a especies invasoras (Kolar & Lodge, 2002; Peterson, 2003; Broennimann et al., 2007; Fitzpatrick et al., 2007; Richardson & Thuiller, 2007), de la proteccin y conservacin de especies amenazadas (Godown & Peterson, 2000; Benito de Pando & Peas de Giles, 2007), de los posibles efectos del cambio climtico (Iverson et al., 1999; Peterson et al., 2002; Iverson, 2004; Arajo et al., 2005a; Arajo et al., 2006; Benito Garzn, 2006; Benito Garzn et al., 2007; Botkin et al., 2007; Pearman et al., 2008), el diseo de reservas (Arajo & Williams, 2000; Margules & Pressey, 2000; Ortega-Huerta & Peterson, 2004; Hannah et al., 2007), los estudios de conservacin (Flather et al., 1997; Arajo et al., 2005b; Ceballos et al., 2005; Rissler et al., 2006), la filogeografa (Peterson et al., 1999; Graham et al., 2004b; Weaver et al., 2006), la biogeografa (Lobo et al., 2001; Luoto et al., 2006; Richards et al., 2007), la delimitacin de regiones biogeogrficas (Peters & Thackway, 1998), la localizacin de lugares donde pueden existir nuevas especies (Raxworthy et al., 2003), la delimitacin de lugares para futuros trabajo de campo (Guisan et al., 2006), la reintroduccin de especies amenazadas (Wiser et al., 1998), la conservacin de especies raras (Bourg et al., 2005; Sattler et al., 2007), la delimitacin de puntos calientes de biodiversidad (Schwartz, 1999; Richardson et al., 2006), el contraste de hiptesis relacionadas con la teora de la evolucin (Peterson et al., 1999), los efectos de las actividades humanas en la distribucin de especies (Jarnevich et al., 2006; Seoane et al., 2006), la taxonoma (Gaubert et al., 2006), y un todava largo etctera. La naturaleza es compleja y heterognea, y predecir con precisin cada uno de sus aspectos es algo muy complicado. Los MDE son una aproximacin a la realidad
38
INTRODUCCIN
que llevan asociados ciertas limitaciones que conviene conocer para una correcta interpretacin de los resultados. En este sentido, Lobo (2000) realiza una reflexin muy interesante: una de las observaciones que alimentan el estudio biogeogrfico es que siempre hay un lugar que parece idneo ambientalmente para una especie, pero que no est habitado por ella (por ejemplo, cada regin mediterrnea tiene riquezas y especies distintas). Cuanto mayor es la escala espacial de anlisis, ms frecuente es este fenmeno debido, lgicamente, a la actuacin de factores de carcter nico e irrepetible que condicionan la distribucin. Se trata de la historia evolutiva propia de cada grupo, de la historia y los avatares propios de cada regin y de las caractersticas geogrficas de la misma. Evidentemente, la importancia de los factores ambientales a la hora de restringir la distribucin de las especies es limitada, de modo que elaborar funciones predictivas que nicamente tengan en consideracin variables ambientales producir, generalmente, modelos incompletos. Ello ser especialmente cierto cuando la escala espacial de anlisis sea amplia, como exige el estudio geogrfico de la variacin del nmero de especies. Historia y geografa tambin juegan y es necesario incluirlas. En la bibliografa podemos encontrar una serie de limitaciones asociadas a los MDE (Guisan & Zimmermann, 2000; Hampe, 2004; Pearson & Dawson, 2004; Guisan & Thuiller, 2005; Soberon & Peterson, 2005; Pearson et al., 2006b). stas son las ms frecuentes: Hiptesis de pseudo-equilibrio (Arajo & Pearson, 2005): los modelos asumen que la poblacin est en equilibrio o, al menos, en pseudo-equilibrio con el medio. Es decir, pequeos cambios en el medio no afectaran a la distribucin de la especie. Como vimos anteriormente, en la realidad la distribucin de una especie tiene una relacin de no-equilibrio con el medio y si consideramos una especie cuya poblacin est aumentando, por ejemplo recolonizando un medio, los datos de ausencia tomados en el campo pueden situarse dentro del hbitat potencial de esa especie y, por tanto, constituiran falsas ausencias que sesgaran el resultado. Por el contrario, para una especie cuyo rea de distribucin est retrayndose, algunas de las presencias pueden constituir falsas presencias (Elith, 2002). Esta limitacin afecta menos a aquellas especies que son relativamente persistentes o que reaccionan lentamente a las condiciones ambientales (elevada resiliencia).
39
Relaciones biticas (Davis et al., 1998; Fitzpatrick et al., 2007): la distribucin de las especies responde a un proceso complejo, donde las relaciones biticas tienen un gran significado, por ejemplo la competencia con ciertas especies puede producir que una especie no ocupe su rea potencial en su totalidad. Este es un factor que no se toma en consideracin en la mayora de los trabajos realizados con MDE, como tampoco lo son otras interacciones como la facilitacin, polinizacin, herbivora, depredacin, parasitismo o simbiosis. En muchos casos la informacin disponible es tan escasa que sera imposible desarrollar otro tipo de modelos. Adems, algunos autores consideran que estas interacciones slo tienen un efecto importante a una escala local y a una resolucin muy fina (Whittaker et al., 2001; Pearson & Dawson, 2004; Guisan & Thuiller, 2005). Sin embargo, otros trabajos muestran resultados totalmente contrarios (Arajo & Luoto, 2007).
Factores
histricos:
la
distribucin
actual
de
un
organismo
est
influenciada por diferentes factores histricos. Por ejemplo, puede no estar presente en la actualidad en un lugar propicio para su desarrollo debido a eventos geolgicos, antropognicos o climticos que han sucedido en el pasado, como glaciaciones o aparicin de barreras biogeogrficas (Guisan & Zimmermann, 2000). Es un factor importante a lo hora de generar un MDE y que conviene considerar a posteriori si se tiene la suficiente informacin. Limitaciones en la capacidad de dispersin de la especie (Svenning & Skov, 2004; Pearson & Dawson, 2005; Lester et al., 2007): en algunas situaciones una especie puede faltar en zonas dentro de su rea potencial de distribucin debido a limitaciones en su capacidad dispersiva. Otro factor importante a tener en cuenta, es como influyen la ecologa de la especie en el resultado final del modelo: si se trata de una especie de distribucin restringida o amplia, la abundancia de la especie, etc. Por ejemplo, en plantas es de esperar que especies que se encuentran en los pasos finales de la sucesin ecolgica sean ms fciles de modelizar que especies pioneras, ya que la distribucin geogrfica de las primeras ser ms estable (Guisan et al., 2007b). Tambin se ha demostrado que los modelos realizados con especies de distribucin restringida son ms fiables que los realizados con especies de amplia distribucin (Feria et al., En revisin). Algunas de estas limitaciones pueden considerarse a la hora de realizar un MDE mediante diferentes estrategias como: 1) aadir la presencia de especies competidoras o facilitadoras como una variable ms en el anlisis; 2) limitar las reas predichas por el modelo como idneas teniendo en cuenta el criterio de
40
INTRODUCCIN
especialistas (Peters & Thackway, 1998; Loisselle et al., 2003); 3) si existe una barrera dispersiva que hace imposible el establecimiento de una especie en un lugar que el modelo predice como potencial podemos eliminar este rea a posteriori (Skov & Borchsenius, 1997); 4) tener en cuenta los sustratos sobre los que no puede desarrollarse una especie (Felicsimo et al., 2005); 5) conocer los factores histricos que han determinado la distribucin actual de la especie y aplicarlos al resultado final obtenido en el modelo (Pape & Gaubert, 2007b); 6) emplear mtodos hbridos que combinen MDE con modelos obtenidos con otras aproximaciones (Graham & Hijmans, 2006; Schurr et al., 2007; Allouche et al., 2008; Nogus-Bravo et al., 2008b); 7) restringir los resultados por regiones biogeogrficas (Peterson et al., 2002); 8) estudiar e introducir en los resultados interacciones de facilitacin relaciones biticas entre distintas especies (Heikkinen et al., 2007); etctera. En este sentido, son muy interesantes las consideraciones de Pearson y Dawson (2004) que apuntan que muchas de estas limitaciones son el objetivo de las investigaciones actuales, cuya meta es mejorar los mtodos existentes o desarrollar otros nuevos. En trabajos relacionados con la conservacin sera deseable que en un futuro estos modelos sean ms realistas desde el punto de vista biolgico. Sin embargo, la capacidad de construir modelos ms realistas est limitada por nuestra comprensin de los sistemas ecolgicos complejos y por los datos limitados disponibles. A pesar de estas limitaciones de los MDE, un elevado nmero de estudios han demostrado su xito, por ejemplo en la prediccin de especies que se desconocan (Raxworthy et al., 2003) y para modelizar la distribucin de especies en el pasado (Martnez-Meyer & Peterson, 2006). Por lo tanto, hay que considerar estos modelos como un primer acercamiento til, por ejemplo para deducir los impactos del cambio climtico en la distribucin de las especies, aunque se deban aplicar cuidadosamente considerando sus limitaciones. En una de las obras clsicas sobre la relacin entre especies vegetales y el clima (Walter, 1985), el autor analiza en detalle algunos patrones que son muy interesantes para poder comprender hasta qu punto son importantes estas limitaciones a la hora de realizar, validar e interpretar los modelos de distribucin de especies vegetales y que nos parece apropiado poner de manifiesto en este contexto. Walter asegura que la actual cobertura vegetal de la Tierra es el resultado de una larga evolucin del reino vegetal bajo la influencia de los factores ambientales, tanto en el pasado como en la actualidad. As, la vegetacin est condicionada en gran parte por el medio ambiente, sobre todo clima y suelo (condiciones trmicas, condiciones hdricas, intensidad lumnica y duracin del da, factores qumicos y y competencia (Leathwick, 2002, gnero Nothofagus); 9) tener en cuenta las
41
factores mecnicos). Estos factores ecolgicos slo son directamente determinantes en los lmites absolutos de la distribucin. Si prescindimos de estas excepciones, vemos que las especies vegetales an pueden crecer muy lejos de su rea si se las protege de la competencia de otras especies. Los lmites naturales de una especie se producen donde unas condiciones ambientales disminuyen hasta tal punto que su capacidad de competencia se ve desplazada por otras especies. Walter asegura que la fuerza de competencia es un fenmeno muy complicado y difcil de medir. Esta competencia da lugar a la aparicin de combinaciones de especies vegetales, denominadas comunidades vegetales. Algunas de estas comunidades son estables y se encuentran en equilibrio ecolgico relativo entre ellas y con su medio ambiente. Son decisivas para mantener este equilibrio: la competencia entre especies, la dependencia de una especie de la existencia de otras, y la presencia de especies complementarias. Otro factor importante a la hora de desarrollar MDE es su fiabilidad final, propiedad que depende de diferentes factores y sobre todo de la calidad de los datos de entrada (variable respuesta e indicadores medioambientales). Los problemas ms habituales que pueden afectar a la fiabilidad de los MDE son los siguientes: Diseo de muestreo: un muestreo inadecuado puede generar una informacin insuficiente o irregular (Lobo, 2000; Hirzel & Guisan, 2002). Precisin y exactitud de los datos (Lobo, 2008): inexistencia o poca fiabilidad en los datos de ausencia (pseudo-ausencias) (vase Segunda Parte), errores o poca precisin en la georreferenciacin de los datos de presencia, errores en la identificacin de los datos de presencia, tamao mnimo de muestra insuficiente (vase Primera Parte), poder predictivo de las variables independientes, etc. Resolucin espacial (Guisan et al., 2007a): debemos emplear la misma resolucin en todos los datos empleados en el anlisis, que debe ser coherente con los objetivos finales del proyecto y la escala a la que estamos trabajando (mundial, continental, regional, comarcal, etc.). Autocorrelacin espacial: si el valor de una determinada variable en una localidad depende de los valores en las localidades adyacentes, se dice que esta variable presenta autocorrelacin espacial, violndose la independencia entre las observaciones que requieren la gran mayora de los estadsticos (Lobo, 2000).
42
INTRODUCCIN
Mtodos de comparacin y seleccin de los mtodos de modelado: existe una gran variedad de mtodos disponibles para realizar MDE y un paso clave es la seleccin del mtodo adecuado (vase partes Segunda y Tercera).
Los MDE se pueden generar a partir de mtodos que pueden clasificarse de varias maneras. Quizs en el contexto de este trabajo la clasificacin ms apropiada sea la que se basa en el tipo de datos de partida que utilicen, y que nos permitira reconocer cinco tipos fundamentales de tcnicas. A continuacin aparece un listado que incluye las principales opciones existentes en la literatura cientfica. Cuando comenzamos a desarrollar este trabajo no existan apenas trabajos de comparacin de mtodos en modelado ecolgico y uno de los objetivos ms importantes dentro de esta comunidad de cientficos era comprobar qu mtodos eran los ms precisos. La seleccin del mtodo empleado en un trabajo de modelado ecolgico es un proceso fundamental para la fiabilidad final de los resultados. Con este objetivo, nos planteamos realizar una comparacin de mtodos y ver cul(es) se ajustaba(n) mejor a nuestros datos de partida y a los objetivos de nuestro proyecto. Una evaluacin listado: A) Tcnicas discriminantes (aquellas que necesitan datos de presencia y ausencia): Tcnicas de clasificacin: classification and regression trees -CART(Breiman et al., 1984a), random forest (Breiman, 2001), boosted regression trees -BRT(Friedman, 2001), mixture discriminant analysis -MDA- (Hastie & Tibshirani, 1996). Tcnicas de ordenacin: anlisis de correspondencia cannica (CCA). Redes neuronales: neural network-assisted (ANN), Plus package NNETW (Venables & Ripley, 2002). Multivariate adaptive regression splines (MARS): con interacciones y sin interacciones (Friedman, 1991). Modelos lineales generalizados (Generalized Linear Models, GLM) (McCullagh & Nelder, 1989): regresin logstica mltiple (RLM), support vector machines -SVM- (Vapnik, 1995), generalized regression analysis and spatial prediction -GRASP- (Lehmann et al., 2003). Modelos aditivos generalizados (Generalized Additive Models, GAM) (Hastie & Tibshirani, 1986), BRUTO (Hastie et al., 1994). de todos los mtodos sera inviable y seleccionamos los ms frecuentemente empleados en la bibliografa, aparecen destacados en negrita en el
43
Mxima entropa: MAXENT (Phillips et al., 2006; Phillips & Dudk, 2008). Este mtodo genera sus propias pseudo-ausencias.
B) Tcnicas descriptivas (slo necesitan datos de presencia): Deductivas: investigacin, opinin del experto. Envueltas geogrficas: convex hull (Worton, 1995), Kernel density estimators (Silverman, 1986; Seaman & Powell, 1996). Envueltas ambientales: BIOCLIM (Busby, 1986;1991), ANUCLIM (Houlder et al., 1999), BIOMAP (Nix and Switzer 1991), HABITAT (Walker & Cocks, 1991), FLORAMAP (Jones & Gladkov, 1999), PCA. Mtodos de distancia: DOMAIN o distancia mtrica de Gower (DMG), LIVES, distancia de Mahalanobis -MADIFA- (Calenge et al., 2008). Ecological niche factor analysis (ENFA): Biomapper (Hirzel et al., 2002). C) Tcnicas mixtas (el algoritmo emplea varias reglas algunas de ellas descriptivas y otras discriminantes): Algoritmos genticos: Desktop-GARP (Stockwell & Peters, 1999), OM-GARP (Elith et al., 2006). Este mtodo autogenera sus propias pseudo-ausencias para el conjunto de reglas que necesitan datos de ausencia. D) Tcnicas multirrespuesta (utilizan como ausencias aquellos lugares en donde no se ha encontrado la especie objeto de estudio pero estn presentes otras especies relacionadas con la especie objetivo): MARS-Multirrespuesta (Elith & Leathwick, 2007). Redes neuronales multirrespuesta. Vector generalized linear (or additive) models.
E) Tcnicas de abundancia (utilizan datos de abundancia): Modelos de regresin para variables ordinales (Guisan & Harrell, 2000): proportional odds (Guisan et al., 1998), continuation ratio, stereotype models, poisson generalized linear modelling, zero inflated negative binomial regression (Welsh et al., 1996b; Boyce et al., 2001; Pearce & Ferrier, 2001; Barry & Welsh, 2002; Dirnbck & Dullinger, 2004 ).
44
INTRODUCCIN
Modelos aditivos generalizados (Generalized Additive Models, GAM) (Leathwick, 2001; Cawsey et al., 2002): Poisson GAM (Pearce & Ferrier, 2001).
rboles de regresin (Iverson & Prasad, 1998). Redes neuronales.
A continuacin analizamos cada uno de los mtodos de modelado ecolgico empleados y comparados en este trabajo de investigacin: Algoritmos genticos GARP, acrnimo de genetic algorithm for rule set production (Stockwell & Peters, 1999), se basa en un smil de la evolucin por seleccin natural. GARP puede ejecutarse con datos de presencia/ausencia o de slo presencia, pero en este caso genera sus propias pseudo-ausencias (back-ground). El primer paso en el proceso es dividir el conjunto de datos en dos subconjuntos, uno de ellos para ejecutar el modelo y otro para evaluarlo. Genera un modelo mediante un conjunto de reglas (atmicas, regresin logstica, envueltas ambientales, reglas de rango, etc.) y lo evala mediante los errores de omisin y comisin. A continuacin realiza otra iteracin, para lo que remuestrea de nuevo los datos, hace dos nuevos subconjuntos de datos, genera nuevas reglas para volver a producir otro modelo y evaluarlo. Si este modelo es mejor que el anterior lo almacena, de esta forma genera una gran cantidad de modelos hasta que no mejoran o hasta que se llega a un nmero de iteraciones establecido por el usuario. El resultado final es un mapa binario de presencia (valor 1) y ausencia (valor 0) de la especie. Se trata de un mtodo muy aleatorio, debido al remuestreo de las presencias y la generacin pseudo-ausencias; para solventar esta desventaja el programa ejecuta mltiples mapas finales y selecciona los modelos que presentan mejor consistencia (best subset). Estos modelos pueden ser combinados para generar un nico mapa final. La ventaja ms destacada de GARP es su implementacin en un nico software. Sin embargo, es como una caja negra ya que sus resultados no se pueden explicar fcilmente, no es interpretable desde el punto de vista ecolgico, los resultados varan enormemente con los mismos datos de partida y no se conoce la influencia de las variables independientes en el modelo final.
45
Figura 1.3. Ventana de GARP Desktop 1.1.6 donde se pueden contemplar los parmetros con los que ejecutamos este mtodo.
Para realizar los modelos empleamos un software desarrollado por Stockwell y Peters (1999), GARP Desktop 1.1.6. Este algoritmo genera modelos diferentes en cada iteracin, ya que se trata de un proceso estocstico donde las mutaciones y recombinaciones del algoritmo afectan a la prediccin final. Esta variacin entre predicciones sugiere el empleo de varios mapas con los que se genera un modelo de consenso final (Elith, 2002). En este estudio generamos 100 modelos, de los que se eliminaron los que cometan ms de un 10% de error de omisin; de los restantes, se seleccionaron los 10 modelos que estaban alrededor de la mediana del error de comisin. Con estos 10 modelos se gener el modelo de consenso. La figura 1.3 muestra los parmetros con los que fue ejecutado este mtodo. Distancia mtrica de Gower (DMG, Domain) Este algoritmo (Walker & Cocks, 1991; Carpenter et al., 1993) utiliza la distancia mtrica de Gower, una medida de distancia que estandariza las variables segn su rango en todos los puntos de presencia para igualar su contribucin al modelo. La distancia entre una presencia A y una celda B para una variable k se calcula como la diferencia absoluta entre A y B dividida por el rango de k para todos los puntos de presencia. La distancia de Gower (G) es la media de las distancias para todas las
46
INTRODUCCIN
variables climticas, y el estadstico de similitud se calcula como 100 (1-G). El valor mximo es 100, que se da en todas las celdas con presencia del organismo.
GAB = 1 (1/p * (|A k B K|/ rango K))

donde p = nmero de presencias, Ak = valor de la variable k en el pxel A, y Bk = valor de la variable k en el pxel B. El resultado es un valor de similitud entre la celda problema y el punto de presencia ms similar conocido. Los modelos realizados con este algoritmo pueden interpretarse como la diferencia entre un sitio de inters y los lugares donde conocemos que la especie est presente. Se pueden generar mapas de presencia/ausencia seleccionando un punto de corte por encima del cual se considera que la especie est presente y por debajo del cual la especie no lo est. En la bibliografa el valor empleado con ms frecuencia como punto de corte para este algoritmo es 95 (Carpenter et al., 1993).
Figura 1.4. Ventanas del software DIVA-GIS donde se contemplan las opciones necesarias para poder ejecutar un modelo de distancia mtrica de Gower en este programa.
Es un mtodo fcil de ejecutar y de intrepretar. Sin embargo, presenta varias desventajas: 1) es un mtodo poco flexible, ya que no permite interacciones entre variables; 2) da la misma importancia a todas las variables; 3) no tienen ningn procedimiento para seleccionar variables; 4) no se puede conocer la influencia de cada variable en el modelo final; 5) tampoco est muy claro cmo puede afectar el
47
empleo de numerosas variables que estn altamente correlacionadas en el resultado final de los modelos; 6) es un mtodo que tiende a sobreajustar; y 7) es muy susceptible a la presencia de valores atpicos (outliers). Para generar los MDE de este mtodo, en un primer momento empleamos un software especfico (DOMAIN32), pero comprobamos que tena un error de programacin por el que los valores del mapa resultante estaban desplazados una celda; empleamos por tanto DIVA-GIS (Hijmans et al., 2004). En la figura 1.4 se pueden observar las opciones elegidas para generar los modelos. Envuelta medioambiental Este es el ttulo que nos parece ms acertado para describir el mtodo BIOCLIM (Busby, 1986;1991) que hemos seleccionado como ejemplo de mtodo de envuelta o entorno medioambiental. Estos mtodos modelizan la distribucin de una especie definiendo un espacio multidimensional en el que cada dimensin viene expresada por el rango de una de las variables independientes tras eliminar las observaciones comprendidas en los 5% superior e inferior de dicho rango. El modelo resultante es el que presenta condiciones incluidas dentro de los lmites de este espacio multidimensional. Es un mtodo fcil de ejecutar e interpretar. Las desventajas que presenta son las mismas que listamos en el mtodo anterior. Los modelos tambin fueron realizados con el software DIVA-GIS (Hijmans et al., 2004). Mxima entropa Maxent (maximum entropy) (Phillips et al., 2006; Phillips & Dudk, 2008) es un mtodo de inteligencia artificial que se basa en el principio estadstico de mxima entropa. Los modelos tienen como unicas limitaciones las realmente conocidas, en nuestro caso hablamos de un universo delimitado por los valores de las variables entre las que se desarrolla la especie problema. As por ejemplo, el valor esperado (valor medio predicho por el modelo) de cada variable independiente debe coincidir con su media emprica (valor medio observado al muestrear las variables independientes con los datos de presencia de partida). MAXENT calcula la probabilidad de distribucin de mxima entropa (es decir, la distribucin ms prxima a la uniforme) sujeta a estas condiciones. El resultado final es una expresin del tipo: P(x) = exp (C1 * F1(x) + C2 * F2(x) + C3 * F3(x) ...) / Z
48
INTRODUCCIN
donde C1, C2... son constantes; F1, F2... son las variables, y Z es una constante que asegura que la suma de todos los valores de P para todas las celdas sea 1. Durante el proceso, Maxent genera distintas distribuciones de probabilidad, comenzando por una distribucin uniforme, sucesivamente mejora el ajuste a los datos. Esta ganancia se define como la probabilidad media de los datos de presencia, menos una constante que implica que la distribucin uniforme tiene una ganancia igual a cero. Al final del proceso, esta ganancia indica el ajuste del modelo a las localidades de presencia. Si esta ganancia tiene un valor de 2 significa que la probabilidad media de las muestras de la presencia es exp(2). Es decir, 7,4 veces mayor que un pxel escogido al azar. Obsrvese que Maxent no est calculando directamente la "probabilidad de ocurrencia". La probabilidad que asigna a cada celda es muy pequea, pues todos los valores deben sumar 1.
Figura 1.5. Ventana del software MAXENT 2.1 donde se pueden observar los parmetros seleccionados para ejecutar este mtodo.
Maxent tiene tres formatos de salida: raw, cumulative y logistic. El segundo es el empleado en este trabajo. Donde el valor de una celda es la suma de las probabilidades de todas las celdas con una probabilidad ms elevada que la celda problema. De esta forma las celdas que el modelo predice que presentan las mejores condiciones para la especie, tendrn valor acumulativo de 100, mientras que los
49
valores acumulativos prximos a 0 indican condiciones inadecuadas para el desarrollo de la especie. Este algoritmo puede usar variables cualitativas, dando a cada clase de la variable un peso relativo al nmero total de puntos de presencia que contiene dicha clase. El programa proporciona curvas de respuesta de la especie ante las diferentes variables independientes y valora la importancia de cada una de ellas en la distribucin de la especie. Entre sus ventajas se encuentra una formulacin relativamente transparente, que permite interacciones entre variables, se puede investigar el efecto de cada una de las variables, es fcil de ejecutar y funciona relativamente bien con tamaos muestrales pequeos. Sin embargo, no existe un mtodo de seleccin de variables y es un mtodo poco estudiado. Para ejecutar este mtodo empleamos un software especfico: MAXENT 2.1, programado en JAVA, que permite desarrollar modelos de distribucin de especie de una forma rpida y sencilla. En la figura 1.5 se pueden observar los distintos parmetros seleccionados para ejecutar este mtodo. Regresin logstica mltiple (RLM) La Regresin logstica mltiple es una regresin lineal con los valores finales comprendidos entre 0 y 1, por lo tanto resulta adecuado para generar un modelo de probabilidad. Al tratarse de una regresin, asume una relacin lineal entre la variable dependiente y las independientes. La variable dependiente adopta la forma de logit: ln (P/1-P), donde P es la probabilidad de presencia; despejando P se obtiene la ecuacin:
P (i ) =
1 1+ e
b ( 0 ) + b (1) x (1) +...+ b ( n ) x ( n )
donde P(i) es la probabilidad de presencia de la especie; x(1) x(n) representan los valores de las variables ambientales y b(1) b(n) son los coeficientes correspondientes. Los modelos de distribucin de especies realizados con este mtodo no son ms que una ecuacin que explica la relacin entre la variable dependiente y las independientes, y su posterior extrapolacin a toda el rea de estudio mediante su implementacin en un SIG. Las variables independientes que se incluyen en el anlisis pueden estar correlacionadas entre s disminuyendo la fiabilidad final del modelo. Un proceso habitual en la construccin de modelos es seleccionar aqullas que son significativas,
50
INTRODUCCIN
una opcin frecuente es eliminar las variables no significativas mediante un proceso hacia delante (forward) o hacia atrs (backward). En el primer caso se realiza una regresin con cada una de las variables, aquella que explica el mayor porcentaje de la varianza total de la variable respuesta se selecciona, se vuelven a realizar regresiones parciales incluyendo la variable seleccionada. El proceso finaliza cuando no se encuentra ninguna variable que contribuya significativamente. El proceso hacia atrs consiste en incluir todas las variables a la vez, eliminando en cada paso las variables menos significativas. Otro mtodo es el anlisis de regresin por pasos (stepwise), que combina el proceso de seleccin forward con una eliminacin backward, comprobando la significacin de cada de una de las variables incluidas en el modelo. Este ltimo mtodo es el que hemos escogido para llevar a cabo la seleccin de variables en este trabajo. Algunas de las ventajas ms destacables de este mtodo son la fcil interpretacin de los modelos generados (tanto desde el punto de vista estadstico como ecolgico), que se pueden seleccionar las variables que se incluyen en el anlisis, se pueden considerar interacciones entre variables, se puede conocer el efecto de cada una de las variables en el modelo final, que se trata de un mtodo bien conocido y evaluado. Una de sus principales desventajas es el empleo de pseudo-ausencias, ya que se trata de un mtodo muy sensible a los errores en presencias y ausencias. Adems, se necesitan varios programas para desarrollarlo. Los modelos fueron realizados en SPSS 12.0 y, posteriormente, mediante una sintaxis en lenguaje AML (Arc Macro Language) ejecutada en ArcInfo Workstation 9.1, el modelo fue implementado en un SIG y convertido en mapa de probabilidad para toda la zona de estudio. rboles de clasificacin y regresin CART (classification and regression trees) es un mtodo desarrollado por Breiman et al. (1984b) que genera rboles binarios (los nodos padres se dividen en dos nodos hijos) mediante particiones iterativas, en un proceso que se puede repetir tratando a su vez a cada nodo hijo como padre. El algoritmo busca los valores ptimos de corte entre todas las variables independientes para obtener una serie ptima de divisiones binarias, de forma que se minimice la varianza dentro de cada nodo y se maximice entre nodos diferentes; es posible por tanto que haya variables que no se utilicen. Una vez obtenido el rbol que mejor clasifica los casos, sin lmite de complejidad, el algoritmo lo poda o simplifica para evitar el sobreajuste (overfitting) de los datos. El resultado es un rbol por el que se desciende a partir de preguntas de tipo si/no. En funcin del tipo de variable dependiente se diferencian
51
dos tipos de rboles: de regresin (variable dependiente continua) y de clasificacin (variable discreta). Las ventajas ms destacadas de este mtodo son las siguientes: se trata de un mtodo fcil de interpretar, se pueden desarrollar fcilmente modelos no lineales, se conoce directamente el efecto de cada una de las variables en el modelo final. Las principales desventajas de este mtodo son que los modelos puede ser difciles de representar como una prediccin, se necesitan varios programas para desarrollarlo y su implementacin en un SIG puede llegar a ser muy complicada. Para generar estos modelos utilizamos CART 5.0 (www.salford-systems.com), aunque lo complicado de su implementacin en un SIG (Muoz & Felicsimo, 2004; Felicsimo et al., 2005), sumado a que no produjo los mejores resultados, recomend no generar los mapas finales. MARS (multivariate adaptive regression splines) MARS es un mtodo estadstico desarrollado por Friedman (1991). Se basa en la construccin de modelos flexibles ajustando los datos a regresiones lineales parciales "segmento por segmento" (piecewise). Es decir, los modelos no lineales se aproximan mediante la utilizacin de regresiones lineales parciales (en distintos intervalos del conjunto de datos), donde la pendiente de la ecuacin cambia de un intervalo a otro. Un nodo nos indica el final de una regresin parcial y el principio de otra. Entre dos nodos consecutivos el modelo se define mediante una regresin lineal. Los nodos se seleccionan mediante un procedimiento de bsqueda que emplea un algoritmo paso a paso, similar al proceso que empleamos en la RLM. El modelo generado est sobreajustado y posteriormente se eliminan los nodos con menor relevancia a travs de un criterio estadstico (mediante validacin cruzada generalizada) y slo se mantienen los nodos ms significativos. Las llamadas funciones bsicas (basis functions) representan la informacin contenida en una o ms variables. Actan como las nuevas variables independientes del modelo y explican el efecto de una o varias variables respuesta sobre la variable independiente en cada intervalo (espacio entre dos nodos). Veamos un ejemplo: suponemos que se ha generado el siguiente modelo: F(x) = 0 + 1 * FB1 + 2 * FB 2 siendo sus funciones bsicas las siguientes: FB 1 = max (0, V1 10)
52
INTRODUCCIN
FB 2 = max (0, V1 20) El efecto de la variable independiente V1 en la variable dependiente es 0 para los valores inferiores a 10; para los valores comprendidos entre 10 y 20 la variable V1 tiene un valor sobre la variable dependiente de 1 y para los valores mayores de 20 el efecto de la variable V1 sobre la variable dependiente se obtiene a partir de la suma de los coeficientes 1 y 2. Para generar estos modelos empleamos MARS 2.0 (www.salford-systems.com). Mediante rutinas de este software realizamos un total de 30 modelos diferentes para cada una de las especies, variando la complejidad de los modelos generados. Posteriormente seleccionamos el modelo que presentaba mejor consistencia (mayor valor del estadstico rea bajo la curva ROC, calculado en SPSS 12). Este modelo se implement despus en un SIG mediante una sintaxis AML (Arc Macro Language). Los parmetros que se variaron fueron: 1) nmero mximo de funciones bsicas permitidas en el modelo (15, 20, 25, 26, 27, 28, 29, 30, 45); 2) factor de velocidad (1, 2, 3, 4), que se refiere a la esfuerzo en la bsqueda de nodos ptimos en cada iteracin; con valores bajos de este parmetro el software analiza cada valor de la variable como posible nodo en cada iteracin, independientemente de que en iteraciones anteriores su contribucin haya sido baja, mientras que con valores altos la bsqueda no tiene por qu encontrar los nodos ptimos; 3) interacciones (se permitan o no interacciones entre las distintas funciones bsicas; 4) variables independientes en el modelo (se incluan todas las variables o bien se eliminaron del anlisis las variables B1 temperatura media anual y B12 precipitacin media anual, de las que se derivan las dems, con el objeto de reducir la multicolinealidad). MARS genera puntuaciones sin un lmite definido, por lo que los modelos finales fueron constreidos a un valor comprendido entre 0 y 1 mediante la funcin logit. Entre las ventajas de este mtodo destacaremos que se trata de un mtodo fcil de interpretar estadstica y biolgicamente, permite desarrollar fcilmente modelos no lineales, se conoce directamente el efecto de cada una de las variables en el modelo final, tiene un proceso para seleccionar variables y permite interacciones parciales en las variables. Una de las desventajas de este mtodo es que se necesitan varios programas para desarrollarlo. MARS-Multirrespuesta Los modelos Multirrespuesta usan datos procedentes de varias especies, que son a su vez incluidos en el anlisis como variables. Se construyen de una forma similar a los modelos de MARS que emplean datos de una sola especie. El modelo
53
Multirrespuesta final usa el mismo conjunto de variables para todas las especies, pero estima diferentes coeficientes para cada una. La naturaleza de estos modelos requiere el empleo de un tipo especial de ausencias (inventory pseudo-absences): aquellos lugares donde estn presentes otras especies pero no se encuentra la especie problema son considerados ausencias para el anlisis (Tabla 1.3) (Elith & Leathwick, 2007). Para ejecutar este modelo se emple el software libre R (http://www.rproject.org). Los parmetros con los que se ejecuto este algoritmo son los mismos que emplearon Elith y Leathwick (2007). X 78,68 76,53 77,10 Y 0,99 1,50 2,39 SP1 1 0 0 SP2 0 1 0 SP3 0 0 1 V1 23 10 5 V2 900 550 100
Tabla 1.3. Ejemplo de una tabla de entrada de datos en un modelo multirespuesta, donde se incluyen los datos de presencia de cada especie (sp) y los valores de las variables ambientales (V) para esas localizaciones (X , Y). Se consideran ausencias (0) para una especie determinada lugares donde estn presentes otras especies pero no se encuentra esta especie.
1.5.3. Evaluacin y comparacin de mtodos

Cada uno de los mtodos que hemos visto anteriormente ofrece un resultado diferente y la seleccin del mtodo que vamos a emplear en nuestro anlisis es un paso determinante para la fiabilidad final del cualquier trabajo de modelado ecolgico. Esta decisin debe estar fundamentada principalmente en una evaluacin y control del error adecuado (Fielding & Bell, 1997; Manel et al., 1999). Aunque no debe estar basada exclusivamente en consideraciones estadsticas, sino que adems es necesario tener en cuenta los objetivos de nuestro proyecto y las consideraciones tericas de los diferentes mtodos (Guisan & Zimmermann, 2000). Antes de adentrarnos en otras consideraciones vamos a definir algunos conceptos bsicos que sern necesarios: Bondad del modelo (accuracy): este trmino se emplea en modelado ecolgico para valorar la calidad y la capacidad predictiva del modelo final (Guisan & Thuiller, 2005). Consistencia del clasificador o consistencia clasificatoria (predictive
performance): es la probabilidad de que un caso positivo punte por encima de uno negativo.
54
INTRODUCCIN
Datos de generacin (training data set): fraccin del total de datos de la variable dependiente que se emplean para generar el modelo pero no para validarlo.
Datos de validacin (testing data set): fraccin del total de datos de la variable dependiente no utilizada para generarlo que se utiliza para evaluar el comportamiento del modelo final, en trminos de ajuste y consistencia, ante nuevos datos.
Interpretabilidad del modelo (model interpretability): algunos autores utilizan este criterio para seleccionar los mtodos o modelos que son ms fcilmente comprensibles o interpretables; es decir, aqullos en los que la relaciones entre las especies y el medio ambiente pueden ser crticamente evaluadas. Existen otros mtodos incomprensibles o no interpretables, en los que no se conocen estas relaciones (cajas negras).
Error de comisin (commission error): error cometido al predecir el modelo la presencia de una especie cuando realmente no se ha observado, es decir, la proporcin de falsos positivos o falsas alarmas.
Error de omisin (omission error): error cometido al predecir el modelo la ausencia de una especie cuando en la realidad est presente; es decir, la proporcin de falsos negativos.
Error estndar (standard error): es una medida de la desviacin muestral con respecto al valor real de un estadstico, o lo que es lo mismo, la desviacin estndar de un estadstico.
Especificidad
(specificity):
proporcin
de
ausencias
correctamente
predichas respecto nmero total de ausencias. Fiabilidad del modelo (reliability): la cualidad del modelo de ser verosmil. Generalidad (generality): la habilidad de comparar la consistencia del mismo modelo en diferentes aplicaciones o entre modelos desarrollados para diferentes especies o con diferentes datos de ejecucin y evaluacin. Generalizable (generalizability): es la capacidad de un modelo de predecir adecuadamente la distribucin de una especie con datos nuevos (datos de validacin), alcanzando un valor de bondad del modelo similar al alcanzado con los datos de generacin. Prevalencia (prevalence): proporcin de la clase sujeto (presencia) en el conjunto de datos.
55
Punto de corte o umbral (threshold): valor que optimiza la proporcin de casos positivos y negativos correctamente predichos. Permite convertir un mapa de probabilidades o cualquier otro ndice en un mapa binario de presencia/ausencia. Valores ms elevados de probabilidad que este umbral suponen que la especie est presente (1), y valores inferiores implican que la especie no est presente (0), generando en el modelo binario (1-0). El punto de corte ptimo es un compromiso entre error de omisin y comisin.
Sensibilidad
(sensibility):
proporcin
de
presencias
correctamente
predichas respecto al nmero total de presencias. Sobreajuste (overfitting): situacin en la que el modelo generado tiene un ajuste alto a los datos de generacin, pero bajo cuando se aplica a datos nuevos (datos de validacin); es decir, es un modelo que casi exclusivamente se ajusta a los datos de partida. Validacin (validation): valoracin de la consistencia del modelo con datos independientes a los de su generacin. Verificacin (verification): capacidad de un modelo de ajustarse al conjunto de datos con los que se ha ejecutado. Cuando verificamos existe una nica coleccin de datos con la que se ejecuta y se evala el modelo. A la hora de evaluar el resultado final de un modelo de distribucin de especies y de realizar comparaciones entre los diferentes mtodos de modelado ecolgico se emplean estadsticos que miden la consistencia del modelo. En la bibliografa se habla de las propiedades deseables de estos estadsticos, entre las que se suelen destacar dos: 1) la habilidad de describir la consistencia en trminos de ajuste del modelo; y 2) la capacidad de medir si un modelo es generalizable (Guisan & Thuiller, 2005). Algunos autores valoran considerablemente la interpretabilidad del modelo a la hora de seleccionar o elegir una determinada tcnica (Guisan & Thuiller, 2005). La mayora de los autores aceptan que es preferible la validacin a la verificacin, pero en algunas ocasiones la verificacin puede ser suficiente, e incluso en algunas situaciones la validacin puede resultar imposible, como cuando no hay suficientes datos de partida para dividirlos en dos subconjuntos, algo muy habitual (Arajo & Guisan, 2006). Tenemos que tener muy claro que decir si un modelo es bueno o malo siempre estar sujeto a crticas, es algo implcito al modelado, la verdad absoluta no puede obtenerse (un modelo por definicin es una aproximacin de la realidad). Por lo tanto, un modelo slo debe ser discutido y definido en el contexto de su aplicacin (Guisan & Zimmermann, 2000). Es decir, no podemos concluir si un modelo es verdadero o falso, pero podemos ver si
56
INTRODUCCIN
producen una solucin aceptable a nuestro problema y son una prediccin fiable de los patrones biolgicos con los que trabajamos (Guisan & Zimmermann, 2000). Existen diferentes estadsticos para medir la consistencia y realizar
comparaciones, pero algunos no son apropiados para todas las situaciones. Fielding & Bell (1997) y Johnson & Omland (2004) proporcionan buenas revisiones de las diferentes posibilidades existentes. Para este trabajo hemos seleccionado el estadstico ms empleado en la bibliografa: el rea bajo la curva ROC (Receiver Operating Characteristics). A continuacin analizaremos este estadstico. Curva ROC (Receiver Operating Characteristic) La curva ROC es la representacin grfica de la capacidad discriminativa de un modelo para todos sus posibles puntos de corte. El eje de ordenadas corresponde a la sensibilidad o casos positivos bien clasificados, y el de abscisas a 1 especificidad, o falsos positivos. En esta grfica un aumento de la sensibilidad implica una disminucin de la especificidad y viceversa (Hanley & McNeil, 1982). El estadstico derivado es el rea bajo la curva ROC o AUC (area under the ROC curve) en su acrnimo ingls. Es equivalente al estadstico U de Mann-Whittney, ya que en realidad corresponde a la probabilidad de que, tomado al azar un par de casos, uno positivo y otro negativo, el modelo adjudique al positivo un valor mayor. El resultado tiene unos valores comprendidos entre 0,5 y 1; un valor de 0,5 significa que el modelo no tiene un valor discriminante, ya que equivaldra a que clasificara los casos al azar. Un valor de AUC igual a 1 significa que el ajuste del modelo es perfecto.
REALIDAD
PRESENCIA PRESENCIA AUSENCIA
PREDICCIN
Verdadero positivo (VP)
Falso positivo (FP)
AUSENCIA
Falso negativo (FN)
Verdadero negativo (VN)
Tabla 1.4. Tabla de contingencia para un punto de corte determinado.
57
Para la representacin grfica de la curva se elabora una tabla de contingencia (Tabla 1.4) para cada uno de los posibles puntos de corte, con los valores de sensibilidad y especificidad. La sensibilidad y especificidad se calculan a partir de las expresiones siguientes:
SENSIBILID AD =
nmero predicho de casos verdadero s positivos VP = nmero real de casos positivos VP + FP

nmero predicho de casos falsos negativos FN = nmero real de casos negativos FN + VN
ESPECIFICIDAD =
Las mayores ventajas de este estadstico son las siguientes: 1) la posibilidad de comparar cualquier mtodo, ya que no dependen de presupuestos paramtricos; 2) sus resultados son independientes de la prevalencia; y 3) es una medida independiente del punto de corte. En este trabajo el estadstico AUC fue calculado mediante rutinas de SPSS 12.0. Los resultados se presentan en esta tesis con los intervalos de confianza. Tambin hay que valorar las limitaciones del estadstico AUC recientemente expuestas (Lobo et al., 2008; Peterson et al., 2008a): 1) no evala la bondad de ajuste del modelo; 2) suma la consistencia para todas las regiones de la curva ROC y debe tenerse en cuenta que algunas de estas regiones raramente son operativas; 3) da igual valor al error de comisin que al error de omisin; 4) no obtenemos informacin espacial del error; y 5) la extensin del anlisis influye de una forma importante en este estadstico.
1.6. Objetivos y estructura de la tesis

De lo tratado hasta el momento es evidente que los modelos de distribucin de especies constituyen una herramienta fundamental en un gran nmero de estudios, pero tambin que su uso no est exento de problemas y dudas. Teniendo en cuenta que uno de los objetivos generales del proyecto de investigacin en el que se enmarca esta Tesis Doctoral era utilizar combinaciones de MDE para construir modelos de diversidad vegetal que identificaran y delimitaran reas de alta diversidad de una forma fiable y objetiva, este trabajo afronta los siguientes objetivos especficos:
58
INTRODUCCIN
1.- Analizar los efectos del tamao de muestra en los modelos de

distribucin de especies. Este objetivo se aborda en la Primera Parte (Estudiando los efectos del tamao de muestra en los modelos de distribucin de especies). Uno de los factores que pueden tener mayor impacto en la fiabilidad final del modelo es el tamao de muestra. En este captulo estudiamos cmo afecta este tamao muestral de la variable dependiente sobre la fiabilidad de los MDE. 2.- Evaluar varios mtodos de generacin de pseudo-ausencias y ausencias de grupo fiables. Otro factor de gran importancia para generar buenos MDE es la calidad de los datos de ausencia. Este objetivo se aborda en la Segunda Parte (Generando pseudo-ausencias y ausencias de grupo fiables. Comparacin de tcnicas descriptivas y discriminantes). Para su consecucin planteamos la generacin de ausencias de grupo a partir de datos procedentes de colecciones de historia natural, en principio ms fiables que las pseudoausencias puramente aleatorias, y posteriormente analizamos si los modelos as obtenidos son robustos y consistentes. 3.- Comparar el rendimiento de los modelos a nivel de especie generados por varios mtodos. Este objetivo, tratado en la Segunda y Tercera Parte, evala el rendimiento de seis mtodos empleados en modelado ecolgico a nivel de especie y contrasta qu tcnicas son ms consistentes, si las discriminantes (necesitan datos de presencia y ausencia) o las descriptivas (slo emplean datos de ausencia). 4.- Comparar el resultado de diferentes estrategias de modelado a nivel de comunidad, con los que generar mapas fiables indicadores de la diversidad. Este objetivo se trata en detalle en la Tercera Parte (Modelando patrones de diversidad). Donde se comparan diferentes estrategias, aproximaciones y corrientes de modelado a nivel de comunidad, evaluando sus ventajas y desventajas.
59
PRIMERA PARTE: Estudiando los efectos del tamao de muestra en los modelos de distribucin de especies.
TAMAO MUESTRAL
2. Estudiando los efectos del tamao de muestra en los modelos de distribucin de especies
2.1. Resumen
El modelado ecolgico se emplea cada vez ms en investigaciones relacionadas con la distribucin potencial de las especies. La mayora de los trabajos llevados a cabo no realizan un anlisis del tamao de muestra mnimo necesario, a pesar de su influencia potencial en la consistencia y fiabilidad de los modelos de distribucin de especies (MDE). MARS (multivariate adaptive regression splines) es uno de los mtodos con ms potencial dentro del modelado ecolgico, pero los efectos del tamao de muestra no han sido analizados para este mtodo. Nuestro objetivo es por tanto analizar los efectos del tamao muestral en MDE generados con MARS. Para realizar este anlisis empleamos dos conjuntos de datos, cada uno de ellos con dos especies: 1) dos especies arbreas en Espaa, el roble melojo o rebollo (Quercus pyrenaica Willd.) y el haya (Fagus sylvatica L.). Estas especies representan juegos de datos con un elevado nmero de presencias (14.661 y 3.734, respectivamente), con ausencias verdaderas y prevalencia desequilibrada; 2) dos especies herbceas endmicas de Ecuador, Anthurium dolichostachyum Sodiro y A. mindense Sodiro. Estas especies representan juegos de datos con un nmero bajo de presencias (ambas 72), sin ausencias verdaderas y prevalencia equilibrada. Se generaron MDE con tamaos muestrales progresivamente menores
seleccionando al azar presencias del juego de datos. Para cada tamao muestral se realizaron 10 rplicas en el caso del gnero Anthurium y 20 en el de los rboles. Todos los modelos fueron generados con MARS. El modelo de referencia considerado como la representacin ms fiable de la realidad con los datos disponibles se compar con las diferentes rplicas mediante el coeficiente de correlacin de Pearson. Tambin se utiliz el coeficiente de correlacin de Pearson para medir la estabilidad de los modelos, comparando todas las rplicas entre s dentro de cada tamao muestral. Se encontr que el coeficiente de correlacin entre los modelos degradados y el modelo de referencia est relacionado directamente con el tamao muestral, y que la estabilidad de los modelos (estimada como la desviacin tpica de la correlacin entre rplicas) est inversamente relacionada con el tamao muestral. Por tanto se demuestra que el tamao de muestra mnimo es un factor de vital importancia para generar MDE fiables y estables empleando MARS, tal y como ha sido demostrado para otros mtodos. En este trabajo ponemos de manifiesto la gran
63
cantidad de elementos que condicionan un tamao de muestra mnimo y por lo tanto sugerimos un anlisis previo de los datos en los proyectos de investigacin llevados a cabo en modelado ecolgico. Generar un modelo de consenso con varias rplicas variando al azar los datos de partida puede mejorar la fiabilidad.
2.2. Introduccin
El modelado es una herramienta de gran importancia en muchos campos de investigacin donde no es fcil la observacin directa o la experimentacin. En el contexto de los modelos de distribucin de especies (MDE), y dependiendo del objetivo perseguido, los datos de partida pueden ser muy limitados, como por ejemplo las especies de distribucin restringida (Pearson et al., 2006a) o en peligro de extincin (Beguera, 2006), llegando incluso en algunas ocasiones a disponer de una nica presencia. Slo en raras ocasiones se dispone de una gran cantidad de informacin de partida (Zaniewski et al., 2002). La cantidad total de informacin disponible en las colecciones de historia natural es enorme, pero muy pocos organismos estn bien representados en dichas colecciones (Loiselle et al., 2008), y sus reas de distribucin completas son en gran medida hipotticas, por lo que son estas especies los principales objetivos del modelado ecolgico, lo que cierra un crculo vicioso de difcil solucin. Son muchos los factores que pueden afectar a la fiabilidad final de los modelos. Algunos trabajos han revisado los efectos de la parametrizacin y el funcionamiento comparativo de los mtodos disponibles (Guisan & Zimmermann, 2000; Guisan & Thuiller, 2005; Arajo & Guisan, 2006; Elith et al., 2006) (vase Tercera Parte); otros se han centrado en la falta de datos de ausencia (Zaniewski et al., 2002; Brotons et al., 2004; Pearce & Boyce, 2006; vase Segunda Parte); y otros han estudiado como afecta la ecologa de la especie (Manel et al., 2001; Luoto et al., 2005; Elith et al., 2006). Sin embargo, todava existen algunos factores del proceso en los que queda mucho trabajo por hacer, como la influencia del tamao mnimo de muestra y la prevalencia (proporcin de la clase sujeto) en los modelos generados. El tamao de muestra tiene una influencia potencial en la consistencia y fiabilidad de los modelos. Este efecto, combinado con las diferencias, a veces extremas, en los resultados de las diferentes tcnicas (Loisselle et al., 2003; Elith et al., 2006; Srgio et al., 2007), se convierte en un interesante campo de investigacin. En teora, la estabilidad y la consistencia de los modelos disminuye segn disminuye el tamao muestral, mientras que la fiabilidad final de los modelos debe aumentar con tamaos de muestra mayores (Stockwell & Peterson, 2002; McPherson et al., 2004; Hernandez et al., 2006; Wisz et al., 2008). Por lo tanto,
64
TAMAO MUESTRAL
para poder generar modelos fiables necesitamos un nmero mnimo de presencias. Por otra parte, la obtencin de datos sobre la distribucin de especies puede ser extremadamente complicada, especialmente en reas tropicales (Raven & Wilson, 1992), por lo que limitar el esfuerzo de muestreo al tamao mnimo apropiado permitira generar MDE fiables sin malgastar recursos valiosos. Varios trabajos han investigado el efecto de la prevalencia (proporcin de presencias en el juegos de datos para ejecutar el modelo) sobre la fiabilidad final de los modelos, con resultados muy diferentes (Tsoar et al., 2007). Algunos estudios documentan un efecto positivo de la prevalencia sobre la fiabilidad final de los MDE (Manel et al., 2001; Kadmon et al., 2003), otros uno negativo (Stockwell & Peterson, 2002; Segurado & Arajo, 2004), otros no encuentran ninguna relacin (Brotons et al., 2004; Jimnez-Valverde & Lobo, 2006), y otros finalmente, documentan una variacin en funcin del grupo biolgico (Pearce & Ferrier, 2000). Sin embargo, no se puede olvidar su efecto negativo a la hora de emplear estadsticos, como la Kappa de Cohen, que dependen de la prevalencia en su clculo (McPherson et al., 2004). Aunque existe un consenso sobre el efecto del tamao muestral en la fiabilidad de los MDE, muchos autores no lo tienen en cuenta, e incluso generan modelos empleando un nmero extremadamente bajo de presencias sin considerar las consecuencias potenciales. Como ejemplo podemos citar las 2 presencias utilizadas por Ortega-Huerta & Peterson (2004) o McClean et al. (2005), las 4 de Loisselle et al. (2003) o Cuesta-Camacho et al. (2006a), o las entre 7 y 12 presencias de Anderson & Martinez-Meyer (2004). Otros autores mencionan las desventajas potenciales de los tamaos muestrales pequeos (p. ej., Stockwell & Peters, 1999; Reese et al., 2005). Otros, cuyo objetivo de investigacin era diferente al efecto del tamao muestral, expresan su preocupacin por el tamao de muestra mnimo (Cumming, 2000a; Pearce & Ferrier, 2000; Drake et al., 2006; Loiselle et al., 2008). Finalmente, algunos trabajos han tratado en profundidad aspectos relativos a los efectos del tamao muestral sobre los modelos obtenidos con RLM, GARP y BIOCLIM en general (Stockwell & Peterson, 2002), sobre los modelos de especies de distribucin restringida empleando BIOCLIM, DOMAIN, GARP y MAXENT (Hernandez et al., 2006), sobre los efectos de la prevalencia en los MDE (McPherson et al., 2004), o sobre el comportamiento comparado de mtodos como GARP y MAXENT (Pearson et al., 2006a; Pape & Gaubert, 2007a), o una comparacin de 12 mtodos (Wisz et al., 2008). Enmarcado dentro de esta lnea de investigacin, el objetivo de este captulo es determinar el efecto del tamao de muestra sobre la fiabilidad y la estabilidad de los MDE generados mediante MARS, algo que no se ha hecho previamente. Con el nimo
65
de presentar resultados lo ms generalizables posible, hemos escogido dos juegos de datos con la intencin de abarcar las diferentes posibilidades existentes dentro del modelo ecolgico: 1) datos de slo presencia y pseudo-ausencias, frente a datos de presencias y ausencias reales; 2) conjunto de datos equilibrado (prevalencia del 50%) frente a desequilibrado; 3) pocas presencias frente a un elevado nmero de presencias.
2.3. Material y mtodos

2.3.1. Variables dependientes
Las variables dependientes seleccionadas fueron cuatro especies de plantas, agrupadas en dos tipos de conjuntos de datos que tratan de cubrir las diferentes dificultades que afectan a los mtodos de modelado ecolgico. Tambin representan dos reas biogeogrficas y climticas muy diferentes: Ecuador (tropical) y Espaa (eurosiberiana-mediterrnea) con esfuerzos de muestreo muy diferentes. Para todas las variables el tamao de celda se estableci en 0,00833 grados (~1 km en el ecuador).
Datos con elevado nmero de presencias, ausencias verdaderas y prevalencia desequilibrada.

Utilizamos datos de presencia/ausencia del haya europea (Fagus sylvatica L.) y del roble melojo (Quercus pyrenaica Willd.) tomados de una versin digital del "Mapa Forestal de Espaa" (Ceballos, 1966) (Fig. 2.1). La primera especie crece en las montaas del Norte de la Pennsula Ibrica y en el Sistema Central (Fig. 2.1.a). Su distribucin general abarca Europa central y occidental, desde la Pennsula Ibrica hasta Polonia y desde Escandinavia hasta Sicilia. La segunda crece en el centro y Norte de Espaa (Fig. 2.1.b). Su distribucin general abarca Francia, la Pennsula Ibrica y el Norte de Marruecos. En la tabla 2.1 aparecen representados los detalles del muestreo estratificado realizado. Hay seis tamaos muestrales diferentes (25%, 15%, 5%, 1%, 0,1% y 0,05% del total de datos). Consideramos el 25% de los datos de partida (3.734 presencias para F. sylvatica y 14.661 para Q.pyrenaica) como un tamao de muestra suficiente para representar la realidad fiablemente. Es el mximo tamao de muestra que permita el software utilizado y, en cualquier caso, es un nmero mucho mayor de lo que habitualmente se consigue tener en condiciones normales. El resto de modelos generados se compararon con este modelo de referencia (Hernandez et al., 2006) (Vase apartado 1.3.5). Para cada tamao muestral, excepto para el 25%, los
66
TAMAO MUESTRAL
dos juegos de datos fueron remuestreados al azar para generar 20 rplicas diferentes. Los datos de ausencias fueron extrados de bosques maduros diferentes al de la especie objeto de estudio, F. sylvatica o Q. pyrenaica, respectivamente. No se muestrearon zonas de cultivo o reas desforestadas, que pudieran representar reas potenciales para estas especies, con el objeto de minimizar los falsos negativos. Estos datos son un ejemplo de juego de datos con un elevado nmero de presencias, ausencias verdaderas y prevalencia desequilibrada.
Figura 2.1.a: distribucin del haya (color morado) en Espaa. Modificado de Ceballos (1966).
Figura 2.1.b: distribucin del roble melojo (color rojo) en Espaa. Modificado de Ceballos (1966).
67
Fagus sylvatica 25% 15% 5% 1% 0,1% 0,05% Quercus pyrenaica 25% 15% 5% 1% 0,1% 0,05%
Presencias 3.734 2.240 744 149 15 8 Presencias 14.661 8.800 3.090 590 84 29
Media de ausencias por rplica 106.330 63.780 21.275 4.250 430 215 Media de ausencias por rplica 132.000 79.200 27.800 5.300 770 260
Rplicas 1 20 20 20 20 20 Rplicas 1 20 20 20 20 20
Tabla 2.1. Nmero de presencias, nmero medio de ausencias por rplica y nmero de rplicas empleado en cada uno de los tamaos muestrales (25%, 15%, 5%, 1%, 0,1% y 0,05% del tamao original) para las especies de rboles. El 25% se considera el modelo de referencia.
Datos con pocas presencias, sin datos de ausencias y prevalencia equilibrada.

Empleamos datos de slo presencia de la base de datos TROPICOS del Missouri Botanical Garden (http://mobot.mobot.org/W3T/Search/vast.htlm) para dos especies endmicas de Ecuador: Anthurium dolichostachyum y A. mindense. La primera tiene un rea de distribucin occidental (Fig. 2.2), mientras que la segunda crece en ambas vertientes de los Andes (Fig. 2.2). En esta ocasin no disponemos de datos sobre ausencias, por lo que recurrimos a la generacin de pseudo-ausencias en aproximadamente igual nmero al de presencias. Para reducir el riesgo de generar falsas ausencias en reas de alta probabilidad de presencia, delimitamos un rea tampn de 30 kilmetros alrededor de cada presencia en la que no se generaron pseudo-ausencias (vase Segunda Parte). Para las dos especies de Anthurium disponemos originalmente de 72 presencias. Los dos juegos de datos fueron remuestreados al azar para generar 10 rplicas para cada uno de los siguientes tamaos muestrales: 60, 50, 40, 30, 25, 18 y 9. El modelo de referencia para las dos especies de Anthurium ser el modelo
68
TAMAO MUESTRAL
generado con todas las presencias disponibles (Hernandez et al., 2006). Con este modelo se comparan el resto de modelos generados. El estudio con estas especies se puede considerar como un ejemplo de datos con un bajo nmero de presencias, sin datos de ausencias y con una prevalencia equilibrada entre los datos de ausencia y presencia.
Figura 2.2. Datos de presencia originales de Anthurium dolichostachyum (puntos rojos en la imagen izquierda) y A. mindense (puntos morados en la imagen derecha).
2.3.2. Variables independientes

Para construir los MDE empleamos las 19 variables bioclimticas del proyecto WorldClim 1.3 (www.worldclim.org), descritas en detalle en Hijmans et al. (2005) (Vase Introduccin General).
2.3.3. Mtodo de modelado ecolgico: MARS

MARS (multivariate adaptive regression splines) fue propuesto originalmente por Friedman (1991), es un mtodo que ha demostrado ser fiable en modelado ecolgico (Moisen & Frescino, 2002; Muoz & Felicsimo, 2004; Leathwick et al., 2006b; Elith & Leathwick, 2007). Este mtodo combina regresin lineal convencional y binary recursive partitioning para producir un modelo donde la relacin entre las variables dependientes e independientes puede ser lineal o no. MARS aproxima la funcin final a travs de un sistema de regresiones lineales parciales denominadas funciones bsicas. La pendiente de las regresiones cambia en unos puntos denominados nodos, que marcan el final de una regin de datos y del principio de otra. El modelo generado en primer lugar est claramente sobreajustado a los datos, con un gran
69
nmero de nodos, y que posteriormente se simplifica eliminando los nodos que menos contribuyen a la eficiencia del modelo mediante validacin cruzada.
2.3.4. Comparacin entre MDE

En total se realizaron 101 modelos para cada uno de los rboles (1 modelo con el 25% de los datos, ms 20 rplicas por cada uno de los 5 tamaos muestrales), y 71 modelos para cada especie de Anthurium (1 modelo con todas las presencias originales, ms 10 rplicas por cada uno de los 7 tamaos muestrales). Para analizar si los modelos generados con pocas presencias eran estables y fiables se compararon, mediante el coeficiente de correlacin de Pearson, con el modelo de referencia (generado con todas las presencias disponibles en el caso del gnero Anthurium y con el 25% de los datos en el caso de las dos especies de rboles). Esta comparacin se realiz de dos formas diferentes: 1) para cada tamao muestral se compar el modelo de referencia con cada rplica y, posteriormente, se calcul el coeficiente de correlacin medio para cada tamao muestral; 2) para cada tamao muestral se gener un modelo de consenso de las rplicas, que posteriormente se compar con el modelo de referencia. Siguiendo a Hernndez et al. (2006), consideramos al modelo de referencia como el ms cercano a la distribucin potencial de una especie, para el mtodo y variables con las que estamos trabajando. Adems, se analiz la evolucin de la estabilidad de los modelos al disminuir el tamao muestral. Para ello calculamos la correlacin entre todos los pares de rplicas posibles dentro de cada tamao muestral. Utilizamos la desviacin estndar de la media de r como indicador de estabilidad.
2.4. Resultados
Al comparar mediante el coeficiente de correlacin de Pearson los MDE realizados con tamaos muestrales menores con el modelo de referencia se obtuvieron los siguientes resultados (Fig. 2.3): 1) los valores de r disminuyen con el tamao muestral, independientemente de la especie considerada; 2) para las cuatro especies analizadas, el coeficiente de correlacin del modelo de consenso (media de todos los modelos para un tamao muestral dado) es mayor que la media de los coeficientes de correlacin de las rplicas de ese tamao; y 3) el coeficiente de correlacin del modelo de consenso se comporta de una forma ms estable en las dos especies con mayor nmero de presencias que en las dos especies con pocas presencias.
70
TAMAO MUESTRAL
En las dos especies de rboles (haya y melojo) se observa una tendencia a la disminucin del coeficiente de correlacin medio de las rplicas al disminuir el tamao muestral (Fig. 2.3). La pendiente de la grfica se mantiene relativamente constante hasta alcanzar el mnimo tamao muestral (0,01%), donde se produce un descenso muy importante del coeficiente de correlacin. Este valor es mucho menor (0,34) en el caso del haya, donde el nmero de presencias es menor (8 presencias). Para el melojo, con un el tamao muestral de 29 presencias (0,01%) se obtiene un coeficiente de correlacin de 0,62. En el caso del haya, 15 presencias parecen suficientes para obtener un modelo comparable con el modelo de referencia, ya que se obtiene un coeficiente de correlacin de 0,70. En el caso del melojo, con 29 presencias (0,01% de la muestra original) se obtiene un coeficiente de correlacin medio similar (0,62). Desconocemos qu sucede con esta especie con tamaos muestrales menores, pero es lgico esperar una disminucin ms drstica del valor del coeficiente de correlacin, como sucede con las otras tres especies. Por otro lado, en las dos especies del gnero Anthurium (Fig. 2.3), el efecto del tamao de muestra es mucho ms dramtico. En todos los casos los valores del coeficiente de correlacin medio es inferior si lo comparamos con las dos especies de rboles ibricos, incluso para tamaos muestrales similares. A modo de ejemplo, para el melojo se obtiene un valor de 0,62 con un tamao muestral de 29 presencias (0,01%), mientras que para las especies de Anthurium se obtienen valores de 0,34 y 0,27 para 30 presencias. Para el haya se obtiene un valor de 0,70 con 15 presencias (0,05%), pero para las especies de Anthurium valores de 0,31 y 0,22 con 18 presencias. Si comparamos entre s las rplicas generadas dentro de cada tamao muestral, vemos como la desviacin estndar del coeficiente de correlacin aumenta al disminuir el tamao muestral (Tabla 2.4), y que en las dos especies de Anthurim presenta un comportamiento ms errtico que las dos especies de rboles. Este aumento de la desviacin nos indica que la estabilidad de los MDE est inversamente relacionada con el tamao muestral.
71
Fagus sylvatica
Media de r Desviacin estndar
Tamao muestral (20 rplicas) 2240

(15%)
744
(5%)
150
(1%)
15
(0,1%)
8
(0,05%)
0,821 0,105
0,825 0,072
0,674 0,122
0,588 0,153
0,145 0,255
Quercus pyrenaica
Tamao muestral (20 rplicas) 8800

(15%)
3090
(5%)
590
(1%)
85
(0,1%)
30
(0,05%)
0,917 0,043
0,811 0,114
0,714 0,162
0,664 0,219
0,413 0,205
Anthurium mindense
Tamao muestral (10 rplicas) 60 0,441 0,190 50 0,426 0,233 40 0,667 0,156 30 0,457 0,269 25 0,706 0,131 18 0,706 0,125 9 0,192 0,340
Anthurium dolichostachyum
Tamao muestral (10 rplicas) 60 0,463 0,191 50 0,394 0,255 40 0,270 0,233 30 0,271 0,228 25 0,304 0,203 18 0,251 0,237 9 0,209 0,311
Tabla 2.4. Comparacin entre las rplicas generadas para cada tamao muestral. Media de r = media del coeficiente de correlacin entre todos los pares de rplicas posibles dentro de cada tamao muestral. Desviacin estndar = desviacin estndar del coeficiente de correlacin entre todos los pares de rplicas posibles dentro de cada tamao muestral.
72
TAMAO MUESTRAL
Fagus sylvatica
Quercus pyreanica
Anthurium dolichostachyum
Anthurium mindense
Figura 2.3. Correlacin media resultante de la comparacin de cada una de las rplicas con el modelo de referencia (lnea discontinua y circunferencias) y correlacin de la comparacin del modelo de consenso de cada tamao muestral con el modelo de referencia (lnea continua y cuadrados negros).
73
2.5. Discusin
La generacin de modelos de distribucin de especies precisos, fiables y estables depende de muchos factores, algunos de ellos conocidos. El tamao de muestra es uno de los elementos que puede afectar de una forma ms drstica al resultado de cualquier trabajo de modelado ecolgico, como ya se ha puesto de manifiesto para otros mtodos de modelado ecolgico (p. ej., Wisz et al., 2008). Estos trabajos discrepan en cuanto al nmero de presencias mnimo para generar MDE fiables: 5 para MAXENT (Hernandez et al., 2006; Pearson et al., 2006a), 10 para GARP (Stockwell & Peterson, 2002), 15 para GARP y MAXENT (Pape & Gaubert, 2007b), 20 para RLM (Stockwell & Peterson, 2002), 40 para support vector machines (Drake et al., 2006), ms de 30 para 12 mtodos diferentes, incluidos GARP y MAXENT (Wisz et al., 2008), 300 para RLM (Cumming, 2000a). Se observan resultados muy variables incluso para el mismo mtodo. De acuerdo con los resultados obtenidos en este captulo pensamos que no se puede proporcionar una regla general con respecto al nmero mnimo de presencias correcto. Este nmero mnimo de muestra puede variar en funcin de mltiples factores, como por ejemplo la calidad de los datos originales, el mtodo de modelado ecolgico, las variables independientes, el tamao de celda, el rea de estudio, la ecologa de la especie (distribucin amplia o restringida), etc. Adems, el nmero apropiado depende del objetivo de cada proyecto. Por ejemplo, en trabajos con especies muy raras no existe otra opcin que realizar los MDE con muy pocos datos de presencia. En estas situaciones en las que una especie esta ntimamente asociada con un hbitat particular o un espacio geogrfico, los MDE pueden ser muy precisos incluso con un nmero muy bajo de presencias, ya que estas pocas presencias representan de forma fiable la variabilidad ecolgica en la que se desarrolla la especie, y generan por tanto MDE fiables (Hernandez et al., 2006; Pearson et al., 2006a). Estos MDE han demostrado su utilidad para descubrir nuevas poblaciones, incluso especies, o estrategias de conservacin, (Godown & Peterson, 2000; Raxworthy et al., 2003; Bourg et al., 2005; Guisan et al., 2006; Sattler et al., 2007). Pero esto no se puede convertir en una regla general, y no podemos aplicar este nmero mnimo de presencias a especies con una valencia ecolgica ms amplia. En este captulo, las cuatro especies analizadas presentan una valencia ecolgica relativamente amplia y una distribucin extensa, y puede considerarse por tanto como un estudio de aplicacin ms general. Aunque, como hemos dicho, no podemos hablar de un tamao de muestra mnimo valido para todas las opciones, s podemos analizar las tendencias generales y extraer conclusiones aplicables a casos concretos. En primer lugar, podemos confirmar que el tamao muestral empleado para generar MDE con MARS afecta
74
TAMAO MUESTRAL
drsticamente a su fiabilidad y estabilidad, algo ya demostrado para otros mtodos. Observamos una tendencia similar para las cuatro especies, pero el efecto es mucho ms drstico en el caso del gnero Anthurium. Ms adelante lo analizaremos ms detalladamente, pero parece deberse a la calidad de los datos de partida y la ecologa de las especies analizadas. Las dos especies de rboles, con un tamao muestral de partida alto, muestran un comportamiento similar, aunque es destacable que en el caso del haya se obtiene un modelo relativamente fiable y comparable con el modelo de referencia con un menor nmero de presencias que en el caso del melojo. Esto se debe con toda seguridad a los requerimientos ecolgicos de esta especie que, aunque de distribucin amplia, se caracteriza por un rango ecolgico ms limitado, lo que hace que sea ms fcil de modelizar con un menor nmero de puntos de presencia. Por otro lado, en las dos especies del gnero Anthurium (Fig. 2.3), en las que el tamao original de datos es muy reducido con respecto al de los rboles, el efecto del tamao de muestra es mucho ms dramtico. En todos los casos los valores del coeficiente de correlacin medio es inferior. En principio era de esperar un efecto contrario y que el coeficiete de correlacin de los modelos realizados con las especies de rboles fuera menor que en en las dos especies de Anthurium, ya que los modelos de referencia en el caso de los rboles estn realizados con un mayor nmero de datos, y por tanto la diferencia entre el modelo de referencia y el resto de modelos debera ser mayor. Esto se debe en gran medida a la menor fiabilidad de los datos almacenados en las colecciones de historia natural (Margules & Pressey, 2000; Soberon & Peterson, 2004; Rowe, 2005; Edwards et al., 2006; Pape & Gaubert, 2007b), incluso de las pseudo-ausencias (Vase Segunda Parte), lo que se traduce en casos atpicos, falsas ausencias y falsas presencias, que tienen un efecto negativo sobre la fiabilidad de los modelos, este efecto es an mayor segn disminuye el tamao de muestra (Carroll & Pearson, 1998). En las dos especies de Anthurium tambin se aprecia un descenso del coeficiente de correlacin medio, pero con un patrn diferente al que se observa en los dos rboles ibricos. Para los modelos realizados con 60, 50 y 40 presencias se aprecia un descenso importante del coeficiente de correlacin, se mantiene luego relativamente estable con los modelos realizados con 30, 25 y 18 presencias, y se produce por ltimo una cada importante para los modelos realizados con 9 presencias. Para ambas especies se obtienen valores anlogos del coeficiente de correlacin para todos los tamaos muestrales. Los valores similares de coeficiente de correlacin indican que prcticamente no existe ninguna diferencia entre emplear 40 y 18 presencias, pero s que parece desatinado emplear menos de
75
aproximadamente 18 presencias para realizar un MDE, ya que alrededor de este valor el coeficiente de correlacin disminuye drsticamente indicando que la fiabilidad de los modelos generados disminuye muy rpidamente. Por lo tanto, debemos interpretar los modelos generados con 18 presencias en el caso de genero Anthurium con bastante precaucin. Los datos de presencia son una representacin de las condiciones ecolgicas sobre las que se desarrolla la especie, por lo que nuestra interpretacin de estos resultados es que si empleamos pocos datos estamos muestreando estas condiciones parcialmente, y por tanto el modelo sera la representacin de una parte de la distribucin posible de la especie. Al disminuir el nmero de datos de partida tambin disminuimos el universo ambiental muestreado, por lo que la posibilidad de no reflejar la distribucin total de la especie aumenta y la estabilidad de los modelos disminuye. Este problema parece solucionarse con la generacin de un modelo de consenso (Arajo & New, 2007; Marmion et al., 2008) entre las diferentes rplicas de un mismo tamao muestral, que combina la informacin de los diferentes modelos parciales. Si analizamos la estabilidad de los MDE generados, observamos dos
comportamientos muy diferenciados para los dos grupos de datos. En las dos especies de rboles se observa un patrn muy claro: al disminuir el tamao muestral disminuye el coeficiente de correlacin medio (comparando todas las rplicas entre s dentro de un mismo tamao muestral) y aumenta la desviacin estndar (Tabla 2.4); es decir, la estabilidad de los modelos disminuye al disminuir el tamao muestral. El modelo de consenso se manifiesta ms fiable en las dos especies de rboles, donde disponemos de datos sobre la distribucin real de la especie y adems generemos un mayor nmero de rplicas para cada tamao muestral que para los Anthurium, con menor nmero de presencias y menor nmero de rplicas por tamao muestral. En el caso de las dos especies del gnero Anthurium, esta relacin no es tan evidente para el coeficiente de correlacin medio, se comporta de una forma mucho ms errtica (Tabla 2.4). Los valores de desviacin estndar son relativamente altos para todos los tamaos muestrales y para las dos especies son mayores (mxima variabilidad) cuanto menor es el tamao muestral. Como en el caso de las dos especies de rboles, con las dos especies de Anthurium el modelo de consenso muestra siempre una mayor correlacin con el modelo de referencia, pero a diferencia de los rboles, es muy inestable. Parece evidente que en especies con pocas presencias de partida, estos datos representan una informacin muy sesgada de la distribucin real, realidad que los modelos de consenso no pueden recuperar
76
TAMAO MUESTRAL
como sucede en el caso de las dos especies de rboles. Esto es especialmente claro con una inspeccin visual de los mapas, que nos permite extraer una conclusin importante: la inclusin o no de unas determinadas localidades tienen un efecto dramtico en el resultado final de los MDE. Seleccionando al azar las presencias con las que realizamos los MDE el resultado final del modelo vara enormemente (Pearson et al., 2006a), con efectos ms drsticos segn disminuimos el nmero de presencias. Parte de este efecto puede deberse al efecto de los casos atpicos, que aumenta su efecto negativo sobre el modelo segn disminuye el tamao de muestra. Como hemos visto, los modelos generados con los datos del gnero Anthurium son menos fiables y estables que los modelos generados con las datos del haya y del melojo. Este efecto se debe principalmente a cinco factores: 1) la cantidad y calidad de los datos de presencia de partida; 2) la menor fiabilidad de la pseudo-ausencias frente a las ausencias reales empleadas en el caso de las dos especies de rboles; 3) el conocimiento preciso de la distribucin de las especies en el caso de las dos especies de rboles; 4) el mayor nmero de ausencias precisas empleado en las especies de rboles aportan una informacin extra a los modelos que ayuda a delimitar las reas poco idneas para el desarrollo de las especies; y 5) la ecologa de las especies. Por lo tanto, una conclusin importante que podemos extraer de este anlisis es que el tamao muestra mnimo est estrechamente vinculado con la ecologa y distribucin de la especie, as como con la calidad de los datos de partida, tanto de presencias como de ausencias. MARS, como otros mtodos que modelizan relaciones complejas e interacciones entre varibles, se comporta como un mtodo que necesita muchos datos de presencia para producir buenos resultados (Guisan & Thuiller, 2005; Wisz et al., 2008), como se pone de manifiesto en este trabajo. Por tanto, para trabajar con especies que presentan un bajo nmero de presencias se sugiere trabajar con mtodos ms eficientes a tamaos muestrales bajos como por ejemplo MAXENT (Hernandez et al., 2006; Pearson et al., 2006a; Phillips et al., 2006; Pape & Gaubert, 2007b; Wisz et al., 2008). Los resultados obtenidos en este trabajo sugieren trabajar con un mnimo de 15 presencias, auque los resultados no son igual de fiables en todos los casos. Por ejemplo los modelos del haya realizados con 15 presencias se muestran mucho ms estables y fiables que los modelos del gnero Anthurium para 18 presencias. Por lo tanto no podemos establecer un criterio vlido para todas las opciones; ste depender de nuestros datos de partida y los objetivos de nuestro proyecto. Esto es extrapolable a todos los mtodos de modelado ecolgico, lo que hace necesario un
77
anlisis en detalle con varios tamaos muestrales y diferentes conjuntos de datos para obtener conclusiones robustas para un mtodo. Gran parte de los trabajos metodolgicos se llevan a cabo con datos colectados en zonas templadas, donde estn disponibles datos de buena calidad. Mientras que la mayora de los trabajos sobre priorizacin de zonas de conservacin y estudio de patrones de biodiversidad se llevan a cabo en zonas tropicales, donde generalmente los datos son ms problemticos. Como hemos visto en este trabajo, no se pueden extrapolar las conclusiones de un trabajo metodolgico desarrollado en zonas templadas a zonas tropicales; la calidad de los datos es inferior y esto puede conllevar graves riesgos para el resultado final del proyecto. Wisz & al. (2008) analizan MARS ejecutado en el software R, donde el cdigo de programacin no es el original de Friedman (1991). En ese trabajo slo se analizan tres tamaos muestrales (100, 30 y 10), cuando la mayora de los datos almacenados en las colecciones de historia natural presenta entre 30 y 10 presencias (Loiselle et al., 2008). De nuestros resultados tambin se pone de manifiesto la necesidad de seguir colectado datos, ya que la cantidad de datos almacenados en las colecciones de historia de natural no es suficiente para realizar modelos de distribucin de especies fiables desde el punto de vista estadstico, sobre todo en zonas tropicales, que son zonas prioritarias para la conservacin de la biodiversidad (Myers et al., 2000; Deutsch et al., 2008). Por lo tanto, es necesario invertir la tendencia a disminuir el nmero de expediciones que se realizan y seguir aumentando las esfuerzos en los sistemas de informacin sobre la biodiversidad (Bisby, 2000; Soberon & Peterson, 2004; Guralnick et al., 2007). Un mayor trabajo centrado en la coleccin de nuevos datos puede producir ms beneficios que emplear esfuerzos en desarrollar aproximaciones ms complejas a la hora de modelizar (Lobo, 2008). En los trabajos publicados en la actualidad se proponen medidas de
conservacin, diseo de reservas, efectos del cambio climtico, etc. Sin embargo, en algunos de estos trabajos no se considera un tamao de muestra mnimo para generar modelos estables y fiables; procedimiento que lleva asociado un grave riesgo de que los resultados obtenidos en estos trabajos puedan no ser fiables. Debido a la gran cantidad de factores que afectan al tamao mnimo de muestra para poder realizar modelos fiables y estables, sugerimos valorar y analizar el tamao de muestra mnimo debido al efecto drstico que tiene sobre la fiabilidad y estabilidad final de los MDE. Una buena prctica es emplear los MDE realizados con un bajo nmero de presencias para disear trabajos de campo orientados a recolectar ms datos, y con estos datos realizar MDE fiables y estables (Pearson et al., 2006a). Esta
78
TAMAO MUESTRAL
estrategia no es posible en todas las situaciones, debido al elevado coste en tiempo y dinero para recolectar nuevos datos, especialmente en zonas tropicales. En estas situaciones sugerimos no emplear datos que presenten un nmero insuficiente tamao de muestra en funcin del anlisis de tamao mnimo realizado.
79
SEGUNDA PARTE: Generando pseudo-ausencias y ausencias de grupo fiables. Comparacin de tcnicas descriptivas y discriminantes.
PSEUDO-AUSENCIAS. VALIDACIN
3. Generando pseudo-ausencias y ausencias de grupo fiables. Comparacin de tcnicas descriptivas y discriminantes

3.1. Resumen
Los datos de presencia almacenados en las colecciones de historia natural son la fuente de informacin disponible ms importante sobre la distribucin de los organismos. Para generar modelos de distribucin de especies (MDE) podemos emplear estos datos y tcnicas descriptivas, pero si queremos emplear tcnicas discriminantes, necesitaremos generar ausencias no reales (pseudo-ausencias). En este captulo comprobamos si los MDE generados con pseudo-ausencias son estadsticamente fiables y tambin si hay diferencias significativas entre los resultados obtenidos con tcnicas descriptivas y discriminantes. Los MDE se generaron mediante un conjunto de datos de 5 especies del gnero Anthurium en Ecuador y 6 mtodos diferentes: 2 descriptivos (BIOCLIM y DMG), 3 discriminativos (MARS, Maxent y RLM) y uno mixto (GARP). GARP y Maxent generan sus propias pseudo-ausencias, mientras que para MARS y RLM se generaron dos tipos de ausencias: 1) pseudo-ausencias al azar evitando una zona tampn alrededor de los datos de presencia; y 2) ausencias de grupo, una forma de generar datos de ausencia que consideramos en principio ms fiable que las pseudo-ausencias. Se trata de utilizar como ausencias localidades en las que se han colectado otras especies del grupo pero no la que se est modelizando. Para comparar los resultados y la consistencia de los MDE se calcul el estadstico AUC con un juego de datos independiente. Las principales conclusiones que podemos extraer de este estudio son: 1) las pseudo-ausencias generadas ayudaron a evitar falsas ausencias; 2) los MDE realizados con pseudo-ausencias son fiables; 3) los modelos realizados con ausencias de grupo se mostraron ms consistentes en lneas generales que los realizados con pseudo-ausencias; y 4) si trabajamos con datos almacenados en colecciones de historia natural, mtodos como MARS, Maxent y RLM producen mejores resultados que las tcnicas descriptivas, posiblemente porque la informacin recogida en las pseudo-ausencias o ausencias de grupo permite describir el entorno en el que no se desarrolla la especie.
83
3.2. Introduccin
El rea de distribucin de los organismos constituye la base fundamental para estudios de biogeografa, evolucin, conservacin, especies invasoras, diseo de reservas, patrones de biodiversidad, efectos del cambio climtico, etc. (vase Introduccin General); pero la distribucin de las especies se conoce de forma poco precisa, especialmente en las zonas tropicales (Raven & Wilson, 1992). El modelado ecolgico se ha convertido en una herramienta muy potente que nos permite generar modelos de distribucin de especies (MDE) que nos informan sobre la idoneidad de presencia de una especie en reas donde no disponemos de datos. Estos MDE se obtienen mediante una serie de mtodos que relacionan diferentes variables medioambientales y los datos disponibles de la distribucin de un organismo. En la mayora de los casos esta informacin solo est disponible en las colecciones de historia natural (CHN) (Arajo & Williams, 2000; Barry & Elith, 2006). Estas colecciones registran datos de slo presencia y no disponemos de informacin sobre los lugares donde la especie no est presente (ausencias). Algunos de los mtodos empleados en modelado ecolgico necesitan datos de ausencia para generar MDE (tcnicas discriminantes), mientras que otros se sirven exclusivamente de los datos de presencia (tcnicas descriptivas), tambin existen mtodos que emplean las dos estrategias (tcnicas mixtas). Los modelos generados con cada uno de estos mtodos pueden y de hecho suelen ser muy diferentes incluso partiendo de los mismos datos (Loisselle et al., 2003; Elith et al., 2006). Por todo esto, debemos ser rigurosos a la hora de aplicar estos resultados y comprobar la fiabilidad de las distintas opciones. Aunque dispongamos de datos de ausencia tomados en el campo es muy complicado comprobar que realmente estamos trabajando con ausencias reales. No detectar una especie en un determinado lugar no es equivalente a su ausencia (MacKenzie et al., 2002; Graham et al., 2004a). Contrastar la presencia de una especie en un lugar es factible y objetivo, pero contrastar su ausencia es ms complicado y subjetivo. En trabajos de modelado ecolgico el dato de ausencia de una especie slo es til cuando refleja condiciones ambientales que no permiten el desarrollo de esa especie (Ltolf et al., 2006). Los errores a la hora de considerar la ausencia de una determinada especie en un rea pueden deberse a varios factores (Ltolf et al., 2006), entre los que queremos destacar que no haya sido detectada en el lugar visitado, ya sea por no avistarla, por insuficiente trabajo de campo (tiempo y/o superficie), errores en la identificacin, falta de experiencia, insuficiente conocimiento de la fenologa o el ciclo biolgico de la especie, etc. Estos factores,
84
entre otros, han llevado a algunos autores a considerar los datos de ausencia como una funcin que expresa zonas donde la abundancia de la especie es menor (Brotons et al., 2004) o incluso datos ambiguos (Rotenberry et al., 2002) y no verdaderos datos de ausencia. Existen pocos estudios en los que se haya hecho un muestreo concreto para la obtencin especfica de ausencias reales con el objeto de usarlas en trabajos de modelado ecolgico (Elith, 2002; Elith et al., 2006; Feria et al., Under evaluation). Colectar datos de ausencia es una tcnica muy costosa en tiempo y dinero, sobre todo si trabajamos en reas tropicales. Por lo tanto, para poder generar MDE mediante tcnicas discriminantes (TDIS) tenemos que recurrir a ausencias no reales (Ponder et al., 2001), generadas al azar dentro del rea de estudio, y denominadas generalmente pseudo-ausencias (Zaniewski et al., 2002). La forma en que generamos estas pseudo-ausencias es muy importante, ya que tienen una influencia muy significativa en el resultado final el modelo (Zaniewski et al., 2002; Barry & Elith, 2006). Se han propuesto diferentes formas de generar pseudo-ausencias: 1) al azar y estableciendo una zona tampn alrededor de las presencias donde no se generan pseudo-ausencias (Hirzel et al., 2001); 2) en dos pasos, generando un MDE con una tcnica discriminativa y pseudo-ausencias generadas al azar para despus generar pseudo-ausencias slo en las reas que en el primer paso han dado valores menores de idoneidad (Zaniewski et al., 2002); 3) tambin en dos pasos, pero utilizando una tcnica descriptiva, ENFA, en el primer paso (Engler et al., 2004; Chefaouia & Lobo, 2008); y 4) utilizando datos de distribucin de especies con requerimientos ambientales similares denominadas especies auxiliares a las especies objeto de estudio (Ltolf et al., 2006). En todos los casos el peso individual de cada pseudo-ausencia puede ponderarse para alcanzar valores de prevalencia de 0,5, o no (p. ej., Ferrier et al., 2002). Se asume que estas pseudo-ausencias representan verdaderas ausencias. Pero, al igual que sucede con las datos de ausencia tomados en el campo, pueden representar puntos de presencia (falsas ausencias), sobre todo si hablamos de pseudo-ausencias generadas totalmente al azar (Engler et al., 2004). Por lo tanto las pseudo-ausencias pueden ser criticadas como datos arbitrarios y los MDE generados pueden no ser fiables. Existen algunos trabajos que valoran los resultados de los MDE obtenidos con pseudo-ausencias (Hirzel et al., 2001; Zaniewski et al., 2002; Brotons et al., 2004; Engler et al., 2004; Pearce & Boyce, 2006; Chefaouia & Lobo, 2008). Pero no se llega a una conclusin definitiva sobre la utilizacin de pseudoausencias, aunque se sugiere el empleo de alguna tcnica discriminativa frente a alguna descriptiva. Incluso alguno de estos trabajos sugiere continuar investigando
85
sobre la consistencia de los modelos realizados con datos de slo presencia (Pearce & Boyce, 2006). Adems de las anteriores, hay otras maneras de generar pseudo-ausencias ms reales que las generadas al azar, las aqu denominadas ausencias de grupo. Para generarlas recurrimos a la nica informacin disponible en la mayora de las ocasiones: las colecciones de historia natural, que slo recogen presencias. Estas ausencias de grupo son similares a las inventory pseudo-absences empleadas en los mtodos multirrespuesta, como por ejemplo MARS-Multirrespuesta (Elith et al., 2006; Elith & Leathwick, 2007). Estos modelos consideran que si un lugar ha sido visitado y una especie no ha sido recolectada en ese lugar se trata como una inventory pseudo-absence. Esta aproximacin ha sido muy poco empleada dentro de los trabajos de modelado ecolgico (Ltolf et al., 2006; Ferrier et al., 2007). Tericamente, es lgico pensar que aquellas localidades donde el especialista en un grupo taxmico (familia, gnero, etc.) ha colectado sin encontrar la especie diana puede ser con cierta probabilidad una localidad en la que no se encuentre dicha especie. Podemos considerar estas localidades como reas donde la probabilidad de encontrar la especie es baja y, por tanto, una ausencia, que hemos denominado ausencias de grupo (vase 3.3.5 Diseo Experimental). Es tambin lgico pensar que estas ausencias de grupo tengan un poder de discriminacin mayor que las pseudoausencias (Ltolf et al., 2006), lo que resultara en modelos ms fiables. Los objetivos de este captulo son, por tanto: 1) desarrollar una nueva forma de generar ausencias basada en colecciones de historia natural (slo presencias); 2) evaluar su consistencia; 3) evaluar la consistencia de modelos obtenidos utilizando pseudo-ausencias generadas al azar; 4) comparar ambas consistencias para decidir si el uso de pseudo-ausencias aleatorias es o no rechazable; 5) comparar los resultados obtenidos con 6 mtodos empleados en modelado ecolgico para contrastar que tcnicas son ms consistentes, las discriminantes o las descriptivas; y 6) evaluar las ventajas y desventajas de las diferencias opciones.

3.3.1. rea de estudio
El rea de estudio es el pas de Ecuador (Vase Introduccin General). Se seleccion este pas principalmente por encontrarse en zonas tropicales, donde los trabajos de recoleccin de datos son menos frecuentes y los datos de ausencia no son nada habituales.
86
3.3.2. Variable dependiente

Los datos de slo presencia empleados en este trabajo provienen de la base de datos TROPICOS (Missouri Botanical Garden; http://mobot.mobot.org/W3T/Search/ vast.htlm). Usamos todos los datos disponibles para el gnero Anthurium (Araceae) en Ecuador. Al comienzo de este estudio no disponamos de ausencias documentadas de ninguna de las especies del gnero. Estas colecciones se convirtieron en archivos rster con tamao de pxel de 0,0083 (~1 km). En esta transformacin algunas colecciones coinciden en el mismo pxel, por lo que pasan a ser una nica presencia (Tabla 3.1). Este gnero ha sido intensamente estudiado y colectado en Ecuador por su especialista, Thomas B. Croat (783 colecciones y 236 localidades en TROPICOS; Croat, 1979;1983;1992;1995;1999) (Fig. 3.1). Del conjunto de especies del gnero Anthurium seleccionamos aqullas para cuales haba un mnimo de 18 presencias (vase Primera Parte) colectadas por T. B. Croat, lo que result en un total de cinco: A. dolischostachium Sodiro, A. harlingianum Croat, A. propinquum Sodiro, A. truncicolum Engl. y A. versicolor Sodiro. EJECUCIN ESPECIES A. dolichostachyum A. harlingianum A. propinquum A. truncicolum A. versicolor C 106 39 39 66 126 P 79 32 34 52 97 PC 47 18 22 23 44 PS-A 37 19 26 29 37 AG 42 15 22 23 43 VALIDACIN P-V 32 14 12 29 53 AG-V 20 22 21 18 29
Tabla 3.1. Datos de presencia y ausencia de cada una de las especies incluidas en este trabajo. C = colecciones en TROPICOS; P = presencias nicas; PC = presencias nicas de T. B. Croat (presencias para generar el modelo); PS-A = pseudo-ausencias (ausencias para generar los modelos); AG = Ausencias de grupo (ausencias para generar los modelos); P-V = presencias de otros autores (presencias para validar el modelo); AG-V = ausencias de grupo para validar el modelo.
Anthurium es un gnero de distribucin neotropical, el ms abundante de su familia (Araceae). En Ecuador habitan 227 txones, de los cuales 145 son endmicos de este pas (Croat, 1999). Las cinco especies seleccionadas para este captulo presentan distribuciones geogrficas, y por tanto apetencias ecolgicas, diferentes: 1) A. dolischostachium (0-2000 m) es una especie endmica de la costa y del rea
87
occidental de los Andes; 2) A. harlingianum (0-2000) crece en la Amazona y en el piedemonte los Andes orientales; 3) A. propinquum (0-2000 m) es tpico de la costa y zona basal de los Andes occidentales. 4) A. truncicolum (0-2500 m) crece en la base de las dos vertientes de los Andes y menos frecuentemente en la costa y la Amazona; y 5) A. versicolor (0-2500 m) que crece en la base de los Andes, tanto orientales como occidentales, es frecuente en la costa septentrional (Esmeraldas) y espordico en la Amazona (Croat, 1999).
Figura 3.1. Puntos de muestreo de Thomas B. Croat en Ecuador incluidos en TROPICOS.

Las variables independientes son las 19 variables bioclimticas (Hijmans et al., 2005) de WorldClim 1.3 (http://www.worldclim.org), derivadas de la temperatura y la precipitacin media mensual y un modelo digital del terreno (Vase Introduccin General).
3.3.4. Mtodos de modelado ecolgico

Los MDE se generaron mediante seis mtodos diferentes (Vase Introduccin General para una descripcin detallada de los mtodos y la parametrizacin empleada), que podemos agrupar en:
Tcnicas discriminantes (TDIS)

Son aquellos mtodos que necesitan ausencias para generar MDE. En este caso hemos empleado tres: RLM (regresin logstica mltiple), MARS (multivariate adaptive regression splines) (Friedman, 1991) y MAXENT (maximum entropy) (Phillips et al., 2006). El primero de ellos se ha empleando de forma constante en
88
modelado ecolgico (Augustin et al., 1996; Narumalani et al., 1997; Guisan et al., 1998; Felicsimo et al., 2002). MARS es un mtodo ms reciente, pero ha demostrado presentar resultado ptimos (Muoz & Felicsimo, 2004; Elith et al., 2006; Leathwick et al., 2006b). Para estos dos mtodos generamos los MDE empleando dos tipos de ausencias: pseudo-ausencias y ausencias de grupo. MAXENT tambin se trata de un mtodo recientemente empleado que ha demostrado buenos resultado (Elith et al., 2006; Feria et al., Under evaluation), este mtodo genera sus propias pseudo-ausencias (background), aunque se le puede forzar a utilizar pseudo-ausencias definidas por el investigador.
Tcnicas descriptivas (TDES)

Slo emplean la informacin disponible en las presencias para generar MDE. Empleamos dos mtodos: un mtodo de envuelta ambiental, BIOCLIM (Busby, 1986;1991) y un ndice de distancia de Gower (Carpenter et al., 1993). Son dos mtodos empleados de forma frecuente en modelado ecolgico (Carpenter et al., 1993; Kirilenko & Solomon, 1998; Pearson & Dawson, 2003; Vargas et al., 2004; Luoto et al., 2005; Heikkinen et al., 2006a; Heikkinen et al., 2006b; Rahbek et al., 2006; Yesson & Culham, 2006; Luoto et al., 2007).
Tcnicas mixtas
En este caso empleamos GARP (genetic algorithm for rule-set production) (Stockwell & Peters, 1999) uno de los mtodos ms empleados en modelado ecolgico. Genera un modelo mediante un conjunto de reglas (atmicas, regresin logstica, envueltas ambientales, reglas de rango, etc.), empleando algunas de ellas datos de slo presencia, mientras que otras necesitan datos de presencia/ausencia para los que el programa genera sus propias pseudo-ausencias (background).
3.3.5. Validacin de los mtodos

Para evaluar la consistencia y la fiabilidad de los 8 MDE generados para cada una de las cinco especies calculamos el estadstico AUC (area under the curve ROC) para un juego de datos independientes (vase diseo experimental).
3.3.6. Diseo experimental

Para el juego de datos de generacin se utilizaron como presencias las colecciones realizadas por T. B. Croat (PC) para cada una de las especies, y como ausencias, para las tcnicas que las necesitan, se tomaron al azar entre las ausencias de grupo (AG) generadas o bien se crearon pseudo-ausencias al azar (PSA) (Fig. 3.2).
89
Para generar ausencias de grupo (AG) empleamos los registros del gnero Anthurium en la base de datos TROPICOS, y consideramos AG aquellas localidades donde el especialista del grupo recolect especies del gnero Anthurium pero no encontr la especie que estamos modelizando en este momento. Se puede suponer que un especialista colectar todas las especies de su grupo en las localidades que visita. Por lo tanto, podemos considerar aquellas localidades donde no encontr una especie como reas donde la probabilidad de encontrar esta especie es muy baja y por tanto ausencias en el sentido que expresan Brotons et al. (2004) (Tabla 3.1) (Fig. 3.2). En realidad, cuando se realizan campaas de campo con el objetivo de colectar datos de ausencia se procede de una forma similar (Feria et al., En revisin). Por otro lado, generamos pseudo-ausencias al azar (PS-A) mediante la extensin Ramdom Point Generador 1.28 en ArcView 3.2, teniendo en cuenta las siguientes condiciones: 1) para dar la misma importancia en el anlisis a las presencias y pseudo-ausencias generamos, aproximadamente, el mismo nmero de pseudoausencias que de presencias para ejecutar el modelo (Titeux, 2006); 2) para evitar problemas de autocorrelacin espacial y cubrir la mxima superficie posible, recogiendo informacin de las diferentes condiciones ecolgicas (Pearson et al., 2006a; Elith & Leathwick, 2007), impusimos una distancia mnima de 30 km entre cada una de las pseudo-ausencias generadas; y 3) con el objetivo de reducir la posibilidad de falsas ausencias, que puedan disminuir la fiabilidad de los MDE (Anderson, 2003; Loisselle et al., 2003), se gener un zona tampn de 30 kilmetros alrededor de cada una de las presencias donde no se permiti que se situaran pseudo-ausencias (Fig. 3.3). En principio, el tamao de la zona tampn podra ser una medida aleatoria o establecida en funcin de alguna caracterstica de la especie, como la capacidad de dispersin (Graham & Hijmans, 2006). En nuestro caso, la distancia de 30 kilmetros fue calculada a partir de la informacin contenida en los mapas en funcin del tamao de celda. Se duplic consecutivamente el tamao de celda de una serie de MDE obtenidos para esta tesis y se calcul la informacin contenida en cada uno de los mapas reescalados mediante la frmula de entropa de Shannon:
H = p (i ) log p(i )
i =1
Los resultados (Fig. 3.4) muestran que la informacin contenida en los mapas reescalados se mantiene constante hasta alcanzar un tamao de pxel de 0,256 (~32 km en el Ecuador), por lo que este valor fue seleccionado como radio del tampn alrededor de cada presencia.
90
DATOS PARA LA EJECUCIN DEL MDE
PC (Presencias de T. Croat para una especie)
Datos de slo presencia del gnero Anthurium
AG (ausencias)
(pseudo-ausencias)
PS-A
BIOCLIM & DMG
GARP & MAXENT
MARS & RLM
8 MDE por cada una de las especies DATOS PAR LA VALIDACIN
Validacin (AUC)
AG-V (ausencias)
P-V (presencias de otros colectores para una especie)

Figura 3.2. Esquema que representa el diseo experimental de este trabajo.
Una vez generados todos los MDE (8 para cada una de las especies) los validamos mediante el estadstico AUC y un juego de datos independiente. Para este conjunto de datos empleamos como presencias las localidades donde autores diferentes al especialista haban colectado la misma especie (P-V), y como ausencias se seleccionaron al azar ausencias de grupo (AG) diferentes a las empleadas para generar el modelo (AG-V) (Tabla 3.1). Para evitar sesgos en la identificacin, todas las colecciones de otros autores utilizadas en esta fase del trabajo haban sido revisadas o identificadas por T. B. Croat (Croat, 1999).
91
Figura 3.3. Presencias de Anthurium dolischostachium (puntos amarillos), rea tampn de 30 kilmetros (crculos grises) y pseudo-ausencias (interrogaciones blancas) generados para esta especie.
0.008
0.016
0.032
0.064
0.128
0.256
0.512
1.024
-3.00 -3.50 Entropa -4.00 -4.50 -5.00 -5.50 -6.00 Tamao de celda
Figura 3.4. Relacin entre la informacin contenida en un mapa y el tamao de celda. Hasta un tamano de pxel de 0.256 (~32 km) no se produce una disminucin de dicha informacin.
Anthurium mindese; = Anthurium dolichostachyum; = Quercus pyrenaica.; sylvatica
= Fagus
3.4. Resultados
3.4.1. Comparacin de los resultados de mtodos y tcnicas
En las figuras 3.5 y 3.6 representamos como ejemplo los MDE obtenidos para la especie con ms datos de presencia (Anthurium dolischostachium), en donde se aprecian diferencias importantes entre los diferentes modelos. La Tabla 3.2 muestra los valores de AUC para cada modelo. Los valores medios de AUC ms altos se obtienen cuando empleamos RLM, MARS y MAXENT, frente a tcnicas que utilizan slo presencias o GARP. Si analizamos cada una de las especies por separado los resultados son similares.
92
Figura 3.5. Mapas de riqueza potencial obtenidos mediante BIOCLIM, DMG, GARP y MAXENT. Los dos primeros solo necesitan presencias, mientras que los dos ltimos generan internamente sus propias pseudo-ausencias, denominadas en ambos casos background points.
93
Figura 3.6. Mapas de diversidad potencial obtenidos utilizando RLM y MARS. Las pseudoausencias son ausencias generadas al azar, mientras que las ausencias de grupo son localidades en las que el especialista del grupo ha colectado otras especies del gnero pero no la que modeliza en ese momento.
94
ESPECIES A. dolichostachyum A. harlingianum A. propinquum A. truncicolum A. versicolor MEDIA
BIOCLIM 0,770 0,786 0,750 0,708 0,570 0,716
DMG 0,804 0,932 0,800 0,759 0,694 0,797
GARP 0,816 0,813 0,810 0,602 0,609 0,730
MAXENT 0,880 0,951 0,988 0,791 0,705 0,855
MARS AG 0,909 0,968 0,972 0,667 0,862 0,875
MARS PS-A 0,873 0,877 0,984 0,655 0,635 0,804
RLM AG 0,961 0,929 0,851 0,812 0,692 0,849
RLM PS-A 0,853 0,864 0,873 0,828 0,772 0,838
Tabla 3.2. Valores del estadstico AUC para las diferentes especies y mtodos. En negrita aparecen destacados los dos mejores valores para cada especie. AG = Ausencias de grupo; PS-A = Pseudo-ausencias.
3.4.2. Comparacin entre ausencias de grupo y pseudo-ausencias

Con MARS, cuatro de los cinco MDE generados con ausencias de grupo producen modelos ms consistentes (mayor valor de AUC), que los generados con pseudoausencias. Mientras que con RLM, tres de los cinco modelos presentan mayor consistencia utilizando pseudo-ausencias (Tabla 3.2). Con ambos mtodos el valor medio de AUC es mayor para los modelos generados con ausencias de grupo (Tabla 3.2).
3.5. Discusin
3.5.1. Comparacin de los resultados de mtodos y tcnicas
Los mayores valores de AUC, que reflejan modelos ms consistentes y fiables, se obtienen con los mtodos que emplean presencias y ausencias (MARS, RLM y MAXENT), algo ya documentado por otros autores (Guisan et al., 2002; Brotons et al., 2004; Segurado & Arajo, 2004). En estos mtodos las ausencias ayudan a definir las reas donde no se desarrolla la especie (Brotons et al., 2004), especialmente si el rea de trabajo es pequea (Lobo, 2008). Si las ausencias (pseudo-ausencias, ausencias de grupo, etc.) que empleamos reflejan reas poco favorables para el desarrollo de la especie, los mtodos pueden obtener informacin extra, mejorando sus resultados (Hirzel et al., 2001). Pero cuando se trata de falsas ausencias pueden inducir a errores y disminuir el poder predictivo de los modelos (Solow, 1993; Welsh et al., 1996a). Adems, las tcnicas descriptivas se ven ms afectadas por los posibles errores de los datos de partida (Guisan et al., 2007b). Los mtodos que ofrecen peores resultados son algunos de los ms utilizados en el pasado: GARP, DMG y BIOCLIM. Estos resultados estn en consonancia con los obtenidos por Elith et al. (2006), quienes ponen de manifiesto que los algoritmos de nueva generacin, como MARS o MAXENT ofrecen mejores resultados.
95
Si analizamos los mapas de hbitat potencial que hemos generado para Anthurium dolischostachium (Fig. 3.5 y 3.6), y tenemos en cuenta que en este caso los algoritmos que ofrecen mayores valores de AUC son RLM, MARS y MAXENT, parece evidente que los menores valores de AUC obtenidos con DMG y BIOCLIM se deben a un problema de sobreajuste (Engler et al., 2004; Chefaouia & Lobo, 2008), provocado por un incremento en el error de omisin. Sin embargo, con GARP sucede todo lo contrario, ya que esta tcnica sobrepredice la distribucin de esta especie al producirse un incremento del error de comisin (Hernandez et al., 2006). En el caso de DMG y BIOCLIM, este efecto parece deberse a la no utilizacin de ausencias y, por tanto, de informacin climtica de los lugares desfavorables (Pearson et al., 2006b; Chefaouia & Lobo, 2008). DMG es el mtodo descriptivo que obtiene los valores de AUC ms cercanos a los valores obtenidos con las tcnicas discriminantes (Tabla 3.2). No obtiene mejores resultados que los MDE generados con MAXENT o con MARS y RLM mediante ausencias de grupo, pero para algunas especies s obtiene mejores resultados para los MDE generados mediante pseudo-ausencias con MARS (A. harlingianum, A. truncicolum y A. versicolor) y RLM (A. harlingianum). La utilizacin de este mtodo puede ser adecuada cuando dispongamos de pocas presencias para una determinada especie, de esta forma se puede dirigir una nueva campaa de coleccin con la que realizar modelos ms fiables. MARS obtiene los mejores resultados si empleamos ausencias de grupo (valor medio de AUC = 0,875), sin embargo la consistencia de los MDE generados con pseudo-ausencias disminuye considerablemente (0,804). La RLM se comporta de una forma ms estable, y prcticamente no existen diferencias en el valor de medio AUC entre los modelos generados con ausencias de grupo (0,849) y pseudo-ausencias (0,838). Los modelos ms consistentes se obtienen con MARS, RLM y MAXENT, por lo que la utilizacin de cualquiera de estos mtodos estara justificada cuando trabajamos con datos almacenados en colecciones de historia natural. MARS, en nuestra opinin, tiene como ventaja que los modelos son fcilmente interpretables, tanto desde el punto de vista estadstico como ecolgico (Muoz & Felicsimo, 2004; Austin, 2007; Elith & Leathwick, 2007), mientras que los generados con MAXENT no lo son tanto. Como contrapartida, en MAXENT no es necesario generar pseudo-ausencias, se ejecuta con un solo software, sus resultados son ms estables, y adems parece tener muy buenos resultados para tamaos de muestra pequeos (Hernandez et al., 2006; Pearson et al., 2006a; Phillips et al., 2006; Pape & Gaubert, 2007b; Wisz et al., 2008). Se puede concluir que el empleo de MARS est indicado cuando queremos
96
realizar un anlisis en detalle y tenemos datos para generar ausencias de grupo, y el de MAXENT cuando queremos modelizar gran cantidad de especies y no necesitamos un anlisis detallado, o para aquellas especies que tienen pocas presencias, como una base para realizar nuevas campaas de coleccin (Pearson et al., 2006a). La regresin logstica es un mtodo que asume una relacin lineal entre la variable dependiente y las independientes, algo que no siempre es cierto en la naturaleza, por lo que parece ms adecuado el uso de MARS o Maxent.
3.5.2. Comparacin entre ausencias de grupo y pseudo-ausencias

Nuestros resultados indican que los MDE generados con pseudo-ausencias son lo suficientemente fiables para ser empleados en trabajos de modelado ecolgico. Se obtienen unos valores de AUC elevados, similares a los obtenidos con modelos realizados con ausencias de grupo. Adems, en ambas situaciones (MDE generados con pseudo-ausencias o ausencias de grupo) 8 de los 10 MDE generados tienen un AUC por encima de 0,7, un valor considerado en la bibliografa como suficiente para emplear MDE en trabajos de conservacin (Pearce & Ferrier, 2000; Elith & Leathwick, 2007), aunque debe tomarse en consideracin lo expuesto por Lobo et al. (2007) y Peterson et al. (2008b). Estos valores elevados de AUC pueden ser debidos a que se han minimizado las falsas ausencias al excluirse zonas tampn prximas a las presencias conocidas, que en principio son reas propicias para el desarrollo de la especie. Se consigue as incluir tambin en el modelo la informacin sobre las reas no favorables, que permiten generar modelos ms reales. Por otro lado, hemos comprobado que una forma fiable de generar ausencias si partimos de datos de slo presencia es elegir aquellas localidades visitadas por el especialista del grupo en las que la especie diana no fue colectada (ausencias de grupo). Hemos comprobado como los MDE generados con estas ausencias, en lneas generales, tienen mayor consistencia que los MDE generados con pseudo-ausencias. Lamentablemente, este tipo de anlisis slo lo podremos realizar cuando dispongamos de datos suficientes. En los casos en los que slo disponemos de informacin de una especie, o de pocas presencias, recurrir a pseudo-ausencias generadas al azar delimitando una zona tampn parece una buena solucin. Una ventaja adicional de los modelos generados con pseudo-ausencias es que con ellas se puede muestrear toda el rea de estudio, lo que aporta informacin muy til a la hora de construir el modelo. Esta puede ser la razn por la que los MDE generados con pseudo-ausencias pueden presentan mejores resultados que los MDE generados con AG en algunas ocasiones (Elith & Leathwick, 2007; Chefaouia & Lobo, 2008). Tambin es importante tener en cuenta que la posibilidad de crear falsas ausencias
97
disminuye segn aumenta la extensin del rea de estudio (Lobo, 2008). La conclusin es que es preferible emplear pseudo-ausencias si el nmero de AG que podemos generar es escaso. En este estudio hemos utilizado el gnero Anthurium como caso problema. Existen pocos juegos de datos tan completos como ste y con un trabajo de campo tan exhaustivo por el especialista del gnero. Pero podemos generar AG empleando otros juegos de datos ms sencillos y comunes en las colecciones de historia natural: 1) seleccionar grupos ms amplios (por ejemplo familias); 2) considerar ausencias aquellas localidades que han sido visitadas por cualquier colector y donde no se ha colectado la especie diana, paralelamente a las inventory pseudo-absence de los mtodos multirrespuesta (Elith & Leathwick, 2007).
3.5.3. Delimitacin de reas tampn al generar pseudo-ausencias al azar

En este trabajo proponemos crear una zona tampn alrededor de los datos de presencias reales en donde no permitimos que se generen pseudo-ausencias. Se plantea como una forma rpida de disminuir la posibilidad de falsas ausencias, ideal en proyectos en los que se trabaja con un gran nmero de organismos. Los resultados obtenidos en este captulo demuestran buenos resultados. Aunque si trabajamos con un pequeo nmero de especies y disponemos de datos para crear suficientes ausencias de grupo, stas se muestran ms eficaces y se obtienen MDE ms consistentes, aunque son ms costosas en cuanto al tiempo de realizacin.
3.5.4. Comparacin de los resultados entre especies

Los MDE de especies con rangos y tolerancias medioambientales amplias suelen ser menos consistentes que los MDE de especies con un rango de distribucin ms restringido y tolerancias medioambientales ms limitadas (Manel et al., 2001; McPherson et al., 2004; Luoto et al., 2005; Elith et al., 2006; Feria et al., En revisin). Este hecho se pone de manifiesto en nuestro trabajo, donde se obtienen los peores resultados para todos los mtodos con las dos especies que presentan una distribucin amplia (Anthurium truncicolum y A. versicolor), que se desarrollan en ambas vertientes de los Andes. Mientras que para las otras tres especies que presentan una distribucin ms restringida se obtienen MDE con una consistencia sensiblemente ms elevada. Este comportamiento es independiente del tamao de muestra, puesto que se obtienen buenos resultados con las tres especies que presentan tamaos de muestra relativamente pequeos: Anthurium harlingianum (18 PC), A. propinquum (22 PC) y A. truncicolum (23 PC). En general, todos los
98
mtodos generan MDE con una consistencia alta por encima de un tamao muestral mnimo (vase Primera Parte), a partir del cual parece tener ms importancia la ecologa de la especie que el tamao de muestra (Hernandez et al., 2006). Otra conclusin que podemos extraer es que con las especies con las que se obtienen resultados pobres con una tcnica, se obtienen resultados igualmente pobres con otras tcnicas, algo que ya apuntaron Guisan & al. (2007b).
3.5.5. Conclusiones
La principal conclusin que se puede extraer de este captulo es que cuando trabajamos con colecciones de historia natural los MDE generados con LMR, MARS y MAXENT utilizando ausencias de grupo (AG) o pseudo-ausencias con zonas tampn, son robustos y fiables. Cada una de las opciones examinadas en este captulo presenta sus ventajas y desventajas, por lo que se sugiere su empleo en trabajos de modelado ecolgico, siempre teniendo en cuenta las particularidades de cada uno de opciones. Estas particularidades han sido examinadas en este captulo y se sugiere el empleo de las diferentes opciones en funcin de los datos disponibles y los objetivos del trabajo. Podemos destacar las ms importantes: 1) usar tcnicas discriminantes frente a descriptivas; 2) emplear ausencias de grupo frente a pseudo-ausencias si nuestros datos de partida nos lo permiten; 3) emplear pseudo-ausencias con una zona tampn como una forma de evitar posibles falsas ausencias, si nuestros datos no nos permiten generar suficientes ausencias de grupo; 4) utilizar MARS cuando nuestro objetivo es realizar un anlisis en detalle y tenemos datos para generar suficientes ausencias de grupo; y 5) aplicar MAXENT cuando trabajamos con gran cantidad de especies y no necesitamos un anlisis detallado, o para aquellas especies que tienen pocas presencias. Otras conclusiones que hemos extrado de este captulo son: 1) los datos de ausencia ayudan a definir las reas donde no se desarrolla la especie; 2) DMG y BIOCLIM parecen tener problemas de sobreajuste, aunque DMG es la tcnica descriptiva que mejores resultados obtiene; 3) GARP parece tener problemas de sobreprediccin; 4) MARS es menos estable frente a las pseudoausencias que RLM; y 5) por encima de un tamao muestral mnimo parece tener ms importancia la ecologa de la especie que el tamao de muestra. Se propone como futura lnea de investigacin contrastar los MDE generados con ausencias de grupo o pseudo-ausencias y zonas tampn con aquellos MDE generados mediante otro tipo de pseudo-ausencias: totalmente al azar, pseudo-ausencias ponderadas, etc.
99
TERCERA PARTE: Modelando patrones de diversidad. Comparacin de diferentes mtodos, estrategias, aproximaciones y corrientes.
PATRONES DE DIVERSIDAD. VERIFICACIN
4. Modelando patrones de diversidad. Comparacin de diferentes mtodos, estrategias, aproximaciones y corrientes

4.1. Resumen
El conocimiento de los patrones espaciales de la biodiversidad es un criterio bsico para establecer el diseo de una red de Espacios Naturales Protegidos (ENP). Aunque las colecciones almacenadas en herbarios recogen una cantidad enorme de informacin sobre la distribucin de las plantas, esos datos estn dispersos y no proporcionan una cobertura espacial completa. Sin embargo, las tcnicas de modelado ecolgico se pueden aplicar a estos datos generando modelos que reflejan la distribucin potencial de una determinada especie en funcin de un determinado grupo de variables ambientales independientes. Estos modelos se conocen como: modelos de distribucin de especies (MDE) y proporcionan una cobertura espacial completa. La combinacin de estos MDE a nivel especfico nos permite generar mapas de riqueza (alfa diversidad) a nivel de comunidad. A la hora de realizar modelos a nivel especfico y comunitario existen una amplia variedad de mtodos, estrategias, aproximaciones y corrientes. Para obtener resultados fiables todas estas opciones deben ser evaluadas rigurosamente, y con este objetivo construimos MDE para 397 especies (nivel especfico) de seis familias de plantas vasculares en Ecuador, y nueve mapas de riqueza especfica (nivel comunitario) empleando cinco mtodos (DMG, GARP, MARS, MAXENT y RLM), diferentes estrategias, aproximaciones y corrientes. La consistencia a nivel especfico se ha evaluado mediante el estadstico AUC (rea bajo la curva ROC). A nivel de comunidad, los nueve mapas de alfa biodiversidad se han comparado entre s mediante el coeficiente correlacin de Pearson. A su vez, estos mapas fueron comparados con datos de los patrones altitudinales de biodiversidad obtenidos por un especialista. Los modelos de MARS presencia/ausencia, MAXENT y un modelo de consenso obtuvieron los valores ms elevados de AUC y sus patrones altitudinales de biodiversidad son similares a los que se observan en la realidad; se aconseja su utilizacin en trabajos relacionados con la conservacin y los patrones de biodiversidad. La colaboracin con otros especialistas (botnicos, eclogos, zologos, etc.) se hace imprescindible en el futuro del modelado ecolgico. La continuacin del Choc colombiano y los bosques hmedos de la regin tropical de los Andes (1000 2500 m) presentan los mayores valores de diversidad
103
vegetal potencial y deben, por tanto, ser una prioridad en el diseo de estrategias de conservacin en Ecuador.
4.2. Introduccin
Ecuador es uno de los pases ms biodiverso de todo el Planeta (vase Introduccin General). Alberga ms de 16.000 especies de plantas vasculares (Jrgensen & Len-Ynez, 1999; Kareiva & Marvier, 2003), de las que ms de 4.000 son endmicas del pas (Valencia et al., 2000), y alrededor de 2.400 especies de vertebrados. La tendencia mundial a la prdida de biodiversidad (Pimm et al., 1995; Chapin et al., 2000) implica un grave problema en Ecuador, especialmente en las zonas menos elevadas del suroeste del pas (Best & Kessler, 1995).
4.2.2. Diseo de Espacios Naturales Protegidos (ENP)

Conservar reas con los mayores ndices de biodiversidad es una estrategia habitual a la hora de plantear el diseo de una red de Espacios Naturales Protegidos -ENP- (Margules & Pressey, 2000; Myers et al., 2000). Desafortunadamente, nuestro conocimiento directo sobre la distribucin de organismos es escaso y no permite saber exactamente los patrones espaciales de la biodiversidad. Por lo tanto, los encargados de disear ENP tienen que emplear otro tipo de datos que los sustituyan, tales como imgenes derivadas de fotografa area o imgenes de satlites, o indicadores ambientales como mapas generados con datos de clima, topografa, las cualidades del suelo, etc. (Margules & Pressey, 2000; Sarkar & Margules, 2002; Wilson et al., 2005; Ferrier et al., 2007). Una estrategia complementaria es utilizar la enorme cantidad de datos almacenados en las colecciones de la historia natural (Skov & Borchsenius, 1997; Ferrier, 2002; Loisselle et al., 2003; Graham et al., 2004a). Aunque su empleo presenta algunas desventajas, entre las que se pueden destacar la dispersin y cobertura espacial defectuosa de los datos (Ferrier, 2002). El primero de los incovenientes parece solucionarse, poco a poco, gracias a los avances de Internet, que se est convirtiendo en un gran sistema de informacin sobre la biodiversidad y est facilitando la accesibilidad a los datos (Bisby, 2000; Soberon & Peterson, 2004; Guralnick et al., 2007). Aunque es evidente la necesidad de seguir colectado datos, sobre todo en zonas tropicales (vase Primera Parte). El segundo problema, como veremos posteriormente, puede solventarse gracias al empleo de tcnicas de modelado ecolgico, que permiten generar modelos de distribucin de especies
104
(MDE), que definen la distribucin potencial de una determinada especie, en funcin de un determinado grupo de variables ambientales, y con una cobertura espacial completa del rea de estudio.
4.2.3. La utilizacin de datos de herbario

Los datos procedentes de herbarios tienen otros inconvenientes (Margules & Pressey, 2000; Soberon & Peterson, 2004; Rowe, 2005; Edwards et al., 2006; Pape & Gaubert, 2007b), como el desconocimiento que ofrecen sus datos en cuanto a la fiabilidad de su georreferenciacin o identificacin. Para evitar estos problemas, al menos parcialmente, se ha propuesto trabajar con pequeos grupos taxonmicos bien limitados y conocidos, que reciben el nombre de "grupos indicadores" (Howard et al., 1998), puesto que este proceso facilita la verificacin y la correccin de los datos. No existe un consenso total en cuanto la utilizacin de estos indicadores (Flather et al., 1997). Algunos trabajos obtienen diferentes patrones de biodiversidad en funcin de los diferentes grupos indicadores empleados (Kareiva & Marvier, 2003; Loisselle et al., 2003), mientras que en otros los resultados son ms constantes (Howard et al., 1998). En este trabajo empleamos seis grupos de plantas vasculares como grupos indicadores (Pereira & Cooper, 2006): el gnero Anthurium y las familias Bignoniaceae, Bromeliaceae, Gesneriaceae, Lauraceae y Papilonaceae. Fueron seleccionados por cumplir los siguientes criterios: 1) las plantas son la base de los ecosistemas terrestres (productores primarios) y por lo tanto influyen en el resto de organismos que constituyen un ecosistema; 2) estos grupos han sido revisados recientemente por su especialista, lo que nos garantiza la fiabilidad de sus identificaciones; 3) reflejan una amplia gama de relaciones florsticas e incluyen una amplia diversidad de biotipos, desde hierbas hasta rboles; 4) son especies nativas de Ecuador; y 5) en su conjunto representan una cobertura ambiental y geogrfica completa de Ecuador.
4.2.4. Opciones y mtodos de modelado ecolgico

Con estos datos y un conjunto de variables independientes se pueden generar MDE individuales para cada una de las especies (modelado a nivel especfico) y posteriormente se pueden combinar para obtener mapas de alfa diversidad (modelado a nivel de comunidad) (Ferrier & Guisan, 2006). El modelado ecolgico es una disciplina en continua expansin, en la que continuamente aparecen nuevas propuestas y mtodos (Elith et al., 2006). Trabajos previos demuestran que la eleccin del mtodo a nivel especfico es una cuestin clave, que puede afectar
105
drsticamente a los modelos finales de riqueza de biodiversidad (Loisselle et al., 2003; Thuiller et al., 2004; Pearson et al., 2006b). Pero la seleccin del mtodo ms apropiado puede ser un proceso desalentador y difcil (Austin, 2002; Segurado & Arajo, 2004; Austin, 2007), y no existe un mtodo que sea mejor para todas las situaciones (Segurado & Arajo, 2004; Johnson & Gillingham, 2005). Por ello, en este captulo nos planteamos realizar una comparacin de diferentes mtodos y conocer cul de ellos se ajusta mejor a nuestros datos y los objetivos de este estudio. El proceso de modelado ecolgico a nivel de comunidad se puede realizar empleando diversas estrategias (Ferrier & Guisan, 2006), aproximaciones (Wilson et al., 2005) y corrientes (Wilson et al., 2005). Explicaremos ms detenidamente estas opciones en la seccin de "Material y mtodos". Estas opciones podran tener un efecto crucial en los resultados finales, pero se han evaluado escasamente. Ferrier & Guisan (2006) ponen de manifiesto la necesidad de evaluar estas diferentes opciones para modelar la diversidad a nivel de comunidad. En este trabajo utilizamos datos de herbario y variables ambientales para obtener un conjunto de MDE a nivel especfico mediante cinco mtodos diferentes. A continuacin, combinamos estos MDE para obtener una estimacin espacial de la riqueza especfica (nivel de comunidad) que puede ser til para realizar un diseo de reservas (Carroll et al., 2001; Raxworthy et al., 2003; Ortega-Huerta & Peterson, 2004). Para ello empleamos una combinacin de diferentes estrategias, aproximaciones y corrientes dentro del modelado en el nivel de comunidad. Esto nos permitir comparar todas las opciones y ver cuales son las ms apropiadas en trabajos relacionados con la biodiversidad. Una forma eficaz y frecuentemente empleada en la bibliografa de evaluar los factores que estructuran la distribucin de especies es el anlisis de gradientes altitudinales (Fleishman et al., 2000; Heaney, 2001; Rickart, 2001; Vetaas & Grytnes, 2002; Bhattarai et al., 2004; McCain, 2004; Rahbek, 2005; Rowe, 2005; Ah-Peng et al., 2007; Romdal & Grytnes, 2007), aunque no tenemos constancia de su empleo en trabajos de modelado ecolgico, y consideramos que sta es la primera vez que se utiliza en este tipo de trabajos. La evaluacin la realizaremos mediante la comparacin de los patrones altitudinales de diversidad de los modelos de alfa diversidad y los obtenidos por un especialista en la realidad (Kessler, 2002). conservacin y los patrones espaciales de la
106
4.2.5. Objetivos
Los objetivos de este captulo son: 1) realizar MDE para 397 especies pertenecientes a un gnero y cinco familias de plantas vasculares en Ecuador por medio de cinco mtodos, usando colecciones de herbario; 2) evaluar la consistencia de estos mtodos a nivel especfico; 3) generar mapas potenciales de riqueza especfica de Ecuador usando diversas estrategias, aproximaciones y corrientes de modelado a nivel de comunidad; 4) comparar estos mapas, evaluando las ventajas y debilidades de las diferentes opciones; 5) obtener los patrones altitudinales de biodiversidad de estos mapas y compararlos con datos reales.

El rea del estudio seleccionada es la Repblica del Ecuador (Vase Introduccin General).
4.3.2. Variable dependiente

Taxon Anthurium Bignoniaceae Bromeliaceae Gesneriaceae Lauraceae Papilionaceae TOTAL N de Especies 53 11 89 93 28 123 397 Colecciones/Presencias 2513 / 1754 415 / 306 3030 / 2526 4977 / 3884 1122 / 826 5007 / 3887 17064 / 13183 N medio de colecciones y presencias por especie 47,41 / 33,09 37,72 / 27,81 34,04 / 28,38 53,51 / 41,76 40,07 / 29,5 40,70 / 31,60 42,98 / 33,21
Tabla 4.1. Nmero de especies, colecciones, presencias nicas, media de colecciones por especie y media de presencias por especie para cada una de los seis txones incluidos en este trabajo.
Empleamos todas las colecciones de los grupos seleccionados (Anthurium sp., Bignoniaceae, Bromeliaceae, Gesneriaceae, Lauraceae y Papilionaceae) almacenados en la base de datos TROPICOS (Missouri Botanical Garden, Tabla 4.1). Excluimos aquellas especies que presentaban menos de 15 presencias (vase Primera Parte). Especialistas del Missouri Botanical Garden (St. Louis, EEUU) y del Real Jardn
107
Botnico (CSIC, Madrid, Espaa) revisaron todas las colecciones y verificaron los datos de localizacin (latitud/longitud). Si se detectaba algn error en la georreferenciacin de los datos se correga, si era posible, o se eliminaba. Posteriormente realizamos un anlisis estadstico para la deteccin de casos atpicos (outliers). Estos casos atpicos nos pueden informar sobre posibles errores en la georreferenciacin o identificacin. Todos estos casos fueron analizados individualmente y, si no ofrecan suficiente fiabilidad, fueron eliminados del anlisis. Un total de 17064 colecciones fueron incluidas en un SIG y trasformadas en una capa en formato rster (tamao de la celda: 0,00833 grados, ~1 kilmetro en el ecuador). Algunas colecciones de una misma especie pueden coincidir en una misma celda, por lo que constituyen una nica presencia, lo que dio como resultado final un total de 13183 presencias nicas.

Utilizamos las 19 variables bioclimticas de WorldClim 1.3 (Hijmans et al., 2005) (http://www.worldclim.org) como variables independientes. Todas las variables derivan de la temperatura y precipitacin medias mensuales y un modelo digital del terreno (Vase Introduccin General).
4.3.4. Mtodos de modelado ecolgico a nivel de especie

En este anlisis empleamos cinco mtodos de modelado diferentes: regresin logstica mltiple (RLM) y multivariate adaptive regression splines (MARS) son tcnicas discriminantes y por lo tanto necesitan datos de presencia y ausencia. Genetic algorithm for rule-set prediction (GARP), el mtodo de distancia mtrica de Gower (DMG) y el mtodo de mxima entropa (MAXENT) son descriptivos o mixtos y solo necesitan datos de presencia (Vase Introduccin General para una explicacin detallada de los mtodos). Para las tcnicas discriminantes se generaron pseudoausencias (vase segunda parte). Los resultados finales de estos mtodos son mapas que presentan diferentes valores (probabilidad, puntuacin, ndice, etc.). La RLM generan valores de la probabilidad; MARS genera puntuaciones (scores) sin un lmite definido, por lo que fueron constreidos a un valor comprendido entre 0 y 1 mediante la funcin logit; MAXENT genera mapas con valores comprendidos entre 0 y 100; GARP genera mapas de presencia/ausencia, pero generamos 10 modelos (Vase Introduccin General) que sumamos para obtener un mapa final con valores comprendidos entre 0 y 10; finalmente, los mapas generados con DMG tienen un mximo de 100 y no
108
tienen un mnimo definido. Todos los mapas fueron reescalados a mapas con valores comprendidos entre 1 y 0 mediante la siguiente ecuacin: Valor reescalado = (Valor de la celda - Mnimo) / (Mximo - Mnimo) La consistencia de los MDE idealmente debe ser validada con un conjunto de datos independientes al conjunto de datos con los que ejecutamos los MDE. En nuestro trabajo este procedimiento fue inviable debido al bajo nmero de colecciones por taxon: el 94% de las especies almacenadas en la base de datos TROPICOS para Ecuador presentan menos de 20 colecciones y solo un 1% tienen ms de 100 colecciones (Loiselle et al., 2008). ste es un problema habitual en los trabajos que se llevan a cabo en zonas tropicales (Raven & Wilson, 1992). Por lo tanto, nosotros verificamos la consistencia de los MDE mediante el mismo conjunto de datos con los que ejecutamos los MDE. Este procedimiento representa una limitacin importante en aquellos modelos que intentan predecir la distribucin de una determinada especie en el exterior de sus rangos de distribucin conocidos. Sin embargo es un procedimiento razonable para los modelos que intentan explicar las distribuciones actuales (Segurado & Arajo, 2004). Aunque, como veremos posteriormente, presenta unas limitaciones importantes. Para medir la consistencia de los modelos empleamos el estadstico AUC (rea bajo la curva de ROC). Las ventajas principales de este estadstico son: 1) mide consistencia a travs de todos los valores de umbral posibles; 2) es independiente de la prevalencia de los datos, y 3) permite comparar todos los mtodos de modelado empleados usados, independientemente de su escala.
4.3.5. Opciones de modelado ecolgico a nivel de comunidad

Existen muchas opciones diferentes (Tabla 4.2) para generar mapas de riqueza potencial especfica a nivel de comunidad. Las diferentes estrategias, aproximaciones, y corrientes pueden ser combinados y sus respectivos resultados comparados. Veamos las opciones ms comunes en la bibliografa:
Estrategias
Ferrier & Guisan (2006) describen tres estrategias diferentes para generar modelos en el nivel de comunidad: 1) agrupar primero, predecir despus ('assemble first, predict later'), en la que los datos se clasifican primero y luego se ordenan o agregan para producir entidades a nivel de comunidad (p. ej.,Gelfand et al., 2005). 2) Predecir primero, agrupar despus ('predict first, assemble later'), en la que se modeliza cada especie individualmente y despus los mapas se clasifican, ordenan o
109
agregan; y finalmente 3) agrupar y predecir al mismo tiempo ('assemble and predict together'), donde todas las especies se modelan y agregan simultneamente (p. ej., Leathwick et al., 2006b). En este trabajo seleccionamos las dos estrategias ms frecuentes en la bibliografa: las estrategias 2 y 3. Los mapas de riqueza a nivel de comunidad en el caso de la estrategia 2 (predecir primero, agrupar despus) se han obtenido combinado los MDE de los diferentes mtodos. La estrategia 3 (agrupar y predecir al mismo tiempo) requiere procedimientos y mtodos especficos. Nosotros hemos empleado el mtodo MARS-Multirrespuesta (Elith & Leathwick, 2007). Los mtodos multirrespuesta asumen como ausencias aquellos lugares donde la presencia de una determinada especie no ha sido registrada, pero s la presencia de alguna de las especies incluidas en el anlisis. En el resultado final estos mtodos utilizan las mismas variables para todas las especies, pero estiman coeficientes diferentes para cada una de ellas (Elith & Leathwick, 2007).
Aproximaciones y corrientes
A la hora de aplicar la estrategia 2 (predecir primero, agrupar despus) existen dos aproximaciones posibles (Wilson et al., 2005): 1) emplear los valores que directamente se obtienen en los mapas de modelado ecolgico (probabilidades, puntuaciones, ndices, etc.); o bien 2) reclasificar estos valores y obtener mapas binarios de presencia/ausencia (1 = presencia, 0 = ausencia). En la aproximacin 1 (mapas con valores originales) combinamos todos los mapas de todas las especies incluidas en el anlisis. El mapa final es una estimacin del nmero total de especies presentes en una determinada zona. Algunos autores sugieren que la nica posibilidad correcta desde el punto vista estadstico, a la hora de obtener mapas de biodiversidad potencial, es la suma de aquellas predicciones expresadas en trminos de probabilidad, siendo el mapa final un estimador del nmero total de especies presentes (Gelfand et al., 2005; Wilson et al., 2005). Esta aproximacin permite dos corrientes diferentes: 1) sumar los mapas empleando un nico mtodo, en la mayora de las situaciones el mejor de los mtodos (el que presenta mayor consistencia); y 2) emplear ms de un mtodo para construir un "modelo del consenso" (Arajo & New, 2007; Marmion et al., 2008). En el caso de la aproximacin 2 (mapas de presencia/ausencia), los mapas originales son reclasificados en mapas de presencia/ausencia, que se suman para obtener un mapa final de riqueza especifica potencial. La reclasificacin del mapa se realiza mediante un valor umbral, para lo que existen dos corrientes diferentes (Wilson et al., 2005): 3) el valor umbral se elige antes de generar los mapas (a priori'); y 4) el umbral se determina una vez realizados los mapas (a posteriori').
110
Liu et al. (2005) y Jimnez-Valverde & Lobo (2007) presentan diferentes posibilidades para seleccionar umbrales o puntos de corte. La seleccin de un umbral depende del objetivo de nuestro trabajo. Si el inters de nuestro estudio es la observacin de patrones espaciales, entonces es aconsejable sobre-predecir. Sin embargo, si la conservacin es el inters principal de nuestro trabajo, parece menos idneo clasificar una presencia conocida como ausencia, que viceversa (Loisselle et al., 2003; Jimnez-Valverde & Lobo, 2007; Pape & Gaubert, 2007b).
4.3.6. Mapas de riqueza especfica (diversidad alfa) potencial

Como consecuencia de la combinacin de las diferentes opciones de modelado ecolgico a nivel de comunidad obtuvimos 9 mapas riqueza especfica, que podemos agrupar de la siguiente manera: 1) Corriente 1: 1 mtodo. La suma de todos los MDE (397 especies) reescalados (valores comprendidos entre 0 y 1) de cada mtodo (LMR, MARS, GARP, DMG, y MAXENT) por separado. Por tanto obtuvimos 5 mapas diferentes de riqueza especfica, uno por mtodo. ESTRATEGIAS Estrategia 1
(agrupar primero, predecir despus)
APROXIMACIONES
CORRIENTES
ESTE TRABAJO
Aproximacin 1
(mapas con valores originales)
Corriente 1
(1 mtodo)
Suma de los MDE de 5 mtodos por separado Modelo de consenso de todos los mtodos DMG (Umbral = 95) Mejor mtodo (Umbral)
Estrategia 2
(predecir primero, agrupar despus)
Corriente 2
(modelo de consenso)
Corriente 3 Aproximacin 2
(mapas de presencia/ausencia) (umbral a priori)
Corriente 4
(umbral a posteriori)
Estrategia 3
(agrupar y predecir al mismo tiempo)
MARSMultirrespuesta
Tabla 4.2. Diferentes opciones de modelado ecolgico (estrategias, aproximaciones y corrientes) a nivel de comunidad y los ejemplos empleados en este trabajo.
111
2) Corriente 2: modelo de consenso promedio. Como ejemplo de modelo consenso hemos elegido esta opcin que parece presentar los mejores resultados de acuerdo con Arajo & New (2007) y Marmion et al. (2008). Para cada una de las especies se hizo la media de todos los MDE reescalados disponibles (DMG, GARP, LMR, MARS, MARS-Multirrespuesta y MAXENT) y se obtuvo un modelo de consenso para cada una de las 397 especies. Posteriormente se agregaron todos los modelos de consenso para obtener un mapa de riqueza. 3) Corriente 3: umbral a priori. Como un ejemplo de esta corriente seleccionamos un caso que se emplea habitualmente en la bibliografa. En los diferentes trabajos publicados hasta la fecha se considera que el umbral ptimo para los mapas obtenidos con DMG es un valor de 95 (Carpenter et al., 1993). Utilizamos este valor para obtener mapas de presencia/ausencia para cada una de las especies y posteriormente los sumamos para obtener un mapa de diversidad alfa. 4) Corriente 4: umbral a posteriori. En este caso empleamos como ejemplo el mtodo que ofrezca los mejores resultados para el estadstico AUC. De acuerdo con Liu et al. (2005), se seleccion como punto ptimo de corte el que present en la curva ROC la distancia de Manhattan ms corta a la esquina superior izquierda (0,1). Para cada una de las especies se calcul a posteriori el umbral ptimo y se gener un mapa de presencia/ausencia empleando este punto de corte. Posteriormente se sumaron todos estos mapas para generar el mapa de riqueza. 5) Estrategia 3: agrupar y predecir al mismo tiempo. Como ejemplo empleamos MARS-Multirrespuesta. Los MDE fueron generados siguiendo a Elith & Leathwick (2007) en el software R (http://www.r-project.org). Obtuvimos un mapa para cada una de las especies que posteriormente sumamos para generar el ltimo mapa de riqueza potencial. Finalmente, comparamos entre s los nueve mapas potenciales de riqueza especfica mediante el coeficiente de correlacin de Pearson (Lehmann et al., 2002; Graham & Hijmans, 2006).
4.3.7. Patrones altitudinales de biodiversidad

Para comparar estos mapas de diversidad alfa potencial con datos reales obtenidos en trabajo de campo empleamos los patrones altitudinales de la biodiversidad. Los gradientes altitudinales encierran gradientes climticos y ambientales que deben influir a la distribucin espacial de la riqueza (Nogus-Bravo et al., 2008a). Rahbek (1995) reconoci tres patrones principales de riqueza especfica en funcin de la elevacin: 1) una disminucin monotnica desde los
112
puntos menos elevados hacia los ms elevados. 2) Un patrn con forma de cerro, con un mximo en las zonas de elevacin media. 3) Valores relativamente constantes en elevaciones bajas y medias, seguidos de una disminucin fuerte. Aunque existen muchos ms tipos de patrones (Rahbek, 2005). Kessler (2001) identifica, en Bolivia central, curvas con forma de cerro para bromeliceas, mientras que las arceas presentan valores relativamente constantes hasta elevaciones comprendidas entre los 1000-1500 m, seguidos de una disminucin monotnica (Fig. 4.1). Estos resultados se pueden relacionar (Kessler, 2001) con los patrones obtenidos respectivamente en Ecuador para plantas endmicas (Kessler, 2002). Para comparar estos resultados con nuestros mapas estimamos los patrones altitudinales de diversidad de los nueve mapas de riqueza especfica para Anthurium y bromeliceas. Para ello dividimos los mapas en clases altitudinales de 500 m y calculamos el valor medio de cada una de estas clases (Fig. 4.5 y 4.6).
Figura 4.1. Patrones altitudinales de alfa diversidad en arceas (ARAC) y bromeliceas (BROM) para Bolivia. Modificado (Kessler, 2001). En bromeliceas la lnea continua representa especies terrestres y la discontinua especies epifitas.
4.4. Resultados
4.4.1. Evaluacin de la consistencia de los MDE a nivel de especie
Hemos realizamos un total de 19.056 MDE, 48 por cada una de las especies (1 modelo de consenso, 11 GARP, 1 DMG, 1 DMG P/A, 1 RLM, 30 MARS, 1 MARS P/A, 1 MARS-Multirrespuesta, 1 MAXENT). Todos fueron posteriormente reescalados a valores comprendidos entre 1 y 0. A pesar de las limitaciones de nuestra verificacin de la consistencia, al no disponer de un grupo de datos independientes, nuestros resultados sugieren que tres mtodos son comparables en trminos de consistencia: DMG, modelo de consenso y MARS, que presentan valores medios relativamente superiores a GARP, LMR, MARSMultirrespuesta y MAXENT (Fig. 4.2). En todo caso hay que subrayar que los resultados de DMG son en realidad un artefacto, como se tratar ms adelante. Los resultados son bastante similares para los seis txones, aunque las bignoniceas presentan valores ms bajos de AUC (Fig. 4.3).
113
1.00 0.98 0.96
0.9963 0.9825 0.9664
0.94
0.9284
0.92 0.90 0.88
0.9264 0.9135 0.9045
Figura 4.2. Valores medios de AUC para los diferentes mtodos de modelado ecolgico.
95% CI
MAXENT
DMG
MARS
RLM
MULTIRESP.
CONSENSO
GARP
DMG MARS Consenso 1.0 GARP MAXENT RLM Multirespuesta
0.9
95% CI
0.8
0.7
0.6
ARAC
BIGN
BROM
GESN
LAUR
LEGU
FAMILIAS
Figura 4.3. Valores medios de AUC para los diferentes mtodos de modelado ecolgico y txones empleados en este trabajo.
Para comprobar si la ausencia de datos independientes a la hora de evaluar modelos de distribucin de especies es crtica, comparamos los resultados obtenidos en este captulo (verificacin) con los obtenidos en el captulo anterior (validacin) (Tabla 4.4), y observamos las siguientes diferencias entre ambos. En primer lugar, los valores de AUC obtenidos mediante un proceso de verificacin tienden a ser ms elevados que los valores de AUC obtenidos mediante validacin (Tabla 4.4). En el proceso de validacin, DMG y MARS obtuvieron los valores medios de AUC ms
114
elevados (0,99 y 0,98 respectivamente) (Fig. 4.2). En el captulo anterior (verificacin) MARS, MAXENT y LMR obtuvieron los valores de AUC ms altos (0,875, 0,855 y 0,849), y DMG y GARP los ms bajos (0,797 y 0,730). Las diferencias ms elevadas se obtienen con GARP (21,37%) y DMG (20,00%) (Tabla 4.4). La consistencia de estos mtodos es injustificablemente ms elevada cuando simplemente verificamos sus resultados. Tanto GARP como DMG asignan, por defecto, una mayor estima a las localidades de presencia. Por el contrario, el resto de mtodos generan una superficie de prediccin (probabilidad, puntuaciones, etc.) sin asignar necesariamente una mayor estima a los puntos de presencia. Si empleamos el mismo conjunto de datos para generar el modelo y para verificarlo, GARP y DMG obtendrn invariablemente excelentes o buenas calificaciones, pero si empleamos un conjunto de datos independientes el valor de AUC disminuye claramente. Veamos un ejemplo: el algoritmo DMG asigna por defecto el mximo valor de similitud (100) a todos los puntos de presencia. Por tanto, si muestreamos el modelo final con el mismo conjunto de datos se obtendr el valor mximo (100) para todas las presencias y cuando realicemos el anlisis del estadstico AUC se obtendrn valores prximos a 1 (mxima capacidad para separar presencias de ausencias). La nica forma de medir la consistencia de estos mtodos (GARP y DMG) es mediante un grupo de datos independientes. Estos resultados coinciden con los obtenidos por Elith (2002). Si analizamos los resultados de cada una de las especies de forma independiente (Anexo I, Tabla 4.3), como sugieren Lobo et al. (2008), los resultados que obtenemos son similares. Si excluimos DMG y GARP, que necesitan un conjunto de datos independientes para ser evaluados, los mejores resultados se obtienen con MARS y el modelo de consenso. De todos modos, hay que destacar que en todos los casos los valores de AUC estn muy prximos entre s, incluso que en muchas ocasiones presentan los mismos valores de AUC, y que estas diferencias pueden no ser significativas desde el punto de vista estadstico. Sin embargo estos modelos presentan enormes diferencias en sus resultados finales, algo que no se ve registrado en el anlisis del estadstico AUC (Termansen et al., 2006; Lobo et al., 2008).
115
Valor mximo de AUC Consenso GARP DMG RLM MARS MAXENT Multirrespuesta
117 52 342 19 11
Tres mejores valores

388 121 381 161 89
Tabla 4.3. En esta tabla se comparar los valores de AUC de los diferentes mtodos por separado para cada una de las especies (anexo I) y se representan el nmero de veces que un mtodo presenta el valor mximo de AUC y el nmero de veces que se encuentra entre los tres mejores valores de AUC. No consideramos los valores de GARP y distancia mtirica de Gower (DMG), para poder evaluar estos modelos es necesario un conjunto de datos independientes.
MTODO
GARP DMG MARS MAXENT RLM
VERIFICACIN (3 Parte)
0,928 0,996 0,982 0,926 0,913
VALIDACIN (2 Parte)
0,730 0,797 0,875 0,855 0,849
DIFERENCIA
0,198 0,199 0,107 0,071 0,064
% DE DIFERENCIA
21,37 % 20,00 % 10,94 % 7,70 % 7,06 %
Tabla 4.4. Valores medios de AUC para 5 empleados en los captulos 2 (validacin) y 3 diferencia entre valor obtenido en la validacin porcentaje que significa esta diferencia respecto
mtodos de modelado ecolgico (verificacin). Tambin aparece la con respecto a la verificacin, y el a la verificacin.
4.4.2. Correlacin a nivel de comunidad

Cada uno de las opciones analizadas en este estudio dio lugar a un mapa de diversidad potencial diferente (Fig. 4.4). Los coeficientes de correlacin (Tabla 4.5) demostraron estas diferencias. Si analizamos estos resultados en su conjunto y excluimos el modelo de consenso, que guarda cierta relacin con todos los mtodos, podemos dividir los mtodos en dos grupos segn su similitud. En el primero de ellos se agrupan DMG, DMG-P/A y MARS-Multirrespuesta y por otro lado encontramos a MARS, MARS-PA, RLM y MAXENT. GARP guarda cierta similitud con ambos grupos: una correlacin de 0,76 con DMG y de 0,72 con MAXENT (Tabla 4.5).
116
Si comparamos los mapas binarios de presencia/ausencia con los mapas originales vemos que la correlacin es mucho ms elevada en el caso de MARS y MARS-P/A (0,97) que en el de DMG y DMG-P/A (0,63) (Tabla 4.5).

Kessler (2001) demostr en su trabajo que las arceas tenan valores relativamente constantes de diversidad alfa hasta una altitud comprendida entre 1000-1500 m, y que por encima de esta elevacin se produce una disminucin de riqueza (Fig. 4.1). En este trabajo, los mapas de riqueza de GARP, MAXTEN, MARSP/A y el modelo del consenso muestran unos patrones altitudinales de alfa diversidad similares a los obtenidos por Kessler (2001) (Fig. 4.5), aunque los dos ltimos (MARS-P/A y el modelo de consenso) sobrepredicen la distribucin de diversidad en las zonas ms elevadas, donde la diversidad de arceas debera ser nula. El resto de mtodos (Fig. 4.5) siguen unos patrones muy diferentes a los resultados que podemos observar en la realidad.
MARS P/A
Consenso
GMD P/A
Consenso GARP DMG GMD P/A RLM MARS MARS P/A MAXENT Multirrespuesta
-0,9141 0,8165 0,6366 0,8060 0,7240 0,7140 0,8914 0,6204
0,9141 -0,7595 0,6138 0,5799 0,6088 0,5759 0,7249 0,5605
0,8165 0,7595 -0,6289 0,4588 0,4425 0,3999 0,5739 0,6363
0,6366 0,6138 0,6289 -0,4568 0,0777 0,1000 0,4892 0,9266
0,8060 0,5799 0,4588 0,4568 -0,6912 0,7262 0,8218 0,3455
0,7240 0,6088 0,4425 0,0777 0,6912 -0,9712 0,7072 0,1712
0,7140 0,5759 0,3999 0,1000 0,7262 0,9712 -0,7134 0,2452
0,8914 0,7249 0,5739 0,4892 0,8218 0,7072 0,7134 -0,5223
MAXENT
MARS
GARP
DMG
RLM
0,6204 0,5605 0,6363 0,9266 0,3455 0,1712 0,2452 0,5223 --
Tabla 4.5. Valores del coeficiente de correlacin de Pearson entre las diferentes opciones de modelado ecolgico a nivel de comunidad.
Para Bromeliaceae, Kessler (2002) encontr curvas con forma de cerro tanto para las especies epfitas (mximo a 1700 m) como terrestres (mximo a 3000 m) (Fig. 4.1). Los mapas de biodiversidad potencial obtenidos con GARP, MARS, MARS-
Multirrespuesta
117
P/A, MAXENT y el modelo de consenso (Fig. 4.6) muestran este tipo de patrones. Al igual que suceda con el gnero Anthurium, el modelo de consenso y MARS-PA sobrepredicen las zonas ms elevadas. Tambin como en el caso anterior, el resto de mtodos siguen unos patrones altitudinales de biodiversidad que no reflejan esta realidad (Fig. 4.6). Si observamos los resultados obtenidos para los seis grupos en su conjunto y tenemos en cuenta los resultados obtenidos en los 4 mtodos (GARP, MARS-P/A, MAXENT y el modelo de consenso) que mejor se han ajustado en Anthurium y bromeliceas, en los 4 casos obtenemos patrones muy similares, con un mximo de diversidad vegetal comprendido entre 1000 y 2000 m de altitud (Fig. 4.7).
Figura 4.4. Mapas de riqueza especfica (diversidad alfa) para diferentes opciones de modelado ecolgico: GARP, MAXENT, DMG, DMG presencia/ausencia.
118
Figura 4.4 cont. Mapas de riqueza especfica (diversidad alfa) para diferentes opciones de modelado ecolgico: MARS, MARS presencia/ausencia, MARS-Multirrespuesta, modelo de consenso, RLM.
119
Figura 4.5. Patrones altitudinales de alfa diversidad potencial en Ecuador para el gnero Anthurium, segn diferentes opciones de modelado ecolgico.
Figura 4.6. Patrones altitudinales de alfa diversidad potencial en Ecuador para bromeliceas, segn diferentes opciones de modelado ecolgico.
120
Figura 4.7. .Patrones altitudinales de alfa diversidad potencial en Ecuador para las seis familias analizadas en este trabajo, segn diferentes opciones de modelado ecolgico
4.5. Discusin
4.5.1. Evaluacin de la consistencia de los MDE a nivel de especie
Si tenemos en cuenta las limitaciones en el proceso de verificacin, los mtodos que obtienen mejor consistencia a nivel especfico son MARS, el modelo de consenso, MAXENT y RLM. Estos resultados son comparables a otros trabajo de comparacin publicados, pero contradicen en algunos aspectos a lo encontrado por Elith et al. (2006), en donde los mayores valores de AUC se obtienen para MARSMultirrespuesta y MAXENT, por encima de MARS. Una posible explicacin de por qu Elith et al. (2006) obtienen peores resultados con MARS es que estos autores utilizan la librera "mda" en R, programada con un cdigo diferente al de la versin comercial que nosotros hemos usado, que utiliza el cdigo original del autor del mtodo (Friedman, 1991). En nuestro caso, MARS obtiene los mejores valores de AUC en ambas situaciones, y parece por tanto el mtodo que mejor se ajusta a nuestros datos y objetivos. Adems, se trata de un mtodo muy interesante con un nmero elevado de ventajas (Muoz & Felicsimo, 2004; Austin, 2007; Elith & Leathwick, 2007). Dentro de sus ventajas queremos destacar la fcil interpretacin de sus resultados, tanto desde el punto de vista ecolgico como estadstico, que permite analizar sus
121
resultados de una forma mucho ms sencilla y objetiva. Aunque, los resultados de Maxent y el modelo de consenso tambin son fiables y se ajuntan a la realidad, como ya comentamos en la Segunda Parte, Maxent tambin presenta ciertas ventajas: no es necesario generar pseudo-ausencias, se ejecuta con un solo software, sus resultados son ms estables, y adems parece tener muy buenos resultados para tamaos de muestra pequeos (Hernandez et al., 2006; Pearson et al., 2006a; Phillips et al., 2006; Pape & Gaubert, 2007b; Wisz et al., 2008). Si comparamos los valores de AUC obtenidos para cada uno de los txones empleados en este trabajo (Fig. 4.3), parece ms determinante la ecologa de las especies que el nmero medio de presencias. As, vemos que las bignoniceas presentan una notable disminucin de los valores de AUC, posiblemente generado por la ecologa de esta familia. Gran parte de estas especies son lianas, que dependen de factores biticos no incluidos en estos modelos. Por lo tanto, por encima de un tamao de muestra mnimo parece ms determinante la ecologa de la especie que el tamao de muestra. Como hemos visto la verificacin de varios mtodos con el estadstico AUC presenta varias limitaciones: 1) estamos valorando exclusivamente la capacidad clasificatoria del modelo a los datos con los que se ha realizado el modelo. 2) Los valores de AUC obtenidos mediante un proceso de verificacin tienden a ser ms elevados que los valores de AUC obtenidos mediante validacin (Elith, 2002). 3) Las diferencias entre los distintos mtodos son mnimas y no reflejan las diferencias reales que se obtienen en cada uno de los modelos, una inspeccin visual de los mapas finales nos muestra que modelos con un valor de AUC muy similar pueden presentar patrones de distribucin muy diferentes (Termansen et al., 2006; Lobo et al., 2008). Mtodos como MARS, RLM y CART que emplean las pseudo-ausencias para ejecutar y validar los modelos, pueden verse favorecidos frente a mtodos como MARS-Multirrespuesta o Maxent que no emplean estas mismas pseudoausencias para ejecutar el modelo. 4) Para verificar hemos empleado pseudoausencias que no representan verdaderas ausencias lo que puede inducir a errores. 5) La consistencia de mtodos como GARP y DMG es injustificablemente ms elevada cuando verificamos sus resultados (Elith, 2002). Otras limitaciones inherentes del estadstico AUC recientemente expuestas (Lobo et al., 2008; Peterson et al., 2008a) son: 1) no evala la bondad de ajuste del modelo; 2) suma la consistencia para todas las regiones de la curva ROC, algunas de estas regiones raramente son operativas; 3) da igual valor al error de comisin que al error de omisin; 4) no obtenemos informacin espacial del error; y 5) la extensin del anlisis influye de una forma importante en este estadstico. Por todos estos motivos consideramos que
122
la verificacin de MDE no es proceso adecuado y es necesaria la validacin mediante datos independientes. Tambin que consideramos que son necesarios nuevos estadsticos ms adecuados a estos mtodos. Como vemos, la seleccin del mtodo ms apropiado es un trabajo complicado (Austin, 2002; Segurado & Arajo, 2004; Austin, 2007). Prueba de ello son los mltiples trabajos de comparacin de mtodos a nivel especfico publicados (Manel et al., 1999; Guisan & Zimmermann, 2000; Moisen & Frescino, 2002; Muoz & Felicsimo, 2004; Segurado & Arajo, 2004; Guisan & Thuiller, 2005; Johnson & Gillingham, 2005; Drake et al., 2006; Elith et al., 2006; Leathwick et al., 2006b; Moisen et al., 2006; Pearson et al., 2006b; Elith & Leathwick, 2007; Meynard & Quinn, 2007; Tsoar et al., 2007; Feria et al., En revisin), con resultados a veces incompatibles (Austin, 2007). Como indican Ferrier & Guisan (2006), es necesario un anlisis de estos mtodos y de las diferentes opciones de modelado a nivel de comunidad, y analizar cmo definen estos mtodos y opciones los patrones espaciales de biodiversidad (Wilson et al., 2005).
4.5.2. Correlacin a nivel de comunidad

En este apartado se ponen de manifiesto las variaciones entre las diferentes opciones de modelado ecolgico a nivel de comunidad. Como vemos en la Fig. 4.4, los mapas de diversidad finales varan enormemente en funcin de la opcin y mtodo empleado. Estas diferencias destacan la importancia en la seleccin de la opcin ms adecuada a la hora de realizar un trabajo de modelado ecolgico, especialmente si utilizamos estos mapas para disear una red de Espacios Naturales Protegidos (Loisselle et al., 2003; Wilson et al., 2005). Mediante una rpida inspeccin de los mapas (Fig. 4.4) podemos comprobar que los grupos creados mediante los valores del coeficiente de correlacin estn relacionados con los patrones espaciales de diversidad que determinan. DMG, DMGPA y MARS-Multirrespuesta tienen sus mximos de biodiversidad en el rea amaznica; mientras que MARS, MARS-PA, MAXENT y RLM presentan los valores ms elevados en los flancos de los Andes. Finalmente, GARP presenta mximos de diversidad en ambas zonas.

En este apartado, como ya explicamos anteriormente, comparamos los patrones de diversidad altitudinal de los nueve mapas de riqueza especfica obtenidos en este trabajo para Anthurium (Fig. 4.5) y bromeliceas (Fig. 4.6) con el trabajo del Kessler
123
(2001) (Fig. 4.1). De esta comparacin se pueden extraer varias conclusiones interesantes, como veremos a continuacin. Nogus-Bravo et al. (2008a) ponen de manifiesto ciertas limitaciones a la hora de valorar los gradientes altitudinales de la biodiversidad, que conviente tener en cuenta, pero en nuestro caso empleamos modelos y no directamente colecciones de herbarios por lo que deber verse afectados por el mayor impacto del hombre sobre el ambientes en las zonas menos elevadas. En mayor o menor medida cuatro mtodos son los que generan patrones altitudinales de biodiversidad similares a los que observamos en la realidad: GARP, MAXENT, MARS P/A y el modelo de consenso. Tres de estos mtodos (MAXENT, MARS P/A y el modelo de consenso) se ven apoyados por ambos anlisis estadsticos: obtienen valores medios de AUC elevados (Fig. 4.2; Tabla 4.4) y el anlisis de correlacin muestra que estos mapas estn muy relacionados entre s (Tabla 4.5). Si inspeccionamos estos mapas (Fig. 4.4) y analizamos los patrones altitudinales totales (Fig. 4.7) podemos confirmar que estas opciones generan patrones de diversidad muy similares con un mximo de diversidad alfa en las altitudes medias de los Andes (1000 2000 m). El resto de opciones (DMG, DMGP/A, MARS, MARS-Multirrespuesta y RLM) se alejan bastante de la realidad. Teniendo en cuenta estos resultados generales, a continuacin analizaremos por separado cada una de las opciones de modelado ecolgico a nivel de comunidad: Dentro de la estrategia 2 (predecir primero, agrupar despus), si consideramos la aproximacin 1 (mapas con valores originales) existen dos corrientes posibles: Corriente 1 (1 mtodo): en este caso los resultados son muy diferentes en funcin del mtodo de modelado a nivel de especie empleado. Es necesario realizar anlisis estadsticos para comprobar que mtodos generan los resultados ms fiables y son los ms apropiados a los objetivos de nuestro estudio. Mtodos como DMG no generan patrones de diversidad como los que observamos en la naturaleza. El patrn altitudinal parece ajustarse ms a la distribucin espacial de las colecciones de partida (Fig. 4.8). MAXENT produce muy buenos resultados a todos los niveles (AUC y anlisis de los patrones altitudinales de biodiversidad). MAXENT se trata de un mtodo novedoso, aplicado recientemente al modelado ecolgico, aunque otros trabajos ya demostraron su potencial (Elith et al. 2006). En este
124
trabajo se demuestra los buenos resultados que se obtienen con este mtodo.
350 300 250 200 150 100 50 0
Figura 4.8. Nmero de colecciones de arceas (cuadrados) y bromeliceas (circunferencias) en funcin de la altitud.
MARS presenta muy buenos resultados en el anlisis del estadstico AUC a nivel especfico, pero la suma de los mapas para generar un mapa de diversidad potencial genera un modelo de riqueza que sobrepredice en zonas en las que la diversidad debiera ser menor. Este efecto se soluciona en gran medida cuando convertimos estos mapas con valores originales en mapas binarios de presencia/ausencia mediante la aplicacin de un punto de corte, como veremos posteriormente. La RLM genera mapas con una adecuada consistencia a nivel especfico, pero la suma de estos mapas para generar un mapa de diversidad potencial produce patrones espaciales de diversidad no acordes con la realidad. Los MDE realizados con GARP presentan muy poca consistencia a nivel de especfico, pero su suma genera un mapa de diversidad potencial en la que los patrones espaciales no se alejan en gran medida de la realidad. Corriente 2 (modelo de consenso): los resultados que ofrece esta opcin de modelado ofrece resultados fiables a nivel especfico y de comunidad. Se trata de una tcnica aplicada recientemente al modelado ecolgico. Dada la dificultad que representa la eleccin del mtodo ms adecuado (Austin, 2002; Segurado & Arajo, 2004; Austin, 2007), algunos autores sugieren la combinacin de varios de estos mtodos para reducir la variabilidad que se observa entre mtodos (Arajo et al., 2005c; Arajo et al., 2006; Arajo & New, 2007; Marmion et al., 2008). El empleo de esta opcin en modelado ecolgico parece ser prometedora.
0 50 500 0 -1 10 0 00 0 0 -1 15 5 00 00 -2 20 0 00 00 -2 25 5 00 00 -3 30 0 00 00 -3 35 5 00 00 -4 40 0 00 00 -4 45 5 00 00 -5 50 0 00 00 -5 50 0
125
Para la aproximacin 2 (mapas de presencia/ausencia), dentro de la misma estrategia, podemos considerar dos corrientes diferentes: Corriente 3 (umbral a priori): la utilizacin de un umbral a priori en DMG no produce ningn beneficio y tampoco buenos resultados a ningn nivel, est opcin no tiene ningn sentido desde el punto de vista biolgico (Jimnez-Valverde & Lobo, 2007). Corriente 4 (umbral a posteriori): el empleo de un punto de corte a posteriori mejora claramente los resultados en el caso de MARS, ya que hace que los patrones altitudinales de diversidad se ajusten ms a la realidad. El umbral o punto de corte delimita correctamente el rea potencial de la distribucin de la especie, aunque tiende a sobre-estimar la diversidad en zonas elevadas. Como ponen de manifiesto (JimnezValverde & Lobo, 2007) la falta de verdaderas ausencias en este trabajo puede limitar los buenos resultados a la hora de obtener buenos puntos de corte. Estrategia 3 (agrupar y predecir al mismo tiempo): al emplear mtodos multirrespuesta hemos obtenido resultados muy diferentes a los de otros autores. Una comparacin reciente entre MARS y MARS-Multirrespuesta (Leathwick et al., 2005) para modelar peces de agua dulce en Nueva Zelanda indica que no existe ninguna ventaja en el empleo de mtodos multirrespuesta. Sin embargo, otros trabajo que comparan estas mismas tcnicas (Elith et al., 2006; Leathwick et al., 2006a; Elith & Leathwick, 2007) reflejan un incremento importante en la consistencia de los mtodos multirrespuesta. Conviene recordar que estos trabajos ejecutan MARS y MARS-Multirrespuesta en R, donde el cdigo no es el original de Friedman (1991). En esta tesis llegamos a la conclusin de que los resultados que ofrece MARS-Multirrespuesta no son fiables ni a nivel especfico ni a nivel de comunidad. Los valores de AUC son menores cuando se comparan con otros mtodos, y no reflej los verdaderos patrones de biodiversidad altitudinal. En una inspeccin visual de los mapas a nivel de especie sus resultados se pueden interpretar como muy variables. Se puede explicar este comportamiento por el funcionamiento intrnseco de este algoritmo, que emplea las mismas variables independientes para explicar la distribucin de todas las especies incluidas en el anlisis, algo que desde nuestro punto de vista es un gran inconveniente, ya que las variables significativas para una especie no tienen por qu serlo para otra.
126
4.5.4. Principales conclusiones aplicables al modelado ecolgico

Los resultados obtenidos en este captulo nos ofrecen importantes
consideraciones para el futuro del modelado ecolgico. A continuacin citaremos brevemente las que consideramos ms importantes. La enorme cantidad de datos almacenada en herbarios y museos de historia natural permiten obtener resultados fiables estadsticamente y reflejan los patrones espaciales de biodiversidad que se observan en la naturaleza. Algunas de las claves ms importantes a la hora de trabajar con estos datos es la fiabilidad de la georreferenciacin modelado ecolgico. Nuestros resultados nos permiten dividir los resultados de las diferentes opciones de modelado ecolgico en dos grandes grupos: Por un lado, tenemos aquellas opciones que a nivel especfico presentan una buena consistencia y por tanto son fiables estadsticamente. A nivel de comunidad estos mtodos reflejan los patrones espaciales de biodiversidad que se observan en la naturaleza y sus resultados se asemejan bastante entre s. Adems se trata de mtodos relativamente trasparentes en su formulacin matemtica y permiten una interpretacin biolgica y estadstica de los resultados. Estas opciones son MARSP/A, MAXENT y el modelo de consenso. Por otro lado tenemos un conjunto de opciones que ofrecen resultados muy diferentes entre s, y tambin diferentes a los anteriores. En algunas ocasiones ofrecen resultados fiables a nivel de especies, pero sus resultados a nivel de comunidad no reflejan la realidad (MARS, RLM), mientras que en otras sucede lo contrario (GARP). Finalmente, estn los que no obtienen resultados fiables en ninguno de los niveles (DMG, DMG-PA y MARS-Multirrespuesta). No existe un mtodo que sea beneficioso para todas las aplicaciones y objetivos (Pearson et al., 2006b). Si el objetivo de nuestro trabajo est relacionado con la conservacin y los patrones espaciales de biodiversidad, se aconseja el empleo de MARS-P/A, MAXENT y un modelo de consenso. El resto de opciones pueden resultar tiles cuando los objetivos de nuestro trabajo sean diferentes. La colaboracin con otros especialistas (botnicos, eclogos, zologos, etc.) se hace imprescindible en el futuro del modelado ecolgico (Lobo, 2008). Su experiencia es de vital importancia para obtener datos fiables y contrastar los resultados finales (Peters & Thackway, 1998; Loisselle et al., 2003; Johnson & e identificacin, el tamao mnimo de muestra, etc.; la comprobacin de la informacin de partida es imprescindible en cualquier trabajo de
127
Gillingham, 2005). Pero su aportacin tambin puede ser importante en otro aspecto del modelado ecolgico: corregir la tendencia a la sobreprediccin de muchos MDE (Graham & Hijmans, 2006; Loiselle et al., 2008). Esto se debe en gran parte a que los modelos estn fundamentados exclusivamente en datos climticos o ambientales, y no tienen en cuentan las relaciones biticas con otras especies, las limitaciones en la capacidad dispersiva ni los factores histricos (Guisan & Zimmermann, 2000; Hampe, 2004; Pearson & Dawson, 2004; Guisan & Thuiller, 2005; Soberon & Peterson, 2005). Los especialistas pueden revisar los MDE y consideraron estos factores para mejorar los resultados finales. Los especialistas tambin pueden ser esenciales para evaluar la fiabilidad de los diferentes mtodos y su comparacin, ya que los mtodos que se utilizan en la actualidad, como hemos visto, presentan un gran nmero de limitaciones.
4.5.5. Principales conclusiones para la conservacin en Ecuador

Hemos comparado los tres modelos finales de diversidad ms fiables (consenso, MARS P/A y MAXENT) con las 19 variables de bioclimticas de WorldClim. Esta comparacin se realiz mediante el coeficiente de correlacin de Pearson. En la Tabla 4.6 observamos los resultados de esta comparacin, donde podemos ver que los patrones de biodiversidad estn directamente relacionados con la isotermicidad diurna y las variables relacionadas con la precipitacin a excepcin de la precipitacin estacional, con la que est inversamente relacionada. Tambin existe una relacin inversamente proporcional con la temperatura estacional. Por la tanto podemos concluir que los lugares con mayor diversidad vegetal son aqullos donde existe una precipitacin abundante, la variabilidad a lo largo del ao en temperatura y precitaciones es pequea y existe poca diferencia de temperatura entre el da y la noche. Estos tres modelos de diversidad vegetal potencial consideran que la zona con ms diversidad se encuentra en la vertiente occidental del norte del pas (provincias de Carchi y Esmeraldas). Este rea se trata de una continuacin del Choc colombiano, considerado uno de los cinco hot spot con ms biodiversidad de todo el planeta (Myers, 1988), el lugar ms rico en aves endmicas de todo el planeta (Terborgh & Winter, 1982) y el rea con la mayor diversidad vegetal de todo Ecuador occidental (Gentry, 1982;1986). Le siguen ambas vertientes de los Andes y parte de la cuenca Amaznica. El bosque hmedo en la regin tropical de los Andes aloja una de la mayores proporciones de riqueza vegetal y faunstica de todo el planeta (Rahbek & Graves, 2001; Fjeldsa et al., 2005) y es por tanto una prioridad mundial en la conservacin (Mittermeier et al., 1998; Olson & Dinerstien, 1998).
128
Figura 4.9. Diversidad alfa potencial en Ecuador mediante tres opciones diferentes de modelado ecolgico (un modelo de consenso, MARS P/A y MAXENT). En color negro aparece destacado el contorno de la red de Espacios Naturales Protegidos de este pas
Si comparamos estos modelos con el Sistema Nacional de reas Protegidas (SNAP) de Ecuador (Fig. 4.9), vemos que ms del 20% del rea del pas cuenta con alguna medida de proteccin, pero lamentablemente estas medidas no son realmente eficaces (Dodson & Gentry, 1991). Adems, estas reas no representan todas las regiones fitogeogrficas del pas (Borchsenius, 1997; Sierra et al., 1999), e incluso Sierra (1999) indica que muchos de los bosques no protegidos en la zona noroeste de Ecuador perteneceran a 3 de las 8 reas prioritarias para la conservacin en Ecuador. Todos estos estudios apoyan la necesidad de establecer las reas adicionales para la conservacin, y nuestro trabajo sugiere que habra que centrarse en las altitudes medias de la vertiente oriental de los Andes y en la vertiente occidental del norte del pas (provincias de Carchi y Esmeraldas).
129
En un futuro prximo estos modelos de diversidad vegetal se emplearn, junto con modelos de diversidad animal y modelos del efecto del cambio climtico en la diversidad para proponer un diseo de Espacios Naturales Protegidos en Ecuador que complemente la red actual. VARIABLES DE WORLCLIM
B1 B2 B3 B4 B5 B6 B7 B8 B9 B10 B11 B12 B13 B14 B15 B16 B17 B18 B19 Temperatura media anual Rango medio diurno (media mensual (t mx.- t min.)) Isotermicidad (P2/P7) (* 100) Temperatura Estacional (desviacin estndar *100) Temperatura mxima del mes ms clido Temperatura mnima del mes ms fro Rango de Temperatura Anual (P5-P6) Temperatura media del mes ms hmedo Temperatura media del mes ms seco Temperatura media del trimestre ms clido Temperatura media del trimestre ms fro Precipitacin anual Precipitacin del mes ms hmedo Precipitacin del mes ms seco Precipitacin estacional (Coeficiente de variacin) Precipitacin del trimestre ms hmedo Precipitacin del trimestre ms seco Precipitacin del trimestre ms clido Precipitacin del trimestre ms fro
CONSENSO 0,070 0,049 0,489 -0,461 0,048 0,105 -0,209 0,016 0,132 0,042 0,106 0,656 0,563 0,588 -0,436 0,573 0,589 0,487 0,610
MARS P/A -0,223 0,036 0,387 -0,399 -0,235 -0,192 -0,144 -0,233 -0,197 -0,238 -0,191 0,338 0,305 0,272 -0,230 0,293 0,298 0,281 0,310
MAXENT -0,064 0,041 0,339 -0,361 -0,079 -0,040 -0,137 -0,086 -0,028 -0,078 -0,038 0,533 0,541 0,438 -0,214 0,536 0,477 0,582 0,367
Tabla 4.6. Coeficiente de correlacin de Pearson entre tres modelos finales de biodiversidad y las 19 variables bioclimticas de WorldClim.
130
4.6. Anexos
4.6.1. ANEXO I: Tabla de resultados de AUC
En este anexo se muestran los valores de AUC obtenidos en el proceso de verificacin para las 397 especies analizadas en este trabajo. Se comparan los siguientes mtodos de modelado ecolgico: un modelo de consenso (Conse.), MARSMultirrespuesta (Multi.), CART, MARS, Regresin logstica mltiple (RLM), distancia mtrica de Gower (DMG), GARP y MAXENT. En negrita aparece marcado los tres mtodos que presentar valores ms elevados de AUC (sombreado en gris el mayor valor), sin considerar DMG y GARP, como vimos anteriormente para poder evaluar la consistencia de estos dos mtodos es necesario un conjunto de datos independiente. Cdigo: cdigo especfico que se asign a cada especie a la hora de ejecutar los modelos; entre parntesis aparece indicado el nmero de colecciones nicas en la base de datos TROPICOS para cada una de las especies.
AUC ESPECIE Anthurium Anthurium acrobates Anthurium apaporanum Anthurium argyrostachyum Anthurium asplundii Anthurium atropurpureum Anthurium breviscapum Anthurium caulorrhizum Anthurium ceronii Anthurium clavigerum Anthurium coripatense Anthurium corrugatum Anthurium decurrens Anthurium dolichostachyum Anthurium effusilobum Anthurium eminens Anthurium ernestii Anthurium gracile Anthurium harlingianum Anthurium incomptum Anthurium interruptum Anthurium lancea Anthurium longicaudatum Anthurium longispadiceum Anthurium macdanielii Anthurium michelii Anthurium microspadix Anthurium mindense Anthurium nigropunctatum 01000001(39) 01000010(56) 01000011(21) 01000014(25) 01000017(25) 01000028(180) 01000038(21) 01000039(35) 01000042(22) 01000047(22) 01000048(19) 01000057(37) 01000060(106) 01000063(28) 01000064(65) 01000065(95) 01000078(65) 01000087(39) 01000092(33) 01000095(23) 01000100(37) 01000111(25) 01000113(33) 01000118(32) 01000127(56) 01000128(62) 01000129(104) 01000140(44) 0,908 0,954 0,994 1,000 0,918 0,886 1,000 0,935 0,959 0,932 0,915 0,989 0,947 0,968 0,938 0,897 0,827 0,943 0,974 0,992 0,998 0,992 0,957 0,976 0,926 0,972 0,946 0,972 0,892 0,929 0,938 0,826 0,834 0,772 0,994 0,771 0,868 0,823 0,795 0,974 0,861 0,944 0,858 0,814 0,805 0,891 0,902 0,872 0,975 0,947 0,918 0,860 0,850 0,910 0,899 0,928 0,795 0,873 0,873 0,918 0,905 0,929 0,953 1,000 0,820 0,850 0,851 0,839 0,970 1,000 0,809 0,857 0,818 0,892 0,727 0,804 0,789 0,738 0,905 0,982 0,895 0,955 0,963 0,965 0,881 0,856 0,811 0,842 0,800 0,805 0,822 0,870 0,912 0,861 0,804 0,921 0,934 0,992 0,860 0,981 0,848 0,865 0,887 0,950 0,934 0,815 0,978 0,942 0,951 0,911 0,835 0,883 0,958 0,998 1,000 1,000 0,994 0,911 0,667 1,000 1,000 1,000 0,904 1,000 0,992 1,000 0,996 0,953 0,805 1,000 1,000 0,989 1,000 1,000 0,968 0,988 0,990 0,994 0,990 0,987 1,000 1,000 1,000 1,000 1,000 0,969 1,000 1,000 1,000 1,000 1,000 1,000 0,962 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,971 1,000 0,795 0,918 0,929 0,948 0,892 0,900 1,000 0,874 0,915 0,938 0,846 0,972 0,931 0,898 0,911 0,852 0,825 0,947 0,919 0,961 0,986 0,998 0,900 0,894 0,875 0,902 0,939 0,947 0,826 0,934 0,957 0,935 0,880 0,763 0,991 0,885 0,816 0,850 0,890 0,945 0,892 0,932 0,916 0,875 0,760 0,986 0,953 0,856 0,986 0,974 0,902 0,859 0,878 0,935 0,912 0,926 CDIGO Conse. Multi. CART RLM MARS DMG GARP MAXENT
131
ESPECIE Anthurium obtusum Anthurium ochreatum Anthurium ovatifolium Anthurium pallidiflorum Anthurium pendulifolium Anthurium penningtonii Anthurium propinquum Anthurium propinquum Anthurium pseudoclavigerum Anthurium pulchrum Anthurium pulverulentum Anthurium rimbachii Anthurium rodrigueziae Anthurium rubrinervium Anthurium scandens Anthurium subtrigonum Anthurium tremulum Anthurium trilobum Anthurium triphyllum Anthurium trisectum Anthurium truncicolum Anthurium uleanum Anthurium umbraculum Anthurium variegatum Anthurium versicolor BIGNONIACEAE Amphilophium paniculatum Arrabidaea chica Arrabidaea patellifera Arrabidaea pubescens Cydista aequinoctialis Macfadyena unguis-cati Mansoa standleyi Mansoa verrucifera Paragonia pyramidata Pithecoctenium crucigeru Tynanthus polyanthus BROMELIACEAE Aechmea aciculosa Aechmea angustifolia Aechmea hoppii Aechmea longifolia Aechmea penduliflora Aechmea tessmannii Aechmea tillandsioides Catopsis sessiliflora Guzmania acuminata Guzmania alborosea Guzmania altsonii Guzmania angustifolia Guzmania asplundii
CDIGO 01000145(118) 01000146(41) 01000150(58) 01000159(21) 01000167(21) 01000169(25) 01000178(39) 01000180(22) 01000181(68) 01000185(60) 01000186(78) 01000194(30) 01000196(24) 01000197(38) 01000204(37) 01000236(29) 01000242(26) 01000243(43) 01000246(54) 01000247(24) 01000249(66) 01000250(56) 01000252(40) 01000254(20) 01000257(126) 02000007(64) 02000016(30) 02000026(27) 02000027(25) 02000043(39) 02000061(22) 02000066(28) 02000067(26) 02000080(95) 02000084(35) 02000100(24)
Conse. 0,883 1,000 0,962 0,971 0,960 0,998 0,966 0,993 0,909 0,941 0,970 0,993 1,000 0,855 0,890 1,000 0,978 1,000 0,963 0,996 0,969 0,936 0,961 0,929 0,901 0,871 0,783 0,861 0,975 0,878 0,825 0,831 0,857 0,752 0,824 0,917
Multi. 0,697 0,971 0,894 0,950 0,915 0,980 0,949 0,983 0,852 0,855 0,931 0,971 0,958 0,773 0,591 0,971 0,956 0,993 0,915 0,954 0,920 0,902 0,875 0,906 0,842 0,759 0,568 0,759 0,975 0,802 0,600 0,773 0,551 0,579 0,627 0,723
CART
RLM
MARS DMG GARP MAXENT 0,962 1,000 0,974 0,989 1,000 1,000 0,995 1,000 0,927 0,998 0,982 1,000 1,000 0,829 0,958 1,000 1,000 1,000 1,000 1,000 0,998 0,974 0,982 0,903 0,974 0,870 0,893 0,740 0,998 0,932 0,900 0,805 0,936 0,807 0,926 1,000 0,980 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,982 1,000 1,000 1,000 1,000 1,000 1,000 0,963 1,000 1,000 0,985 1,000 1,000 1,000 1,000 0,961 0,993 0,994 1,000 0,996 0,984 0,985 0,990 0,976 0,990 1,000 0,838 0,981 0,952 0,952 0,902 0,938 0,579 0,979 0,905 0,935 0,940 0,999 0,997 0,833 0,713 1,000 1,000 0,979 0,813 0,993 0,937 0,919 0,964 0,935 0,905 0,766 0,698 0,869 0,966 0,831 0,834 0,824 0,517 0,684 0,721 0,854 0,668 0,969 0,928 0,954 0,885 0,951 0,567 0,965 0,865 0,992 0,918 0,970 0,958 0,865 0,777 0,974 0,953 0,981 0,935 0,952 0,937 0,904 0,908 0,912 0,845 0,838 0,698 0,801 0,979 0,864 0,668 0,759 0,539 0,655 0,752 0,886
0,906 0,811 0,999 0,962 0,796 0,920 0,873 0,899 0,905 0,970 0,960 1,000 0,936 0,943 0,929 0,981 0,883 0,878 0,831 0,858 0,974 0,939 0,906 0,964 0,896 1,000 0,771 0,812 0,500 0,500 0,905 1,000 0,998 0,889 1,000 0,986 1,000 0,958 0,885 0,866 0,879 0,911 0,907 0,906 0,776 0,933 0,825 0,903 0,898 0,886 0,500 0,798 0,500 0,720 0,500 0,740 0,979 0,982 0,768 0,758 0,702 0,631 0,904 0,792 0,500 0,647 0,624 0,574 0,500 0,679 0,854 0,919
03003314(21) 03000006(49) 03002534(62) 03003498(24) 03001396(103) 03000051(21) 03000053(34) 03000114(30) 03002801(18) 03003327(16) 03002711(22) 03000911(37) 03002802(24)
0,979 0,964 0,931 0,937 0,971 0,916 0,971 0,964 0,997 0,996 1,000 0,974 1,000
0,851 0,864 0,862 0,868 0,956 0,774 0,851 0,899 0,955 0,958 0,982 0,901 0,995
0,969 0,854 1,000 0,803 0,857 0,909 0,857 0,857 0,877 0,947 0,500 0,824 0,845 0,946 0,972 0,860 0,993 0,976 0,996 0,933 0,841 1,000 0,849 0,943 1,000 1,000
1,000 1,000 0,989 0,955 1,000 0,893 1,000 1,000 1,000 0,990 0,993 1,000 1,000
1,000 1,000 1,000 1,000 0,994 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,998
0,967 0,895 0,886 0,859 0,933 0,831 0,946 0,869 0,984 1,000 0,990 0,895 1,000
0,885 0,893 0,915 0,872 0,953 0,893 0,922 0,911 0,950 0,965 0,993 0,906 0,969
132
ESPECIE Guzmania claviformis Guzmania confusa Guzmania coriostachya Guzmania diffusa Guzmania eduardii Guzmania farciminiformis Guzmania globosa Guzmania gloriosa Guzmania gracilior Guzmania graminifolia Guzmania jaramilloi Guzmania lingulata Guzmania melinonis Guzmania monostachia Guzmania morreniana Guzmania mosquerae Guzmania pearcei Guzmania remyi Guzmania rosea Guzmania scherzeriana Guzmania squarrosa Guzmania testudinis Guzmania vanvolxemii Guzmania variegata Guzmania wittmackii Mezobromelia bicolor Mezobromelia capituligera Mezobromelia pleiosticha Pitcairnia arcuata Pitcairnia bakeri Pitcairnia brongniartiana Pitcairnia dodsonii Pitcairnia ferrell-ingramiae Pitcairnia fusca Pitcairnia heterophylla Pitcairnia hitchcockiana Pitcairnia lehmannii Pitcairnia nigra Pitcairnia pungens Pitcairnia riparia Pitcairnia sceptriformis Pitcairnia simulans Pitcairnia sodiroi Pitcairnia trianae Puya clava-herculis Puya eryngioides Puya hamata Racinaea dielsii Racinaea parviflora Racinaea penlandii Racinaea riocreuxii
CDIGO 03002704(15) 03003785(26) 03000915(44) 03000197(21) 03003337(32) 03189101(17) 03002085(21) 03003240(36) 03002525(45) 03002712(32) 03003343(22) 03000559(58) 03000199(44) 03000560(71) 03000821(20) 03002893(43) 03002838(25) 03002901(32) 03003815(25) 03000552(25) 03001413(80) 03002900(36) 03002892(23) 03002081(37) 03003236(24) 03003506(32) 03003817(27) 03002537(22) 03002425(37) 03002506(31) 03002590(18) 03003379(26) 03128879(29) 03003381(17) 03000948(17) 03003089(19) 03002135(22) 03002395(37) 03000297(99) 03000301(24) 03000635(20) 03003391(25) 03002803(30) 03001900(24) 03002804(18) 03002510(18) 03001836(23) 03003835(20) 03003526(26) 03003528(31) 03003533(25)
Conse. 0,995 0,997 0,960 0,972 1,000 0,996 1,000 0,990 1,000 1,000 0,992 0,897 0,983 0,937 1,000 0,995 0,979 1,000 1,000 0,988 0,987 1,000 0,982 0,971 0,996 0,993 0,969 0,980 0,999 1,000 0,992 0,995 1,000 1,000 1,000 1,000 0,942 0,999 0,992 1,000 1,000 1,000 0,999 0,998 0,997 1,000 0,990 0,993 1,000 0,963 0,946
Multi. 0,981 0,977 0,939 0,923 0,999 1,000 0,984 0,983 0,992 1,000 0,908 0,778 0,915 0,854 0,989 0,984 0,947 0,993 1,000 0,970 0,982 0,997 0,984 0,945 0,950 0,982 0,986 0,952 0,999 0,970 0,980 0,988 0,987 0,922 0,978 0,980 0,918 0,993 0,980 0,964 1,000 0,998 0,994 0,985 0,986 0,992 0,879 0,974 0,983 0,931 0,948
CART
RLM
MARS DMG GARP MAXENT 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,993 1,000 1,000 0,948 1,000 0,989 1,000 1,000 1,000 1,000 1,000 1,000 0,998 1,000 1,000 1,000 0,966 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,942 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,973 0,995 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999 1,000 1,000 1,000 0,992 0,999 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,998 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,759 1,000 1,000 1,000 1,000 0,996 0,998 1,000 0,998 0,993 0,967 0,997 0,942 0,980 0,997 0,996 0,989 0,992 0,998 0,988 0,982 0,855 0,918 0,909 1,000 0,997 0,925 0,999 1,000 0,935 0,978 1,000 0,965 0,966 0,973 0,980 0,966 0,959 1,000 0,994 0,971 0,999 0,993 1,000 1,000 1,000 0,921 0,984 0,920 0,986 1,000 0,766 0,991 0,998 1,000 1,000 0,987 0,990 0,984 0,953 0,884 0,993 0,975 0,926 0,884 0,974 0,992 0,984 0,977 0,990 1,000 0,922 0,837 0,953 0,928 0,988 0,988 0,965 0,990 1,000 0,935 0,967 1,000 0,944 0,950 0,978 0,953 0,838 0,882 0,980 0,977 0,978 0,939 0,992 0,984 0,971 0,971 0,936 0,986 0,982 0,955 1,000 0,774 1,000 0,991 0,986 0,992 0,876 0,962 0,981 0,927 0,896
1,000 0,995 0,990 0,946 0,825 0,884 0,833 0,863 0,984 0,954 1,000 0,987 0,976 1,000 0,952 0,937 0,959 0,995 0,914 1,000 0,875 0,853 0,659 0,773 0,995 0,932 0,736 0,899 1,000 0,942 0,910 0,919 0,972 0,926 0,987 1,000 1,000 1,000 0,965 0,923 0,879 0,906 0,912 1,000 0,857 0,876 0,950 0,894 0,960 0,970 0,854 0,955 0,978 0,764 0,928 0,900 0,988 0,969 1,000 0,948 0,935 0,958 0,999 0,976 0,959 0,993 1,000 0,983 0,906 1,000 0,989 1,000 0,833 0,860 0,970 0,992 0,896 0,969 0,977 1,000 1,000 1,000 0,978 1,000 0,958 0,996 0,864 0,977 0,906 0,983 0,938 1,000 0,950 0,969 0,816 0,885 1,000 0,995 0,911 0,914 0,881 0,927
133
ESPECIE Racinaea schumanniana Racinaea seemannii Racinaea spiculosa Racinaea tetrantha Ronnbergia deleonii Tillandsia asplundii Tillandsia buseri Tillandsia complanata Tillandsia confinis Tillandsia disticha Tillandsia fendleri Tillandsia incarnata Tillandsia lajensis Tillandsia latifolia Tillandsia narthecioides Tillandsia recurvata Tillandsia secunda Tillandsia stenoura Tillandsia superba Tillandsia tovarensis Tillandsia truncata Tillandsia usneoides Vriesea cylindrica Vriesea dubia Vriesea rubrobracteata GESNERIACEAE Besleria barbata Capanea affinis Capanea grandiflora Columnea guttata Columnea inaequilatera Columnea schimpffii Columnea strigosa Diastema scabrum Heppiella verticillata Heppiella ulmifolia Alloplectus medusaeus Alloplectus panamensis Alloplectus ichthyoderma Besleria stricta Chrysothemis friedrichsthaliana Codonanthe crassifolia Codonanthe uleana Columnea angustata Diastema racemiferum Drymonia alloplectoides Drymonia coriacea Drymonia macrophylla Drymonia serrulata Drymonia turrialvae Drymonia warszewicziana
CDIGO 03000003(51) 03003494(27) 03003845(44) 03003495(69) 03003792(25) 03001956(30) 03002894(30) 03000709(139) 03001484(55) 03000422(51) 03000744(36) 03000446(32) 03002613(25) 03000729(32) 03003137(57) 03000584(47) 03000492(23) 03001942(28) 03002806(18) 03001559(19) 03002374(35) 03000586(32) 03002059(26) 03002370(36) 03009046(31)
Conse. 0,991 1,000 0,955 0,982 0,998 0,986 0,997 0,957 0,970 0,952 0,972 0,998 1,000 0,985 0,991 0,989 0,998 0,994 1,000 1,000 0,956 0,970 0,908 0,926 0,982
Multi. 1,000 0,996 0,955 0,959 0,959 0,984 0,975 0,826 0,937 0,907 0,923 0,978 1,000 0,953 0,960 0,980 0,989 0,945 0,937 0,984 0,935 0,905 0,868 0,880 0,985
CART
RLM
MARS DMG GARP MAXENT 1,000 1,000 0,996 0,957 1,000 0,980 1,000 0,983 1,000 0,997 0,947 1,000 1,000 1,000 1,000 0,999 1,000 0,981 1,000 0,959 0,999 0,997 0,915 0,966 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,998 1,000 0,999 0,976 0,997 0,923 0,960 0,999 0,966 1,000 0,901 0,926 0,911 0,945 1,000 1,000 0,964 0,957 0,960 0,998 0,994 0,967 1,000 0,983 0,888 0,929 0,941 0,978 0,959 0,987 0,922 0,962 0,962 0,972 0,951 0,948 0,934 0,965 0,857 0,977 0,997 0,965 0,992 0,974 0,996 0,988 0,963 0,997 0,955 0,959 0,965 0,913 0,952
0,945 0,930 0,960 0,964 0,995 0,897 0,913 0,960 0,968 0,864 0,820 0,964 0,907 0,905 0,906 0,886 0,889 0,868 0,864 0,940 0,790 0,711 0,950 0,965 1,000 1,000 0,981 0,917 0,926 0,948 0,872 0,981 0,909 0,942 0,840 0,960 1,000 0,963 0,944 0,928 0,883 1,000 0,865 0,964 0,761 0,803 0,821 0,867 0,967 0,885
04000115(115) 04000147(75) 04000149(15) 04000159(62) 04000160(59) 04000175(25) 04000178(158) 04000196(85) 04000242(22) 04000289(134) 04000459(26) 04000460(24) 04000469(76) 04000484(30) 04000487(19) 04000490(31) 04000492(34) 04000495(75) 04000546(52) 04000548(25) 04000550(34) 04000555(80) 04000561(76) 04000564(36) 04000566(114)
0,966 0,995 1,000 0,973 0,982 0,931 0,979 0,979 0,986 0,979 0,989 0,994 0,985 0,995 1,000 1,000 0,949 0,969 0,980 1,000 0,941 0,948 0,937 0,981 0,943
0,882 0,940 0,949 0,956 0,947 0,767 0,923 0,739 0,976 0,935 0,966 0,939 0,931 0,940 0,844 0,647 0,873 0,846 0,844 0,959 0,753 0,827 0,741 0,896 0,747
0,854 0,918 0,948 0,988 0,917 1,000 0,981 1,000 0,972 0,926 0,500 0,550 0,910 0,945 0,737 0,832 0,875 0,981 0,926 0,996 0,955 0,810 0,908 0,942 0,925 0,958 0,913 0,936 0,972 1,000 0,964 1,000 0,917 0,915 0,943 0,803 0,810 0,918 1,000 0,991 0,740 0,936 0,802 0,922 0,990 0,868 0,937 0,957 0,985 0,929
1,000 1,000 1,000 1,000 0,992 1,000 0,991 0,922 1,000 0,999 1,000 1,000 1,000 1,000 1,000 1,000 0,971 1,000 1,000 1,000 0,970 0,975 0,994 1,000 0,991
0,992 1,000 1,000 0,943 1,000 1,000 0,990 1,000 1,000 0,983 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999 0,998 1,000 0,980
0,896 0,981 1,000 0,908 0,905 0,868 0,926 0,814 0,960 0,929 0,978 0,972 0,967 0,980 0,967 0,940 0,918 0,936 0,913 1,000 0,850 0,884 0,900 0,922 0,861
0,971 0,976 0,985 0,919 0,971 0,843 0,969 0,894 0,979 0,969 0,899 0,944 0,974 0,948 0,938 0,904 0,945 0,927 0,989 0,990 0,915 0,921 0,902 0,969 0,933
134
ESPECIE Gasteranthus wendlandianus Monopyle macrocarpa Neomortonia rosea Paradrymonia metamorphophylla Monopyle sodiroana Drymonia urceolata Columnea picta Kohleria inaequalis Alloplectus teuscheri Columnea tenensis Columnea dielsii Alloplectus schultzei Besleria aggregata Drymonia semicordata Gasteranthus corallinus Besleria solanoides Besleria variabilis Columnea ciliata Columnea ericae Columnea tessmannii Columnea villosissima Corytoplectus speciosus Drymonia affinis Drymonia coccinea Drymonia hoppii Drymonia pendula Kohleria spicata Nautilocalyx ecuadoranus Paradrymonia ciliosa Paradrymonia longifolia Columnea kucyniakii Columnea spathulata Pearcea sprucei Diastema affine Gasteranthus pansamalanus Alloplectus tetragonoides Columnea byrsina Columnea albiflora Columnea lehmannii Cremosperma castroanum Alloplectus dodsonii Columnea minor Cremosperma hirsutissimum Drymonia killipii Alloplectus tenuis Alloplectus bolivianus Alloplectus purpureus Alloplectus sprucei Gloxinia dodsonii Columnea fuscihirta Pearcea hispidissima
CDIGO 04000575(32) 04000580(74) 04000592(19) 04000601(18) 04000886(27) 04001006(80) 04001007(128) 04001008(36) 04001010(151) 04001011(31) 04001048(25) 04001053(16) 04001062(113) 04001064(21) 04001065(130) 04001089(49) 04001092(21) 04001100(31) 04001102(155) 04001113(20) 04001114(66) 04001118(19) 04001123(34) 04001126(158) 04001134(98) 04001137(79) 04001161(105) 04001169(41) 04001180(30) 04001183(20) 04001234(23) 04001411(58) 04001457(127) 04001458(51) 04001469(56) 04001488(133) 04001495(30) 04001505(18) 04001507(26) 04001509(29) 04001526(42) 04001532(72) 04001534(30) 04001536(19) 04001538(37) 04001572(19) 04001573(25) 04001580(75) 04001582(41) 04001583(20) 04001597(17)
Conse. 0,996 0,910 1,000 0,987 0,987 0,990 0,994 0,994 0,994 0,917 0,991 0,995 0,986 0,885 0,957 0,981 1,000 1,000 0,977 1,000 0,965 1,000 0,991 0,977 0,999 0,986 0,981 0,983 0,898 0,921 1,000 0,982 0,984 0,978 0,970 0,990 0,986 1,000 1,000 0,991 0,980 0,988 1,000 0,996 1,000 0,989 0,998 0,990 1,000 0,965 0,983
Multi. 0,990 0,744 0,999 0,977 0,899 0,978 0,895 0,956 0,952 0,793 0,873 0,952 0,951 0,944 0,766 0,927 0,911 0,998 0,892 1,000 0,893 0,947 0,879 0,881 0,964 0,909 0,853 0,940 0,757 0,709 0,968 0,913 0,975 0,816 0,928 0,935 0,903 0,985 1,000 0,902 0,825 0,896 0,985 0,926 0,939 0,926 0,986 0,973 0,987 0,959 0,942
CART
RLM
0,852 0,962 0,973 0,841 1,000 1,000 0,990 0,899 0,957 0,917 0,984 0,984 0,827 0,976 1,000 0,974 0,987 0,928 0,877 0,922 0,913 0,961 0,857 0,962 0,903 0,964 0,971 0,827 0,845 0,946 0,958 0,938 0,933 1,000 1,000 1,000 0,970 0,982 1,000 1,000 0,827 0,941 1,000 1,000 0,999 0,960 0,932 0,946 0,900 1,000 0,926 0,938 0,764 0,837 0,900 0,946 0,902 0,758 0,853 0,874 0,977 0,982 0,781 0,926 0,928 0,972 0,962 0,764 0,875 0,936 0,982 0,969 0,959 0,901 0,912 1,000 1,000 1,000 0,975 0,952 0,908 0,947 0,966 0,948 0,857 0,972 0,879 0,984 0,891 0,990 0,938 0,926 0,980 0,984 0,964 0,964 0,973 1,000 0,875 0,785 0,833 0,929
135
ESPECIE Alloplectus herthae Besleria comosa Columnea kienastiana Pearcea schimpfii Kohleria villosa Columnea eburnea Gasteranthus quitensis Columnea rubriacuta Columnea minutiflora Pearcea abunda Pearcea reticulata Gasteranthus lateralis Drymonia brochidodroma Columnea mastersonii Columnea medicinalis Gasteranthus calcaratus Alloplectus grandicalyx LAURACEAE Aniba guianensis Aniba hostmanniana Beilschmiedia alloiophylla Beilschmiedia costaricensis Cinnamomum napoense Cinnamomum triplinerve Endlicheria formosa Endlicheria griseo-sericea Endlicheria ruforamula Nectandra acutifolia Nectandra crassiloba Nectandra laurel Nectandra membranacea Nectandra obtusata Nectandra purpurea Nectandra reticulata Ocotea aciphylla Ocotea bofo Ocotea cernua Ocotea floribunda Ocotea infrafoveolata Ocotea insularis Ocotea javitensis Ocotea oblonga Ocotea quixos Persea mutisii Pleurothyrium trianae Rhodostemonodaphne kunthiana PAPILIONACEAE Abarema jupunba Abarema laeta Acacia macracantha
CDIGO 04001629(44) 04001634(29) 04001667(25) 04001748(19) 04001790(56) 04001800(63) 04001801(60) 04001810(74) 04001912(38) 04002078(27) 04002080(24) 04069106(22) 04071694(25) 04073943(36) 04073945(96) 04079416(82) 04217886(27)
Conse. 0,995 0,980 1,000 0,996 0,989 0,983 0,998 0,996 0,991 0,957 0,968 1,000 1,000 0,994 0,989 0,981 1,000
Multi. 0,980 0,870 0,876 0,992 0,916 0,928 0,983 0,951 0,986 0,814 0,928 0,995 0,964 0,904 0,903 0,913 0,998
CART
RLM
MARS DMG GARP MAXENT 1,000 0,997 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,998 1,000 1,000 1,000 1,000 1,000 1,000 0,865 0,990 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,999 1,000 1,000 0,958 0,991 0,988 0,987 0,921 0,993 0,856 0,983 0,931 0,911 1,000 0,975 0,989 0,927 0,941 0,998 0,986 0,927 0,989 0,969 0,946 0,975 0,995 0,990 0,984 0,879 0,953 0,988 0,950 0,965 0,957 0,954 0,984
0,934 0,971 0,992 0,920 0,872 1,000 0,933 0,500 0,935 0,927 0,963 0,940 0,895 0,993 0,994 0,992 0,931 0,984 0,870 0,879 0,864 0,811 0,925 1,000 0,837 0,983 0,825 0,977 0,977 0,947 0,981 0,968 0,938 1,000
05800524(20) 05800128(29) 05802444(38) 05802678(21) 05805581(26) 05803333(40) 05802388(34) 05189478(26) 05189460(21) 05800057(25) 05805990(30) 05801070(49) 05801086(85) 05806049(42) 05800084(54) 05800085(42) 05800041(45) 05801157(29) 05800185(73) 05800218(41) 05805586(34) 05800241(80) 05804691(86) 05800282(32) 05805788(21) 05801350(22) 05804299(40) 05804394(37)
1,000 0,886 0,938 0,997 0,905 0,936 0,975 0,994 0,997 0,951 0,935 0,995 0,909 0,982 0,893 0,984 0,932 0,974 0,839 0,994 0,958 0,981 0,957 0,832 0,934 0,987 0,877 0,935
0,936 0,769 0,731 0,801 0,794 0,886 0,956 0,927 0,904 0,862 0,901 0,917 0,866 0,925 0,839 0,775 0,868 0,660 0,641 0,822 0,935 0,916 0,902 0,812 0,795 0,971 0,785 0,745
1,000 0,904 0,500 0,735 0,938 0,879 0,920 0,965 0,825 0,841 0,500 0,730 0,889 0,978 0,958 0,879 0,861 0,978 0,748 0,500 0,839 0,784 0,979 0,988 0,865 0,815 0,895 0,979 0,897 0,865 0,950 0,801 0,824 0,844 0,954 0,753 0,679 0,693 0,500 0,817 0,883 0,892 0,945 0,895 0,870 0,934 0,500 0,785 0,868 0,886 0,900 0,950 0,820 0,870 0,500 0,839
1,000 0,968 0,823 1,000 0,841 0,999 1,000 0,983 1,000 0,962 1,000 0,992 0,971 1,000 0,906 0,983 0,985 1,000 0,810 1,000 1,000 0,995 0,999 0,946 0,888 1,000 0,912 0,991
1,000 0,988 1,000 0,961 0,997 0,965 0,996 0,991 1,000 1,000 1,000 0,999 0,919 0,996 0,983 0,947 0,976 0,998 0,957 0,992 1,000 1,000 0,996 0,995 0,993 1,000 0,976 0,981
1,000 0,906 0,832 0,931 0,894 0,886 0,949 0,856 0,986 0,800 0,905 0,968 0,795 0,953 0,807 0,888 0,873 0,895 0,756 0,929 0,926 0,876 0,818 0,627 0,895 0,967 0,734 0,885
0,958 0,726 0,876 0,975 0,872 0,874 0,893 0,896 0,935 0,848 0,846 0,979 0,863 0,957 0,880 0,833 0,883 0,830 0,748 0,880 0,980 0,949 0,823 0,537 0,838 0,987 0,819 0,826
06000004(26) 06076353(29) 06004152(50)
0,940 0,850 0,978
0,827 0,801 0,929
0,768 0,853 0,773 0,714 0,838 0,950
1,000 0,956 1,000
1,000 1,000 1,000
0,915 0,834 0,930
0,814 0,803 0,920
136
ESPECIE Albizia multiflora Amicia glandulosa Andira inermis Astragalus geminiflorus Bauhinia aculeata Bauhinia brachycalyx Bauhinia guianensis Bauhinia tarapotensis Brownea coccinea Brownea grandiceps Brownea multijuga Browneopsis ucayalina Caesalpinia glabrata Caesalpinia spinosa Calliandra angustifolia Calliandra pittieri Calliandra trinervia Calopogonium mucunoides Cedrelinga cateniformis Centrolobium ochroxylum Chamaecrista nictitans Coursetia caribaea Coursetia dubia Coursetia grandiflora Crotalaria nitens Dalea coerulea Dalea humifusa Desmodium adscendens Desmodium axillare Desmodium intortum Desmodium molliculum Dialium guianense Dussia lehmannii Dussia tessmannii Erythrina amazonica Erythrina edulis Erythrina megistophylla Erythrina peruviana Erythrina poeppigiana Erythrina schimpffii Erythrina smithiana Geoffroea spinosa Gliricidia brenningii Hymenaea oblongifolia Indigofera suffruticosa Inga acreana Inga alba Inga auristellae Inga capitata Inga cayennensis
CDIGO 06076498(29) 06046603(24) 06048538(22) 06016768(35) 06027181(35) 06000761(18) 06027298(57) 06043415(52) 06003119(27) 06003122(134) 06003135(26) 06003149(77) 06027587(47) 06003320(64) 06004722(34) 06004911(17) 06004978(68) 06045056(29) 06008019(36) 06008024(19) 06028581(24) 06069026(22) 06028870(34) 06028872(16) 06029351(47) 06014068(132) 06014132(30) 06018304(57) 06018324(34) 06017674(25) 06018472(38) 06017824(42) 06000613(21) 06000618(28) 06009244(29) 06009270(82) 06009298(25) 06009309(24) 06009315(26) 06009322(26) 06009325(37) 06048869(29) 06083424(21) 06005959(30) 06021076(40) 06006102(51) 06021157(35) 06006123(47) 06006163(52) 06006177(34)
Conse. 1,000 0,996 0,986 0,992 0,963 0,973 0,908 0,932 0,990 0,999 1,000 1,000 0,993 0,999 0,986 1,000 0,995 0,906 0,907 0,983 0,930 0,988 1,000 1,000 0,926 0,991 1,000 0,866 0,894 0,983 0,977 0,980 0,976 0,962 0,985 0,971 1,000 0,997 0,933 0,976 0,904 0,998 0,960 0,958 0,970 0,941 0,961 0,976 0,885 0,999
Multi. 0,987 0,983 0,976 0,987 0,900 0,871 0,901 0,874 0,980 0,966 0,997 0,980 0,989 0,979 0,961 1,000 0,966 0,890 0,823 0,924 0,934 0,968 0,995 0,996 0,821 0,979 0,986 0,756 0,733 0,924 0,948 0,939 0,927 0,915 0,888 0,928 0,950 0,938 0,783 0,954 0,879 0,989 0,963 0,952 0,867 0,885 0,800 0,981 0,908 0,994
CART
RLM
MARS DMG GARP MAXENT 1,000 1,000 1,000 1,000 0,942 0,988 0,984 0,988 1,000 0,999 0,998 0,999 0,954 1,000 1,000 1,000 0,995 0,972 0,956 0,976 0,895 1,000 1,000 1,000 0,991 1,000 1,000 0,957 0,941 1,000 0,988 0,988 0,969 0,976 0,965 0,973 1,000 1,000 0,958 1,000 0,950 1,000 1,000 1,000 1,000 0,996 0,996 1,000 0,981 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,998 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,993 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,978 0,992 0,990 0,922 0,935 0,947 0,392 0,905 0,995 0,952 0,978 1,000 0,978 0,984 0,961 1,000 0,959 0,869 0,844 0,995 0,898 0,954 0,994 1,000 0,825 0,964 0,999 0,639 0,728 0,924 0,968 0,942 0,899 0,952 0,959 0,908 0,991 0,987 0,887 0,924 0,882 0,966 0,932 0,951 0,837 0,926 0,940 0,953 0,906 1,000 0,990 0,960 0,929 0,992 0,948 0,811 0,366 0,984 0,966 0,996 1,000 0,997 0,982 0,986 0,954 1,000 0,961 0,793 0,858 0,944 0,906 0,997 0,992 1,000 0,877 0,984 0,994 0,805 0,812 0,934 0,968 0,959 0,896 0,866 0,968 0,950 0,927 0,983 0,748 0,846 0,876 0,996 0,966 0,922 0,877 0,881 0,858 0,961 0,805 0,976
0,926 0,990 0,870 0,930 0,909 0,821 0,926 0,995 0,900 0,965 1,000 0,744 0,789 0,909 0,825 0,864 0,955 0,933 0,993 0,994 0,957 1,000 0,977 0,990 0,985 0,988 0,885 0,976 0,995 0,981 1,000 1,000 0,961 0,960 0,763 0,813 0,790 0,788 0,806 0,849 0,900 0,820 0,975 0,985 0,931 0,984 0,969 1,000 0,770 0,910 0,981 0,994 0,964 1,000 0,991 0,740 0,500 0,670 0,942 0,978 0,879 0,960 0,989 0,972 0,778 0,878 0,995 0,897 0,917 0,965 0,871 0,933 0,995 1,000 0,850 0,981 0,977 0,783 0,500 0,916 0,806 0,898 0,979 0,996 0,944 0,957 0,962 0,817 0,500 0,848 0,849 0,887 0,925 0,855 0,940 0,933 0,978 0,827 0,982 0,979
137
ESPECIE Inga ciliata Inga coruscans Inga densiflora Inga edulis Inga insignis Inga leiocalycina Inga marginata Inga multinervis Igna novilis Inga oerstediana Inga punctata Inga ruiziana Inga sapindoides Inga sertulifera Inga silanchensis Inga spectabilis Inga tenuistipula Inga thibaudiana Inga velutina Leucaena trichodes Lonchocarpus seorsus Lonchocarpus utilis Lupinus microphyllus Lupinus pubescens Lupinus ramosissimus Lupinus tauris Machaerium cuspidatum Machaerium millei Macrolobium acaciifolium Mimosa acantholoba Mimosa albida Mimosa debilis Mimosa myriadenia Mimosa polydactyla Mimosa quitensis Mucuna rostrata Myroxylon balsamum Otholobium brachystachyum Otholobium mexicanum Parkia balslevii Parkia multijuga Phaseolus coccineus Pithecellobium excelsum Platymiscium stipulare Prosopis juliflora Pseudosamanea guachapele Pterocarpus amazonum Senna alata Senna bacillaris Senna bicapsularis Senna dariensis
CDIGO 06006188(48) 06006205(28) 06006216(46) 06006228(86) 06006299(20) 06008789(37) 06021299(94) 06076413(44) 06008849(80) 06008862(56) 06008911(73) 06008938(87) 06008949(41) 06021380(20) 06047765(20) 06021384(39) 06009013(30) 06009018(59) 06009037(25) 06021952(57) 06090579(21) 06009939(22) 06037051(65) 06014482(26) 06037092(17) 06037130(54) 06014790(51) 06014845(30) 06014898(49) 06036082(23) 06036107(72) 06036252(17) 06036550(28) 06045255(37) 06016507(39) 06000203(21) 06003351(21) 06072539(21) 06071171(103) 06067609(50) 06031301(36) 06012164(17) 06031904(50) 06032022(20) 06032104(28) 06015326(17) 06015486(19) 06032838(23) 06041262(83) 06032844(30) 06041308(43)
Conse. 1,000 0,771 0,952 0,865 1,000 0,911 0,961 0,979 0,941 0,874 0,877 0,926 0,898 0,991 1,000 0,871 1,000 0,938 0,995 0,995 0,983 0,984 0,991 1,000 0,980 0,989 0,990 0,977 0,998 0,989 0,977 1,000 0,947 0,985 0,990 0,866 0,834 0,997 0,999 0,979 0,971 1,000 0,998 0,918 1,000 0,938 0,926 0,867 0,971 0,983 0,990
Multi. 0,980 0,625 0,902 0,768 0,944 0,807 0,830 0,500 0,805 0,754 0,821 0,884 0,802 0,947 0,926 0,778 0,963 0,872 0,891 0,979 0,500 0,921 0,991 1,000 0,926 0,511 0,942 0,950 0,950 0,973 0,945 0,997 0,882 0,933 0,981 0,742 0,713 0,997 0,996 0,923 0,912 0,973 0,990 0,827 0,991 0,957 0,922 0,837 0,961 0,940 0,947
CART
RLM
1,000 1,000 0,500 0,644 0,900 0,877 0,878 0,789 0,882 0,994 0,700 0,758 0,779 0,827 0,923 0,904 0,960 0,895 0,799 0,725 0,843 0,811 0,807 0,876 0,717 0,749 0,974 0,985 0,500 1,000 0,700 0,822 0,942 1,000 0,870 0,851 0,932 0,991 0,969 0,980 0,969 0,958 0,921 0,968 0,971 0,988 0,974 0,998 0,906 0,953 0,989 0,972 0,905 0,910 0,880 0,930 0,933 1,000 1,000 0,993 0,859 0,950 0,971 0,993 0,870 0,931 0,887 0,913 0,829 0,983 0,853 0,650 0,500 0,690 0,974 0,997 0,970 0,990 0,938 0,948 0,912 0,914 0,933 0,976 0,966 0,997 0,896 0,856 0,981 0,974 0,500 0,910 0,833 0,785 0,500 0,693 0,951 0,972 0,885 0,972 0,937 0,950
138
ESPECIE Senna incarnata Senna macrophylla Senna mollissima Senna multiglandulosa Senna multijuga Senna pistaciifolia Senna reticulata Senna ruiziana Stryphnodendron porcatum Swartzia arborescens Swartzia bombycina Swartzia haughtii Swartzia simplex Vicia andicola Vicia setifolia Zygia coccinea Zygia heteroneura Zygia lathetica Zygia longifolia
CDIGO 06041351(16) 06041374(75) 06041385(34) 06041394(86) 06041395(28) 06041468(22) 06041488(28) 06041497(50) 06070915(25) 06001674(33) 06064475(24) 06013516(48) 06033289(72) 06034617(45) 06007255(47) 06075865(72) 06007142(23) 06076101(27) 06013106(36)
Conse. 1,000 0,970 0,997 0,998 1,000 1,000 0,941 0,954 0,972 1,000 0,998 0,998 0,973 0,989 0,998 0,993 1,000 0,996 0,932
Multi. 0,996 0,922 0,960 0,981 0,998 0,997 0,903 0,927 0,872 0,971 0,957 0,960 0,949 0,964 0,997 0,938 0,990 0,500 0,875
CART
RLM
MARS DMG GARP MAXENT 1,000 0,955 1,000 1,000 1,000 1,000 0,995 1,000 0,960 1,000 1,000 1,000 0,986 0,997 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 1,000 0,906 0,987 0,974 1,000 1,000 0,863 0,862 0,905 0,978 1,000 0,980 0,960 0,967 0,996 0,943 1,000 0,940 0,834 1,000 0,956 0,988 0,996 0,996 1,000 0,885 0,905 0,967 0,973 1,000 0,987 0,959 0,974 0,992 0,984 0,988 0,982 0,900
0,933 1,000 0,892 0,926 0,997 0,991 0,965 0,997 1,000 0,992 1,000 1,000 0,714 0,886 0,841 0,915 0,870 0,929 0,917 1,000 1,000 0,995 0,892 1,000 0,894 0,929 0,949 0,959 0,987 0,977 0,933 1,000 0,932 0,988 0,904 1,000 0,833 0,855
4.6.2. ANEXO II: Flujo de trabajo

En este Anexo se muestran los pasos ms importantes para llevar a cabo este captulo. Con ello queremos mostrar de una forma ordenada los pasos que se deben dar para realizar trabajos de modelado ecolgico. Una parte del proceso est automatizado mediante diferentes sintaxis de programacin (ArcInfo, SPSS, CART y MARS) elaboradas por nosotros. Esta automatizacin ha permitido disminuir la posibilidad de errores humanos.
A.- Preparacin de los datos

A.1.- Crear un rbol de directorios acorde con los objetivos y datos del proyecto. Donde se almacenan todos los datos de partida y todos los datos creados durante el desarrollo del proyecto. Los directorios deben tener nombres cortos (no ms de 9 dgitos) y no deben contener espacios. A.2.- Generar un polgono marco sin islas que se emplear como mscara (extensin) del anlisis. Se almacena como F:\FBBVA\SUPPLM\sample_mask.shp A.3.- Los datos de presencia de las especies se guardan en tablas diferentes, una de ellas para cada familia. Por ejemplo la tabla de las arceas se almacena en el directorio F:\FBBVA\PLANTS\01ARAC\ 01araceae.mdb. Esta tabla incluir los siguientes campos: TAX_ID REC_ID FAMILY_NAM FULL_NAME CNTRY_NAME PROV_NAME LOWER_NAME ELEV_DISP COORD_DISP COLLECTOR SENIOR_COL COLL_NUMB DATE_DISP DET_BY Y_LAT X_LONG LOCALITY_D PRES_AUS
139
Estos campos tendrn los siguientes valores, veamos un ejemplo: 01000001 381000 Araceae Anthurium acrobates Sodiro Ecuador Sucumbios Sucumbios 190 m 0,33S 075,13W Lawesson, J.E., T. Lsse & P.M. Jorgensen LAWESSON 44466,00000 16 Jun 1983 - 17 Jun 198 T. Croat, 1985 -0,55000 -75,21660 vic. Redondo Cocha 1 El campo Tax_id es un cdigo especfico (<codeespecie>, de ahora en adelante) generado por nosotros. Las dos primero dgitos indican la familia (01 = araceae, 02 = bignoniaceae, 03 = bromeliaceae, 04 = gesneriaceae, 05 = lauraceae, 06 = papilionaceae), los tres siguientes el gnero, y los tres ltimos la especie. Este campo tendr formato de texto. Para posteriores trabajos se recomienda no comenzar este cdigo por cero, puede generar problemas en fases posteriores a la hora de generar archivos en formato rster. El campo "Pres_aus" tiene valor 1 para todas las filas y formato de nmero. Este valor ndica presencia de la especie. Agrupar subespecies dentro una misma especie. A.4.- Convertir esta tabla en un tema de puntos (formato shapefile de ArcView). Seleccionamos aquellas especies que tienen ms de 15 colecciones: Primero exportar los datos en una tabla en formato DBASEIV de Excel. Abrir un proyecto de ArcView, abrir el modulo de tablas (Tables), carga la tabla (Add), abrir el modulo de vista (View) y seguir las siguientes opciones: View, Add event theme y seleccionar las siguientes opciones:
A continuacin seguir los siguientes pasos: Theme, Conver to Shapefile y guardar el tema de puntos en el siguiente directorio F:\FBBVA\PLANTS\01ARAC\01arac.shp. A.5.- Revisar los datos de georreferenciacin de todas las especies. Para ello utilizar mapas en papel, mapas digitales, gazetteer, ArcMap, y la informacin registrada en la tabla (colector, localidad, identificador, etc). Si los datos no ofrecen suficiente fiabilidad eliminarlos.
140
A.6.- Descargar variables independientes (19 variables climticas de WorldCLim) y recortarlas para la zona de estudio. Almacenarlas en el directorio F:\FBBVA\INDVAR\ACTUAL A.7.- Proyectar al geoide de referencia (WGS84) las variables de WorlClim y los archivos de presencia de las diferentes familias. Formato vectorial: En ArcMap seguir los siguientes pasos: Activar ArcTool Box, Data Management Tools, Projections and transformations, Define projection (Buscar el shapefile que queremos georreferenciar), Select a predefine coordinate system. Geographic coordinate system; World; WGS 1984.prj Formato rster: desde ArcInfo 9.1 podemos ejecutar la sintaxis 07_wgs84.aml, para poder ejecutarla tenemos que situarnos en el directorio en el que estn los rster que queremos georreferenciar.
B.- Generacin del rster de muestreo

B.1.- Para cada familia generamos un proyecto de ArcView (F:\FBBVA\PLANTS\01ARAC\sampling_araceae.apr) Ajustar propiedades de la vista: Map Units: decimal degrees. Distance Units: kilometres. Generar una vista, donde debemos cargar: Los puntos de la familia (F:\FBBVA\PLANTS\01ARAC\01arac.shp). Un rster de WorldClim para usar de plantilla en Analysis Properties. Polgono marco sin islas (F:\FBBVA\SUPPLM\sample_mask.shp), se emplear como mscara en los anlisis. B.2.- Para saber el nmero de presencias de cada una de las especie (slo vamos a trabajar con aquellas especies que contengan un mnimo de 15 presencias), abrir la tabla que contiene la informacin para toda la familia (F:\FBBVA\PLANTS\01ARAC\01arac.dbf), sumar () por la columna Tax_id y aadimos (Add) la columna FULL_NAME, para conocer el nombre de la especie. Exportar esta tabla y almacenar en el directorio: F:\FBBVA\PLANTS\01ARAC\01arac_species.dbf. Convertir en un archivo de texto separado por comas (01arac_species.csv) y eliminamos el archivo *.dbf. Proceso para generar los datos de presencia para cada una de las especies B.3.- Seleccionar (Query) la especie en el tema de puntos de la familia. Seguir el siguiente esquema:
141
B.4.- Convertir en un tema de puntos (shapefile) que se almacena de la siguiente forma: F:\FBBVA\PLANTS\01ARAC\01001001(n)_all.shp. Siendo n el nmero de presencias total para la especie con la que estamos trabajando. B.5.- Transformar a rster con el nombre <codeespecie>p. F:\FBBVA\PLANTS\01ARAC\01001001p Coger el campo pres_aus como valor de las celdas (1). Este valor indica presencia de la especie en anlisis posteriores. No aadir el resto de los datos al nuevo rster. Proceso para generar pseudo-ausencias para cada especie B.6.- Cargar la extensin Random point generator 1.28 en el mismo proyecto de ArcView (File, Extensions). Previamente tenemos que guardar la extensin correspondiente (Random point generator 1.28) en el directorio: C:\ESRI\AV_GIS30\ARCVIEW\EXT32\ Seleccionar la opcin: with respect to polygons in a polygon theme. Generar n puntos (n= nmero de presencias) siguiendo el esquema siguiente:
142
En este caso n (nmero de presencias) = 20 Salvar el tema de puntos que hemos generado como F:\FBBVA\PLANTS\01ARAC\<codespecie>n.shp Proceso para seleccionar pseudo-ausencias situadas a una distancia inferior de 30 km respecto de las presencias y borrarlas (zona tampn) B.7.- Seleccionar (opcin Query de ArcView) la especie en el tema de puntos de la familia (arac.shp). B.8.- Activar el tema de puntos que acabamos de de crear (<codespecie>n.shp), haciendo clic con el ratn sobre l. B.9.- Seleccionar los puntos ejecutando la opcin Select by Theme, donde elegimos la siguientes opciones:
143
B.10.- Para eliminar los puntos seleccionados seguir los siguientes pasos: Table, start editing, delete records y stop editing. B.11.- Transformar a rster con el mismo nombre (<codespecie>n) y elegir la siguiente opcin: Pick field for cell values: Sample_mas. Guardar en el directorio F:\FBBVA\PLANTS\01ARAC\01001001n Proceso para sumar los rster de presencia y ausencia B.12.- Ejecutar desde ArcInfo AADIRLE el sufijo n ni p). Arc: &r 01_sumagrid <codeespecie> (SIN
Se trata de una sintaxis con la que obtenemos un rster con valores de 1 (presencia) y 0 (ausencia), se almacena automticamente en F:\FBBVA\PLANTS\01ARAC\01001001t Proceso para crear archivo de texto con el valor de las variables independientes para las localidades de presencia y ausencia de la especie B.13.- Ejecutar desde Arcinfo Arc: &r 02_sample <family dir> <codeespecie>
Con esta sintaxis obtenemos un archivo de texto con los valores de las 19 variables bioclimticas en las localidades de presencia o ausencia de la especies. Estos datos se utilizarn para realizar el anlisis estadstico y los diferentes modelos con los diferentes mtodos. El archivo de texto se almacena automticamente en el directorio: F:\FBBVA\TABLES\01ARAC\SAMPLE\01000001(39)_01.txt En este ejemplo 39 es el nmero de colecciones que existe para esta especie (01000001) en la base de datos. 01 nos indica que empleamos aproximadamente el mismo nmero de presencias que de ausencias. Anteriormente realizamos diferentes anlisis con un mayor nmero de pseudo-ausencias (doble, triple, etc.) y vimos que se obtienen resultados muy similares. B.14.- Repetir el paso 2 para todas las especies que tengan ms de 15 presencias.
C.- Anlisis estadstico y proceso para generar modelos con RLM, CART y MARS
Anlisis estadsticos y anlisis de casos atpicos
144
C.1.- Abrir la sintaxis de SPSS _01_FBBVA_IMPORT.SPS y remplazar el valor <codeespecie> empleando CTRL-H para evitar posibles errores (2 cambios). Ejecutar la sintaxis. Esta sintaxis importa el archivo de muestreo que hemos elaborado anteriormente y lo convierte en un archivo de datos de SPSS (*.sav), elimina todos los datos que tengan valores perdidos (missing) y lo almacena como: F:\FBBVA\TABLES\01ARAC\SPSS\<codeespecie>.sav C.2.- Ejecutar la sintaxis de SPSS _02_FBBVA EXPLORE & LMR.SPS Esta sintaxis realiza las siguientes acciones: Crea dos nuevas variables: filter_$ y casenum . La primera se utiliza para seleccionar los puntos de presencia (pres_aus = 1) en los anlisis exploratorios que se ejecutan posteriormente. La segunda variable (casenum) se utiliza en el proceso de ejecucin de la RLM y para calcular las distancia de Mahalanobis. Un anlisis de correlacin entre las variables de temperatura y otro entre las variables de precipitacin. Una serie de anlisis para cada una de las variables bioclimticas por separado: o Estadstica descriptiva y un histograma. o Los anlisis de normalidad de Kolmogorov-Smirnov y Shapiro-Wilk; casos atpicos univariantes y multivariantes. o Boxplot de todas las variables independientes. Una regresin lineal para poder generar la distancia de Mahalanobis para cada uno de los puntos de presencia respecto al centroide del espacio multivariante. Una exploracin del grfico (boxplot) de las distancias de Mahalanobis permite observar posibles datos atpicos (outliers). Ejecuta un modelo de Regresin Logstica Multivariante (RLM) por pasos y nos indica la ecuacin (constantes y variables incluidas en el modelo). Tambin aade una nueva columna al archivo de datos con la probabilidad predicha por este modelo en las localidades de presencias y ausencia. Salva los resultados de este anlisis en un archivo de resultados de SPSS (*.spo): F:\FBBVA\TABLES\01ARAC\SPSS\<codeespecie>.spo
C.3.- Analizar los resultados de estos anlisis, especialmente los casos atpicos. Si existe uno o varios casos atpicos (outliers) revisar toda la informacin para estas colecciones: localidad, recolector, quien identific la coleccin, etc. Si existe algn error en la georreferenciacin rectificarlo. Si no es posible o los datos sobre la identificacin no ofrecen suficiente confianza eliminar ese registro. C.4.- Si existen casos atpicos y se han eliminado volver a correr la sintaxis hasta que no existan casos atpicos. C.5.- Eliminar del anlisis todas aquellas especies que tengan menos de 15 datos de presencia. Tener presente que el nmero de presencias se ve reducido despus de descartar casos atpicos, datos perdidos (missing) y colecciones que presentan en la misma celda de un kilmetro de lado. Proceso para generar modelos de CART C.6.- Ir al directorio F:\FBBVA\TABLES\01ARAC\CART y comprimir los archivos que existan procedentes del anlisis de la anterior especie, dentro del archivo CART.rar
145
C.7.- Abrir la sintaxis del programa CART (*.cmd) que se encuentra en ese directorio con un editor de texto. Remplazar <codeespecie> de la anterior especie por la especie que vamos a ejecutar ahora. Emplear la opcin reemplazar del editor de texto para no cometer errores. Guardar la sintaxis con el nombre <codeespecies>.cmd C.8.- Ejecutar el programa CART 5.0 y correr la opcin submit command file buscar la sintaxis que acabamos de crear (<codeespecies>.cmd) Esta sintaxis ejecuta el modelo de CART con los parmetros seleccionados y almacena los resultados del anlisis (valores de probabilidad predichos por el modelo, rbol de clasificacin, etc.) en el directorio: F:\FBBVA\TABLES\01ARAC\CART Proceso para generar modelos de MARS C.9.- Ir al directorio F:\FBBVA\TABLES\01ARAC\MARS y comprimir los archivos que existan procedentes del anlisis de la anterior especie, dentro del archivo MARS.rar C.10.- Abrir la sintaxis del programa MARS (*.cmd) que se encuentra en ese directorio con un editor de texto. Remplazar <codeespecie> de la anterior especie por la especie que vamos a ejecutar ahora. Emplear la opcin reemplazar del editor de texto para no cometer errores. Guardar la sintaxis con el nombre <codeespecies>.cmd C.11.- Ejecutar el programa MARS 2.0 y correr la opcin submit command file buscar la sintaxis que acabamos de crear (<codeespecies>.cmd). Esta sintaxis ejecuta el modelo de MARS con los parmetros seleccionados y almacena los resultados del anlisis (valores de probabilidad predichos por el modelo, funciones bsicas, nodos, grficos, etc.) en el directorio: F:\FBBVA\TABLES\01ARAC\MARS Mediante esta sintaxis se generan un total de 30 modelos para cada una de las especies, variando los distintos parmetros que permite el anlisis (mximo nmero de funciones bsicas, velocidad del anlisis, variables incluidas en el anlisis y si se permiten interacciones entre las funciones bsicas o no). Los resultados de cada de los modelos se guardan segn un cdigo que sigue las siguientes indicaciones: n= no se permiten interacciones entre funciones bsicas y= se permiten interacciones
<codeespecie> + L (funcin logit)
N de funciones bsicas
speed factor
1|12= n de las variables eliminadas int= se incluyen todas las variables
Proceso para seleccionar el modelo con mejor bondad de ajuste de MARS C.12.- Abrir la sintaxis de SPSS _03_FBBVA_MATCH_FILES.SPS. Remplazar <codeespecie> utilizando CTRL+H para evitar errores (64 cambios). Ejecutar la sintaxis. Esta sintaxis abre los archivos donde se encuentran las probabilidades predichas por CART y por los 30 modelos de MARS, calcula la funcin logit (valores comprendidos entre 0 y 1) para los 30 modelos de MARS y pega estas probabilidades predichas como nuevas columnas en el archivo que almacena los datos para esta especie: F:\FBBVA\TABLES\01ARAC\SPSS\<codeespecies>.sav C.13.- Ejecutar la sintaxis de SPSS _04_FBBVA_ROC_AREA.SPS.
146
Esta sintaxis calcula el estadstico AUC para todos los modelos y almacena los resultados en el archivo <codeespecie>.spo, que previamente tenemos que tener abierto. De esta forma se puede comprobar que modelo de MARS presenta una mejor consistencia y seleccionarlo para los siguientes pasos. Si varios modelos presentan la misma consistencia, seleccionamos el modelo ms sencillo. Proceso para generar modelos binarios de MARS presencia/ausencia e implementar ambos modelos (MARS y MARS P/A) en un SIG C.14.- Una vez seleccionado el modelo de MARS con mejor bondad de ajuste (paso anterior), ir al directorio F:\FBBVA\TABLES\01ARAC\_LOGS y abrir el archivo de texto (*.txt) correspondiente al modelo seleccionado: Por ejemplo: 01000001(39)_01_154intn_MARS_log.txt Seleccionar y copiar las funciones bsicas de este modelo. C.15.- Ejecutar la sintaxis _05_FBBVA_SIMTEST.SPS Mediante esta sintaxis se genera un archivo de texto en el que se incluyen los valores predichos por el mejor modelo de MARS y lo almacena en el directorio: F:\FBBVA\TABLES\01ARAC\SIMTEST\st_<codeespecie>.txt Este archivo ser necesario en el siguiente paso. C.16.- Ejecutar el programa SIMTES desde MS-DOS para calcular el punto de corte para este modelo (cut for best classification rate). En Windows: Inicio -> ejecutar -> cmd Y desde MS-DOS ejecutar los siguientes comandos: F: cd: F:\FBBVA\TABLES\01ARAC\SIMTEST ST 01001001 El programa nos proporciona el punto de corte ptimo (cut for best classification rate). C.17.- Ir al directorio F:\FBBVA\_AML y abrir la sintaxis 04_MARS.aml Remplazar los siguientes datos: <codeespecie>, punto de corte ptimo, funciones bsicas (eliminar puntos y comas) y modelo de MARS con mejor consistencia. Y guardar el archivo como M_<codeespecie>.aml Ejecutar esta sintaxis desde ArcInfo: &r M_<codeespecie> Esta sintaxis genera dos modelos (en formato rster) uno de MARS y otro de MARS P/A y los almacena directamente en el directorio F:\FBBVA\MODELS\01ARAC con el nombre m_<codeespecie> y m_<codeespecie>pa Proceso para implementar los modelos de CART en un SIG C.18.- El proceso para implementar este modelo en un SIG resulto muy complejo para llevarlo a cabo para un nmero tan elevado de especies. Adems los mapas resultantes estaban demasiado pixelados, de forma que no se ajustan a patrones naturales; y los resultados del estadstico AUC siempre ofrecieron resultados muy bajos. Por estos motivos se decidi no emplear este mtodo en los siguientes pasos.
147
Proceso para implementar los modelos de RLM en un SIG C.19.- Ir al directorio F:\FBBVA\TABLES\01ARAC\SPSS\ y abrir el archivo de resultados de SPSS <codeespecie>.spo Buscar los parmetros de la RLM. C.20.- Ir al directorio F:\FBBVA\_AML y abrir la sintaxis 4_LMR.aml Remplazar <codeespecie> y los parmetros de la RLM y guardarlo como RLM_<codeespecie>.aml C.21.- Ejecutar este AML desde ArcInfo: &r LMR_<codeespecie> Esta sintaxis implementa el modelo de RLM y genera un mapa (formato rster) y lo almacena en el directorio F:\FBBVA\MODELS\01ARAC con el nombre lr<codeespecie> C.22.- Repetir el paso 3 para todas las especies.
D.- Proceso para generar los modelos de DMG

D.1.- En un primer momento ejecutamos los modelos con el software DOMAIN, pero tras comprobar un error en la programacin de este software, empleamos el SIG de libre difusin DIVA-GIS. D.2.- Trasformar las 19 variables bioclimticas en formato rster de ESRI en formato de texto (ASCII). Este proceso se puede realizar con una sintaxis o en ArcMap. IMPORTANTE: cuando se trasforma el grid de formato rster (ESRI) a formato ASCII los datos del encabezado tienen una coma como smbolo decimal. Hay que cambiar las comas por puntos. D.3.- Transformar las 19 variables de formato ASCII a formato GRI de DIVA, mediante el programa DIVA-GIS, en la opcin Data Import grid file. Se almacenan en el directorio F:\FBBVA\DIVA\INDVAR\ACTUAL D.4.- Generar un tema de puntos en ArcView con las especies que vamos a modelizar de cada familia. Para ello seguir los pasos indicados en este diagrama para cada especie (todas las especies que presentan ms de 15 presencias y que han sido empleadas en otros mtodos) haciendo clic en el botn add to set. No utilizar la opcin new set
D.5.- Eliminar los casos atpicos del tema de puntos que se acaba de generar.
148
D.6.- Abrir el programa DIVA-GIS y generar un stack con las 19 variables climticas. Hacer clic sobre el men stack" y despus sobre make stack". D.7.- Cargar el tema de puntos de la familia con la que se va a trabajar. Hacer clic en modeling y seguir los siguientes esquemas:
Mediante este proceso se generan los modelos de DMG en formato GRI de DIVA. Almacenarlos en el directorio F:\FBBVA\DIVA\OUTPUT\01ARAC D.8.- Repetir el proceso, seleccionando DOMAIN TRU/FLASE en lugar de DOMAIN, de esta forma se ejecutan los modelos de presencia/ausencia para este algoritmo (punto de corte de 95). D.9.- Convertir los modelos en formato GRI en formato ASCII. Para ello hacer clic en data, export gridfile y multiple files D.10.- Ejecutar desde ArcInfo la sintaxis 05_Diva_asciitoraster.aml. Esta sintaxis trasforma los grid de formato ASCII a formato rster de ESRI. Guarda los modelos el siguiente directorio F:\FBBVA\MODELS\01ARAC\dv<codeespecie> D.11.- Repetir el paso 4 para todas las familias.
E.- Proceso para generar los modelos de GARP

E.1.- Ejecutar la sintaxis de SPSS 06_export_points.sps Esta sintaxis genera los archivos de muestreo para cada especie necesarios para ejecutar este mtodo. Este archivo contiene los valores de las 19 variables bioclimticas para las localidades de presencia de la especie. Estos archivos se almacenan automticamente en el directorio F:\FBBVA\GARP\PLANTS\01ARAC E.2.- Abrir estos archivos de muestreo uno por uno. Remplazar los espacios por comas.
149
Aadir una nueva columna con el valor: <codespecie> (importante: no olvidarse de la coma en todas las celdas). Aadir una nueva fila al comienzo, donde escribimos: species,long,lat. Cambiar la extensin de este archivo por CSV, creando un archivo de Excel delimitado por comas. E.3.- Combinar todos estos archivos en un nico archivo para cada familia (01ARAC.csv) que contiene la informacin para todas estas especies. Almacenar este archivo en el directorio F:\FBBVA\GARP\PLANTS\01ARAC E.4.- Abrir el software DatasetManager de GARP y crear un archivo ecuador.dxl que contiene todas las variables bioclimticas y una mscara (mask). E.5.- Abrir el programa DesktopGarp. Cargar los archivos: 01ARAC.csv y ecuador.dxl, segn el siguiente esquema. En esta imagen tambin se pueden observar todos los parmetros que hemos elegido para realizar los modelos.
E.6.- Ejecutar el programa. Los rster de salida (formato ASCII) se almacenan en el directorio F:\FBBVA\GARP\OUTPUT\01ARAC\BESTSUBSETS\<CODEESPECIE>\PROJ00. SE obtienen 10 rster en formato ASCII para cada especie. E.7.- Ejecutar desde ArcInfo la sintaxis 07_GARP_SUMAGRID.aml Esta sintaxis suma los 10 rster de cada especie. E.8.- Ejecutamos desde ArcInfo la sintaxis 08_GARP_asciitoraster_para.aml Trasforma los rster de formato ASCII a formato grid de ESRI y los almacena en el directorio F:\FBBVA\GARP\MODELS\01ARAC\gp<codeespecie>
150
E.9.- Repetir el paso 5 para todas las familias.
F.- Proceso para generar los modelos de MAXENT

F.1.- MAXENT utiliza el mismo formato de entrada de datos que GARP, tanto para los puntos de presencia de las especies, como para las variables bioclimticas. Por lo tanto, se pueden emplear los datos realizados para GARP en el proceso anterior. F.2.- En el archivo maxent.bat especificar los parmetros que son necesarios para correr los modelos. Este archivo debe situarse en el directorio C:\ARCHIVOS DE PROGRAMA\MAXENT El contenido de este archivo es el siguiente: java -mx1300m -jar maxent.jar -O -s f:\fbbva\maxent\plants\01arac\01arac.csv -e f:\fbbva\maxent\indvar\actual -o f:\fbbva\maxent\output\01arac -j f:\fbbva\maxent\indvar\future -B 100000 F.3.- Ejecutar este archivo (maxent.bat) y se abre la siguiente pantalla del programa MAXENT:
F.4.- Ejecutar el programa y los rster de salida (en formato ASCII) se almacenan en el directorio F:\FBBVA\MAXENT\OUTPUT\01ARAC F.5.- Ejecutar desde ArcInfo la sintaxis 08_Maxent_asciitoraster.aml Esta sintaxis trasforma los modelos de formato ASCII a grid de ESRI y guarda los modelos en el directorio F:\FBBVA\MODELS\01ARAC\mx<codeespecie> F.6.- Repetir el paso 6 para todas las familias.
151
G.- Proceso para generar modelos de MARS-Multirrespuesta

Proceso para generar el grid de muestreo G.1.- Unir todos los temas de puntos de presencia (<codeespecie>p.shp) de todas las especies, sin casos atpicos. Para ello utilizar la funcin Merge de ArcMap o Query de ArcView. Este tema de puntos se alamacena en el directorio: F:\FBBVA\MARS-MM\01ARAC\PLANTS\araceae_MM.shp G.2.- Abrir un proyecto de ArcView: F:\FBBVA\MARS-MM\01ARAC\PLANTS\sampling.apr Ajustar propiedades de la vista a Map Units: decimal degrees. Distance Units: kilometres. En la vista sampling debern estar: Puntos de la familia araceae-MM.shp Un grid de worldclim para usar de plantilla en Analysis Properties. Polgono marco sin islas (F:\FBBVA\SUPPLM\sample_mask.shp), se emplear como mscara en los anlisis. G.3.- Convertir el tema de puntos en un rster, seleccionando el campo pres_aus. Y almacenarlo en el directorio F:\FBBVA\MARS-MM\01ARAC\PLANTS\arac_mm Proceso para generar el archivo de muestreo G.4.- Abrir ArcInfo y nos situarnos en el directorio donde se encuentran las variables que se van a muestrear (variables bioclimticas y los grid de presencia de todas las especies): F:\FBBVA\MARS-MM\01ARAC\INDVAR Previamente copiar en este directorio todos los rster de presencia de todas las especies de arceas que se encuentran en el directorio F:\FBBVA\PLANTS\01ARAC\<codeespecie>p Tambin tenemos que copiar las 19 variables climticas que se encuentran en el directorio F:\FBBVA\INDVAR\ACTUAL G.5.- Ejecutar desde ArcInfo la sintaxis 10_SAMPLE_Mars_Multiresponse.aml Previamente abrir la sintaxis con un editor de texto y comprobar que los directorios son correctos, hay que hacer 5 cambios. Esta sintaxis no muestrea la primera grid y por lo tanto hay que repetir el rster de la primera especie. Esta sintaxis muestrea las variables climticas y los rster de presencia de todas las especies con el rster de muestreo (arac_mm). Crea varios archivos de texto con los valores de las 19 variables bioclimticas y la presencia o ausencia de cada una de las especies en todos los puntos. Guarda automticamente estos archivos en el directorio F:\FBBVA\MARS-MM\01ARAC\TABLES\SAMPLE \sample1.txt G.5.- Abrir todos los archivos de muestreo con un editor de texto Remplazar valores missing por 0
152
Remplazar ^t010 por ^tmm010 para no tener problemas al importar el archivo en SPSS. Remplazar p^t por ^t. El ltimo nombre de cada archivo no se reemplaza automticamente. G.6.- Importar estos archivos en un archivo de datos de SPSS. Hacer clic con el botn derecho del ratn sobre el archivo y elegir la opcin abrir con SPSS manager y seguir las siguientes opciones: No/Siguiente, Delimited/Yes/siguiente, Each line represent a case/All of the cases/siguiente, tab/none/siguiente, siguiente, finalizar. Repetir el proceso para todos los archivos de muestreo. Guardarlos en el directorio F:\FBBVA\MARS-MM\01ARAC\TABLES\SPSS \sample0.sav G.7.- Combinar todos los archivos de datos para crear un nico archivo, en SPSS seguir los siguientes pasos: Open sample0.sav data/merge files/add variables/Seleccionar sample1.sav G.8.- Para comprobar si existen valores no data ordenar los datos por alguna de las variables bioclimticas (opcin Short ascending) y si en algn registro tienen valores 0 para todas las variables bioclimticas, eliminar este registro. Quitar los decimales en los campos de las variables bioclimticas. G.9.- Para comprobar que el nmero de presencias es el correcto para todas las especies y se ha realizado un muestreo adecuado analizar los estadsticos descriptivos. Para ello, seguir las siguientes opciones en SPSS Analize -> Descritive statistics -> frecuencias. Comprobar que todas las especies tienen el nmero de presencias adecuado y guardar el archivo de resultados con el nombre frecuencias.spo G.10.- Exportar el archivo Sample1.sav (donde hemos nido todos los archivos) como archivo de texto separado por comas y almacenarlo en el direcotrio F:\FBBVA\MARS-MM\01ARAC\TABLES\R\sample.dat G.11.- Abrir este archivo con un editor de texto y remplazar comas por tabuladores (^t) y salvar como F:\FBBVA\MARSMM\01ARAC\TABLES\R\sample.csv G.12.- Eliminar las tres primeras columnas araceae x e y Proceso para ejecutar el modelo en R G.13.- En propiedades del icono del acceso directo de R, cambiar el directorio en el que vamos a trabajar: F:\FBBVA\MARS-MM\01ARAC\TABLES\R G.14.- Abrir R 2.3.1 G.15.- Cargar MDA package > utils:::menuInstallLocal() package 'mda' successfully unpacked and MD5 sums checked updating HTML package descriptions G.16.- Cargar funcin mars.public de Elith source("F:/RGMateo/Ftextos/R/MARS/mars.public.functions.3.1.R") G.17.- Cargar la tabla de datos
153
testdat <- read.csv("F:/FBBVA/MARS-MM/01ARAC/TABLES/R/testdat.csv") G.18.- Visualizar tabla de datos fix(testdata) G.19.- Correr MARS-Multiresponse mspecies.mars.glm <- mars.glm(data = testdat, mars.x = c(62:80), mars.y = c(1:61), family = "binomial") G.20.- Exportar tabla con los valores para realizar los mapas de idoneidad de cada una de las especies write.table(mspecies.mars.glm$mars.table, "F:\\FBBVA\\MARSMM\\01ARAC\\TABLES\\R\\tables.txt", sep="\t", row.names=F) G.20.- Abrir la tabla con un editor de texto y reemplazar ^tsp01 por ^t01 Proceso para representar los modelos en ArcView G.21.- Crear un proyecto de ArcView y guardarlo en el directorio F:\FBBVA\MARS-MM\01ARAC\MODELS\MARS_R.apr Ajustar propiedades de la vista a Map Units : decimal degrees Distance Units: kilometres En la vista models debern estar: Tema de puntos de la familia Los 19 variables de WorldClim. Para usar de plantilla en Analysis Properties Polgono marco sin islas (F:\FBBVA\SUPPLM\sample_mask.shp), se emplear como mscara en los anlisis. G.22.- Correr el Script MARS_Multiresponse (F:\RGMateo\Ftextos\R\MARS\ mars_raster_3.0_multiresponse.ave). Direccionar este scrip para que almacene los modelos correctamente F:\FBBVA\MODELS\01ARAC\mm<codeespecie> G.23.- Repetir el paso 7 para todas las familias.
H.- Proceso para generar el modelo de consenso

H.1.- Ejecutar desde ArcInfo la sintaxis 11_consenso_rescalar.aml Esta sintaxis proyecta los grid al datum WGS84; y rescala los valores para que estn comprendidos en el rango 0-1; de todos los modelos creados hasta al momento para una especie y que se encuentran en el directorio F:\FBBVA\MODELS\01ARAC\ Almacena los modelos reescalardos en el directorio F:\FBBVA\RESCALED\01ARAC H.2.- Ejecutar desde ArcInfo la sintaxis 11_consenso_media.aml Esta sintaxis calcula celda a celda la media de los grid reesacalados anteriormente para crear el modelo de consenso. Ejecutarlo desde el directorio F:\FBBVA\RESCALED\01ARAC Los resultados (modelo de consenso) los guarda automticamente en el directorio F:\FBBVA\ENSEMBLE\01ARAC\av<codeespecie> H.3.- Repetir el paso 8 para todas las especies.
154
I.- Generacin de los modelo de alfa diversidad potencial

I.1.- Sumar los modelos de distribucin de especies de todas las especies para una familia. Para ello se emplea la opcin cell statistics de ArcMap Guardar los resultados en el directorio F:\FBBVA\BIODIVERSITY\01ARAC I.2.- Repetir el paso anterior para los diferentes mtodos y opciones de modelado ecolgico I.3.- Sumar el resultado de las 6 familias para obtener el mapa final de diversidad vegetal potencial para cada mtodo. Guardar los resultados en el directorio F:\FBBVA\BIODIVERSITY\TOTAL
J.- Proyectar todos los modelos (wgs84)

J.1.- Ejecutar desde ArcInfo la sintaxis 12_wgs84.aml Situarnos en los diferentes directorios donde hayamos creados modelos J.2.- Repetir el anterior paso para todas las especies y modelos, en todos los directorios.
K.- Generacin de metadatos para todos los modelos

K.1.- Ejecutar desde ArcInfo la sintaxis 13_metadata m_<codeespecie>.aml Para cada especie tenemos que rectificar los datos que corresponden con esa especie (autor, fecha, proyecto, geoide, etc). K.2.- Repetir el proceso para todas las especies y modelos.
L.- Proceso para generar el archivo de muestreo de todos los mtodos para la obtencin de los valores de AUC
L.1.- Ejecutar desde ArcInfo la sintaxis 14_SAMPLE_ROC.aml Con esta sintaxis generamos un archivo de texto que incluye los valores predichos por todos los modelos para una determinada especie en las localidades originales de presencia y ausencia. Guarda directamente los resultados en el directorio F:FBBVA\TABLES\01ARAC\ROC\<codeespecie>.txt L.2.- Abrir el archivo con un editor de texto y eliminar todas las filas donde exista valores missing L.3.- Abrir el archivo <codeespecie>.spo guardado anteriormente en el directorio F:\FBBVA\TABLES\01ARAC\SPSS L.4.- Ejecutar la sintaxis de SPSS 15_import_ROC_total.sps Esta sintaxis crea un archivo de datos SPSS (*.sav) con los datos del archivo de muestro (F:FBBVA\TABLES\01ARAC\ROC\<codeespecie>.txt) y lo almacena en el directorio F:\FBBVA\TABLES\01ARAC\ROC_SPSS\dvgpmx_<codeespecie>_.sav Esta sintaxis tambin ejecuta el estadstico AUC para todos los modelos y guarda los resultados en el archivo <codeespecie>.spo. L.5.- Repetir el paso 12 para todas las especies.
155
M.- Medida de correlacin entre los diferentes mapas de diversidad potencial

M.1.- Desde ArcInfo y en el mdulo de grid correr anlisis de correlacin de Pearson, para todos los modelos de diversidad vegetal potencial. Por ejemplo: para comparar el modelo de diversidad total de MARS-Multirrespuesta y con el modelo de consenso total habra que correr el siguiente comando (situado en el directorio donde se encuentran los modelos). Grid: CORRELATION totalmmressum totalavressum M.2.- Repetir el proceso para todos los modelos. Comparar todos los modelos entre si cubriendo todas las posibilidades.
N.- Patrones altitudinales de diversidad

N.1.- Reclasificar el modelo digital del terreno (DEM) en tramos de 500 m mediante la opcin reclassify de ArcView. N.2.- Mediante la opcin Sumarize zones de ArcView se obtiene una tabla de datos con indica los estadsticos de un modelo cada 500 metros. Tener activo el DEM reclasificado anteriormente. N.3.- Exportar la tabla de estadsticos como DBF, abrir con Excell y hacer los grficos. N.4.- Repetir el proceso para cada modelo y familia.
156
RESUMEN Y CONCLUSIONES FINALES
RESUMEN Y CONCLUSIONES
Resumen
Esta tesis investiga la construccin de modelos de distribucin de especies en plantas, con un nfasis especial en su aplicacin en trabajos relacionados con los patrones de diversidad y la biologa de la conservacin. Nos hemos centrado en la enorme cantidad informacin depositada en los herbarios, con su consecuente relevancia e importancia. El rea de estudio seleccionada fue Ecuador, uno de los pases con ms diversidad vegetal por unidad de superficie. Uno de los objetivos principales de este trabajo es lograr modelos lo suficientemente fiables para ser aplicados en el mundo real. Todo el trabajo fue diseado teniendo en cuenta este objetivo, para ello tuvimos en cuenta los siguientes principios: Datos de presencia slidos. Se emplearon familias revisadas recientemente por su especialista que representaban todo el rea de estudio, se revisaron dos veces las georreferenciaciones de sus colecciones, los casos atpicos (outliers) fueron estudiados pormenorizadamente y eliminados si no ofrecan suficiente confianza, y se hizo un anlisis del tamao mnimo muestral necesario (primera parte de esta tesis), etc. Datos de ausencia slidos. Se presentaron dos formas de generar ausencias: pseudo-ausencias con una zona tampn y ausencias de grupo. Se comprob que los MDE generados con ellas eran fiables (segunda parte). Comparacin de mtodos de modelado ecolgico a nivel especfico. Se realizaron dos comparaciones diferentes. En la primera de ellas se analizan seis mtodos diferentes para 5 especies del gnero Anthurium. Para su validacin se emple un conjunto de datos independiente (segunda parte de esta tesis). En la segunda se generan MDE para 397 especies en Ecuador con seis mtodos diferentes. En esta ocasin los mtodos fueron verificados y no validados (tercera parte). En ambos casos se obtienen resultados similares, con MARS y MAXENT como los mtodos ms apropiados para nuestros datos y objetivos. Comparacin de diferentes opciones de modelado ecolgico a nivel de comunidad. Se emplearon diferentes opciones (estrategias, aproximaciones y corrientes) para combinar los MDE obtenidos para las 397 especies y se generaron diferentes mapas de diversidad vegetal potencial en Ecuador, que fueron comparados entre s y con datos reales de patrones altitudinales de diversidad (tercera parte). Los resultados ms fiables se obtienen con las
159
siguientes opciones: MARS presencia/ausencia, MAXENT y un modelo de consenso de varios mtodos. Las zonas con mayor diversidad vegetal de Ecuador son la vertiente
noroccidental del pas (provincias de Carchi y Esmeraldas), ambas vertientes de los Andes y parte de la cuenca Amaznica. Los mapas de diversidad potencial obenidos en este trabajo sern empleados en un futuro prximo para disear una red de espacios protegidos a nivel regional en Ecuador, entre otras aplicaciones.
160
Conclusiones finales
1 PARTE: Estudiando los efectos del tamao de muestra en los modelos de distribucin de especies
La estabilidad y la fiabilidad de los modelos de distribucin de especies est claramente afectada por el nmero de presencias empleadas para generar el modelo. Son muchos los factores que afectan al tamao mnimo de muestra, por lo que se recomienda realizar un estudio previo en todos los trabajos de modelado ecolgico. Para analizar los efectos del tamao de muestra en un mtodo de modelado ecolgico es necesario emplear varios conjuntos de datos y muchos tamaos muestrales diferentes. Para MARS se sugiere emplear un mnimo de 15 datos de presencia, auque en algunos casos lo modelos pueden ser poco fiables y estables. Estos modelos deben ser interpretados con precaucin. No se pueden emplear las conclusiones metodolgicas obtenidas en estudios realizados en zonas templadas para realizar trabajos de modelado ecolgico en reas tropicales. Se sugiere emplear los MDE realizados con un bajo nmero de presencias para disear nuevas recoleciones de datos. Si esto no es posible, sugerimos no emplear tamaos muestrales pequeos. Ponemos de manifiesto la necesidad de seguir colectado datos de herbario, sobre todo en zonas tropicales. La utilizacin de un modelo de consenso puede mejorar la consistencia final del modelo en algunas situaciones.
2 PARTE: Generando pseudo-ausencias y ausencias de grupo fiables. Comparacin de tcnicas descriptivas y discriminantes
Generar pseudo-ausencias con una zona tampn alrededor de las presencias se plantea como una forma rpida de disminuir la posibilidad de falsas ausencias, y la ms apropiada en proyectos en los que se trabaja con un gran nmero de organismos.
161
Se presenta una nueva forma de genera ausencias ms fiables, ausencias de grupo. Son aquellas localidades de recoleccin del especialista del grupo donde no encontr la especie problema. Los modelos de distribucin de especies generados con pseudo-ausencias y ausencias de grupo son fiables, aunque se sugiere emplear ausencias de grupo frente a pseudo-ausencias si nuestros datos de partida lo permiten. Las tcnicas discriminantes (RLM, MARS y MAXENT) presentan mejores resultados que las descriptivas. En estos mtodos las ausencias ayudan a definir las reas donde no se desarrolla la especie. Por lo tanto se sugiere su utilizacin. Se sugiere utilizar MARS cuando nuestro objetivo es realizar un anlisis en detalle y tenemos datos para generar sufrientes ausencias de grupo, y aplicar MAXENT cuando trabajamos con gran cantidad de especies y no necesitamos un anlisis detallado, o para aquellas especies que tienen pocas presencias. Especies que presentan resultados poco fiables con un mtodo tienden a mostrar resultados igualmente pobres con todos los mtodos. Por lo tanto, para poder generar MDE fiables cuando trabajamos con colecciones de historia natural se aconseja el empleo de ausencias de grupo (AG) o pseudo-ausencias y mtodos flexibles como LMR, MARS y MAXENT. Por encima de un tamao muestral mnimo parece tener ms importancia la ecologa de la especie que el tamao de muestra. Se propone como futura lnea de investigacin contrastar los MDE generados con ausencias de grupo o pseudo-ausencias y zonas tampn con aquellos MDE generados mediante otro tipo de pseudo-ausencias.
3 PARTE: Modelando patrones de diversidad. Comparacin de diferentes mtodos, estrategias, aproximaciones y corrientes
Hemos generado modelos de distribucin de especies en Ecuador para 397 especies pertenecientes a seis familias empleando cinco mtodos de modelado ecolgico a nivel especfico (GARP, DMG, MARS, RLM y MAXENT), y diferentes estrategias, aproximaciones y corrientes de modelado a nivel de comunidad. Estos modelos sern empleados en un futuro prximo con varios objetivos: 1) su comparacin con MDE realizados bajo un escenario de cambio climtico; 2) su comparacin con MDE realizados con otras variables independientes
162
(NDVI); y 3) disear una red de espacios protegidos para la proteccin de la biodiversidad en Ecuador. Los datos almacenados en la base de datos TROPICOS pueden ser empleados junto con pseudo-ausencias para obtener modelos de distribucin fiables. El empleo de tcnicas estadadsticas de verificacin presenta un gran variedad de inconvenientes se sugiere emplear validacin con un conjunto de datos independientes, siempre que esto sea posible. Los diferentes mtodos de modelado ecolgico analizados presentan
resultados muy diferentes, en el caso de la base de datos TROPICOS, las opciones que mejores resultados presentan a nivel especfico y de comunidad son MARS-presencia/ausencia, MAXENT y el modelo de consenso. Estos mtodos presentan resultados muy similares entre s, fiables desde el punto de vista estadstico y reflejan los patrones altitudinales de biodiversidad reales. Son mtodos relativamente trasparentes en su formulacin matemtica y permiten una interpretacin biolgica y estadstica de los resultados. Por todos estos motivos se aconseja su empleo en trabajos relacionados con la conservacin y los patrones espaciales de biodiversidad. DMG, DMG-PA, GARP, MARS, MARS-Multirrespuesta y RLM no han obtenido resultados tan fiables y no se aconseja su utilizacin en trabajos relacionados con la conservacin y los patrones espaciales de biodiversidad. Algunos de estos mtodos pueden ser tiles en otro tipo de trabajos como la caracterizacin de especies amenazadas o raras o dirigir nuevas campaas de coleccin. MARS parece no presentar los mismos resultados en su versin comercial y en la librera mda de R. Siendo ms fiables los resultados desde el punto de vista estadstico en el caso de la versin comercial, donde el cdigo es el original de Friedman (1991). La utilizacin de un umbral a posteriori para generar mapas binarios de presencia/ausencia es ms eficaz que el empleo de un umbral a priori. La utilizacin de un modelo de consenso de los diferentes mtodos a nivel especfico parece ser muy prometedora en el futuro del modelado ecolgico. La regin de las provincias de Carchi y Esmeraldas (continuacin del Choc colombiano) y los bosques hmedos de los Andes tropicales presentan los mayores ndices de biodiversidad potencial y, consecuentemente, deben ser una prioridad en las estrategias regionales de conservacin.
163
La biodiversidad vegetal potencial en Ecuador est directamente relacionada con aquellos lugares donde existe una precipitacin abundante, la variabilidad a lo largo del ao en temperatura y precitaciones es pequea y existe poca diferencia de temperatura entre el da y la noche.
Generales:
Se presenta un trabajo de recopilacin bibliogrfica que rene gran parte de la informacin dispersa en una infinidad de artculos cientficos. Se ha realizado un esfuerzo para traducir los tecnicismos publicados en ingls. Esta tesis ha tratado una serie de preguntas relevante en la investigacin de los modelos de distribucin de especies en el contexto de la conservacin y los patrones espacies de la biodiversidad. Manifiestamente, existen ms preguntas que pueden ser hechas y que deben ser contestadas. Algunas han emergido de este trabajo. Se ha puesto de manifiesto la fiabilidad de los datos almacenados en las colecciones de historia natural, lo que aumenta su valor. Tambin se ha puesto de manifiesto el xito de la aplicacin del conocimiento de expertos en los MDE, y se aconseja el trabajo interdisciplinario en el futuro (eclogos, botnicos, zologos, modeladores, etc.).
164
APNDICE
APNDICE
Apndice
Mateo, R. G.; A. M. Felicsimo; J. Muoz. (Enviado). Effects of sample size on the reliability and stability of species distribution models generated with multivariate adaptive regression splines. Ecography. Mateo, R. G.; T. B. Croat; A. M. Felicsimo; J. Muoz. (Enviado). Profile or group discriminative techniques? Generating reliable pseudo-absences and targetgroup absences from natural history collections. Diversity and Distributions. Mateo, R. G.; T. Delgado; A. M. Felicsimo; J. Muoz. (En preparacin). Modeling tropical biodiversity patterns from herbarium collections: specie and community level. Ecological Monographs.
167
REFERENCIAS BIBLIOGRFICAS
Referencias bibliogrficas
Ah-Peng, C., Chuah-Petiot, M., Descamps-Julien, B., Bardat, J., Stamenoff, P. & Strasberg, D. 2007. Bryophyte diversity and distribution along an altitudinal gradient on a lava flow in La Runion. Diversity and Distributions 13: 654-662. Akin, W.E. 1991. Global patterns: climate, vegetation, and soils University of Oklahoma Press Norman Allouche, O., Steinitz, O., Rotem, D., Rosenfeld, A. & Kadmon, R. 2008. Incorporating distance constraints into species distribution models. Journal of Applied Ecology 45: 599-609. Anderson, R.P. 2003. Real vs. artefactual absences in species distributions: test for Oryzomys albigularis (Rodentia: Muridae) in Venezuela. Journal of Biogeography 30: 591-605. Anderson, R.P. & Martinez-Meyer, E. 2004. Modeling species geographic distributions for preliminary conservation assessments: an implementation with the spiny pocket mice (Heteromys) of Ecuador. Biological Conservation 116: 167- 179. Arajo, M.B. & Williams, P.H. 2000. Selecting areas for species persistence using ocurrence data. Biological Conservation 96: 331-345. Arajo, M.B. & Pearson, R.G. 2005. Equilibrium of species distributions with climate. Ecography 28: 693-695. Arajo, M.B., Pearson, R.G., Thuiller, W. & Erhard, M. 2005a. Validation of speciesclimate impact models under climate change. Global Change Biology 11: 1504-1513. Arajo, M.B., Thuiller, W., Williams, P.H. & Reginster, I. 2005b. Downscaling European species atlas distributions to a finer resolution: implications for conservation planning. Global Ecology and Biogeography 14: 17-30. Arajo, M.B., Whittaker, R.J., Ladle, R.J. & Erhard, M. 2005c. Reducing uncertainty in projections of extinction risk from climate change. Global Ecology and Biogeography 14(6): 529-538. Arajo, M.B. & Guisan, A. 2006. Five (or so) challenges for species distribution modelling. Journal of Biogeography 33: 1677-1688. Arajo, M.B. & Rahbek, C. 2006. How does climate change affect biodiversity? Science 33(5792): 1396-1397. Arajo, M.B., Thuiller, W. & Pearson, R.G. 2006. Climate warming and the decline of amphibians and reptiles in Europe. Journal of Biogeography 33: 17121728. Arajo, M.B. & Luoto, M. 2007. The importance of biotic interactions for modelling species distributions under climate change. Global Ecology and Biogeography 16: 743-753. Arajo, M.B. & New, M. 2007. Ensemble forecasting of species distributions. Trends in ecology and evolution 22: 42-47. Augustin, N.H., Mugglestone, M.A. & Buckland, S.T. 1996. An autologistic model for the spatial distribution of wildlife. Journal of Applied Ecology 33: 339-347. Austin, M. 2007. Species distribution models and ecological theory: A critical assessment and some possible new approaches. Ecological Modelling 200: 1-19.
171
Austin, M.P. 2002. Spatial prediction of species distribution: an interface between ecological theory and statiscal modelling. Ecological Modelling 157: 101-118. Balslev, H. & Renner, S.S. 1989. Diversity of East Ecuadorian lowland forests. In: L.B. Holm-Nielsen, I.C. Nielsen and H. Balslev. Tropical forests: botanical dynamics, speciation, and diversity: 287-295. Academic Press. London. Barry, S. & Elith, J. 2006. Error and uncertainty in habitat models. Journal of Applied Ecology 43: 413-423. Barry, S.C. & Welsh, A.H. 2002. Generalised additive modelling and zero inflated count data. Ecological Modelling 157: 179-188. Beguera, S. 2006. Validation and evaluation of predictive models in hazard assessment and risk management. Natural Hazards 37: 315-329. Benito de Pando, B. & Peas de Giles, J. 2007. Aplicacin de modelos de distribucin de especies a la conservacin de la biodiversidad en el sureste de la Pennsula Ibrica. GeoFocus 7: 100-119. Benito Garzn, M. 2006. El efecto del cambio climtico sobre las distribuciones de los bosques ibricos: PASADO, PRESENTE y FUTURO. Universidad Autnoma de Madrid. Madrid. Benito Garzn, M., Snchez de Dios, R. & Sinz Ollero, H. 2007. Predictive modelling of tree species distributions on the Iberian Peninsula during the Last Glacial Maximum and Mid-Holocene. Ecography 30 120-134. Best, B.J. & Kessler, M. 1995. Biodiversity and conservation in tumbesian Ecuador and Peru. BirdLife International. Cambridge. Bhattarai, K.R., Vetaas, O.R. & Grytnes, J.A. 2004. Fern species richness along a central Himalayan elevational gradient, Nepal. Journal of Biogeography 31(3): 389-400. Bisby, F.A. 2000. The quiet revolution: biodiversity informatics and the internet. Science 289: 2309-2312. Borchsenius, F. 1997. Patterns of plant species endemism in Ecuador. Biodiversity and Conservation 6: 379-399. Botkin, D.B., Saxe, H., Arajo, M.B., Betts, R., Bradshaw, R.H.W., Cedhagen, T., Chesson, P., Dawson, T.P., Etterson, J.R., Faith, D.P., Ferrier, S., Guisan, A., Hansen, A.S., Hilbert, D.W., Loehle, C., Margules, C., New, M., Sobel, M.J. & Stockwell, D.R.B. 2007. Forecasting the effects of global warming on biodiversity. Bioscience 57: 227-236. Bourg, N.A., McShea, W.J. & Gill, D.E. 2005. Putting a cart before the search: successful habitat prediction for a rare forest herb. Ecology 86: 2793-2804. Box, E.O. 1981. Macroclimate and Plant Forms: An Introduction to Predictive Modeling in Phytogeography. Junk. Boyce, M.S., MacKenzie, D.I., Manly, B.F.J., Haroldson, M. & Moody, D. 2001. Negative binomial models for abundance estimation of multiple closed populations. Journal of Wildlife Management 65: 498-509. Breiman, L., Friedman, F., Olshen, R. & Stone, C. 1984a. Classification and regression trees. Wadsworth and Brooks. Pacific Grove, CA, USA. Breiman, L., Friedman, J.H., Olshen, R.A. & Stone, C.J. 1984b. Classification and Regression Trees. California, USA. Breiman, L. 2001. "Random Forests". Machine Learning 45: 5-32.
172
Broennimann, O., Treier, U.A., Mller-Schrer, H., Thuiller, W., Peterson, A.T. & Guisan, A. 2007. Evidence of climatic niche shift during biological invasion. Ecology Letters 10: 701-709. Brotons, L., Thuiller, W., Araujo, M.B. & Hirzel, A.H. 2004. Presence-absence versus presence-only modelling methods for predicting bird habitat suitability. Ecography 27: 437-448. Brotons, L., Herrando, S. & Pla, M. 2007. Updating bird species distribution at large spatial scales: applications of habitat modelling to data from long-term monitoring programs. Diversity and Distributions 13: 276-288. Busby, J.R. 1986. Bioclimate Prediction System (BIOCLIM). User's Manual Version 2.0. Australian Biological Resources, Study Leaflet. Busby, J.R. 1991. BIOCLIM: A bioclimate analysis and prediction system. In: C.R.a.A. Margules, M.P. . Nature Conservation: Cost Effective Biological Surveys and Data Analysis: 64-68. CSIRO. Australia Cain, S.A. 1944. Foundations of Plant Geography. Harpers and Brothers. New York. Calenge, C., Darmon, G., Basille, M., Loison, A. & Jullien, J.M. 2008. The factorial decomposition of the Mahalanobis distances in habitat selection studies. Ecology 89: 555-566. Carpenter, G., Gillison, A.N. & Winter, J. 1993. DOMAIN: a flexible modelling procedure for mapping potential distrubitions of plants ans animals. Biodiversity and Conservation 2: 667-680. Carroll, C., Noss, R.F. & Paquet, P.C. 2001. Carnivores as focal species for conservation planning in the rocky mountain region. Ecological Applications 11: 961-980. Carroll, S.S. & Pearson, D.L. 1998. The effects of scale and sample size on the accuracy of spatial predictions of tiger beetle (Cicindelidae) species richness. Ecography 21: 401-414. Cawsey, E.M., Austin, M.P. & Baker, B.L. 2002. Regional vegetation mapping in Australia: a case study in the practical use of statistical modeling. Biodiversity and Conservation 11: 2239-2274. Ceballos, G., Ehrlich, P.R., Soberon, J., Salazar, I. & Fay, J.P. 2005. Global Mammal Conservation: What Must We Manage? Science 309: 603-607. Ceballos, L. 1966. Mapa forestal de Espaa. Madrid, Ministerio de Agricultura. Direccin General de Montes, Caza y Pesca Fluvial: 50 + 20 maps ; 82 x 53 cm. Chapin, F.S., Zavaleta, E.S., Eviner, V.T., Naylor, R.L., Vitousek, P.M., Reynolds, H.L., Hooper, D.U., Lavorel, S., Sala, O.E., Hobbie, S.E., Mack, M.C. & Daz, S. 2000. Consequences of changing biodiversity. Nature 405: 234242. Chefaouia, R.M. & Lobo, J.M. 2008. Assessing the effects of pseudo-absences on predictive distribution model performance. Ecological Modelling 210(4): 478-486. Croat, T.B. 1979. The distribution of the Araceae. In: K. Larsen and L.B. HolmNielsen. Tropical botany: 291-308. Academic Press London. Croat, T.B. 1983. A revision of the genus Anthurium (Araceae) of Mexico and Central America. Part I: Mexico and Middle America. Annals of the Missouri Botanical Garden 70: 211-420. Croat, T.B. 1992. Species diversity of Araceae in Colombia: a preliminary survey. Annals of the Missouri Botanical Garden 79: 17-28.
173
Croat, T.B. 1995. Floristic comparisons of Araceae in six Ecuadorian florulas. In: S.P. Churchill, H. Balslev, E. Forero and J.L. Luteyn. Biodiversity and conservation of Neotropical Montane Forest: 489-499. The New York Botanical Garden. New York. Croat, T.B. 1999. Araceae. In: P.M. Jrgensen and S. Len-Ynez. Catalogue of the vascular plants of Ecuador: 227-246. Missouri Botanical Garden. St. Louist. Cuesta-Camacho, F., Ganzenmueller, A. & Baquero, F. 2006a. Predinting distribution of Andean-centered taxa using ecological niche modelling methods. Lyonia 9(1): 19-33. Cuesta-Camacho, F., Ganzenmller, A., Peralvo, M., Novoa, J. & Riofro, M.G. 2006b. Predicting species niche distribution shifts and biodiversity change within climate change scenarios: A regional assessment for bird and plant species in the Northern Tropical Andes. EcoCiencia. Quito. Cuesta-Camacho, F., Peralvo, M., Ganzenmller, A., Senz, M., Novoa, J., Riofro, G. & Beltrn, K. 2006c. Identificacin de vacos y prioridades de conservacin para la biodiversidad terrestre en el Ecuador continental. EcoCiencia. Quito. Cumming, G.S. 2000a. Using between-model comparisons to fine-tune linear models of species ranges. Journal of Biogeography 27: 441-455. Cumming, G.S. 2000b. Using habitat models to map diversity: pan-African species richness of ticks (Acari: Ixodida). Journal of Biogeography 27: 425-440. Davis, A.J., Jenkinson, L.S., Lawton, J.H., Shorrocks, B. & Wood, S. 1998. Making mistakes when predicting shifts in species range in response to global warming. Nature 391: 783-786. Deutsch, C.A., Tewksbury, J.J., Huey, R.B., Sheldon, K.S., Ghalambor, C.K., Haak, D.C. & Martin, P.R. 2008. Impacts of climate warming on terrestrial ectotherms across latitude. Proceedings of the national academy of science 105: 6668-6672. Dirnbck, T. & Dullinger, S. 2004 Habitat distribution models, spatial autocorrelation, functional traits and dispersal capacity of alpine plant species. Journal of Vegetation Science 15: 77-84. Dodson, C.H. & Gentry, A.H. 1991. Biological Extinction in Western Ecuador. Annals of the Missouri Botanical Garden 78: 273-295. Drake, J.M., Randin, C. & Guisan, A. 2006. Modelling ecological niches with support vector machines. Journal of Applied Ecology 43: 424432. Edwards, J.T.C., Cutler, D.R., Zimmermann, N.E., Geiser, L. & Moisen, G.G. 2006. Effects of sample survey design on the accuracy of classification tree models in species distribution models. Ecological Modelling 199(2): 132-141. Elith, J. 2002. Predicting the distribution of plants. The University of Melbourne. Meria de Tesis Doctoral Elith, J., Graham, C.H., Anderson, R.P., Dudk, M., Ferrier, S., Guisan, A., Hijmans, R.J., Huettmann, F., Leathwick, J.R., Lehmann, A., Li, J., Lohmann, L.G., Loiselle, B.A., Manion, G., Moritz, C., Nakamura, M., Nakazawa, Y., Overton, J.M., Peterson, A.T., Phillips, S.J., Richardson, K., Scachetti-Pereira, R., Schapire, R.E., Sobern, J., Williams, S., Wisz, M.S. & Zimmermann, N.E. 2006. Novel methods improve prediction of species' distributions from occurrence data. Ecography 29: 129-151.
174
Elith, J. & Leathwick, J.R. 2007. Predicting species distributions from museum and herbarium records using multiresponse models fitted with multivariate adaptive regression splines. Diversity and distributions 13: 265 - 275. Engler, R., Guisan, A. & Rechsteiner, L. 2004. An improved approach for predicting the distribution of rare and endangered species from occurrence and pseudo-absence data. Journal of Applied Ecology 41(2): 263-274. Felicsimo, A.M., Francs, E., Fernndez, J.M., Gonzlez-Dez, A. & Varas, J. 2002. Modeling the potential distribution of forests with a GIS. Photogrammetric Engineering and Remote Sensing 68(5): 455-461. Felicsimo, A.M., Gmez, A. & Pozo, M.M. (2003). Potential distribution of forests species in Dehesas of Extremadura (Spain). International Symposium on Sustainability of Dehesas, Montados and other agrosylvopastoral systems, Cceres, Spain. Felicsimo, A.M., Gmez, A. & Muoz, J. 2005. Potencial distribution of forest species in dehesas of Extremadura (Spain). Sustainability of Agrosilvopastoral Systems -Dehesa, Montados-): 231-246. Feria, T.P., Loisselle, B., Muoz, J., Espinosa, D., Dale, J.M. & Mateo, R.G. En revisin. Predicting species distributions: the influence of environmnetal variables, taxa and range size on model accuracy. Ecography. Ferrier, S. 2002. Mapping spatial pattern in biodiversity for regional conservation planning: where to from here? Systematic biology 51(2): 331-363. Ferrier, S., Watson, G., Pearce, J. & Drielsma, M. 2002. Extended statistical approaches to modelling spatial pattern in biodiversity in northeast New South Wales. I. Species-level modelling. Biodiversity and Conservation 11: 2275-2307. Ferrier, S. & Guisan, A. 2006. Spatial modelling of biodiversity at the community level. Journal of Applied Ecology 43(3): 393-404. Ferrier, S., Manion, G., Elith, J. & Richardson, K. 2007. Using generalised dissimilarity modelling to analyse and predict patterns of beta-diversity in regional biodiversity assessment. Diversity and distributions 13: 252-264. Fielding, A.H. & Bell, J.F. 1997. A review of methods for the assessment of prediction errors in conservation presence/absence models. Environmental Conservation 24(1): 38-49. Fitzpatrick, M.C., Weltzin, J.F., Sanders, N.J. & Dunn, R.R. 2007. The biogeography of prediction error: why does the introduced range of the fire ant over-predict its native range? Global Ecology and Biogeography 16: 24-33. Fjeldsa, J., lvarez, M.D., Lazcano, J.M. & Len, B. 2005. Illicit crops and armed conflict as constraints on biodiversity conservation in the Andes Region. Ambio 34(3): 205-211. Flather, C.H., Wilson, K.R., Dean, D.J. & McComb, W.C. 1997. Identifying gaps in conservation networks: of indicators and uncertainty in geographic-based analyses. Ecological Applications 7: 531-542. Fleishman, E., Fay, J.P. & Murphy, D.D. 2000. Upsides and Downsides: Contrasting Topographic Gradients in Species Richness and Associated Scenarios for Climate Change. Journal of Biogeography 27(5): 1209-1219. Friedman, J.H. 1991. Multivariate adaptive regression splines. Annals of Statistics 19: 1-141. Friedman, J.H. 2001. Greedy function approximation: a gradient boosting machine. Annals of Statistics 29: 1189-1232.
175
Gaubert, P., Papes, M. & Peterson, A.T. 2006. Natural history collections and the conservation of poorly known taxa: ecological niche modeling in central African rainforest genets (Genetta spp.). Biological Conservation 130: 106-117. Gelfand, A.E., Schmindt, A.M., Wu, S., Silander, J.A., Latimer, A. & Rebelo, A.G. 2005. Modelling species diversity throught species level hierarchical modelling. Applied Statistics 54(1-20): Gentry, A.H. 1982. Phytogeographic patterns in northwest South America and southern Central America as evidence for a Choc Refugium. In: G. Prance. Biological Diversification in the Tropics: 112- 136. Colombia Univ. Press. New York. Gentry, A.H. 1986. Species richness and floristic composition of the Choco region plant communities. Caldasia 15: 71-79. Godown, M.E. & Peterson, A.T. 2000. Preliminary distributional analysis of US endangered bird species. Biodiversity and Conservation 9(9): 1313-1322. Good, R. 1953. The Geography of the Flowering Plants. Longman. London. Graham, C.H., Ferrier, S., Huettman, F., Moritz, C. & Perteson, A.T. 2004a. New developments in museum-based informatics and applications in biodiversity analysis. Ecology and Evolution 19(9): 497-503. Graham, C.H., Ron, S.R., Santos, J.C., Schneider, C.J. & Moritz, C. 2004b. Integrating phylogenetics and environmental niche models to explore speciation mechanisms in Dendrobatid frogs. Evolution Psychiatrique 58(8): 1781-1793. Graham, C.H. & Hijmans, R.J. 2006. A comparison of methods for mapping species ranges and species richness. Global Ecology and Biogeography 15: 578587. Graham, C.H., Elith, J., Hijmans, R.J., Guisan, A., Peterson, A.T. & Loiselle, B.A. 2008. The influence of spatial errors in species occurrence data used in distribution models. Journal of Applied Ecology 45: 239-247. Grinnell, J. 1917. The niche relationship of the California Thrasher. Auk 34: 427433. Guisan, A., Theurillat, J.-P. & Kienast, F. 1998. Predicting the potential distribution of plant species in an alpine environment. Journal of Vegetation Science 9: 65-74. Guisan, A. & Harrell, F.E. 2000. Ordinal Response Regression Models in Ecology. Journal of Vegetation Science 11: 617-626. Guisan, A. & Zimmermann, N.E. 2000. Predictive habitat distribution models in ecology. Ecological Modelling 135: 147-186. Guisan, A., Edwards Jr., T.C. & Hastie, T. 2002. Generalized linear and generalized additive models in studies of species distributions: setting the scene. Ecological Modelling 157: 89-100. Guisan, A. & Thuiller, W. 2005. Predicting species distribution: offering more than simple habitat models. Ecology Letters 8: 9931009. Guisan, A., Broennimann, O., Engler, R., Vust, M., Yoccoz, N.G., Lehmann, A. & Zimmermann, N.E. 2006. Using Niche-Based Models to Improve the Sampling of Rare Species. Conservation Biology 20: 501-511. Guisan, A., Graham, C.H., Elith, J., Huettmann, F. & Group, N.S.D.M. 2007a. Sensitivity of predictive species distribution models to change in grain size. Diversity and Distributions 13: 332-340. Guisan, A., Zimmermann, N.E., Elith, J., Graham, C.H., Phillips, S. & Peterson, A.T. 2007b. What matters for predicting the occurrences of trees:
176
Techniques, data, or species characteristics? Ecological Monographs 77: 615630. Guralnick, P., Hill, A.W. & Lane, M. 2007. Towards a collaborative, global infrastructure for biodiversity assessment. Ecology Letters 10: 663-672. Hampe, A. 2004. Bioclimate envelope models: what they detect and what they hide. Global Ecology and Biogeography 13 469-471. Hanley, J.A. & McNeil, B.J. 1982. The meaning and use of the area under a Receiver Operating Characteristic (ROC) Curve. Radiology 143(1): 29-36. Hannah, L., Midgley, G., Andelman, S., Arajo, M., Hughes, G., MartinezMeyer, E., Pearson, R. & Williams, P. 2007. Protected area needs in a changing climate. Frontiers in Ecology and Environment 5: 131-138. Hastie, T. & Tibshirani, R. 1986. Generalized additive models. Statistical Sciences 1 297-318. Hastie, T., Tibshirani, R. & Buja, A. 1994. Flexible disriminant analysis by optimal scoring. Journal of the American Statistical Association 89: 1255-1270. Hastie, T. & Tibshirani, http://lib.stat.cmu.edu/S/.): R. 1996. S Archive: (mda). StatLib.
Heaney, L.R. 2001. Small mammal diversity along elevational gradients in the Philippines: an assessment of patterns and hypotheses. Global Ecology and Biogeography 10(1): 15-39. Heikkinen, R.K., Luoto, M., Arajo, M.B., Virkkala, R., Thuiller, W. & Sykes, M.T. 2006a. Methods and uncertainties in bioclimatic envelope modelling under climate change. Progress in Physical Geography 30(6): 751-777. Heikkinen, R.K., Luoto, M. & Virkkala, R. 2006b. Does seasonal fine-tuning of climatic variables improve the performance of bioclimatic envelope models for migratory birds? Diversity and Distributions 12: 502-510. Heikkinen, R.K., Luoto, M., Virkkala, R., Pearson, R.G. & Krber, J.H. 2007. Biotic interactions improve prediction of boreal bird distributions at macro-scales. Global Ecology and Biogeography 16: 754-763. Hernandez, P.A., Graham, C.H., Master, L.L. & Albert, D.L. 2006. The effect of sample size and species characteristics on performance of different species distribution modeling methods. Ecography 29: 773785. Hijmans, R.J., Guarino, L., Bussink, C., Mathur, P., Cruz, M., Barrantes, I. & Rojas, E. 2004. DIVA-GIS, version 4. A geographic information system for the analysis of biodiversity data. Manual. (Available at http://www.diva-gis.org). Hijmans, R.J., Cameron, S.E., Parra, J.L., Jones, P.G. & Jarvis, A. 2005. Very high resolution interpolated climate surfaces for global land areas. International Journal of Climatology 25: 19651978. Hirzel, A. & Guisan, A. 2002. Which is the optimal sampling strategy for habitat suitability modelling. Ecological Modelling 157 331-341. Hirzel, A.H., Helfer, V. & Metral, F. 2001. Assesing habitat-suitability models with a virtual species. Ecological Modelling 145: 111-121. Hirzel, A.H., Hausser, J., Chessel, D. & Perrin, N. 2002. Ecological-niche factor analysis: How to compute habitat- suitability maps without absence data? . Ecology 83: 2027-2036. Hoekstra, J.M., Boucher, T.M., Ricketts, T.H. & Roberts, C. 2005. Confronting a biome crisis: global disparities of habitat loss and protection. Ecology Letters 8: 3-29.
177
Holdridge, L.R. 1967. Life Zone Ecology. Tropical Science Center. San Jos, Costa Rica. Hopkins, M.J.G. 2007. Modelling the known and unknown plant biodiversity of the Amazon Basin. Journal of Biogeography 34: 1400-1411. Hortal, J., Garcia-Pereira, P. & Garca-Barros, E. 2004. Butterfly species richness in mainland Portugal: Predictive models of geographic distribution patterns. Ecography 27: 68-82. Houlder, D., Hutchinson, M.F., Nix, H.A. & McMahon, J.P. 1999. ANUCLIM users guide. CRES. Canberra. Howard, P.C., Viskanic, P., Davenport, T.R.B., Kigenyi, F.W., Balterz, M., Dickinson, C.J., Lwanga, J.S., Matthews, R.A. & Balmford, A. 1998. Complementary and the use of indicator groups for reserve selection in Uganda. Nature 394: 472-475. Hutchinson, E.G. 1957. A Treatise on Limnology. Volume I Geography, Physics, and Chemistry. Chapman and Hall. New York. Iverson, L.R. & Prasad, A.M. 1998. Predicting Abundance of 80 Tree Species Following Climate Change in the Eastern United States. Ecological Monographs 68: 465-485. Iverson, L.R., Prasad, A. & Schwartz, M.W. 1999. Modeling potential future individual tree-species distributions in the eastern United States under a climate change scenario: a case study with Pinus virginiana. Ecological Modelling 115: 77-93. Iverson, L.R. 2004. How fast and far might tree species migrate in the eastern United States due to climate change? Global Ecology and Biogeography 13: 209219. Jarnevich, C.S., Stohlgren, T.J., Barnett, D. & Kartesz, J. 2006. Filling in the gaps: modelling native species richness and invasions using spatially incomplete data. Diversity and Distributions 12: 511-520. Jenkins, M. 2003. Prospects for biodiversity. Science 302: 1175-1177. Jimnez-Valverde, A. & Lobo, J.M. 2006. The ghost of unbalanced species distribution data in geographical model predictions. Diversity and distributions 12: 521-524. Jimnez-Valverde, A. & Lobo, J.M. 2007. Threshold criteria for conversion of probability of species presence to either-or presence-absence. Acta oecologica 31: 361-369. Johnson, C.G. & Gillingham, M.P. 2005. An evaluation of mapped species distribution models used for conservation planning. Environmental Conservation 2005: 117-128. Johnson, J.B. & Omland, K.S. 2004. Model selection in ecology and evolution. TRENDS in Ecology and Evolution 19: 101-108. Jones, P.G. & Gladkov, A. 1999. FloraMap: A computer tool for predicting the distribution of plants and other organisms in the Wild. Centro Internacional de Agricultura, Tropical (CIAT). Cali. Jrgensen, P.M., Ulloa, C.U., Pedersen, H.B. & Luteyn, J.L. 1992. The Quito Herbarium (QCA): 100,000 Important Collections from Ecuador. Taxon 41: 5156.
178
Jrgensen, P.M. & Len-Ynez, S. (Eds.). 1999. Catalogue of the vascular plants of Ecuador. Monographs in systematic botany from the Missouri Botanical Garden. Kadmon, R., Farber, O. & Danin, A. 2003. A systematic analysis of factors affecting the performance of climatic envelope models. Ecological Applications 13: 853-867. Kadmon, R., Farber, O. & Danin, A. 2004. Effect of roadside bias on the accuracy of predictive maps produced by bioclimatic models. Ecological Applications 14: 401-413. Kareiva, P. & Marvier, M. 2003. Conserving biodiversity coldspot. American Scientist 91: 344-351. Kearney, M. 2006. Habitat, environment and niche: what are we modelling? OIKOS 115(1): 186-191. Kessler, M. 2001. Patterns of diversity and range size of selected plant groups along an elevational transect in the Bolivian Andes. Biodiversity and Conservation 10: 18971921. Kessler, M. 2002. The elevational gradient of Andean plant endemism: varying influences of taxon-spedific traits and topography at different taxonomic levels. Journal of Biogeography 29: 1159-1165. Kirilenko, A.P. & Solomon, A.M. 1998. Modeling dynamic vegetation response to rapid climate change using bioclimatic classification. Climatic Change 38: 15-49. Kolar, C.S. & Lodge, D.M. 2002. Ecological predictions and risk assessment for alien fishes in North America. Science 298: 1233-1236. Leakey, R.E. & Lewin, R. 1996. The Sixth Extinction: Biodiversity and Its Survival Weidenfeld and Nicolson. London Leathwick, J., Rowe, D., Richardson, J., Elith, J. & Hastie, T. 2005. Using multivariate adative regression splines to predict the distributions of New Zelans freshwater diadromous fish. Freshwater Biology 50: 2034-2052. Leathwick, J.R. 2001. New Zealand's potential forest pattern as predicted from current species-environment relationships. New Zealand Journal of Botany 39: 447-464. Leathwick, J.R. 2002. Intra-generic competition among Nothofagus in New Zealand's primary indigenous forests. Biodiversity and Conservation 11: 21772187. Leathwick, J.R., Elith, J., Francis, M.P., Hastie, T. & Taylor, P. 2006a. Variation in demersal fish species richness in the oceans surrounding New Zealand: an analysis using boosted regression trees. Marine ecology progress series 321: 267281. Leathwick, J.R., Elith, J. & Hastie, T. 2006b. Comparative performance of generalized additive models and multivariate adaptive regression splines for statistical modelling of species distributions. Ecological Modelling 199(2): 188196. Lehmann, A., Leathwick, J.R. & Overton, J.M. 2002. Assessing New Zealand fern diversity from spatial predictions of species assemblages. Biodiversity and Conservation 11: 2217-2238. Lehmann, A., Overton, J.M.C. & Leathwick, J.R. 2003. GRASP: generalized regression analysis and spatial prediction. Ecological Modelling 160: 65-183.
179
Lester, S.E., Ruttenberg, B.I., Gaines, S.D. & Kinlan, B.P. 2007. The relationship between dispersal ability and geographic range size. Ecology Letters 10: 745-758. Liu, C., Berry, P.M., Dawson, T.P. & Pearson, R.G. 2005. Selecting thresholds of occurrence in the prediction of species distributions. Ecography 28: 385-393. Lobo, J.M. (2000). Es posible predecir la distribucin geogrfica de las especies basndonos en variables ambientales? PrIBES 2000, Zaragoza, Espaa. Lobo, J.M., Castro, I. & Moreno, J.C. 2001. Spatial and environmental determinants of vascular plant species richness distribution in the Iberian Peninsula and Balearic Islands. Biological Journal of the Linnean Society of London 73: 233-253. Lobo, J.M., Jimnez-Valverde, A. & Real, R. 2007. AUC: a misleading measure of the performance of predictive distribution models. Global Ecology and Biogeography 17 145151. Lobo, J.M. 2008. More complex distribution models or more representative data? Biodiversity Informatics 5: 14-19. Lobo, J.M., Jimnez-Valverde, A. & Real, R. 2008. AUC: a misleading measure of the performance of predictive distribution models. Global Ecology and Biogeography 17: 145-151. Loiselle, B.A., Jrgensen, P.M., Consiglio, T., Jimnez, I., Blake, J.G., Lohmann, L.G. & Montiel, O.M. 2008. Predicting species distributions from herbarium collections: does climate bias in collection sampling influence model outcomes? Journal of Biogeography 35 105-116. Loisselle, B., Howell, C.A., Graham, C.H., Goerck, J.M., Brooks, T., Smith, K.G. & Williams, P.H. 2003. Avoiding pitfalls of using species distributions models in conservation planing. Conservation biology 17: 1591-1600. Loreau, M., Oteng-Yeboah, A., Arroyo, M.T.K., Babin, D., Barbault, R., Donoghue, M. & 2006. Diversity without representation. Nature 442: 245-246. Luoto, M., J., P., Heikkinen, R.K. & Saarinen, K. 2005. Uncertainty of bioclimate envelope models based on the geographical distribution of species. Global Ecology and Biogeography 14: 575-584. Luoto, M., Heikkinen, R.K., Poyry, J. & Saarinen, K. 2006. Determinants of the biogeographical distribution of butterflies in boreal regions. Journal of Biogeography 33(10): 1764-1778. Luoto, M., Virkkala, R. & Heikkinen, R.K. 2007. The role of land cover in bioclimatic models depends on spatial resolution. Global Ecology and Biogeography 16: 34-42. Ltolf, M., Kienast, F. & Guisan, A. 2006. The ghost of past species occurence: improving species distributions models for presence-only data. Journal of Applied Ecology 43: 802-815. MacKenzie, D.I., Nichols, J.D., Lachman, G.B., Droege, S., Royle, J.A. & Langtimm, C.A. 2002. Estimating site occupancy rates when detection probabilities are less than one. Ecology 83: 2248-2255. Manel, S., Dias, J.-M. & Ormerod, S.J. 1999. Comparing discriminant analysis, neural networks and logistic regression for predicting species distributions: a case study with a Himalayan river bird. Ecological Modelling 120: 337-347. Manel, S., Williams, H.C. & Ormerod, S.J. 2001. Evaluating presence-absence models in ecology: the need to account prevalence. journal of Applied Ecology 38: 921-931.
180
Margules, C.R. & Pressey, R.L. 2000. Systematic conservation planning. Nature 405: 243-252. Marmion, M., Parviainen, M., Luoto, M., Heikkinen, R.K. & Thuiller, W. 2008. Evaluation of consensus methods in predictive species distribution modelling. Diversity and distributions): Martnez-Meyer, E. & Peterson, A.T. 2006. Conservatism of ecological niche characteristics in North American plant species over the Pleistocene-to-Recent transition. Journal of Biogeography 33: 1779-1789. McArthur, R.H. 1972. Geographical Ecology: Patterns in the Distribution of Species. Harper and Row. New York. McCain, C.M. 2004. The mid-domain effect applied to elevational gradients: species richness of small mammals in Costa Rica. Journal of Biogeography 31(1): 19-31. McClean, C.J., Lovett, J.C., Kper, W., Hannah, L., Sommer, J.H., Barthlott, W., Termansen, M., Smith, G.F., Tokumine, S. & Taplin, J.R.D. 2005. African plant diversity and climate change. Annals of the Missouri Botanical Garden 92(2): 135-152. McCullagh, P. & Nelder, J.A. 1989. Generalized linear models. Chapman & Hall. London. McPherson, J.M., Jetz, W. & Rogers, D.J. 2004. The effects of species range sizes on the accuracy of distribution models: ecological phenomenon or statistical artefact? Journal of Applied Ecology 41: 811823. Mecham, J. (Unpublished manuscript). Causes and consequences of deforestation in Ecuador. Meynard, N. & Quinn, J.F. 2007. Predicting species distributions: a critical comparison of the most common statistical models using artificial species. Journal of Biogeography 34 1455-1469. Mittermeier, R.A., Myers, N., Thompsen, J.B. & Fonseca, G.A.B. 1998. Biodiversity hotspots and major tropical wilderness areas: approaches to conserving to setting conservation priorities. Conservation biology 12: 516-520. Moisen, G.G. & Frescino, T.S. 2002. Comparing five modelling techniques for predicting forest characteristics. Ecological Modelling 157: 209-225. Moisen, G.G., Freeman, E.A., Blackard, J.A., Zimmermann, N.E. & Edwards Jr., T.C. 2006. Predicting tree species presence and basal area in Utah: A comparison of stochastic gradient boosting, generalized additive models, and tree-based methods ecological Modelling 199: 176-187. Montenegro Armijos, T.P. 2006. Rarity of an endemic species in Ecuador. Lyonia 9(1): 91-101. Muoz, J. & Felicsimo, A.M. 2004. A comparison between some statistical methods commonly used in predictive modeling. Journal of Vegetation Science 15: 285-292. Muoz, J., Felicsimo, .M., Cabezas, F., Burgaz, A.R. & Martnez, I. 2004. Wind as a long-distance dispersal vehicle in the Southern Hemisphere. Science 304: 1144-1147. Myers, N. 1988. Threatened biotas: "Hotspots" in tropical forests. Environmentalist 8(3): 1-20. Myers, N., Mittermeler, R.A., Mittermeler, C.G., Fonseca, G.A.B. & Kent, J. 2000. Biodiversity hotspots for conservation priorities. Nature 403: 853-858.
181
Narumalani, S., Jensen, J.R., Althausen, J.D., Burkhalter, S. & Mackey, H.E. 1997. Aquatic macrophyte modeling using GIS and logistic multiple regression. Photogrammetric Engineering and Remote Sensing 63: 41-49. Nogus-Bravo, D., Arajo, M.B., Romdal, T. & Rahbek, C. 2008a. Scale effects and human impact on the elevational species richness gradients. Nature 453: 216-220. Nogus-Bravo, D., Pulido, F., Valladares, F., Aranda, I. & Martnez, I. 2008b. Towards an integrative approach for evaluating species distributional responses to rapid environmental change. Poster. DANBIF. Biodiversity Informatics and Climate Change Impacts on Life, University of Aarhus. Olivier, F. & Wotherspoon, S.J. 2006. Modelling habitat selection using presenceonly data: Case study of a colonial hollow nesting bird, the snow petrel. Ecological modelling 195: 187-204. Olson, D.M. & Dinerstien, E. 1998. The global 2000: a representation approach to conserving the Earth's most biologically valuable ecoregions. Conservation biology 12(502-515): Ortega-Huerta, M.A. & Peterson, A.T. 2004. Modelling spatial patterns of biodiversity for conservation prioritization in North-eastern Mexico. Diversity and Distributions 10: 39-54. Ottaviani, D., Lasinio, G.J. & Boitani, L. 2004. Two statistical methods to validate habitat suitability models using presence-only data. Ecological Modelling 179: 417-443. Pacala, S. & Socolow, R. 2004. Stabilization Wedges: Solving the Climate Problem for the Next 50 Years with Current Technologies. Science 305: 968 - 972. Pape, M. & Gaubert, P. 2007a. Modelling ecological niches from low numbers of occurrences: assessment of the conservation status of poorly known viverrids (Mammalia, Carnivora) across two continents. Diversity & Distributions 13: 890902. Pape, M. & Gaubert, P. 2007b. Modelling ecological niches from low numbers of occurrences: assessment of the conservation status of poorly known viverrids (Mammalia, Carnivora) across two continents. Diversity and distributions 13: 890-902. Parmesan, C. & Yohe, G. 2003. A globally coherent fingerprint of climate change impacts across natural systems. Nature 421: 37-42. Pearce, J. & Ferrier, S. 2000. Evaluating the predictive performance of habitat models developed using logistic regression. Ecological Modelling 133: 225245. Pearce, J. & Ferrier, S. 2001. The practical value of modelling relative abundance of species for regional conservation planning: a case study. Biological Conservation 98: 33-43. Pearce, J. & Boyce, M. 2006. Modelling distribution and abundance with presenceonly data. Journal of Applied Ecology 43: 405-412. Pearman, B., Randin, C.F., Broennimann, O., Vittoz, P., Knaap, W.O.v.d., Engler, R., Lay, G.L., Zimmermann, N.E. & Guisan, A. 2008. Prediction of plant species distributions across six millennia. Ecology Letters): Pearson, R.G. & Dawson, J.W. 2003. Predecing the impacts of climate change on the distribution of species: are bioclimate envelope models useful? Global Ecology and Biogeography 12: 361-371.
182
Pearson, R.G. & Dawson, T.P. 2004. Bioclimate envelope models: what they detect and what they hide response to Hampe (2004). Global Ecology and Biogeography 13: 469-476. Pearson, R.G. & Dawson, T.P. 2005. Long-distance plant dispersal and habitat fragmentation: identifying conservation targets for spatial landscape planning under climate change. Biological Conservation 123 389-401. Pearson, R.G., Raxworthy, C.J., Nakamura, M. & Townsend Peterson, A. 2006a. Predicting species distributions from small numbers of occurrence records: a test case using cryptic geckos in Madagascar. Journal of Biogeography 34: 102-117. Pearson, R.G., Thuiller, W., Arajo, M.B., Martinez-Meyer, E., Brotons, L., McClean, C.J., Miles, L., Segurado, P., Dawson, T.P. & Lees, D.C. 2006b. Model-based uncertainty in species range prediction. Journal of Biogeography 33: 1704-1711. Peralvo, M.F., Cuesta, F. & Manen, F.v. 2005. Delineating priority habitat areas for the conservation of Andean bears in northern Ecuador. Ursus 16(2): 222-233. Pereira, H.M. & Cooper, H.D. 2006. Towards the global monitoring of biodiversity change. TRENDS in Ecology and Evolution 21: 123-129. Peters, D. & Thackway, R. (1998). "A new biogeogrphic regionalisation for Tasmania." Peterson, A.T., Soberon, J. & Snchez-Cordero, V. 1999. Conservatism of ecological niches in evolutionary time. Science 285: 1265-1267. Peterson, A.T., Ortega-Huerta, M.A., Bartley, J., Snchez-Cordero, V., Sobern, J., Buddemeier, R.H. & Stockwell, D.R.B. 2002. Future projections for Mexican faunas under global climate change scenarios. Nature 416: 626-629. Peterson, A.T. 2003. Predicting the geography of species invasions via ecological niche modeling. Quarterly Review of Biology 78: 419-433. Peterson, A.T., Papes, M. & Sobern, J. 2008a. Rethinking receiver operating characteristic analysis applications in ecological niche modeling. Ecological Modelling In press: Peterson, A.T., Papes, M. & Sobern, J. 2008b. Rethinking receiver operating characteristic analysis applications in ecological niche modeling. Ecological Modelling doi:10.1016/j.ecolmodel.2007.11.008: Phillips, S.J., Anderson, R.P. & Schapire, R.P. 2006. Maximum entropy modeling of species geographic distributions. Ecological Modelling 190(3/4): 231-259. Phillips, S.J. & Dudk, M. 2008. Modeling of species distributions with Maxent: new extensions and a comprehensive evaluation. Ecography 31: 161-175. Pimm, S.L., Russel, G.J., Gittleman, J.L. & Brooks, T.M. 1995. The future of biodiversity. Science 269: 347-350. Ponder, W.F., Carter, G.A., Flemons, P. & Chapman, R.R. 2001. Evaluation of museum collection data for use in biodiversity assesment. Conservation Biology 15(3): 648-657. Rahbek, C. 1995. The elevational gradient of species richness a uniform pattern. Ecography 18: 200205. Rahbek, C. & Graves, G.R. 2001. Multiscale assessment of patterns of avian species richness. Proceedings of the national academy of science 98: 4534-4539. Rahbek, C. 2005. The role of spatial scale and the perception of large-scale speciesrichness patterns. Ecology Letters 8: 224-239.
183
Rahbek, C., Gotelli, N.J., Colwell, R.K., Entsminger, G.L., Rangel, T.F.L.V.B. & Graves, G.R. 2006. Predicting continental-scale patterns of bird species richness with spatially explicit models. Proceedings of the Royal Society B: Biological Sciences doi:10.1098/rspb.2006.3700: Raven, P.H. & Wilson, E. 1992. A fifty-year plan for biodiversity surveys. Science 258: 1099-1100. Raxworthy, C.J., Martinez-Meyer, E., Horning, N., Nussbaum, R.A., Schneider, G.E., Ortega-Huerta, M.A. & Peterson, A.T. 2003. Predicting distributions of known and unknown reptile species in Madagascar. Nature Biotechnology 426: 837-841. Reddy, S. & Dvalos, L.M. 2003. Geographical sampling bias and its implications for conservation priorities in Africa. Journal of Biogeography 30: 1719-1727. Reese, G.C., Wilson, K.R., Hoeting, J.A. & Flather, C.H. 2005. Factors affecting species distribution predictions: a simulation modeling experiment. Ecological Applications 15: 554-564. Richards, L., Carstens, B.C. & Knowles, L.L. 2007. Distribution modelling and statistical phylogeography: an integrative framework for generating and testing alternative biogeographical hypotheses. Journal of Biogeography 34: 1833-1845. Richardson, B.J., Zabka, M., Gray, M.R. & Milledge, G. 2006. Distributional patterns of jumping spiders (Araneae: Salticidae) in Australia. journal of Biogeography 33: 707-719. Richardson, D.M. & Thuiller, W. 2007. Home away from home - objective mapping of high-risk source areas for plant introductions. Diversity and Distributions 13: 299-312. Rickart, E.A. 2001. Elevational diversity gradients, biogeography and the structure of montane mammal communities in the intermountain region of North America. Global Ecology and Biogeography 10(1): 77100. Ricklefs, R.E. & Schluter, D. 1994. Species Diversity in Ecological Communities. The University of Chicago Press. Rissler, L.J., Hijmans, R.J., Graham, C.H., Moritz, C. & Wake, D.B. 2006. Phylogeographic Lineages and Species Comparisons in Conservation Analyses: A Case Study of California Herpetofauna. The American Naturalist 167: 655666. Romdal, T.S. & Grytnes, J.-A. 2007. An indirect area effect on elevational species richness patterns. Ecography 30: 440-448. Rotenberry, J.T., Knick, S.T. & Dunn, J.E. 2002. Aminimalist approach to mapping species habitat: Pearsons planes of closest fit. In: J.M. Scott, P.J. Heglund and M.L. Morrison. Predicting Species Occurrences. Issues of Accuracy and Scale: 218-289. Island Press. Washington. Rowe, R.J. 2005. Elevational gradient analyses and the use of historical museum specimens: a cautionary tale. Journal of Biogeography 32: 1883-1897. Salisbury, E.J. 1926. The geographical distribution of plants in relation to climatic factors. The Geographical Journal 57: 312-335. Sarkar, S. & Margules, C. 2002. Operationalizing biodiversity for conservation planning. Journal of biosciences 27: 299-308. Sattler, T., Bontadina, F., Hirzel, A.H. & Arlettaz, R. 2007. Ecological niche modelling of two cryptic bat species calls for a reassessment of their conservation status. Journal of Applied Ecology 44: 1188-1199.
184
Schulman, L., Toivonen, T. & Ruokolainen, K. 2007. Analysing botanical collecting effort in Amazonia and correcting for it in species range estimation. Journal of Biogeography 34: 1388-1399. Schurr, F.M., Midgley, G.F., Rebelo, A.G., Reeves, G., Poschlod, P. & Higgins, S.I. 2007. Colonization and persistence ability explain the extent to which plant species fill their potential range. Global Ecology and Biogeography 16: 449-459. Schwartz, M.W. 1999. Choosing the appropriate scale of reserves for conservation. Annual Review of Ecology and Systematics 30: 83-108. Seaman, D.E. & Powell, R.A. 1996. An Evaluation of the Accuracy of Kernel Density Estimators for Home Range Analysis. Ecology 77: 2075-2085. Segurado, P. & Arajo, M.B. 2004. An evaluation of methods for modelling species distributions. Journal of Biogeography 31: 15551568. Seoane, J., Justrib, J.H., Garca, F., Retamar, J., Rabadn, C. & Atienza, J.C. 2006. Habitat-suitability modelling to assess the effects of land-use changes on Duponts lark Chersophilus duponti: A case study in the Layna Important Bird Area. Biological Conservation 128: 241-252. Srgio, C., Figueira, R., Draper, D., Menezes, R. & Sousa, A.J. 2007. Modelling bryophyte distribution based on ecological information for extent of occurrence assessment. Biological Conservation 135(3): 341-351. Sierra, R., Campos, F. & Chamberlin, J. 1999. Areas prioritarias para la conservacin de la biodiversidad en el Ecuador Continental. Un estudio basado en la diversidad de ecosistemas y su ornitofauna. Quito. Silverman, B.W. 1986. Density Estimation for Statistics and Data Analysis. Chapman and Hall. London. Skov, F. & Borchsenius, F. 1997. Predicting plant species distribution patterns using simple climatic parameters: a case study of Ecuadorian palms. Ecography 20: 347-355. Soberon, J., Llorente, J. & Benitez, H. 1996. An International View of National Biological Surveys. Annals of the Missouri Botanical Garden 83: 562-573. Soberon, J. & Peterson, A.T. 2004. Biodiversity informatics: managing and applying primary biodiversity data. Philosophical Transactions of the Royal Society of London Series B Biologial Sciencies 359: 689-698. Soberon, J. & Peterson, A.T. 2005. Interpretation of models of fundamental ecological niches and species' distributional areas. Biodiversity Informatics 2: 110. Solbrig, O.T. 1991. From genes to ecosystems: A research agenda for biodiversity. IUBS/SCOPE/UNESCO. Solow, A.R. 1993. Inferring extinction from sighting data. Ecology 74: 962-964. Stockwell, D. & Peters, D. 1999. The GARP modelling system: problems and solutions to automated spatial prediction. International Journal of Geographical Information Science 13(2): 143-158. Stockwell, D.R.B. & Peterson, A.T. 2002. Effects of sample size on accuracy of species distribution models. Ecological Modelling 148: 1-13. Svenning, J.C. & Skov, F. 2004. Limited filling of the potential range in European tree species. Ecology Letters 7: 565-573. Terborgh, J. & Winter, B. 1982. Evolutionary circumstances of species with small ranges. In: G.T. Prance. Biological diversification in the tropics: 587-600. Columbia University Press. New York.
185
Termansen, M., McClean, C.J. & Preston, C.D. 2006. The use of genetic algorithms and Bayesian classification to model species distributions. Ecological Modelling 192: 410-424. Thomas, C.D., Cameron, A., Green, R.E., Bakkenes, M., Beaumont, L.J., Collingham, Y., Erasmus, B.F.N., de Siqueira, M.F., Grainger, A., Hannah, L., Hughes, L., Huntley, B., van Jaarsveld, A.S., Midgley, G.F., Miles, L.J., Ortega-Huerta, M.A., Townsend Peterson, A., Phillips, O. & Williams, S.E. 2004. Extinction risk from climate change. Nature 427: 145-148. Thuiller, W., Arajo, M.B., Pearson, R.G., Whittaker, R.J. & Lavorel, S. 2004. Uncertainty in predictions of extinction risk. Nature 430: 33. Titeux, N. 2006. Modelling species distribution when habitat occupancy departs from suitability. Application to birds in a landscape context. Universit catholique de Louvain. Tsoar, A., Allouche, O., Steinitz, O., Rotem, D. & Kadmon, R. 2007. A comparative evaluation of presence-only methods for modelling species distribution. Diversity and distributions 13: 397-405. Ulloa Ulloa, C. & Jrgensen, P.M. 2004. rboles y arbustos de los Andes del Ecuador http://www.efloras.org/flora_page.aspx?flora_id=201. Valencia, R., Pitman, N., Len-Ynez, S. & Jrgensen, P.M. 2000. Libro rojo de las plantas endmicas del Ecuador. Herbario QCA, Pontificada Universidad Catllica del Ecudor. Quito. Vapnik, V. 1995. The Nature of Statistical Learning Theory. Springer-Verlag. New York. Vargas, J.H., Consiglio, T., Jrgensen, P.M. & Croat, T.B. 2004. Modelling distribution patterns in a species-rich plant genus, Anthurium (Araceae), in Ecuador. Diversity and Distributions 10: 211-216. Venables, W.N. & Ripley, B.D. 2002. Modern Applied Statistics with S-PLUS. Springer. New York. Vetaas, O.R. 2002. Realized and potencial niches: a comparation of four Rhododendron species. Journal of Biogeography 29: 545-554. Vetaas, O.R. & Grytnes, J.-A. 2002. Distribution of vascular plant species richness and endemic richness along the Himalayan elevation gradient in Nepal. Global Ecology and Biogeography 11(4): 291-301. von Humboldt, A. & Bonpland, A. 1807. Essai sur la gographie des plantes. Paris. Walker, P.A. & Cocks, K.D. 1991. HABITAT: A Procedure for Modelling a Disjoint Environmental Envelope for a Plant or Animal Species. Global Ecology and Biogeography Letters 1: 108-118. Walter, H. 1985. Vegetation of the Earth and Ecological Systems of Geobiosphere. Springer. Heidelberg. Walter, H. 1997. Zonas de vegetacin y clima. Ediciones Omega. Barcelona. Walther, G.-R., Post, E., Convey, P., Menzel, A., Parmesan, C., Beebee, J.C., Fromentin, J.-M., Hoegh-Guldberg, O. & Bairlein, F. 2002. Ecological responses to recent climate change. Nature 416: 389-395. Weaver, K.F., Anderson, T. & Guralnick, R. 2006. Combining phylogenetic and ecological niche modeling approaches to determine distribution and historical biogeography of Black Hills mountain snails (Oreohelicidae) Diversity and Distributions 12 (6): 756766.
186
Welsh, A.H., Cunningahm, R.B., Donnelly, C.F. & Lindenmayer, D.B. 1996a. Modelling the abundace of rare species: statistical models for counts with extra ceros. Ecological Modelling 88: 297-308. Welsh, A.H., Cunningham, R.B., Donnelly, C.F. & Lindenmayer, D.B. 1996b. Modelling the abundance of rare species: statistical models for counts with extra zeros. Ecological Modelling 88: 297-308. Whittaker, R.J., Willis, K.J. & Field, R. 2001. Scale and species richness: towards a general, hierarchical theory of species diversity. Journal of Biogeography 28: 453-470. Wilson, E.O. 1988. Biodiversity. National Academy of Sciences/Smithsonian Institution. Washington. Wilson, K.A., Westphal, M.I., Possingham, H.P. & Elith, J. 2005. Sensitivity of conservation planning to different approaches to using predicted species distribution data. Biological Conservation 122(1): 99-112. Wiser, S.K., Peet, R.K. & White, P.S. 1998. Prediction of rare-plant occurrence: a Southern Appalachian example. . Ecological Applications 8: 909-920. Wisz, M.S., Hijmans, R.J., Li, J., Peterson, A.T., Graham, C.H., Guisan, A. & Group, N.P.S.D.W. 2008. Effects of sample size on the performance of species distribution models. Diversity and distributions): Woodward, F.I. 1987. Climate and Plant Distribution. University Press. Cambridge. Worton, B.J. 1995. A Convex Hull-Based Estimator of Home-Range Size. Biometrics 51: 1206-1215. Yesson, C. & Culham, A. 2006. A phyloclimatic study of Cyclamen. BMC Evolutionary Biology 6: 72. Zaniewski, A.E., Lehmann, A. & Overton, J.M. 2002. Predicting species spatial distributions using presence-only data: a case study of native New Zealand ferns. Ecological Modelling 157: 261-280. Zimmermann, N.E., Jr, T.C.E., Moisen, G.G., Frescino, T.S. & Blackard, J.A. 2007. Remote sensing-based predictors improve distribution models of rare, early successional and broadleaf tree species in Utah. Journal of Applied Ecology 44: 1057-1067.
187

Tesis RGM

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Tesis RGM

Diunggah oleh

Hak Cipta:

Format Tersedia

UNIVERSIDAD COMPLUTENSE DE MADRID FACULTAD DE CIENCIAS BIOLGICAS DEPARTAMENTO DE BIOLOGA VEGETAL I

MANUEL RUBN GARCA MATEO

UNIVERSIDAD COMPLUTENSE DE MADRID FACULTAD DE CIENCIAS BIOLGICAS DEPARTAMENTO DE BIOLOGA VEGETAL I

Madrid, 2 de septiembre de 2008

Fdo. Jess Muoz Fuente

Fdo. ngel Manuel Felicsimo Prez

Modelos predictivos de riqueza de diversidad vegetal

PRIMERA PARTE: estudiando los efectos del tamao de muestra en los

SEGUNDA PARTE: generando pseudo-ausencias y ausencias de grupo

TERCERA PARTE: modelando patrones de diversidad. Comparacin de

Modelos predictivos de riqueza de diversidad vegetal

RESUMEN Y CONCLUSIONES FINALES ........................................................... APNDICE .................................................................................................. REFERENCIAS BIBLIOGRFICAS

Modelos predictivos de riqueza de diversidad vegetal

VERSIN 9.1 9.1 9.1 3.2 5.0

1.1.6 5.2 2.0

Entorno de programacin libre (http://www.r-project.org/) Programa de estadstica de libre difusin

Programa de anlisis estadstico (http://www.spss.com/es/)

1.1. El problema a investigar

Modelos predictivos de riqueza de diversidad vegetal

1.2. Biogeografa y biodiversidad

Modelos predictivos de riqueza de diversidad vegetal

1.3. El rea de estudio

Modelos predictivos de riqueza de diversidad vegetal

Figura 1.1. Mapa poltico del Ecuador continental.

Modelos predictivos de riqueza de diversidad vegetal

1.4. Sistemas de Informacin Geogrfica (SIG)

1.5. Modelado ecolgico (Ecological modelling)

Modelos predictivos de riqueza de diversidad vegetal

1.5.1. Tipos de datos utilizados en modelado ecolgico

Modelos predictivos de riqueza de diversidad vegetal

TAXON Anthurium Gesneriaceae Lauraceae Bromeliaceae Bignoniaceae Leguminosae Total

ESPECIES 53 11 89 93 28 123 397

COLECCIONES 2513 415 3030 4977 1122 5007 17064

Modelos predictivos de riqueza de diversidad vegetal

Tabla 1.2. Variables bioclimticas de WorldClim.

1.5.2. Modelos de distribucin de especies

Modelos predictivos de riqueza de diversidad vegetal

Modelos predictivos de riqueza de diversidad vegetal

Modelos predictivos de riqueza de diversidad vegetal

Modelos predictivos de riqueza de diversidad vegetal

rboles de regresin (Iverson & Prasad, 1998). Redes neuronales.

Modelos predictivos de riqueza de diversidad vegetal

GAB = 1 (1/p * (|A k B K|/ rango K))

Modelos predictivos de riqueza de diversidad vegetal

Modelos predictivos de riqueza de diversidad vegetal

Modelos predictivos de riqueza de diversidad vegetal

Modelos predictivos de riqueza de diversidad vegetal

1.5.3. Evaluacin y comparacin de mtodos

Modelos predictivos de riqueza de diversidad vegetal

Verdadero positivo (VP)

Falso positivo (FP)

Falso negativo (FN)

Verdadero negativo (VN)

Tabla 1.4. Tabla de contingencia para un punto de corte determinado.

Modelos predictivos de riqueza de diversidad vegetal

nmero predicho de casos verdadero s positivos VP = nmero real de casos positivos VP + FP

1.6. Objetivos y estructura de la tesis

1.- Analizar los efectos del tamao de muestra en los modelos de

Modelos predictivos de riqueza de diversidad vegetal

Modelos predictivos de riqueza de diversidad vegetal

2.3. Material y mtodos

Datos con elevado nmero de presencias, ausencias verdaderas y prevalencia desequilibrada.

Modelos predictivos de riqueza de diversidad vegetal