Anda di halaman 1dari 64

Curso Geoestadistica

ESTADISTICA GEOESTADISTICA
MODELAMIENTO
GEOLOGICO
DE BLOQUES

1.5 Kms.
ESTADÍSTICA DESCRIPTIVA
ESTADISTICA

Disciplina encargada y dedicada a estudiar las poblaciones

Descriptiva Inferencial

Describe su comportamiento según


La definición de varias hipótesis
las condiciones o características de
o suposiciones en torno a esas
interés
características de estudio
Población

Grupo de individuos, objetos que tienen una


característica en común.
Población

Variable Cualitativas

Cuantitativas

Continuas Discretas

Muestra

la muestra debe ser


representativa
Muestra probabilística Muestra no probabilística

Técnica de muestreo que Técnica de muestreo donde


integra a toda la población las muestras se recogen en
dándole la oportunidad de un proceso que no brindan
participar en la muestra. a todos los individuos de la
población iguales
oportunidades de ser
seleccionados.
Aleatorio simple, sistemático,
estratificado, conglomerado
Casual o accidental, intencional u opinatico, conveniencia,
consecutivo, bola de nieve.
Métodos de muestreo
Muestreo aleatorio todos los componentes o unidades de la
simple población tienen la misma probabilidad de ser
seleccionados.

Representación gráfica del muestreo aleatorio simple


Métodos de muestreo
Se selecciona al azar un punto de partida y un intervalo
Muestreo sistemático muestral. Así si el punto de partida fuera el 11 y el intervalo
el 6 se elegirían el 11, 16, 21, 26 hasta recorrer toda la
población.

Representación gráfica del muestreo sistemático


Métodos de muestreo
La población en estudio se sub- divide en estratos o
Muestreo estratificado subpoblaciones que tienen cierta homogeneidad en el terreno
y en cada estrato se realiza un muestreo aleatorio simple (o
sistemático).

Requisito principal para aplicar este método de muestreo:


conocimiento previo de información que permita subdividir la
población.
Métodos de muestreo
Muestreo por
En poblaciones muy extensas
conglomerados

Características del conglomerado

• Conjunto de unidades muestrales elementales.


• Heterogeneidad de la variable a medir
• El número total de conglomerados en la población es conocido.
• División previa de la población en conglomerados o “áreas
convenientes”, de las cuales se selecciona un cierto número para la
muestra.
Variables y Tipos de variables

Variable cada una de las características de los elementos de una


población y que varían de una unidad a otra.

Tipos de variables

Variables cualitativas (o
categóricas)

aquellas que no tienen medida numérica; se


representan por categorías o atributos (tipo
de suelo, de vegetación, textura,…).
Tipos de variables

las que pueden expresarse


Variables cuantitativas numéricamente (temperatura,
precipitación, profundidad suelo,
se clasifican en altitud, pendiente, etc.)

Variables discretas Variables continuas

son el resultado de
son el resultado de
contar y sólo toman
medir, y pueden
valores enteros
contener decimales
(número de puntos,
(temperatura,
de cuadrículas, de
profundidad, altura).
píxeles).
Tipos de muestreos

Regular Aleatorio Tran-sect

Aleatorio estratificado Grupos Contorno


Tipo de depósito
de mineral

Distribución de
mineral útil y su
tamaño.

Etapa de
investigación en
la que se efectúa
el muestreo

La accesibilidad
para la toma de
muestras..

El costo de la
toma de
muestras.
Alteración
Sesgos en el superficial de la
muestreo
roca

Pérdida selectiva
de elementos Contaminaciones.
móviles.

Mala
Fallo Humano.
recuperación
Medidas Estadísticas

Promedio o MEDIA
Medidas de Moda
posición Mediana
Percentiles
Estadística

Rango
Medidas de Varianza
variabilidad DESVIACION ESTANDAR
COEF. DE VARIACION
Parámetros Estadísticos

a) Moda (Mo):

𝑓𝑖 − 𝑓𝑖−1
𝑀𝑜 = 𝐿𝑖 +
൫𝑓𝑖 − 𝑓𝑖−1 ) + 𝑓𝑖 − 𝑓𝑖+1

Li: es el límite inferior de la clase modal.


fi: es la frecuencia absoluta de la clase modal.
fi-1: es la frecuencia absoluta inmediatamente inferior a la clase modal.
fi+1: es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai: es la amplitud de la clase.
ഥ ):
b) Media (𝑿 Medidas de Posición
𝒏
𝒙𝒊
ഥ=෍
𝒙
𝒏
𝒊=1

Promedio o Media de la muestra

Mediana: Valor que deja el 50% de los datos


n
Con los datos Ordenados: Xi
Número Impar de datos -- el dato central X=
i =1 n
Número Par de datos -- promedio de los dos
datos centrales.

Moda: Valor más común


ഥ ):
b) Media (𝑿
𝒏
𝒙𝒊
ഥ=෍
𝒙
𝒏
𝒊=1

c) Varianza (𝝈𝟐 )
σ 𝑋 − 𝑋ത 2
𝜎2 =
𝑛
✓ Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas
se puede calcular la varianza total.

Si todas las muestras tienen el mismo tamaño: 𝜎12 + 𝜎22 + ⋯ +𝜎𝑛2


𝜎2 =
𝑛

2 2 2
𝑘1 . 𝜎1 + 𝑘 2 . 𝜎2 + ⋯ + 𝑘 𝑛 . 𝜎𝑛
𝜎2 =
𝑘1 + 𝑘2 + ⋯ + 𝑘𝑛
Si las muestras tienen distinto tamaño:

2 2 2
𝑘1 . 𝜎1 + 𝑘 2 . 𝜎2 + ⋯ + 𝑘 𝑛 . 𝜎𝑛
𝜎2 =
𝑘1 + 𝑘2 + ⋯ + 𝑘𝑛
Parámetros Estadísticos

d) Desviación Estándar (𝝈)

σ 𝑋 − 𝑋ത 2
𝜎= = 𝜎2
𝑛
Parámetros Estadísticos

a) Coeficiente de Variabilidad (CV):

Es una medida de la variación relativa de los datos en porcentaje

𝜎
𝐶𝑉 =
𝑋ത

𝜎
𝐶𝑉 = ∗ 100
𝑋ത
Medidas Estadísticas

Promedio o MEDIA
Medidas de Moda
posición Mediana
Percentiles
Estadística

Rango
Medidas de Varianza
variabilidad DESVIACION ESTANDAR
COEF. DE VARIACION
Medidas de Posición
n
Xi
Promedio o Media de la muestra X=
i =1 n
Mediana: Valor que deja el 50% de los datos
Con los datos Ordenados:
Número Impar de datos -- el dato central
Número Par de datos -- promedio de los dos
datos centrales.

Moda: Valor más común

Geology – Modeling / 1 july 2009


• Parámetros de tamaño Mo

– Mínimo (P0)

– Máximo (P100)

– Moda (Mo)

– Mediana (M = P50)

P0 P50 P100

Geology – Modeling / 1 july 2009


Media▪ Lejos, es la Medida de Tendencia Central más
utilizada

0 1 2 3 4 5 6 7 8 9 10

Media = 5

▪ Afectada por Valores Extremos (Outliers)


0 1 2 3 4 5 6 7 8 9 10 12 14

Media = 6
Mediana

▪ En Arreglo Ordenado, la Mediana es el valor “del


medio”
▪ Si n es impar, → Mediana = X[(n+1)/2].
▪ Si n es par, → Mediana =½(X[n/2]+X[n/2+1])

▪ No es afectada por los valores extremos (robusta),


sino por el tamaño de la muestra.

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14

Mediana = 5 Mediana = 5
Moda

▪ Valor que ocurre más Frecuentemente


▪ No es Afectado por Valores Extremos
▪ Puede que no exista Moda
▪ Pueden existir varias Modas
▪ Se emplea en datos Categóricos o Numéricos

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6

Moda = 9 No-Moda
¿Cuándo usar Media, Moda o Mediana?
¿Datos son Si La primera consideración es el tipo de
categóricos? MODA datos, si la variable es categórica, la
Moda es la única medida que mejor
No describe los datos

La segunda consideración es pregun-


¿El total es de Si
tarse si el total de las observaciones es
Interés? MEDIA de algún interés. Si la respuesta es
afirmativa, entonces la medida ade-
No cuada de la tendencia central es la Media

¿DistribuciónS
Si Si el total de las observaciones no es de
esgada? interés. Entonces, si el histograma es
MEDIANA
sesgado, usar la Mediana como medida
No de la tendencia central.

En caso contrario la Media si es


MEDIA moderadamente sesgada
En todos los casos el histograma
debe ser unimodal
Medidas de variabilidad

Rango: Diferencia entre los valores máximo y mínimo


n

 i
( X − X ) 2

Varianza muestral S 2
= i =1

n −1

Desviación estándar S= S 2

s
Coeficiente Variacion
C.V . =
x
Geology – Modeling / 1 july 2009
Variancia Muestral
▪ Importante Medida de la Dispersión

▪ Mide la Desviación Cuadrática Promedio


alrededor de la Media; esto es, toma en cuenta
cómo se distribuyen los datos alredor de la
Media

 (X )
n
2
i
−X
◼ Variancia Muestral : s 2 = i =1
n −1
Deviación Estándar Muestral
▪ La más Importante Medida de Dispersión
▪ Muestra la Raíz de la Desviación cuadrática
promedio alrededor de la Media

▪ Tiene las misma Unidad que los Datos Originales

 (X )
n
2
i
−X
s = i =1
n −1

s = 23,35
Comparando Desviaciones Estándar
Datos A Media = 15.5
^
s = 3.338
11 12 13 14 15 16 17 18 19 20 21

Datos B
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 ^
s = .9258

Datos C
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 ^
s = 4.57
Estadísticas Básicas
Yacimiento tipo pórfido
cuprífero CV = 0.7
Yacimiento de cobre de
mediana var. CV = 1.5
Yacimiento de oro de alta
variabilidad CV = 4.5
Varianza y soporte
• Histograma
• La escala de intensidades se divide en N clases.
• Una frecuencia está asociada a cada centro de clase y representada por
un rectángulo proporcional
• Las frecuencias pueden ser absolutas (Nb) o relativas (%)

Histogram m e de M oS2.
Sondage n°647
MoS2 (%) Nb Obs. 24
<0,15 8
20
0,29 37
0,43 31 16
0,57 14

Nb d'obs
12
0,71 4
0,86 1 8

1,00 3 4
1,14 0
0
1,28 1 0 0.2 0.4 0.6 0.8 1 1.2
0.1 0.3 0.5 0.7 0.9 1.1 1.3
1,42 1
M OS2
• Histograma
• La selección del número de clases influye
en la legibilidad Zn(%) Nb
• 15 a 20 clases es comunmente óptimo 3.8 16
9.3 88
14.8 220
20.2 219
25.8 125
31.2 41
36.8 9

7, 21 o 100 clases para un total de 800 observaciones


• Histograma en frecuencias acumuladas
• Frecuencias acumuladas de 0% a 100%
• Lectura rápida de « percentiles »
Tipos de distribución
• Distribución Normal
• Eventos debido a múltiples causas independientes,…
• Ex. granulometría de un sedimento, Densidad por alteración, fluctuationes mensuales
de un nivel piezométrico, geoquímica de un elemento mayor y móvil (Fe, Mn,…), …

− (x− )2
2 . 2
e
f (x ) =
 . 2. 
con :
µ = media
σ = desviación típica
Distribución Normal (Gaussiana)
• La distribución gaussiana es simétrica: g(z)

• La media y mediana son iguales 0.40

0.35

0.30

0.25

0.20 95 %
0.15

0.10

0.05 2.5% 2.5%


0.00
0 2 4 6 8 10 12 14 16
z

• Cualquier Distribucion puede pasar a Normal Gaussiana


(estandarizar).
X −
• Si X ~ N ( ,  2 ) y definimos: Y = , entonces: Y ~ N (0,1)

• Y tiene distribucion Normal Gaussiana
Análisis Univariables valores extremos
• Valores extremos: afectan considerablemente las estadísticas básicas
• ¿Qué hacer con ellos?:
• Declarar los valores extremos como erróneos y eliminarlos
• Clasificarlos en poblaciones estadísticas separadas
• Usar estadísticas robustas, que son menos sensibles a los valores extremos: mediana,
coeficiente de correlación de posición
• Transformar los datos para reducir su influencia
• Bajarlos a un máximo “razonable”
• Outliers: Observaciones que parecen no pertenecer a la misma población constituida
por el resto de los datos
• Generan considerables problemas al aplicar regresión, debido a que tienen un efecto
desproporcionado sobre los coeficientes de regresión estimados
• Los datos considerados extremos (outliers) puede eliminarse sólo si se ha
comprobado que están errados. En caso de ser datos verdaderos, proveen
información que puede ser crítica para la respuesta del modelo.
Análisis Univariable
• La distribuciones son útiles para chequear la presencia de
dos poblaciones
CDF PDF
Análisis Estadístico
• Son útiles para chequear la presencia de dos poblaciones
• Debe confirmarse con información geológica
¿Agrupaciones de puntos? → Investigar ....

18

16

Observed Value
Histogram
90
14
80

12
70

10 60

No of obs
50
8
40

6
30

4 20

10
2
0
-1,0 0,7 2,3 4,0 5,6 7,3 9,0 10,6 12,3 13,9 15,6
0 Var1

-2
-4 -3 -2 -1 0 1 2 3 4

Theoretical Quantile
Correlación
⚫Covarianza : parámetro adimensional [-∞,+∞]  xy
 xy =
⚫Correlación : parámetro adimensional [-1,1]  xx . yy

Fe Ni Cu V
Fe 1.00 .90 .38 .81
Ni .90 1.00 .44 .73
Cu .38 .44 1.00 .52
V .81 .73 .52 1.00
Geology – Modeling / 1 july 2009
Correlación Caso 1 Caso 2
Y Y

• Diferentes ejemplos = 1  = 0,68

de coeficiente de X X

correlación
Caso 3 Caso 4
Y Y

=0 =0

X X

Caso 5 Caso 6
Y Y

 = -0,87

 = -1

X X
Regla Práctica de Interpretación
Pendiente Correlación Pendiente
Negativa entre X e Y es… Positiva

r
0.00 ‘Ninguna’ 0.00
-0.19 - -0.01 ‘Muy Débil’ 0.01 - 0.19
-0.39 - -0.20 ‘Débil’ 0.20 - 0.39
-0.69 - -0.40 ‘Modesta’ 0.40 – 0.69
-0.89 - -0.70 ‘Fuerte’ 0.70 – 0.89
-0.99 - -0.90 ‘Muy Fuerte’ 0.90 – 0.99
-1.00 ‘Perfecta’ 1.00
• Una base de datos concentra toda la información cualitativa y cuantitativa de los sondajes
perforados durante el proyecto. Aunque, actualmente los Administradores de Base de Datos,
concentran TODA la información relevante del proyecto, incluso administración de contratos.

• Una base de datos puede ser tan grande como se quiera, siempre y cuando, tenga una
estructura lógica y consistente de tablas relacionadas.

• Debe tener vínculos que relacionan items entre sí, de manera que siempre exista una relación
entre el sondaje y los datos que se asocian a él.

• Lo que a Modelamiento geológico se refiere, la base de datos debe contener a los menos 4
grandes grupos de información, que se pueden usar en cualquier tipo de Programa de
Modelamiento tridimensional:

• Collar, con toda la información de localización de los sondajes o muestras.


• Survey, con toda la información de trayectoria de los sondajes.
• Assays, con todos los análisis químicos asociados a las muestras de intervalos de sondajes
o puntuales.
• Geology, con toda la información descrita por los geólogos.
 Uno de los factores más importantes de la base de datos, es la validación de su
información.

 La base de datos constituye el soporte básico de todas las interpretaciones geológicas,


por lo tanto, es sumamente importante su influencia en las declaraciones del recurso,
los chequeos de la integridad y la consistencia de la base de datos.

 Solo debe existir una sola versión de la base de datos.

 Este principio ha inspirado la generación de software de Administración de Datos, que


permiten definir accesos, privilegios y/o prohibiciones, a una base de datos específica.
De manera que puedan usar los datos sin peligro de tener modificaciones a los datos
oficiales.

 La base de datos debe tener suficiente flexibilidad para que el geólogo que realice el
registro pueda incluir observaciones sobre variables adicionales.
Naturaleza de los datos geológicos
– Datos Categóricos (multimodales)
– tipo litológico (norita, anortosita, monzonita,…)

– Datos Continuos (absolutos (%))


– ley en Ag, Cu, Mo, Au, ...

– Datos Continuos (relativos)


– latitud, longitud, localización espacial,...
– Datos angulares
– orientación de fallas,...
– Datos ordinales (de rango)
– dureza de Mohs, magnitud de Richter,...
– Datos binarios (dicotómicos)
– intrusivo o extrusivo; > o < 450 ppm P2O5 ,...
Conceptos
• QAQC - Calidad de los datos muestreados:
Basicos
• Estos datos (logueo y leyes) deben tener alta calidad (confianza) y estar casi
limpio de errores.
• Si entra (INPUT) data erronea se tendra como resultado (OUTPUT) data
erronea.
• Análisis de Calidad (QA) : es la información reunida para demostrar y cuantificar la
confiabilidad en los ensayes.
• Control de Calidad (QC): consiste en los procedimientos usados para mantener el
nivel deseado de calidad de los ensayes.
Control de Precisión en MDG
y = 1.001x + 0.0051 SDT II - CuT%
R2 = 0.9987
10.000
2008
9.000
0.790
8.000

Resultado CuT%
Muestra 0.770
7.000
Cut% Duplicados

Duplicado de
6.000
Gruesos - 0.750
rechazos (MDG)
5.000 Linear (Muestra 0.730
Duplicado de
4.000 Gruesos - 0.710
rechazos
3.000 0.690
(MDG))
2.000
0.670
1.000 AC AC AC AC AC AC AC AC AC AC AC AC AC AC AC
-1 - - - - - - - - - - - - -1 -2
08 45A 189 130 130 197 197 23A 221 14 197 197 28 18 6
A A A A A
0.000
0.000 2.000 4.000 6.000 8.000 10.000
Fecha
CuT% Originales
CuT% Low er_± 5% Upper_± 5% Low er_Cert% Upper_Cert%
EXACTITUD Y PRECISIÓN
En teoría del muestreo de minerales se utilizan las nociones
de exactitud y precisión.

La PRECISIÓN se refiere a la
La EXACTITUD está
dispersión del conjunto de
relacionada con el sesgo
valores obtenidos de
de una estimación.
mediciones repetidas de
Cuanto menor es el sesgo
una magnitud. Cuanto
más exacta es una
menor es la dispersión
estimación.
mayor la precisión.
Ejemplo
En resumen:

exactitud Media

precisión Varianza

“La media debe ser insesgada (sin desviación sistemática) y la


varianza debe ser pequeña”.
Conceptos Basicos
• La estimación no es el valor verdadero:
• Los recursos minerales estan basado sobre estimación no son valores reales.
Entonces un buen muestreo, geología y optima estimación hace que este
error sea el minimo posible.
• La realización de un modelo se realiza con un pequeño muestreo:
• Se debe tener en mente que la muestra representa una muy pequeña parte
del cuerpo.
Conceptos Basicos
realidad .............................. Muestras ...........................Estimado
Incertidumbre: Conceptos básicos
Ningún modelo numérico reproducirá la realidad sin error. Hay incertidumbre.
Esta incertidumbre existe debido a nuestra falta de conocimiento debida a un
muestreo no exhaustivo.
No es una característica inherente al depósito
Modelo de Blastholes tiene menos incertidumbre que el modelo drillholes.
Conceptos Basicos
• La incertidumbre es dependiente de:
• La densidad de muestreo (sin muestras no hay estimación)
• Homogeneidad geológica (La continuidad de los valores dentro
de cada geología)
Conceptos Basicos
• Regionalización o Fenómeno Regionalizado:
• De la existencia de áreas geológicas de: altas leyes, medianas leyes, bajas
leyes y áreas geológicas sin mineralización. En cada zona o área se tiene un
fenomeno regionalizado (mineralización) diferente (estadística,
geoestadística, etc). Todo esto esta intimamente ligado a los datos geológicos
y se debe tomar en cuenta para la estimación.
Conceptos Basicos
• Regionalización:
Conceptos Basicos
• Homogeneidad Geológica y estadística:
• Debería hacer una relación entre geología y la estadística/geoestadistica.
• Controles Geológicos definen la Mineralización. Entonces la comprensión del
modelo geológico es esencial para la mejor realización de la estimación.
Mine Material Type
Conceptos Basicos
No Min Max
Au (gpt) Statistics
Mean SD CV Capping #Capped
Gold Dom1_Cen Gold Dom2_Cen

La Quinua Gold_All 7495 0.002 4.04 0.535 0.440 0.823 5 2


La Quinua Gold_Dom1_Cen 1262 0.002 3.19 0.617 0.572 0.928 - -
La Quinua Gold_Dom2_Cen 4446 0.016 4.04 0.596 0.443 0.744 5 2
La Quinua Gold_Nor 935 0.015 1.162 0.277 0.161 0.581 - -
La Quinua Gold_Sur 852 0.009 1.77 0.376 0.188 0.500 - -

Gold All Gold Dom1_Cen Gold Dom2_Cen

Gold Nor Gold Sur

Gold Nor Gold Sur

Nor

Cen_Dom1
Cen_Dom2

Sur

Anda mungkin juga menyukai