Anda di halaman 1dari 13

Introduction

(Basic Statistics)
1. Chiles, JP., and Delfiner, P., Geostatistics - Modeling Spatial
Uncertainty, John Wiley & Sons, Inc., 1999
2. Davis, J.C., Statistics and Data Analysis in Geology, John Wiley &
Sons, 2nd ed., 1986
3. David, M., Geostatistical Ore Reserve Estimation, Elsevier Scientific
Publishing Company, 1979.
4. Diktat kuliah : Analisa Statistik Kebumian (Dr. Darharta Dahrin)
5. Journel A.G. and Ch. J. Huijbregts, Mining Geostatistics, Academic
Press, 1978.
6. Journal Computers dan Geosciences, Pergamon Press, 1991.
7. Kelkar, M., dan Perez, G., 2002, Applied Geostatistics for Reservoir
Characterization, SPE
8. Walpole, R.E., Myers, S.L. dan Ye, K., 2007, Probability & Statistics
for Engineers and Scientist, Pearason Prentice Hall.
9. Webster , R., dan Oliver, M., 2001, Geostatistics for Environmental
Scientist, John Wiley & Sons.


References
Dua macam sifat alam

1. Sistematik, deterministik : sifat yang
mengikuti hukum-hukum fisika, kimia,
biologi dan dapat dinyatakan dalam
formulasi matematik.
2. Acak / random : hanya dapat
diformulasikan dengan pendekatan
konsep statistik dimana sifat parameter
alam tersebut dapat dinyatakan dalam
besaran prediksi pada suatu tingkat
kepercayaan.
Contoh

1.Sistematik, deterministik : misalnya
densitas, resistivitas, kecepatan suatu
lapisan yang homogen, dll.


2.Acak / random : tekanan/temperatur
dimana banyak parameter lain yang
mempengaruhi keberadaan lingkungan
tersebut, macam mineral.

Penggabungan sifat
Sistematik & deterministik dan sifat
Acak / random dapat dilakukan dengan
berdasarkan pada pendekatan statistik



Dalam ilmu dan teknologi Kebumian :
GEOSTATISTIK
GEOSTATISTICS
A branch of applied statistics that
focuses on mathematical
description and analysis of
geological observations

Geostatistics is a collection of
statistical methods which were
traditionally used in geo-sciences.

1. Memberikan pemahaman tentang
dasar-dasar statistik dan aplikasi
komputasi dalam bidang ilmu
geologi & geofisika.

2. Mampu memecahkan berbagai
masalah dalam ilmu kebumian
dengan menggunakan pendekatan
geostatistik.
Tujuan perkuliahan
secara umum
1. Optimalisasi interpretasi :
minimize error dan ketidakpastian

2. Pengambilan keputusan :
Korelasi antar variabel
Uji hipotesa / validitas
Probabilitas
Menaksir suatu parameter




Tujuan GEOSTATISTIK
Statistika
Bahasa latin modern statisticum collegium
(dewan negara)
Bahasa Italia statista (negarawan/politikus).
Gottfried Achenwall (1749) dalam bahasa Jerman
statistik (kegiatan analisis data kenegaraan) sbg
ilmu tentang negara (state).
Antara tahun 1786 dan1798, Sir John Sinclair
dalam bahasa Inggris statistics
Statistika secara prinsip mula-mula hanya
mengurus data yg dipakai lembaga-lembaga
administratif dan pemerintahan

Pada awal abad ke-19 terjadi pergeseran ilmu
mengenai pengumpulan dan klasifikasi data.
Cabang statistika yg pada saat ini sangat luas
digunakan untuk mendukung metode ilmiah,
statistika inferensi, dikembangkan pada paruh
kedua abad ke-19 dan awal abad ke-20 oleh
Ronald Fisher (peletak dasar statistika inferensi),
Karl Pearson (metode regresi linear), dan William
Sealey Gosset (meneliti problem sampel berukuran
kecil).
Saat ini, penggunaan statistika telah banyak
digunakan dalam semua bidang ilmu pengetahuan

Statistik : kumpulan data, bilangan/non bilangan yg
disusun/disajikan sedemikian rupa (dalam bentuk
tabel/grafik) dan menggambarkan suatu persoalan
atau keadaan

Statistika : pengetahuan yg berhubungan dgn cara-
cara pengumpulan, penyajian, pengolahan dan
analisis data, serta teknik-teknik analisis data
sbg cara-cara ilmiah untuk mengumpulkan,
menyusun, meringkas dan menyajikan data
penelitian
Cara untuk mengolah data dan menarik
kesimpulan-kesimpulan yg teliti dan
keputusan-keputusan yg logik

Ruang Lingkup Statistik
Statistik Deskriptif / Deduktif
Statistik Analitik / Inferensial / Induktif
Statistik Deskriptif

Bidang statistik yg meliputi : pengumpulan
data, pengolahan data, penyajian data dan
analisis data secara sederhana.
Tujuan untuk menggambarkan keadaan
atau karakteristik populasi/sampel yg dikaji.
Alat yg digunakan biasanya dalam bentuk
tabel, grafik, diagram, peta, gambar, dll.
Hasil perhitungan analisis yg dapat
dihadirkan, yaitu, proporsi, modus, median,
mean, variansi dan standar deviasi.
Statistik Analitik/Inferensial

Bidang statistik yg mencakup semua
kegiatan statistik secara utuh mulai dari
kegiatan pengumpulan data, pengolahan
data, penyajian data, analisis data dan
penarikan simpulan berdasarkan data yg
ada.
Tujuan akhir untuk membuat inference
atau menggeneralisasi hasil pengukuran
sampel ke populasi.
Alat yg digunakan pada statistik analitik
adalah teori estimasi, pengujian hipotesis,
dll.
STATISTIK & STATISTIKA
Alat untuk :
Pengumpulan data
Pengolahan data
Penyajian data
Analisis data
Penarikan simpulan data
DATA !
KEJADIAN STATISTIK
Stokastik
Hubungan kejadian yg tdk pasti

Determinan
Hubungan kejadian yg pasti
Data Menurut Sifatnya
Data Kualitatif : menunjukkan sifat-sifat
objek yg tdk memungkinkan secara
langsung dapat diubah menjadi angka,
sehingga menggunakan pendekatan
dalam bentuk kategori.
Contoh : interval kontur rapat, keputusan
tepat, perkataannya benar
Data Kuantitatif : data yg dinyatakan
dalam bentuk angka.
Contoh : 2.67 gr/cc, 10 km
2


1. Data primer diperoleh secara langsung dari obyak yg
diteliti baik secara individu maupun kelompok (merupakan
data mentah dan dikategorikan sbg hasil pengukuran
sendiri atau berdasarkan hasil pengukuran orang lain
namun belum diinterpretasi)

2. Data sekunder diperoleh secara tdk langsung untuk
mendapatkan informasi dari obyek yg diteliti (data yg
dicuplik dalam literatur, biasanya merupakan data yg sdh
diinterpretasi)

3. Data tersier diperoleh secara tdk langsung dari obyek
yg diteliti biasanya diperoleh dari pihak ketiga baik dari
individu maupun kelompok yg sengaja mengungkapkan
fakta dari pihak kedua

Skala pengukuran data
Skala nominal
Skala ordinal
Skala interval
Skala ratio
Tabel
Gambar/Grafik
Grafik garis (line chart)
Grafik Batangan (bar chart)
Grafik lingkaran (pie chart)
Grafik gambar (Pictogram chart)
Diagram Pencar (Scatter diagram)

Cara Penyajian Data
Jenis Grafik/Gambar
DISTRIBUSI FREKUENSI
Bentuk pengelompokan data untuk
menggambarkan distribusi data

Dapat dinyatakan dalam
bentuk tabel distribusi frekuensi
histogram atau poligon frekuensi
Macam-macam bentuk diagram
Data tidak terkelompok : diagram batang,
diagram lingkaran, garis, gambar (simbol)

Data terkelompok : histogram dan poligon
frekuensi, ogive
Karakteristik
Populasi Data
Universe
Unit sampel
Variabel random
Distribusi kemungkinan
Median
Mean
Modus
Mid-range
Distribusi data

Besaran dispersi Karakterisasi distribusi
kemiringan dan kurtosis

Hubungan 2 variabel

Tes Z (normal), Tes t, Tes F, Tes _
2
Kumpulan elemen yang terdefinisi dengan baik
Totalitas semua nilai yg mungkin, hasil observasi
kuantitatif / kualitatif mengenai karakteristik
tertentu dari semua anggota kumpulan yang
lengkap dan jelas
Kumpulan dari keseluruhan pengamatan yang
menjadi perhatian
Populasi
Ruang sampel yang akan dianalisa
Dalam survey geofisika , semua data yang
diperoleh dalam daerah penelitian
merupakan universe
Memiliki batas area, misalnya struktur
geologi
Universe / semesta
Bagian kumpulan dari elemen yang diambil dari
populasi
Himpunan bagian dari ruang sampel
Sampel
Unit sampel
Bagian dari universe dimana pengukuran
dilakukan
Pemilihan unit sampel dilakukan berdasarkan:
ketersediaan data, metode statistik yg
digunakan, hasil target yang diharapkan
Penentuan unit sampel ditujukan untuk
karakterisasi daerah penelitian agar
memenuhi tujuan yang efektif
Dalam survey geofisika, unit sampel
tergantung pada target geologi, lingkungan,
teknologi yg digunakan, dana dsb
Populasi : sebuah kumpulan dari semua
kemungkinan orang-orang, benda-benda dan
ukuran lain dari objek yang menjadi perhatian
yang mempunyai ciri atau karakteristik yang
sama


Sampel : bagian dari populasi yang dijadikan
sebagai bahan penelaahan dengan harapan
sampel yang diambil dari populasi tersebut
dapat mewakili (representative) terhadap
populasinya

Sampel adalah suatu bagian dari
populasi tertentu yang menjadi
perhatian

Population Parameters Sample Parameters
= Population Mean
o = Population Standard
Deviation
X = Sample Mean
S = Sample Standard
Deviation
POPULATION vs. SAMPLE
Statistik
Ukuran lokasi (pemusatan)
Ukuran dispersi (sebaran)
Ukuran kemiringan
Ukuran keruncingan
Ukuran lokasi ukuran
cenderung memusat

Rata-rata
Median
Modus

Kuartil
Desil
Persentil


Ukuran dispersi ukuran
cenderung menyebar
Range

Deviasi rata-rata


Range = Nilai Maksimum Nilai Minimum

n
x x
DS
i

=
Variansi : penyebaran berdasarkan jumlah
kuadrat simpangan data terhadap rata-
ratanya; melihat ketidaksamaan sekelompok
data
Standar deviasi penyebaran data
berdasarkan akar dari variansi; menunjukkan
keragaman kelompok data

Miring (positif & negatif)

Ukuran kemiringan suatu distribusi menyatakan
derajat simetri distribusinya
Kemiringan positif jika ekor ke kanan sementara
untuk kemiringan negatif, jika ekornya ke kiri
Kemiringan positif menunjukkan sedikit gejala yang
bernilai makin besar, sebaliknya untuk kemiringan
negatif

Kemiringan positif
Kemiringan negatif
S
x x
kemiringan

=
Data dapat disajikan dalam bentuk :






Kemiringan kurva dapat dihitung berdasarkan rumus
Koefisien Kemiringan Pearson, yaitu :




Kemiringan (-) kurva miring ke kiri
Kemiringan (+) miring ke kanan
Kemiringan = nol kurva normal
Kemiringan / Skewnes dan Kurtosis
Ukuran Keruncingan (Kurtosis)
Adalah derajat kepuncakan dari
suatu distribusi, biasanya diambil
relatif terhadap distribusi normal
Leptokurtik Platikurtik
Mesokurtik
( )

P P
K K
2
1
K
10 90
1 3

=
- Jika koefisien kurtosis kurang dari 0,263 maka
distribusinya adl platikurtik
- Jika koefisien kurtosis sama dengan 0,263
maka distribusinya adl mesokurtik
- Jika koefisien kurtosis lebih dari 0,263 maka
distribusinya adl leptokurtik

Kriteria untuk mengetahui model
distribusi dari koefisien kurtosis
a4 = 3 data berdistribusi normal,
a4 < 3 kurva normal platikurtik
a4 > 3 kurva leptokurtik
Rules:
= 68.25% of the data will fall within +/- 1 os from the mean
= 95.46% of the data will fall within +/- 2 os from the mean
= 99.73% of the data will fall within +/- 3 os from the mean
= 99.9937% of the data will fall within +/- 4 os from the mean
= 99.999943% of the data will fall within +/- 5 os from the mean
= 99.9999998% of the data will fall within +/- 6 os from the mean

-4 -3 -2 -1 0 1 2 3 4
68.3%
95.5%
99.73%
NORMAL CURVE PROPERTIES
Accurate but Imprecise Process
LS US
Nominal
Inaccurate but Precise Process
LS US
Nominal
PROCESS VARIATION
Accurate & Precise Process
LS US
Nominal
Inaccurate & Imprecise Process
LS
Nominal
US
PROCESS VARIATION
LS US
LS US
The dispersion is within the
tolerance.
The distribution is well centered
between the limits.
The risk of defect is minimal.
The dispersion is within the
tolerance.
The distribution is off-center.
Production of defects is likely.
PROCESS CENTERING
LS US
LS US
The dispersion is less than the
tolerance.
The distribution is very off-center
and exceeds the upper tolerance.
Production of defects has
occurred.
The dispersion is equal to the
tolerance.
The distribution is centered.
The risk of defects is high.
PROCESS VARIATION
LS US
LS US
The dispersion is greater than the
tolerance.
The distribution is also off-center.
Production of defects has occurred.
The dispersion is greater than the
tolerance.
The distribution is centered.
Production of defects has occurred.
PROCESS VARIATION
LS US
LS US
The distribution is bimodal (two
peaks).
Both dispersions are within the
tolerance.
Indicates that the data comes
from two distinct populations (
two machines, two
shifts, two suppliers, etc.)
The dispersion is within the
tolerance.
The distribution is asymmetrical
(shifted towards one limit).
There is a possibility that the
data are distorted or inaccurate.
However, certain processes are
naturally asymmetrical.
PROCESS VARIATION
DISTRIBUSI FREKUENSI
1. DATA

2. TABEL

3. HISTOGRAM

4. POLIGON

5. OGIVE
Mean:
-The arithmetic average of a set of values.
uses the quantitative value of
each data point.
strongly influenced by extreme
values.
Median:
- Number reflecting the 50% rank of a set
of values.
can be easily identified as the
center after all of the values are
sorted from high to low.
hardly affected by extreme values.
Mode:
- Most frequently occurring value in a
data set.
n
n
i
i

=
X
= X
1
MEASUREMENTS OF CENTRAL TENDENCY
12
14
17
18
19
22
27
27
28
Range:
- Numerical distance between the highest and the
lowest values in a data set.
very sensitive to extreme values in the data.
max min = Range
Variance :
- Sum of the distances between individual data points and
population or sample mean. Distances are squared to
remove negative.
very sensitive to extreme values in the data.
) ; (
2 2
s o
1
) (
1
2
2

X X
=

=
n
s
n
i
i
Standard Deviation :
- The square root of the variance.
most commonly used measurement to
quantify variability.
) ; ( s o
1
) (
1
2

X X
=

=
n
s
n
i
i
Adding Variances :
) (
2
2
2
1
o o +
o
2
1
o
2
2 = Variance of sample 2
= Variance of sample 1
o o o
2
2
2
1
2
+ = Then
) (
2
2
2
1 o o
o + =
MEASUREMENTS OF VARIABILITY
Distribusi Probabilitas
Deskripsi numerik dari hasil observasi
Karakteristik yang menunjukkan variasi / sesuatu yang
nilainya berubah-ubah
Variabel
Suatu peubah acak jika himpunan kemungkinan hasilnya
terhitung

Variabel diskrit
Suatu peubah jika himpunan kemungkinan hasilnya tak
berhingga banyaknya
Variabel dengan nilai tidak terbatas yang dapat diukur

Variabel kontinu
Distribusi Probabilitas
Kumpulan pasangan nilai-nilai dari variabel
acak X dengan probabilitas nilai-nilai
variabel random X, yaitu P(X=x) disebut
distribusi probabilitas X (distribusi X)

Distribusi Probabilitas Diskrit

Distribusi Probabilitas Diskrit
Fungsi Distribusi Kumulatif

Distribusi Probabilitas Kontinu

Grafik dari Fungsi Kepadatan Probabilitas

probability density function
The Probability Density Function (PDF) of a continuous random
variable is a function which can be integrated to obtain the probability
that the random variable takes a value in a given interval.

PDF is used to find the point of Normal Distribution curve.
Continuous Probability Density Function of the Normal Distribution is
called the Gaussian Function.


Standard Normal Distribution:
A random variable which has a normal distribution with a mean =0
and a standard deviation =1 is referred to as Standard Normal
Distribution.





where, m = Mean, = Standard Deviation, = 3.14, e = 2.718

Example 1: Find Probability Density Function with mean =5 ,
Standard deviation =2, Normal random variable x=10
Example 1: Find Probability Density Function with mean =5 ,
Standard deviation =2, Normal random variable x=10
The Normal Distribution is also called the Gaussian
distribution.

It is defined by two parameters mean ("average" m)
and standard deviation ().

A theoretical frequency distribution for a set of variable
data, usually represented by a bell-shaped curve
symmetrical about the mean.

Formula:
X < mean = 0.5-Z
X > mean = 0.5+Z
X = mean = 0.5
Z = (X-m) /
where, m = Mean, = Standard Deviation.
X = Normal Random Variable
Z = (X-m) / X < mean = 0.5-Z
X > mean = 0.5+Z
X = mean = 0.5
Z = (X-m) /
z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0 0 0.004 0.008 0.012 0.016 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.091 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.148 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.17 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.195 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.219 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.258 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.291 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.334 0.3365 0.3389
1 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
.
.
3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998
Z table
http://easycalculation.com/statistics/statistics.php
Point Estimate
Lower
Confidence
Limit
Upper
Confidence
Limit
Width of confidence interval
-?o

+?o
Level of Confidence
Is the probability that the interval includes the unknown
population parameter
Denoted (1 - o)
o is probability that interval does not include the parameter
Typical values of confidence interval: 99%, 95%, 90%
Three Important Areas under the Normal Curve
The Empirical Rule for Normal Populations
68.26% confidence interval = 1 standard error
95.44% confidence interval = 2 standard errors
99.73% confidence interval = 3 standard errors