Anda di halaman 1dari 4

Bab 1

Konsep Statistika Dasar

Tujuan Praktikum
Memahami dan dapat menyelesaikan permasalahan kebumian dengan meggunakan analisis statistik melalui analisa mean,
median, modus, variansi,kovariansi, korelasi, histogram dan pdf.

1.1 Pendahuluan
Pengetahuan dasar-dasar statistika sudah merupakan keharusan untuk dipahami supaya kita mampu memahami geostatistik
dengan lebih baik. Pemahaman dasar yang terpenting adalah pemahaman bahwa nilai parameter petrofisik tertentu misalnya
porositas, permeabilitas dan lain-lain merupakan variabel acak dengan nilai dan probabilitas tertentu.

1.2 Statistik Dasar


Berikut beberapa pengertian statistik univarian dan bivarian: (dalam kurung merupakan perintah MATLAB untuk menghi-
tung parameter statistik yang bersangkutan)
• Mean (mean)
Arithmetic mean secara matematis dapat diformulasikan sebagai berikut:
Pn
xi
x = i=1 (1.1)
n
Disamping itu, adapula geometric mean yang merupakan akar n dari perkalian semua n obervasi atau kejadian.
• Variansi (var)
variansi dari suatu populasi dianalisa dengan menggunakan persamaan :
Pn
(xi − µ)2
σ 2 = i=1 (1.2)
n
Dari formulasi di atas dapat disimpulkan bahwa variansi merupakan rata-rata deviasi suatu populasi terhadap mean.
Atau jika dihitung dari sampel : Pn
(xi − x)2
s2 = i=1 (1.3)
n−1
Variansi juga dapat dinyatakan dalam bentuk:
SS
s2 = (1.4)
n−1
(Penjelasan lebih lanjut silahkan merujuk ke buku Davis halaman 33).
• Standar deviasi (std)
Standar deviasi dan variansi merupakan contoh ukuran statistik/parameter populasi yang memiliki karakteristik penye-
baran atau dispersi terhadap mean. √
s = s2 (1.5)
Nilai standar deviasi yang kecil menunjukkan bahwa observasi terkumpul (ter-cluster) dengan sangat kuat sekitar nilai
pusat (mean/median/modus). Sebaliknya jika nilainya besar, maka menunjukkan data yang tersebar (ter-scatter).
• Median

M = x n+1 Untuk n ganjil (1.6)


2

M = x n2 + n+1
2
Untuk n genap (1.7)
2

5
6

• Nilai maksimum (max) dan minimum (min)

• Modus (mode)
Adalah nilai atau kejadian yang muncul dengan frekuensi terbanyak.

• Kovariansi (cov)
Definisi kovariansi mirip dengan variansi. Bedanya kovariansi digunakan untuk analisa dua sekuens data yang berbeda.
Pn
(xi − x)(yi − y)
covXY = i=1 (1.8)
n−1
Kovariansi tidak terlalu memiliki arti fisis yang signifikan, tetapi dari nilai kovariansi dapat dihitung korelasi yang
memliki arti dan pengertian yang sangat signifikan dalam analisa data sekuens.

• Korelasi (corcoef)
Korelasi secara matematis dinyatakan sebagai berikut:

covXY
rxy = (1.9)
sx sy
sx dan sy masing - masing adalah standar deviasi sampel / data sekuen x dan y. Korelasi memiliki nilai maksimum 1
dan nilai minimum -1. Dari dua sekuen yang memiliki korelasi 1 berarti bahwa kedua sekuen ini memiliki hubungan
yang sempurna dan berbanding lurus. Jika bernilai -1, kedua data sekuen memiliki hubungan yang sempurna tetapi
saling berlawanan. Dan jika nilainya 0, maka kedua data sekuen ini tidak saling berhubungan atau saling independen.

Contoh 1: Tabel di bawah ini menyajikan data panjang dan lebar dari kerang Brachiopod Composita:

Tabel 1.1: Ukuran panjang dan lebar 6 sampel Brachiopoda


Panjang (mm) Lebar (mm)
18.4 15.4
16.9 15.1
13.6 10.9
11.4 10.7
7.8 7.4
6.3 5.3

Buatkan statistick deskriptif dari kedua kelompok data di atas dan analisa keterkaitan antara kedua besaran tersebut?

clear,clc
a=load(’brachiopod.dat’);
rata2=mean(a); % Menghitung nilai rata-rata
mini=min(a); % Mencari nilai minimum dari input
maks=max(a); % Mencari nilai maksimum dari input data
modus=mode(a); % Menentukan frekuensi paling banyak
variansi=var(a); % Menghtung nilai variansi dari input data
standev=std(a); % Menghitung standar deviasi dari input data
kovariansi=cov(a); % Menghitung koariansi antara dua sekuen data
korkoef=corrcoef(a); % Menghitung koefisien korelasi antara dua sekuen data

1.3 Histogram
Histogram adalah sebuah diagram yang mengambil sekumpulan pengukuran dan menggambarkan banyaknya pengukuran
(frekuensi) yang terdapat dalam masing-masing interval. Histogram juga merupakan pendekatan untuk probability density
function (pdf).

Contoh 2: Berikut nilai porositas yang diambil dari core sample pada interval reservoir tertentu:
0.141,0.124,0.152,0.156,0.113,0.167,0.194,0.142,0.133,0.149,0.106,0.137,0.147,0.159,0.174,0.129,0.153,
0.173,0.189,0.16,0.193,0.156,0.149,0.135,0.145,0.171,0.101,0.151,0.176,0.191,0.121,0.148,0.153,0.171,0.183,
0.108,0.123,0.169,0.185,0.153,0.117,0.127,0.145,0.141,0.165,0.14,0.143,0.178,0.179,0.157.
Analisa nilai porositas,φ ini menggunakan analisis distribusi frekuensi.
Di bawah ini diberikan contoh teknik pengolahan data dengan menggunakan gslib (http://www.gslib.com/). Manual
untuk paket program ini diberikan pada http://www.gslib.com/gslib_help/gslibhlp.html.
Modul Praktikum TG3107 Semester I 2010/2011 2010:Prodi Teknik Geofisika 7

Parameters for HISTPLT


**********************

START OF PARAMETERS:
data/porositas.dat \file with data
1 0 \ columns for variable and weight
-1.0e21 1.0e21 \ trimming limits
histposoXXX.ps \file for PostScript output
0.1 0.2 \attribute minimum and maximum
-1 \frequency maximum (<0 for automatic)
5 \number of classes
0 \0=arithmetic, 1=log scaling
0 \0=frequency, 1=cumulative histogram
-1 \ number of cum. quantiles (<0 for all)
2 \number of decimal places (<0 for auto.)
Porositas XXX \title
1.5 \positioning of stats (L to R: -1 to 1)
-1.1e21 \reference value for box plot

Gambar 1.1: Histogram porositas sumur XXX.

1.4 Fungsi Densitas


Untuk sebuah variabel acak yang kontinu X, probability density function (pdf)-nya adalah fungsi yang memenuhi seperti
persamaan di bawah ini:
f (x) ≥ 0
Z ∞
f (x)dx = 1 (1.10)
−∞
Z b
P (a ≤ X ≤ b) = f (x)dx
a

Cumulative distribution function (cdf) dari suatu variabel acak yang kontinu X adalah:
Z x
F (x) = P (X ≤ x) = f (u)du untuk −∞<x<∞ (1.11)
−∞

Dari sejumlah model distribusi (distribusi uniform, normal, binomial, poisson, dan lain-lain) yang sering digunakan dalam
keteknikan untuk menyatakan distribusi variabel acak adalah distribusi normal atau disebut juga distribusi Gauss. Suatu
variabel acak normal (model distribusi normal) memiliki fungsi distribusi densitas:
1 −(x−µ)2
f (x) = √ e 2σ2 −∞<x<∞ (1.12)
2πσ
8

Dengan µ adalah mean dan σ 2 adalah variansi. Probabilitas kumulatif yang penting dari distribusi normal ini diperlihatkan
pada gambar 1.2. Besarnya suatu probabilitas kumulatif variabel acak tertentu dan bentuk fungsi distribusi normal dipen-

Gambar 1.2: Probabilitas penting pada distribusi normal (direproduksi dari [Montgomery dan Runger, 2004])

garuhi oleh µ dan σ 2 -nya. Oleh karena akan sangat banyak kemungkinan µ dan σ 2 pada setiap kasus keteknikan (atau
apapun) yang dihadapi, maka akan dibutuhkan tabel probabilitas distribusi normal yang banyak pula. Untuk menyeder-
hanakan permasalahan ini, maka distribusi normal dari berbagai nilai µ dan σ 2 distandarisasikan ke distribusi normal
standar yang memiliki µ = 0 dan σ 2 = 1 . Dan variabel X ditransformasikan ke Z, yang hubungannya dinyatakan oleh:

X −µ
Z= (1.13)
σ

Contoh 3: Data ketebalan pay-zone yang diperoleh dari suatu formasi tertentu pada suatu lapangan minyak memiliki nilai
mean 18 ft dan variansi 400 f t2 . Hitung:

1. Probabilitas dari ketebalan pay-zone pada suatu well yang akan diukur melebihi 20 ft.

2. Probabilitas dari ketebalan pay-zone antara 20-60 ft

3. Berapakah ketebalan maksimum yang akan didapatkan untuk probabilitas sebesar 80 %.

Penyelesaian:

1. P (X > 20) = P ( X−18


20 > 20−18
20 ) = P (Z > 0.1) = 1 − P (Z ≤ 0.1) = 1 − 0.5398 = 0.4602 atau 46.02%. Nilai P (Z ≤ 0.1)
didapat melalui script MATLAB di bawah ini:

clear,clc
mu=18;
sigma=20;
X=20;
Z=(X-mu)/sigma;
p=normp(Z)

2. P (20 < X < 60) = P (0.1 < Z < 2.1) = P (Z < 2.1) − P (Z < 0.1) = 0.4423

p=normp((60-20)/18)-normp((20-18)/20)

3. P (X < x) = P ( X−18
20 < x−18
20 ) = P (Z < x−18
20 ) = 0.8

Z=normq(0.8);

Dengan bantuan perintah di atas kita dapat menyimpulkan bahwa P (Z < 0.8416) = 0.8. Sehingga ketebalan
maksimum:0.8416 ∗ 20 + 18 = 34.8324 ft.

Anda mungkin juga menyukai