Tujuan Praktikum
Memahami dan dapat menyelesaikan permasalahan kebumian dengan meggunakan analisis statistik melalui analisa mean,
median, modus, variansi,kovariansi, korelasi, histogram dan pdf.
1.1 Pendahuluan
Pengetahuan dasar-dasar statistika sudah merupakan keharusan untuk dipahami supaya kita mampu memahami geostatistik
dengan lebih baik. Pemahaman dasar yang terpenting adalah pemahaman bahwa nilai parameter petrofisik tertentu misalnya
porositas, permeabilitas dan lain-lain merupakan variabel acak dengan nilai dan probabilitas tertentu.
M = x n2 + n+1
2
Untuk n genap (1.7)
2
5
6
• Modus (mode)
Adalah nilai atau kejadian yang muncul dengan frekuensi terbanyak.
• Kovariansi (cov)
Definisi kovariansi mirip dengan variansi. Bedanya kovariansi digunakan untuk analisa dua sekuens data yang berbeda.
Pn
(xi − x)(yi − y)
covXY = i=1 (1.8)
n−1
Kovariansi tidak terlalu memiliki arti fisis yang signifikan, tetapi dari nilai kovariansi dapat dihitung korelasi yang
memliki arti dan pengertian yang sangat signifikan dalam analisa data sekuens.
• Korelasi (corcoef)
Korelasi secara matematis dinyatakan sebagai berikut:
covXY
rxy = (1.9)
sx sy
sx dan sy masing - masing adalah standar deviasi sampel / data sekuen x dan y. Korelasi memiliki nilai maksimum 1
dan nilai minimum -1. Dari dua sekuen yang memiliki korelasi 1 berarti bahwa kedua sekuen ini memiliki hubungan
yang sempurna dan berbanding lurus. Jika bernilai -1, kedua data sekuen memiliki hubungan yang sempurna tetapi
saling berlawanan. Dan jika nilainya 0, maka kedua data sekuen ini tidak saling berhubungan atau saling independen.
Contoh 1: Tabel di bawah ini menyajikan data panjang dan lebar dari kerang Brachiopod Composita:
Buatkan statistick deskriptif dari kedua kelompok data di atas dan analisa keterkaitan antara kedua besaran tersebut?
clear,clc
a=load(’brachiopod.dat’);
rata2=mean(a); % Menghitung nilai rata-rata
mini=min(a); % Mencari nilai minimum dari input
maks=max(a); % Mencari nilai maksimum dari input data
modus=mode(a); % Menentukan frekuensi paling banyak
variansi=var(a); % Menghtung nilai variansi dari input data
standev=std(a); % Menghitung standar deviasi dari input data
kovariansi=cov(a); % Menghitung koariansi antara dua sekuen data
korkoef=corrcoef(a); % Menghitung koefisien korelasi antara dua sekuen data
1.3 Histogram
Histogram adalah sebuah diagram yang mengambil sekumpulan pengukuran dan menggambarkan banyaknya pengukuran
(frekuensi) yang terdapat dalam masing-masing interval. Histogram juga merupakan pendekatan untuk probability density
function (pdf).
Contoh 2: Berikut nilai porositas yang diambil dari core sample pada interval reservoir tertentu:
0.141,0.124,0.152,0.156,0.113,0.167,0.194,0.142,0.133,0.149,0.106,0.137,0.147,0.159,0.174,0.129,0.153,
0.173,0.189,0.16,0.193,0.156,0.149,0.135,0.145,0.171,0.101,0.151,0.176,0.191,0.121,0.148,0.153,0.171,0.183,
0.108,0.123,0.169,0.185,0.153,0.117,0.127,0.145,0.141,0.165,0.14,0.143,0.178,0.179,0.157.
Analisa nilai porositas,φ ini menggunakan analisis distribusi frekuensi.
Di bawah ini diberikan contoh teknik pengolahan data dengan menggunakan gslib (http://www.gslib.com/). Manual
untuk paket program ini diberikan pada http://www.gslib.com/gslib_help/gslibhlp.html.
Modul Praktikum TG3107 Semester I 2010/2011 2010:Prodi Teknik Geofisika 7
START OF PARAMETERS:
data/porositas.dat \file with data
1 0 \ columns for variable and weight
-1.0e21 1.0e21 \ trimming limits
histposoXXX.ps \file for PostScript output
0.1 0.2 \attribute minimum and maximum
-1 \frequency maximum (<0 for automatic)
5 \number of classes
0 \0=arithmetic, 1=log scaling
0 \0=frequency, 1=cumulative histogram
-1 \ number of cum. quantiles (<0 for all)
2 \number of decimal places (<0 for auto.)
Porositas XXX \title
1.5 \positioning of stats (L to R: -1 to 1)
-1.1e21 \reference value for box plot
Cumulative distribution function (cdf) dari suatu variabel acak yang kontinu X adalah:
Z x
F (x) = P (X ≤ x) = f (u)du untuk −∞<x<∞ (1.11)
−∞
Dari sejumlah model distribusi (distribusi uniform, normal, binomial, poisson, dan lain-lain) yang sering digunakan dalam
keteknikan untuk menyatakan distribusi variabel acak adalah distribusi normal atau disebut juga distribusi Gauss. Suatu
variabel acak normal (model distribusi normal) memiliki fungsi distribusi densitas:
1 −(x−µ)2
f (x) = √ e 2σ2 −∞<x<∞ (1.12)
2πσ
8
Dengan µ adalah mean dan σ 2 adalah variansi. Probabilitas kumulatif yang penting dari distribusi normal ini diperlihatkan
pada gambar 1.2. Besarnya suatu probabilitas kumulatif variabel acak tertentu dan bentuk fungsi distribusi normal dipen-
Gambar 1.2: Probabilitas penting pada distribusi normal (direproduksi dari [Montgomery dan Runger, 2004])
garuhi oleh µ dan σ 2 -nya. Oleh karena akan sangat banyak kemungkinan µ dan σ 2 pada setiap kasus keteknikan (atau
apapun) yang dihadapi, maka akan dibutuhkan tabel probabilitas distribusi normal yang banyak pula. Untuk menyeder-
hanakan permasalahan ini, maka distribusi normal dari berbagai nilai µ dan σ 2 distandarisasikan ke distribusi normal
standar yang memiliki µ = 0 dan σ 2 = 1 . Dan variabel X ditransformasikan ke Z, yang hubungannya dinyatakan oleh:
X −µ
Z= (1.13)
σ
Contoh 3: Data ketebalan pay-zone yang diperoleh dari suatu formasi tertentu pada suatu lapangan minyak memiliki nilai
mean 18 ft dan variansi 400 f t2 . Hitung:
1. Probabilitas dari ketebalan pay-zone pada suatu well yang akan diukur melebihi 20 ft.
Penyelesaian:
clear,clc
mu=18;
sigma=20;
X=20;
Z=(X-mu)/sigma;
p=normp(Z)
2. P (20 < X < 60) = P (0.1 < Z < 2.1) = P (Z < 2.1) − P (Z < 0.1) = 0.4423
p=normp((60-20)/18)-normp((20-18)/20)
3. P (X < x) = P ( X−18
20 < x−18
20 ) = P (Z < x−18
20 ) = 0.8
Z=normq(0.8);
Dengan bantuan perintah di atas kita dapat menyimpulkan bahwa P (Z < 0.8416) = 0.8. Sehingga ketebalan
maksimum:0.8416 ∗ 20 + 18 = 34.8324 ft.