Anda di halaman 1dari 30

Metode Penelitian dan Statistika Lanjut

1.1 Distribusi Normal

Distribusi normal, disebut pula distribusi Gauss, adalah distribusi probabilitas yang
paling banyak digunakan dalam berbagai analisis statistika. Distribusi normal baku adalah
distribusi normal yang memiliki rata-rata nol dan simpangan baku satu. Distribusi ini juga
dijuluki kurva lonceng (bell curve) karena grafik fungsi kepekatan probabilitasnya mirip
dengan bentuk lonceng.
Distribusi normal memodelkan fenomena kuantitatif pada ilmu alam maupun ilmu
sosial. Beragam skor pengujian psikologi dan fenomena fisika seperti jumlah foton dapat
dihitung melalui pendekatan dengan mengikuti distribusi normal. Distribusi normal banyak
digunakan dalam berbagai bidang statistika, misalnya distribusi sampling rata-rata akan
mendekati normal, meski distribusi populasi yang diambil tidak berdistribusi normal.
Distribusi normal juga banyak digunakan dalam berbagai distribusi dalam statistika, dan
kebanyakan pengujian hipotesis mengasumsikan normalitas suatu data.

Danny Steven Poluan - 19202109016 1


Metode Penelitian dan Statistika Lanjut

1.1.1 Distibusi Normal Standar

Suatu distribusi normal tidak hanya memiliki satu kurva, tetapi merupakan kumpulan
kurva yang mempunyai ciri-ciri yang sama.sehingga harus ditentukan 1 pegangan sebagai
distribusi nprmal yang standar.

Ada 2 cara untuk menentukan distribusi normal :

1.1.1.1 Cara Ordinat

Menggunakan rumus distribusi normal berikut :

Y= 1 x e-½ (X - µ) ²
σ √2 π σ

µ = rata-rata
σ = simpang baku
π = 3,1416 (bilangan konstan)
e = 2,7183 (bilangan konstan)
X = absis dengan batas -∞ < X < π

Bila nilai µ dan σ tetap maka setiap nilai x akan menghasilkan nlai y sehingga bila nilai
x dimasukkan dalam perhitungan berkali-kali dengan julah tak terhingga maka akan dihasilkan
suatu kurva distribusi normal. Terdapat banyak kurva normal dengan bentuk yang berlainan,
tergantung dari besar dan kecilnya σ.

 Bila σ besar, kurva yang terbentuk mempunyai puncak yang rendah, sebaliknya bila σ
kecil akan menghasilkan puncak kurva yang tinggi.
 Dapat pula bentuk kurva normal dengan µ yang berbeda atau dengan µ dan σ yang
berbeda

Danny Steven Poluan - 19202109016 2


Metode Penelitian dan Statistika Lanjut

1.1.1.2 Cara Luas

Kurva normal adalah kurva yang simetris, yang berarti bahwa kurva ini akan membagi
luas kurva menjadi 2 bagian yang sama.Seluruh luas kurva = 1 atau 100% dan rata-rata (µ)
membagi luas kurva menjadi 2 bagian yang sama.Berarti luas tiap belahan adalah 50%.

Setiap penyimpangan rata-rata dapat ditentukan presentase terhadap seluruh luas kurva.

penyimpangan ke kanan dan ke kiri :

- Penyimpangan 1 SD = 68,2% dari seluruh luas kurva.

- Penyimpangan 2 SD = 95,5% dari seluruh luas kurva.

- Penyimpangan 3 SD, = 99,7% dari seluruh luas kurva.

Danny Steven Poluan - 19202109016 3


Metode Penelitian dan Statistika Lanjut

Proses standarisasi dapat dilakukan dengan transformasi rumus (kurva normal standar) :
Z=x-µ
σ
x = Nilai variable random
µ = Rata-rata distribusi
σ = Simpang baku
Z = Nilai standar, yaitu besarnya penyimpangan suatu nilai terhadap rata-rata yang
dinyatakan dari unit SD.

Standarisasi penting dilakukan karena ada variabel random yang memiliki satuan yang
berbeda-beda, seperti cm, kg, bulan.

Danny Steven Poluan - 19202109016 4


Metode Penelitian dan Statistika Lanjut

Untuk memudahkan perhitungan dapat digunakan sebuah table yang menunjukkan luas area di
bawah kurva normal antara nilai rata-rata dan suatu nilai variable random yang dinyatakan
dalam unit SD.
Misalnya : luas 95% adalah 1,96 SD.

Untuk transformasi distribusi normal menjadi distribusi normal standar dinyatakan µ = 0 dan
σ = 1.

1.1.2 Karakteristik Distribusi Probabilitas Normal


Distribusi probabilitas normal dan kurva normal telah dikembangkan oleh De Moivre
(1733) dan Gauss (1777 – 1855) dengan menurunkan persamaan matematis dan kurva
normalnya. Oleh sebab itu, kurva normal sering juga disebut kurva Gauss.

Beberapa karakteristik dari distribusi probabilitas dan kurva normal adalah:


1. Kurva berbentuk genta atau lonceng dan memiliki satu puncak yang terletak di tengah.
Nilai rata-rata hitung (µ) = median (Md) = modus (Mo). Nilai µ = Md = Mo yang berada
di tengah membelah kurva menjadi dua bagian yaitu setengah di bawah nilai µ = Md =
Mo dan setengah di atas nilai µ = Md = Mo.
Danny Steven Poluan - 19202109016 5
Metode Penelitian dan Statistika Lanjut

2. Distribusi probabilitas dan kurva normal berbentuk kurva simetris dengan rata-rata
hitungnya (µ).
3. Distribusi probabilitas dan kurva normal bersifat asimptotis.
4. Kurva mencapai puncak pada saat X = µ.
5. Luas daerah di bawah kurva normal adalah 1; ½ di sisi kanan nilai tengah dan ½ di sisi
kiri.
Bila X suatu pengubah acak normal dengan nilai tengah μ, dan standar deviasi σ, maka
persamaan kurva normalnya adalah:

1.1.3 Jenis-jenis Distribusi Probabilitas Normal

1.1.3.1 Distribusi Probabilitas dan Kurva Normal dengan μ dan σ Berbeda


Bentuk distribusi probabilitas dan kurva normal dengan nilai tengah sama dan standar
deviasi yang berbeda, adalah bentuk leptokurtic, platykurtik dan mesokurtik. Kurva normal
tersebut mempunyai μ = Md = Mo yang sama, namun mempunyai σ berbeda. Semakin besar σ,
maka kurva semakin pendek dan semakin tinggi nilai σ, maka semakin runcing. Oleh sebab
Danny Steven Poluan - 19202109016 6
Metode Penelitian dan Statistika Lanjut

itu, σ tinggi cenderung menjadi platykurtik dan σ rendah menjadi leptokurtik. Nilai σ yang
tinggi menunjukkan bahwa nilai data semakin menyebar dari nilai tengahnya (μ). Apabila σ
rendah, maka nilai semakin mengelompok pada nilai tengahnya.

Ada 3 macam distribusi yang dapat menunjukan variasi dari datanya ketiga data tersebut adalah
1. Leptokurtic adalah distribusi data yang lancip
2. Mesokurtic adalah distribusi data yang berada diantara leptokurtic dan
platykurtic,dimana tidak terlalu lancip dan tidak terlalu landai.
3. Platykurtic adalah distribusi data yang landai.

1.1.3.2 Distribusi Probabilitas dan Kurva Normal dengan μ Berbeda dan σ Sama
Bentuk distribusi probabilitas dan kurva normal dengan μ berbeda dan σ sama
mempunyai jarak antara kurva yang berbeda, namun bentuk kurva tetap sama. Hal demikian

Danny Steven Poluan - 19202109016 7


Metode Penelitian dan Statistika Lanjut

bisa terjadi karena kemampuan antar populasi berbeda, namun setiap populasi mempunyai
keragaman yang hampir sama.

1.1.3.3 Distribusi Probabilitas dan Kurva Normal dengan μ dan σ Berbeda


Distribusi kurva normal dengan μ dan σ berbeda. Kurva ini mempunyai titik pusat yang
berbeda pada sumbu mendatar dan bentuk kurva berbeda karena mempunyai standar deviasi
yang berbeda.

Distribusi normal memiliki kurva yang simetris membentuk suatu lonceng. Hal ini
terjadi ketika nilai mean, median dan modus dari data bernilai sama. Namun ketika kondisi ini
tidak terpenuhi, distribusi data yang akan terbentuk akan miring ke kanan atau ke kiri.

Danny Steven Poluan - 19202109016 8


Metode Penelitian dan Statistika Lanjut

Berdasarkan penyebaran data berdistribusi normal, penyebaran 68% data pengamatan


berada pada interval μ – σ, penyebaran 95 % data pengamatan berada pada interval μ – 2σ dan
penyebaran data 99,7 % data pengamatan berada pada interval μ – 3σ sampai μ + 3σ.

Sedangkan, fungsi kepadatan kumulatif (CDF) dari variabel acak X Normal adalah

Danny Steven Poluan - 19202109016 9


Metode Penelitian dan Statistika Lanjut

1.1.4 Distribusi Probabilitas Normal Baku


 Distribusi normal baku adalah distribusi probabilitas acak normal dengan nilai tengah
nol dan simpangan baku 1.
 Seringkali disebut dengan distribusi z.
 Hal yang perlu dilakukan dalam rangka distribusi probabilitas normal baku adalah
mengubah atau membakukan distribusi aktual dalam bentuk distribusi norma baku yang
dikenal dengan nilai Z atau skor Z
 Nilai Z adalah jarak yang berbeda antara sebuah nilai X yang dipilih dari ratarata μ,
dibagi dengan standar deviasinya, σ.

Rumus nilai Z adalah :

Z = Skor Z atau nilai normal baku


X = Nilai dari suatu pengamatan atau pengukuran
μ= Nilai rata-rata hitung suatu distribusi
σ= Standar deviasi

1.1.5 Distribusi F
Merupakan distribusi variabel acak Kontinu. Fungsi densitasnya mempunyai persamaan :

Dimana :
F = Variabel acak yang memenuhi F>0
K = Bilanan tetap yang harganya pada derajat kebebasan v1 dan v2
V1 = Derajat kebebasan antara varians rata-rata sampel (sebagai pembilang)
V2 = Derajat kebebasan dalam keseluruhan sampel (sebagai penyebut) Luas dibawah kurva

Danny Steven Poluan - 19202109016 10


Metode Penelitian dan Statistika Lanjut

satu.
Daftar distribusi normal berisikan nilai-nilai F untuk peluang 0,01 dan 0,05 dengan
derajat kekebasan v1 dan v2. Peluang ini sama dengan luas daerah ujung kanan yang diarsir,
sedangkan derajat kekebasan pembilang (v1 ) ada pada baris paling atas dan derajat kebebasan
penyebut (v2) pada kolom paling kiri.

Notasi lengkap untuk nilai-nilai F dari daftar distribusi F dengan peluang p dan dk =
(v1,v2) adalah Fp(v1,v2). Demikianlah untuk contoh kita didapat :
F0.05(24,8) = 3.12 dan F0,01(24,8 )= 5.28.
Meskipun daftar yang diberikan hanya untuk peluang p = 0.05 dan p = 0.01, tetapi
sebenarnya masih bisa didapat nilai-nilai F dengan peluang 0,99 dan 0,95. Untuk ini digunakan
hubungan :

Dalam rumus diatas perhatikan antara p dan (1- p) dan pertukaran antara derajat kebebasan (v1,
v2 ) menjadi (v2, v1).

1.1.6 Distribusi T
Distribusi dengan variabel acak kontinu lainnya selain dari distribusi normal ialah
Distribusi student atau Distribusi - t. Fungsi densitasnya adalah :

Danny Steven Poluan - 19202109016 11


Metode Penelitian dan Statistika Lanjut

Berlaku untuk harga-harga t yang memenuhi ⎼∞<t<∞ K merupakan bilangan tetap yang
besarnya bergantung pada n sedemikian sehingga luas daerah di bawah kurva sama dengan
satu unit.

Pada distribusi t ini terdapat bilangan (n-1) yang dinamakan derajat kebebasan, akan
disingkat dengan dk.
Bentuk kurva-t identik dengan bentuk kurva normal, tetapi kurtosisnya ditentukan oleh
besar kecilnya derajat kebebasan df. Untuk n ≥ 30 pola distribusi t mendekati pola distribusi
normal.

Dalam tabel distribusi-t kolom paling kiri berisikan derajat kebebasan (dk), baris teratas
berisikan nilai peluang.
Gambar dibawah ini merupakan grafik distribusi-t dengan dk = ( n – 1 ). Luas bagian
yang diarsir = p dan dibatasi paling kanan oleh tp. Harga tp inilah yang dicari dari daftar untuk
pasangan dk dan p yang diberikan.

Danny Steven Poluan - 19202109016 12


Metode Penelitian dan Statistika Lanjut

2.1 Distribusi Poisson

Sumbu aksis adalah indeks k. Fungsi ini hanya didefinisikan untuk bilangan bulat k. Garis
penghubung hanya ilustrasi untuk memudahkan.

Sumbu aksis adalah indeks k. Fungsi Distribusi Kumulatif diskontinyu pada bilangan bulat k
dan lainnya datar, karena variabel yang digunakan adalah bilangan bulat.

Dalam teori probabilitas dan statistika, distribusi Poisson (dilafalkan [pwasɔ̃]) adalah
distribusi probabilitas diskret yang menyatakan peluang jumlah peristiwa yang terjadi pada
periode waktu tertentu apabila rata-rata kejadian tersebut diketahui dan dalam waktu yang
saling bebas sejak kejadian terakhir. (distribusi Poisson juga dapat digunakan untuk jumlah
kejadian pada interval tertentu seperti jarak, luas, atau volume).

Danny Steven Poluan - 19202109016 13


Metode Penelitian dan Statistika Lanjut

Distribusi ini pertama kali diperkenalkan oleh Siméon-Denis Poisson (1781–1840) dan
diterbitkan, bersama teori probabilitasnya, pada tahun 1838 dalam karyanyaRecherches sur la
probabilité des jugements en matière criminelle et en matière civile (“Penelitian Probabilitas
Hukum Masalah Pidana dan Perdata”). Karyanya memfokuskan peubah acak N yang
menghitung antara lain jumlah kejadian diskret (kadang juga disebut "kedatangan") yang
terjadi selama interval waktu tertentu.
Apabila nilai harapan kejadian pada suatu interval adalah λ, maka probabilitas terjadi
peristiwa sebanyak k kali (k adalah bilangan bulat non negatif, k = 0, 1, 2, ...) maka sama dengan

dimana
 e adalah basis logaritma natural (e = 2.71828...)
 k adalah jumlah kejadian suatu peristiwa — peluang yang diberikan oleh fungsi ini
 k! adalah faktorial dari k
 λ adalah bilangan riil positif, sama dengan nilai harapan peristiwa yang terjadi dalam
interval tertentu. Misalnya, peristiwa yang terjadi rata-rata 4 kali per menit, dan akan
dicari probabilitas terjadi peristiwa k kali dalam interval 10 menit, digunakan distribusi
Poisson sebagai model dengan λ = 10×4 = 40.

Sebagai fungsi k, ini disebut fungsi massa probabilitas. Distribusi Poisson dapat
diturunkan sebagai kasus terbatas distribusi binomial. Distribusi Poisson dapat diterapkan pada
sistem dengan kejadian berjumlah besar yang yang mungkin terjadi, yang mana kenyataannya
cukup jarang. Contoh klasik adalah peluruhan nuklir atom.

Sebuah r.v X disebut sebagai r.v poisson dengan parameter jika pmf-nya diberikan oleh

Fungsi distribusi (cdf) dari sebuah r.v poisson X adalah

Rata-rata dan varians dari r.v poission X adalah

Danny Steven Poluan - 19202109016 14


Metode Penelitian dan Statistika Lanjut

Distribusi poisson dijumpai pada permasalahan-permasalahan yang melibatkan


penghitungan cacah (counting) di dalam telekomunikasi, seperti memantau banyaknya
permintaan sambungan telepon (atau panggilan telepon) di sebuah sentral telepon dalam suatu
periode waktu tertentu. Distribusi Poisson berlaku pula pada permasalahan transmisi digital,
jika data yang dikirimkan berjumlah besar sedangkan tingkat errornya kecil. Dalam kasus
semacam ini, distribusi binomial sulit untuk digunakan sebagai piranti analitis. Akan tetapi,
jika nilai rata-rata dari tingkat error berada dalam kisaran berhingga dan sama dengan , maka
kita dapat menggunakan distribusi poisson sebagai taksiran pendekatan untuk distibusi normal.

2.1.1 Jenis-jenis Distribusi Poisson


Ada beberapa jenis dari distrbusi poisson. Distribusi poisson terdiri dari Probabilitas
Poisson, Probabilitas Distribusi Poisson Kumulatif, dan Distribusi Poisson sebagai Pendekatan
Distribusi Binomial. Setiap jenis dari distribusi poisson memilki karakter masing-masing
berikut dengan metode dan fungsi yang berbeda.

2.1.1.1 Probabilitas Poisson Satu Peristiwa


Distribusi untuk satu peristiwa yang jarang terjadi didefinisikan sebagai Probabilitas
poisson satu peristiwa.Probabilitas suatu peristiwa yang berdistribusi Poisson dirumuskan
sebagai berikut.

P (x) =

Keterangan:
λ = rata-rata terjadinya suatu peristiwa.
e = bilangan alam = 2,71828.

Rumus terjadinya suatu kedatangan yang mengikuti proses poisson dirumuskan sebagai
berikut.

P (x) =

Keterangan:
λ = tingkat kedatangan rata-rata persatuan waktu.
t = banyaknya satuan waktu.
x = banyaknya kedatangan dalam t satuan waktu.
Danny Steven Poluan - 19202109016 15
Metode Penelitian dan Statistika Lanjut

2.1.1.2 Probabilitas Distribusi Poisson Kumulatif


Probabilitas Poisson kumulatif adalah probabilitas dari peristiwa poisson lebih dari
satu. Probabilitas poisson kumulatif dapat dihitung dengan rumus sebagai berikut.

PPK =

PPK = P(x =0)+P(x=1)+P(x = 2 + …+P(x = n)

Distribusi Poisson sebagai pendekatan distribusi binomial dirumuskan sebagai berikut.

P(x) =

keterangan:
np = rata-rata distribusi binomial.

2.1.2 Ciri-Ciri Distribusi Poisson


Penjelasan mengenai distribusi poisson, baik dari pengertian, dan jenis-jenis,
melahirkan beberapa ciri yang dimiliki oleh distribusi poisson. Distribusi Poisson memiliki
ciri-ciri sebagai berikut (Hassan,2001).
1) Banyaknya hasil percobaan yang terjadi dalam suatu interval waktu atau suatu daerah
tertentu, tidak bergantung pada banyaknya hasil percobaan yang terjadi pada interval
waktu atau daerah lain yang terpisah.
2) Probabilitas terjadinya hasil percobaan selama suatu interval waktu yang singkat atau
dalam suatu daerah yang kecil, sebanding dengan panjang interval waktu atau besarnya
daerah tersebut dan tidak bergantung pada banyaknya hasil percobaan yang terjadi diluar
interval waktu atau daerah tersebut.
3) Probabilitas lebih dari satu hasil percobaan yang terjadi dalam interval waktu yang
singkat atau dalam daerah yang kecil dapat diabaikan.

2.1.3 Rata-rata, Varians, dan Simpangan Baku Distribusi Poisson


1) Rata-rata
Untuk mencari nilai rata-rata pada distribusi poisson digunakan rumus sebagai berikut
(Hasan,2001).
Danny Steven Poluan - 19202109016 16
Metode Penelitian dan Statistika Lanjut

E(x) = µ = λ = n . p

2) Varians
Untuk mencari nilai varians pada distribusi poisson digunakan rumus sebagai berikut
(Hasan,2001).

E(x - λ)2 = σ2 = n . p

3) Simpangan baku
Untuk mencari nilai simpangan baku pada distribusi poisson digunakan rumus sebagai
berikut (Hasan,2001).

σ= =

2.1.4 Sebaran Poisson


Percobaan yang menghasilkan nilai-nilai bagi suatu peubah acak x, yaitu banyaknya
hasil percobaan yang terjadi selama suatu selang waktu tertentu atau disuatu daerah tertentu,
sering disebut percobaan Poisson. Selang waktu tersebut dapat berapa saja panjangnya,
misalnya satu menit, satu hari, satu minggu, satu bulan atau bahkan satu tahun (Wallpole,1995).
Percobaan Poisson memiliki ciri-ciri sebagai berikut:
1) Banyaknya hasil percobaan yang terjadi dalam suatu selang waktu atau suatu daerah
tertentu, tidak bergantung pada banyaknya hasil percobaan yang terjadi pada selang
waktu atau daerah lain yang terpisah.
2) Peluang terjadinya satu hasil percobaan selama suatu selang waktu yang singkat sekali
atau dalam suatu daerah yang kecil, sebanding dengan panjang selang waktu atau
besarnya daerah tersebut dan tidak bergantung pada banyaknya hasil percobaan yang
terjadi diluar selang waktu atau daerah tersebut.
3) Peluang lebih dari satu hasil percobaan yang terjadi dalam interval waktu yang singkat
atau dalam daerah yang kecil dapat diabaikan.

Danny Steven Poluan - 19202109016 17


Metode Penelitian dan Statistika Lanjut

3.1 Distribusi Binomial

Dalam teori probabilitas dan statistika, distribusi binomial adalah distribusi probabilitas
diskret jumlah keberhasilan dalam n percobaan ya/tidak (berhasil/gagal) yang saling bebas,
dimana setiap hasil percobaan memiliki probabilitas p. Eksperimen berhasil/gagal juga disebut
percobaan bernoulli. Ketika n = 1, distribusi binomial adalah distribusi bernoulli. Distribusi
binomial merupakan dasar dari uji binomial dalam uji signifikansi statistik.

Distribusi ini seringkali digunakan untuk memodelkan jumlah keberhasilan pada


jumlah sampel n dari jumlah populasi N. Apabila sampel tidak saling bebas (yakni
pengambilan sampel tanpa pengembalian), distribusi yang dihasilkan adalah distribusi

Danny Steven Poluan - 19202109016 18


Metode Penelitian dan Statistika Lanjut

hipergeometrik, bukan binomial. Semakin besar N daripada n, distribusi binomial merupakan


pendekatan yang baik dan banyak digunakan.

Sebuah r.v X akan disebut sebagai r.v binomial dengan parameter (n,p) jika pmf-nya ditentukan
melalui rumusan berikut :

dimana dan

yang mana besaran ini dinamakan koefisien binomial. Fungsi distribusi (cdf) dari r.v binomial
X dengan demikian adalah :

Rata-rata dan varians dari r.v binomial X adalah

Variabel acak binomial X adalah sebuah variabel acak diskrit yang bernilai bulat dan
terkait dengan pengulangan-pengulangan sebuah eksperimen. Umpamakan bahwa kita
melakukan sebuah eksperimen dan kita hendak mengamati kemunculan kejadian A saja.
Apabila A muncul, maka kita mengatakan bahwa eksperimen kita berhasil, namun jika A tidak
muncul ( muncul), maka eksperimen kita dikatakan gagal. Misalkan bahwa peluang

munculnya A adalah P(A)=p, maka . Kita mengulangi eksperimen kita


sebanyak n kali (n percobaan) dengan berpegang pada asumsi-asumsi berikut :
1. P(A) bernilai tetap (konstan) di setiap percobaan
2. Masing-masing dari n percobaan yang dilakukan tidak bergantung pada satu sama
lainnya (berdiri sendiri)
Sebuah titiak sampel (hasil) di dalam ruang sampel eksperimen ini akan terdiri dari
sejumlah A dan sejumlah . Sebuah titik sampel yang terdiri dari k buah A dan (n-k) buah
akan memiliki peluang kemunculan sebesar , sehingga, jika X adalah sebuah variabel
acak yang merepresentasikan jumlah kemunculan kejadian A di dalam n kali percobaan (atau
pengulangan sebuah eksperimen), maka nilai X adalah bilangan-bilangan bulat k=0,1,..,n.
Didalam ilmu telekomunikasi, distribusi binomial dapat dijumpai pada studi sistem transmisi

Danny Steven Poluan - 19202109016 19


Metode Penelitian dan Statistika Lanjut

digital, dimana X merepresentasikan jumlah bit yang error didalam sebuah pesan sepanjang n
bit.

Distribusi Binomial adalah suatu distribusi probabilitas yang dapat digunakan


bilamana suatu proses sampling dapat diasumsikan sesuai dengan proses Bernoulli. Misalnya,
dalam perlemparan sekeping uang logam sebanyak 5 kali, hasil setiap ulangan mungkin
muncul sisi gambar atau sisi angka. Begitu pula, bila kartu diambil berturut-turut, kita dapat
memberi label “berhasil” bila kartu yang terambil adalah kartu merah atau “gagal” bila yang
terambil adalah kartu hitam. Ulangan-ulangan tersebut bersifat bebas dan peluang
keberhasilan setiap ulangan tetap sama,taitu sebasar
½..(Ronald E. Walpole).
Syarat Distribusi Binomial:
1. Jumlah percobaan merupakan bilangan bulat. Contoh melambungkan koin 2 kali, tidak
mungkin 2½ kali.
2. Setiap eksperimen mempunyai dua outcome (hasil). Contoh: sukses atau gagal, laki-
laki atau perempuan, sehat atau sakit.
3. Peluang sukses sama setiap ekperimen. Contoh: Jika pada lambungan pertama peluang
keluar mata H/sukses adalah ½, pada lambungan seterusnya juga ½. Jika sebuah dadu,
yang diharapkan adalah keluar mata lima, maka dikatakan peluang sukses adalah 1/6,
sedangkan peluang gagal adalah 5/6.Untuk itu peluang sukses dilambangkan p,
sedangkan peluang gagal adalah (1-p) atau biasa juga dilambangkan q, di mana q = 1-
p.

3.1.1 Ciri-Ciri Distribusi Binomial.


Distribusi Binomial dapat diterapkan pada peristiwa yang memiliki ciri-ciri
percobaan Binomial atau Bernoulli trial sebagai berikut :
1. Setiap percobaan hanya mempunyai 2 (dua) kemungkinan hasil: sukses (hasil yang
dikehendaki) dan gagal (hasil yang tidak dikehendaki).
2. Setiap percobaan beersifat independen atau dengan pengembalian.
3. Probabilita sukses setiap percobaan harus sama, dinyatakan dengan p. Sedangkan
probabilita gagal dinyatakan dengan q, dan jumlah p dan q harus sama dengan satu.
4. Jumlah percobaan, dinyatakan dengan n, harus tertentu jumlahnya.

Danny Steven Poluan - 19202109016 20


Metode Penelitian dan Statistika Lanjut

3.1.2 Penerapan Distribusi Binomial


Beberapa kasus dimana distribusi normal dapat diterapkan yaitu:
1. Jumlah pertanyaan dimana anda dapat mengharapkan bahwa terkaan anda benar
dalam ujian pilihan ganda.
2. Jumlah asuransi kecelakaan yang harus dibayar oleh perusahaan asuransi.
3. Jumlah lemparan bebas yang dilakukan oleh pemain basket selama satu musim.

Rumus Distribusi Binomial

n!
b(x; n; p) = Cnxpx qn−x = pxqn−x
x! n−x !

Keteranagan:
x = 0,1,2,3,…,n
n = banyaknya ulangan
x = banyaknya keberhasilan dalam peubah acak
x p = peluang berhasil dalam setiap ulangan
q = peluang gagal,
dimana q = 1-p dalam setiap ulangan

4.1 Analisis Variogram


Variogram merupakan alat dalam geostatistik yang berguna untuk menunjukkan korelasi
spatial antara data yang diukur. Jika kita memetakan hasil pengukuran nilai densitas suatu
batuan, maka dapat terlihat bahwa nilai yang rendah akan berada dekat dengan nilai rendah
lainnya begitu pula dengan nilai yang besar cenderung berada di dekat nilai yang besar lainnya.
Perbedaan data tersebut dapat dituangkan delam suatu grafik varriogram sebagai fungsi jarak.
Nilai varriogram dapat dihitung dengan menggunakan persamaan berikut :

Danny Steven Poluan - 19202109016 21


Metode Penelitian dan Statistika Lanjut

Dimana :
Z ( Xi) adalah nilai data di titik Xi
Z ( Xi + h ) adalah nilai data di titik Xi + h
N(h) adalah banyaknya pasangan titik yang memiliki jarak h
Variogram memiliki tingkah laku yang penting untuk diamati ( Suprajitno, 2005)
sebagai berikut:
1. Nilai variogram disekitar titik awal mencerminkan kontinuitas lokal dan variabilitas dari
data random yang dimiliki.
2. Nilai variogram untuk jarak (h) yang besar memiliki sifat yang konstan, Bila mencapai
nilai konstan dinamakan sill.
3. Jarak (h) pada nilai variogram mencapai nilai sill disebut range. Variogram dihitung
dengan suatu rumus yang sederhana yaitu perbedaan rata-rata antara dua titik conto
dengan jarak tertentu. Oleh karena perbedaan tersebut kemungkinan < 0 atau > 0, agar
perbedaan rata-rata tersebut selalu > 0 maka perlu diaplikasikan perhitungan statistik
yang berdasarkan pada perbedaan kuadrat.
Variogram adalah suatu langkah dalam menghitung cakupan/hubungan antara satu poin
dengan poin lain.Sehingga didapatlah penyebaran atau lokasi yang dipetakan dalam bentuk
grid-grid.Analisis variogram merupakan tahapan dalam perhitungan pada sejumlah lokasi &
melihat hubungan antar observasi pada berbagai lokasi yang diukur.
Proses yang dilakukan dalam analisis variogram adalah meregister seluruh data,
mengeksplorasi data, membuat model, melakukan dan membandingkan pemodelan. Analisis
mendalam dan terintegrasi dengan geostatistik sangat diperlukan untuk dapat membuat model
detail guna analisa fasies dan peta porositas yang bertujuan determinasi dan input pada model
simulasi reservoir.
Salah satunya adalah melalui metode Variogram. Variogram adalah serangkaian
aktivitas mulai dari penelusuran data, pembuatan model hingga laporan analisa.Berikut uraian
dalam tahapan analisa :

4.1.1 Penelusuran Data


Penelusuran data dilakukan secara manual atau dengan komputer. Jika data tersusun
dalam grid/ spacing yang teratur dapat dilakukan perhitungan secara langsung dengan arah
horisontal, vertikal ataupun diagonal.

Danny Steven Poluan - 19202109016 22


Metode Penelitian dan Statistika Lanjut

4.1.2 Pembuatan dan Analisis Variogram Eksperimen


Variogram adalah suatu fungsi vektor yang dapat digunakan untuk mengkuantifikasikan
tingkat kemiripan atau variabilitas antara dua conto yang terpisah oleh jarak tertentu dengan
grafik x - y yang dihasilkan dari plot jarak dan varians dari data yang berpasangan.
Variogram dilakukan untuk melakukan penaksiran kadar bijih dengan tujuan
kuantifikasi korelasi ruang antar conto menggunakan suatu perangkat statistik. Sifat - sifat yang
merupakan ciri khas dari variabel terregional antara lain:
1. Suatu variabel terregional terlokalisir (menempati lokasi tertentu), dimana variasi
terjadinya deposit, ukuran, dan orientasi tertentu.
2. Variabel terregional dapat mencerminkan variasi kontinuitas yang relatif tinggi ataupun
rendah.
3. Variabel terregional mencerminkan anisotropi, artinya tingkat distribusi varians dari
variabel berbeda pada masing-masing arah.
Di sisi lain, data variogram yang memiliki jarak antar conto tidak teratur diperlukan
suatu toleransi untuk kedua variabel tersebut. David (1977) menjelaskan istilah angle classes
(θ±α/2) dan distance classes (h±∆h) sebagai toleransi untuk menghitung pasangan data dengan
jarak antar data yang tidak teratur. Semua titik conto atau data yang berada pada search area
yang didefinisikan dengan angle classes dan distance classes akan dianggap sebagai titik-titik
conto yang berjarak h dari titik x0 (titik origin) pada arah yang dimaksud.
1. Eksplorasi Data
Pemahaman yang menyeluruh pada data yang ada sangat diperlukan untuk dapat
menganalisis geostatistik. Eksplorasi dari pendistribusian data, melihat batasan – batasan
secara global dan lokal, melihat pola –pola global, memeriksa korelasi spasial, dan memahami
kovariasi dari berbagai data.

2. Pembuatan Model
Pada mulanya, geostatistik merupakan sinonim dari "kriging”, namun dalam
perkembangannya juga meliputi metode deterministik. Metode deterministik tidak memiliki
penilaian untuk kesalahan prediksi, tidak ada asumsi untuk data. Sedangkan metode kriging
memiliki penilaian untuk kesalahan prediksi dan mengasumsikan data dari proses stokastik.
Peta yang dihasilkan dapat berupa peta prediksi (peta interpolasi), peta standar eror, peta
Quantile, peta probability.

Danny Steven Poluan - 19202109016 23


Metode Penelitian dan Statistika Lanjut

3. Melakukan Diagnostik
Dalam pemodelan geologi, khususnya pemodelan reservoir, model yang baik akan
memiliki satu kualitas yang sederhana yaitu: harus menyediakan prediksi yang baik dari
perilaku reservoir untuk merespon keadaan (Tyson and Math, 2009). Prediksi yang baik harus
memiliki prediksi mean eror yang mendekati nol, RMS (root-mean-square) yang lebih kecil
lebih baik. Apabila estimasi rata – rata standar eror dibandingkan dengan prediksi eror RMS
sama maka prediksi bagus, apabila <1 maka overestimate dan apabila >1 maka underestimate.

4. Membandingkan Model
Beberapa model yang dihasilkan dari beberapa perlakuan harus dibandingkan untuk
melihat mana yang lebih baik. Penggunaan cross validation statistic sangat membantu dalam
pembandingan ini.

4.1.3 Korelasi Informasi Data Geologi Terhadap Variogram


Pada tahapan pemodelan karakterisasi reservoir diperlukan suatu analisa hubungan
spasial (spatial relationship) antara pasangan atau beberapa pasangan data geologi untuk
mengetahui geometri dan kontinuitas properti reservoir.Salah satu analisa tersebut adalah
analisa variogram.Parameter utama variogram terdiri dari empat bagian yaitu ; Major dan
Minor trend (melihat penyebaran lapisan pada arah horizontal dan vertikal), sill and Range,
serta Nugget.Analisis variogram yang baik adalah analisis yang memasukan atau
menggabungkan data geologi pada setiap penentuan parameter variogram.

5.1 Metode Kriging

Istilah kriging diambil dari nama seorang ahli, yaitu D.G. Krige, yang pertama kali
menggunakan korelasi spasial dan estimator yang tidak bias. Istilah kriging diperkenalkan oleh
G. Matheron untuk menonjolkan metode khusus dalam moving average terbobot (weighted
moving average) yang meminimalkan varians dari hasil estimasi.
Kriging adalah suatu metode geostatistika yang memanfaatkan nilai spasial pada lokasi
tersampel dan variogram untuk memprediksi nilai pada lokasi lain yang belum dan/atau tidak
tersampel dimana nilai prediksi tersebut tergantung pada kedekatannya terhadap lokasi
tersampel [1]. Pada penerapannya, kriging dibawah asumsi kestasioneran dalam ratarata (μ)
2
dan varians (σ ), sehingga jika asumsi kestasioneran tersebut dilanggar maka kriging
Danny Steven Poluan - 19202109016 24
Metode Penelitian dan Statistika Lanjut

menghasilkan nilai prediksi yang kurang presisif. Selain itu, sebagaimana pada semua metode
analisis data nonspatial (crosssectional, time series, panel, dll.), kriging juga dapat
menghasilkan nilai prediksi kurang presisif jika di antara data yang ada terdapat pencilan
(outlier). Outlier didefinisikan sebagai nilai yang ekstrim dari nilai amatan lainnya yang
kemungkinan dapat disebabkan oleh kesalahan pencatatan, kalibrasi alat yang tidak tepat atau
kemungkinan lainnya. Kriging sebagai interpolasi spasial optimum dapat menghasilkan nilai
prediksi kurang presisif jika di antara data yang ada terdapat pencilan (outlier). Outlier
didefinisikan sebagai nilai yang ekstrim dari nilai amatan lainnya yang kemungkinan dapat
disebabkan oleh kesalahan pencatatan, kalibrasi alat yang tidak tepat atau kemungkinan
lainnya. Pengembangan ordinary kriging (kriging klasik) adalah robust kriging yang
mentransformasi bobot variogram pada variogram klasik sehingga menjadi variogram yang
robust terhadap outlier.
Data yang digunakan dalam penelitian ini adalah data spasial yang mengandung outlier
dan memenuhi asumsi kriging klasik. Hasil analisis menunjukkan bahwa robust kriging jauh
lebih presisif dibandingkan dengan ordinary kriging dalam mengestimasi nilai dari titik-titik
spasial untuk data yang mengandung pencilan. Hal tersebut ditunjukkan dengan nilai cross
validation (MAE dan RMSE) dari robust kriging jauh lebih kecil dibandingkan dengan
ordinary kriging.
Ada beberapa model kriging yang umum digunakan di antaranya adalah ordinary
kriging dan universal kriging yang notabenenya tidak mengakomodir adanya outlier. Lebih
lanjut, pengembangan ordinary kriging adalah robust kriging yang mentransformasi bobot
variogram pada variogram klasik sehingga menjadi variogram yang robust terhadap outlier.

5.1.1 Variogram, Semivariogram, Kovariogram dan Korelogram

Pada pemodelan variogram dan kriging, data spasial diasumsikan sebagai proses
d
stokastik {Z(S):S E D} dengan D adalah himpunan bagian dalam ruang berdimensi R , d > 0.
Kovarian nilai antara dua titik sembarang si dan sj didefinisikan sebagai,

dengan nilai korelasi adalah

Danny Steven Poluan - 19202109016 25


Metode Penelitian dan Statistika Lanjut

Suatu proses dikatakan stasioner pada ratarata dan varians jika dan hanya jika μ(Si) = μ dan
2 2
μ (Si)=μ , akibatnya:
C(Si,Sj) = C(Si –Sj) = C(h)
ρ(Si,Sj) = ρ(Si –Sj) = ρ(h)

di mana h adalah vektor jarak antara titik i dan j, C(h) disebut kovariogram dan ρ(h) disebut
korelogram.
Varians nilai antara dua lokasi dengan jarak tertentu ditentukan sebagai Var [Z(S + h)
-Z(S)] = 2ϒ(h), 2ϒ(h )disebut variogram dan ϒ (h) disebut semivariogram.
Hubungan antara kovariogram, korelogram dan semivariogram berdasarkan
kestasioneran dinyatakan dengan [2]

5.1.2 Semivariogram Empirik

Semivariogram empirik dihitung dari data sampel yang kemudian diplotkan sebagai
fungsi dari jarak. MisalZ(Si) adalah nilai hasil pengukuran pada lokasi i, sedangkan Si = (Xi,yi)
adalah vektor yang mengandung koordinat spasial x, y, semivariogram cloud didefinisikan
sebagai

2
ϒij=0,5[Z(Si)-Z(Sj)]

untuk semua pasangan jarak yang mungkin {(Si,Sj); i,j = 1,2,3,…,n} dan diplotkan
sebagai fungsi jarak, yang dihitung dengan:

Danny Steven Poluan - 19202109016 26


Metode Penelitian dan Statistika Lanjut

2 2
|h| = lSi -Sjl = [(Xi –Xj) + (yi –yj) ]1/2 Perhitungan ini melibatkan ribuan titik pada plot
semivariogram sehingga mengakibatkan sulitnya melihat pola tertentu.
Untuk mengatasi hal tersebut maka yij dikelompokkan (binning) berdasarkan kesamaan
jarak. Berikut rumusan semivariogram yang dikelompokkan (semivariogram empirik):

ϒ(h) =

di mana
N(h) : himpunan pasangan data pada Si dan Sj yang mempunyai selisih jarak yang sama, h E
T(h), sedangkan T(h) merupakan daerah toleransi di sekitar h. |N(h)| : banyak pasangan jarak
di dalam himpunan N(h).

5.1.3 Spatial Outlier


Spatial Outlier (pencilan spasial) didefinisikan sebagai nilai lokasi observasi yang tidak
konsisten (ekstrim) terhadap nilai lokasi observasi yang lainnya. Munculnya pencilan dapat
disebabkan oleh mekanisme pengambilan nilai observasi yang berbeda dengan yang lainnya,
Ada banyak metode yang digunakan untuk mendeteksi adanya pencilan salah satunya adalah
dengan spatial statistics Z test. Untuk spatial statistics Z test, didefinisikan sebagai:

Jika Zs(x) > θ, maka dideteksi sebagai pencilan (outlier), untuk tingkat signifikansi 5%, nilai θ
= 2.

5.1.4 Robust Kriging


Model yang mendasari robust kriging adalah

Dengan W(·) stasioner intrinsik dan gaussian dan ɳ(·)+ϵ(·) = ε(·) . Berbeda dengan
kriging klasik (simple, ordinary), untuk mengakomodir adanya outlier, variogram empirik
untuk robust kriging dirumuskan sebagai :

Danny Steven Poluan - 19202109016 27


Metode Penelitian dan Statistika Lanjut

Robust kriging mengakomodir adanya outlier sehingga semivariogram yang digunakan


adalah semivariogram empirik terboboti. Adapun paket program ArcGIS 9.2 yang digunakan
untuk membuat peta kontur prediksi pada ordinary kriging masih belum menyediakan fasilitas
penghitungan nilai dan pembuatan peta kontur prediksi untuk robust kriging, demikian pula
untuk semua paket program geostatistika. Oleh karena itu, diperlukan pembuatan program yang
sesuai untuk algoritma robust kriging.
Penelitian tentang aplikasi robust kriging masih terbatas. Pada umumnya, para peneliti
hanya sampai pada ilustrasi statistika matematika dari modelmodel yang menunjang
penggunaan robust kriging. Pada penelitian ini, untuk mengestimasi nilai pada suatu daerah
tertentu adalah dengan menggunakan macro Minitab v.14 . Namun, kelemahan pada macro
tersebut adalah ketidakmampuan untuk mengestimasi nilai pada daerah lain, sehingga pada
penelitian ini hanya dicari nilai estimasi pada daerah yang sudah diketahui nilai asalnya yang
kemudian dihitung tingkat ketepatan dalam mengestimasi.
Langkah awal dari macro adalah menghitung jarak masingmasing titik, menghitung
interval masingmasing lag dimana besar lag didapatkan dari proses perhitungan via ArcGIS
9.2, kemudian mengelompokkan jarakjarak tersebut pada lag yang bersesuaian. Langkah kedua
adalah menghitung variogram dan semivariogram untuk robust kriging.
Selanjutnya menghitung matrik C yang terbentuk dari semivariogram robust, matrik C0
yang terbentuk dari semivariogram dari titik yang diestimasi dengan semua titik yang
diketahui. Langkah terakhir adalah menghitung matrik lambda yang digunakan untuk
menentukan nilai estimasi.
Berdasarkan hasil analisis dari macro didapat nilai estimasi yang relatif sama dengan nilai
asalnya atau dengan kata lain tingkat presisif dari robust kriging untuk data yang mengandung
pencilan sangat tinggi.
Kriging memberikan lebih banyak bobot pada contoh dengan jarak terdekat dibandingkan
dengan contoh dengan jarak lebih jauh, kemenerusan dan anisotropi merupakan pertimbangan

Danny Steven Poluan - 19202109016 28


Metode Penelitian dan Statistika Lanjut

yang penting dalam kriging, bentuk geometri dari data dan karakter variabel yang diestimasi
serta besar dari blok juga ditaksir.

3.1.5 Sifat-sifat Kriging


Sifat-sifat Kriging yaitu sebagai berikut :
1. Struktur dan korelasi variabel melalui fungsi γ(h)
2. Hubungan geometri relatif antar data yang mencakup hal penaksiran dan penaksiran
volume melalui (Si,Sj) (hubungan antar data) dan sebagai (Si,V) (hubungan antara data
dan volume)
3. Jika variogram isotrop dan pola data teratur, maka sistem kriging akan memberikan
data yang simetri
4. Dalam banyak hal hanya contoh-contoh di dalam blok dan di sekitar blok memberikan
estimasi dan mempunyai suatu faktor bobot masing-masing nol
5. Dalam hal ini jangkauan radius contoh yang pertama atau kedua pertama tidak
memengaruhi (tersaring).
6. Efek screen ini akan terjadi, jika tidak ada nugget effect atau kecil sekali ε = C0/C
7. Efek nugget ini menurunkan efek screen
8. Untuk efek nugget yang besar, semuai contoh mempunyai bobot yang sama.
9. Contoh-contoh yang terletak jauh dari blok dapat diikutsertakan dalam estimasi ini
melalui harga rata-ratanya

Danny Steven Poluan - 19202109016 29


Metode Penelitian dan Statistika Lanjut

DAFTAR PUSTAKA

Sumber internet :
https://miqbal.staff.telkomuniversity.ac.id/jenis-distribusi/
https://lingkarankata.blogspot.com/2015/01/analisis-variogram.html
http://fikrintambang08.blogspot.com/2013/03/pengertian-variogram.html
https://id.wikipedia.org/wiki/Kriging
http://zaihooiz.blogspot.com/2012/05/pengertian-dan-model-kriging.html
https://irmasafitri07.wordpress.com/2013/11/14/bab-vii-kurva-normal-distribusi-
probabilitas-dan-kurva-normal/
https://anitaharum.wordpress.com/2013/11/12/distribusi-normal-kurva-normal/
https://vebrianaparmita.wordpress.com/2013/11/10/bab-viii-distribusi-probabilitas-dan-
kurva-normal/
http://suryanaoky.blogspot.com/2011/02/variable-dan-distribusi-data.html

Danny Steven Poluan - 19202109016 30