Anda di halaman 1dari 16

Data terdistribusi secara normal adalah konsep umum yang sering salah paham

oleh beberapa orang. Beberapa orang percaya bahwa semua data yang
dikumpulkan dan digunakan untuk analisis harus didistribusikan secara normal.
Tapi distribusi normal tidak terjadi sesering orang pikirkan , dan itu bukan tujuan
utama . Distribusi normal adalah sarana untuk mencapai tujuan , bukan tujuan itu
sendiri .

Data terdistribusi secara normal diperlukan untuk menggunakan sejumlah alat


statistik , seperti analisis regresi, analisis Cp / Cpk , uji-t, analisis varians
( ANOVA ) dan masih banyak lagi. Jika seorang praktisi tidak menggunakan alat
khusus seperti itu, bagaimanapun , tidak penting apakah data terdistribusi secara
normal . Distribusi menjadi masalah hanya ketika praktisi mencapai suatu titik
dalam sebuah proyek di mana mereka ingin menggunakan alat statistik yang
memerlukan data terdistribusi normal dan mereka tidak memilikinya .

Probabilitas plot pada Gambar di atas adalah contoh dari uji normalitas. Dalam
hal ini , asumsi normalitas jelas tidak dapat terpenuhi, nilai p kurang dari 0,05 dan
lebih dari 5 persen dari titik data berada di luar interval kepercayaan 95 persen .

Apa yang bisa dilakukan? Pada dasarnya,


ada dua pilihan :
1. Mengidentifikasi dan, jika mungkin, menentukan alasan data tidak normal
dan mengatasinya atau
2. Gunakan alat yang tidak memerlukan asumsi normalitas

Mengidentifikasi alasan data tidak normal


Ketika data tidak terdistribusi normal , penyebab non - normalitas harus
ditentukan dan tindakan perbaikan yang tepat harus diambil . Ada enam alasan
yang sering dialami untuk data tidak normal .
Alasan 1 : Data Ekstrim
Terlalu banyak nilai-nilai ekstrim dalam satu set data yang akan menghasilkan
distribusi skewness(miring). Normalitas data dapat dicapai dengan
menghilangkan data tersebut. Hal ini kemungkinan terjadi karena kesalahan
menentukan pengukuran, kesalahan data-entry dan outlier dan untuk
mengatasinya dengan menghapus data tersebut dari data yang digunakan untuk
alasan yang masuk akal.

sangatlah penting bahwa outlier diidentifikasi sebagai penyebab yang benar-


benar membuat data tidak normal sebelum mereka dieliminasi . Jangan lupa :
Sifat data terdistribusi normal adalah bahwa kecil persentase dari nilai-nilai
ekstrim yang diharapkan, tidak setiap outlier disebabkan oleh alasan khusus.

Alasan 2 : Tumpang tindih dari Dua atau Lebih


Proses
Data tidak dapat terdistribusi secara normal karena sebenarnya berasal dari lebih
dari satu proses , penjumlahan atau pergeseran, atau dari sebuah proses yang
sering bergeser . Jika dua atau lebih set data yang terdistribusi secara normal
yang tumpang tindih, data mungkin terlihat bimodal atau multimodal - itu akan
memiliki dua atau lebih nilai yang paling sering terjadi.

Tindakan perbaikan untuk situasi ini adalah untuk menentukan X penyebab


bimodal atau distribusi multimodal dan kemudian stratifikasi data . Data harus
diperiksa lagi untuk normalitas dan setelah proses stratified dapat bekerja secara
terpisah .

Gambar berikut menunjukkan data waktu akses website yang memiliki  data tidak
normal pada sebuah website.

Setelah stratifikasi waktu akses website antara akhir pekan dibandingkan Data
hari kerja, menunjukkan kedua kelompok berdistribusi normal. sehingga bisa
dijadikan perimbangan dalam analisis data yang akan.
Alasan 3 : Kurangnya data Diskriminasi
Round- off error atau perangkat pengukuran dengan resolusi rendah dapat
membuat benar-benar data continues dan data terdistribusi normal terlihat diskrit
dan tidak normal . Kurangnya data diskriminasi dan karena terbatasnya jumlah
nilai yang berbeda - dapat diatasi dengan menggunakan sistem pengukuran
yang lebih akurat atau dengan mengumpulkan lebih banyak data.

Alasan 4 : Data yang diurutkan


Data yang dikumpulkan tidak mungkin terdistribusi normal jika itu merupakan
hanya bagian dari seluruh data dalam suatu proses. Hal ini dapat terjadi jika data
dikumpulkan dan dianalisis setelah penyortiran. Data pada Gambar dibawah
diperoleh dari proses produksi botol di mana target adalah untuk menghasilkan
botol dengan volume 100 ml . Spesifikasi minimal dan maksimal yang dapat
diterima adalah 97,5 ml dan 102,5 ml dan di luar spesifikasi tersebut dihapus dari
proses analisis. Sehingga terlihat pada gambar dibawah ini. Dari data tersebut
tentunya data tidak terdistribusi normal karena hanya sebagian yang dimasukkan
yaitu yang masuk dalam spesifikasi.

Alasan 5 : Nilai Mendekati Nol


Jika proses memiliki banyak nilai mendekati nol, distribusi data akan miring
(skewness) ke kanan atau kiri. Dalam hal ini, transformasi seperti tenaga
transformasi Box - Cox, dapat membantu membuat data normal. Dalam metode
ini , semua data dinaikkan , atau diubah , dengan eksponen tertentu , ditunjukkan
dengan nilai Lambda . Ketika melakukan transformasi, semua data harus
dilakukan perlakuan (diubah) yang sama.

Gambar di bawah ini menggambarkan contoh dari konsep ini. Gambar


menunjukkan satu set data siklus - waktu;

menunjukkan data yang sama diubah setelah dilakukan transformasi dengan


logaritma natural.

Untuk bahasan transformasi box cox silahkan ke link "transormasi box cox"

Perhatikan : Metode transformasi tidak memberikan jaminan distribusi normal .


Selalu periksa dengan uji normalitas untuk menentukan apakah distribusi normal
dapat diterpenuhi setelah transformasi .

Alasan 6 Data Mengikuti Distribusi Berbeda


Ada banyak tipe data yang mengikuti distribusi non-normal. Contoh berikut:
 Distribusi Weibull , ditemukan dengan data survival seperti waktu
kelangsungan hidup suatu produk
 Distribusi log - normal, ditemukan dengan panjang data seperti
ketinggian
 Distribusi Largest-extreme-value, ditemukan dengan data seperti waktu
terpanjang down setiap hari
 Distribusi eksponensial, ditemukan dengan data pertumbuhan seperti
pertumbuhan bakteri
 Distribusi Poisson, ditemukan dengan peristiwa langka seperti jumlah
kecelakaan
 Distribusi binomial, ditemukan dengan " proporsi " data seperti persen
barang cacat

Jika data berikut salah satu distribusi yang berbeda , harus ditangani dengan
menggunakan alat dengan menggunakan disribusi yang sama.

Alat analisis yang tidak mensyaratkan data


normal
Beberapa alat statistik tidak memerlukan data terdistribusi normal . Untuk
membantu para praktisi memahami kapan dan bagaimana alat ini dapat
digunakan , tabel di bawah ini menunjukkan perbandingan alat yang tidak
memerlukan distribusi normal dengan setara - distribusi normal.

Perbandingan alat analisis untuk data berdistribusi normal dan tidak normal
Alat analisis yang
Alat analisis untuk data
menggunakan data Distribusi yang diperlukan
tidak normal
normal
Mann-Whitney test; Mood’s
T-test median test; Kruskal-Wallis Any
test
Mood’s median test;
ANOVA Any
Kruskal-Wallis test
uji t berpasangan One-sample sign test Any
F-test; Bartlett’s test Levene’s test Any
analisis regresi non
Analisis regresi Any
parametrik
Weibull; log-normal; largest
Cp/Cpk analysis Cp/Cpk analysis extreme value; Poisson;
exponential; binomial

Metode analisis data jatuh ke dalam dua kelas yang


berpijak pada asumsi tentang distribusi data. Asumsi menjadi
dasar untuk mengklasifikasi apakah menggunakan metode
parametrik atau nonparametrik.

 Statistik Parametrik

Parametrik dalam arti harfiah yaitu asumsi tentang parameter


dari distribusi data populasi yang digunakan untuk menguji
hipotesis mendekati normal atau mendekati distribusi normal
setelah teorema limit sentral.

 Statistik Nonparametrik

Non-parametrik adalah metode yang tidak mendasarkan pada


asumsi distribusi populasi. Dalam arti sempit non-parametrik
adalah sebuah kategori nol karena hampir semua uji statistik
mengasumsikan satu atau lain hal tentang sifat-sifat populasi.

Metode nonparametrik populer untuk sejumlah alasan. Alasan


utama bahwa peneliti tidak dibatasi asumsi-asumsi tentang
populasi seperti pada metode parametrik. Banyak metode
nonparametrik mudah untuk diterapkan dan dipahami.

Tapi kebanyakan metode parametrik lebih efisien daripada


metode nonparametrik. Meskipun perbedaan dalam efisiensi
biasanya tidak banyak masalah, ada kasus di mana perlu
mempertimbangkan metode yang lebih efisien.

Uji mengetahui data berdistribusi normal atau tidak


dilakukan uji normalitas Kolmogorov-Smirnov. Berikut tabel
berisi poin-poin umum analisis data statistik terkait perbedaan
antara metode parametrik dan nonparametrik:

PARAMETRIK NONPARAMETRIK
Deskriptif
Asumsi Distribusi Normal -
Asumsi Varian Homogen -
Jenis Data Rasio atau Interval Ordinal atau Nominal
Hubungan data set Independent -
Ukuran central Mean Median
Manfaat Lebih banyak kesimpulan Sederhana dan sedikit outlier
Tes
Uji korelasi Pearson, Regresi Spearman
Uji 2 Kelompok, berbeda Independent Sample t test Mann-Whitney
Uji 2 Kelompok lebih, Independent One Way
Kruskal-Wallis
berbeda ANOVA
Uji berulang, 2 kondisi Paired Sample t Test Wilcoxon
Uji berulang, 2 kondisi lebih Repeated One Way ANOVA Friedman

erbedaan Statistik Parametrik dan Statistik Non-Parametrik

Saat kita hendak melakukan suatu riset, seringkali kita dihadapkan pada
pilihan metode. Metode statistik apakah yang cocok digunakan dalam riset kita
tersebut. Dalam mempelajari statistik, biasanya kita langsung dihadapkan pada
metode statistik parametrik, padahal tidak semua data cocok diolah dengan statistik
parametrik. Walaupun perkembangan statistik parameter sudah sedemikian canggih
namun statistik parametrik memiliki beberapa kekurangan, misalnya pada masalah-
masalah sosial yang memiliki skala nominal dan rasio, statistik parametrik tidak
mampu mengukur dengan baik. Kalaupun bisa, hal tersebut merupakan upaya yang
berlebihan (excessively method). Maka Statistik parametrik digunakan jika kita telah
mengetahui model matematis dari distribusi populasi suatu data yang akan
dianalisis. Jika kita tidak mengetahui suatu model distribusi populasi dari suatu data
dan jumlah data relatif kecil atau asumsi kenormalan tidak selalu dapat dijamin
penuh,maka kita harus menggunakan statistik non parametrik (statistik bebas
distribusi).

Berikut ini adalah ringkasan yang memuat perbedaan antara Statistik Parametrik
dan Statistik Non Parametrik. Dengan memahami perbedaan antara keduanya,
diharapkan kita bisa menemukan metode statistik yang tepat dalam mengolah data
riset yang tepat.

STATISTIK PARAMETRIK

Statistik Parametrik, yaitu ilmu statistik yang mempertimbangkan jenis sebaran


atau distribusi data, yaitu apakah data menyebar secara normal atau tidak. Dengan
kata lain, data yang akan dianalisis menggunakan statistik parametrik harus
memenuhi asumsi normalitas. Pada umumnya, jika data tidak menyebar normal,
maka data seharusnya dikerjakan dengan metode statistik non-parametrik, atau
setidak-tidaknya dilakukan transformasi terlebih dahulu agar data mengikuti sebaran
normal, sehingga bisa dikerjakan dengan statistik parametrik. 

Contoh metode statistik parametrik :


a. Uji-z (1 atau 2 sampel)
b. Uji-t (1 atau 2 sampel)
c. Korelasi pearson,
d. Perancangan percobaan (one or two-way anova parametrik), dll.

Ciri-ciri statistik parametrik :


- Data dengan skala interval dan rasio
- Data menyebar/berdistribusi normal

Keunggulan dan kelemahan statistik parametrik : 


Keunggulan :
1. Syarat syarat parameter dari suatu populasi yang menjadi sampel biasanya tidak
diuji dan dianggap memenuhi syarat, pengukuran terhadap data dilakukan dengan
kuat.
2. Observasi bebas satu sama lain dan ditarik dari populasi yang berdistribusi normal
serta memiliki varian yang homogen.
Kelemahan :
1.  Populasi harus memiliki varian yang sama.
2.  Variabel-variabel yang diteliti harus dapat diukur setidaknya dalam skala interval.
3.  Dalam analisis varian ditambahkan persyaratan rata-rata dari populasi harus normal
dan bervarian sama, dan harus merupakan kombinasi linear dari efek-efek yang
ditimbulkan.

STATISTIK NON-PARAMETRIK

Statistik Non-Parametrik adalah test yang modelnya tidak menetapkan syarat-


syaratnya yang mengenai parameter-parameter populasi yang merupakan induk 
sampel penelitiannya. Oleh karena itu observasi-observasi independent dan variabel
yang diteliti pada dasarnya memiliki kontinuitas. Uji metode non parametrik atau
bebas sebaran adalah prosedur pengujian hipotesa yang tidak mengasumsikan
pengetahuan apapun mengenai sebaran populasi yang mendasarinya kecuali
selama itu kontinu.
Pendeknya: Statistik Non-Parametrik adalah yaitu statistik bebas sebaran (tidak
mensyaratkan bentuk sebaran parameter populasi, baik normal atau tidak). Selain
itu, statistik non-parametrik biasanya menggunakan skala pengukuran sosial, yakni
nominal dan ordinal yang umumnya tidak berdistribusi normal. 

Contoh metode statistik non-parametrik (selengkapnya dapat dilihat disini) :

a. Uji tanda (sign test)


b. Rank sum test (wilcoxon)
c. Rank correlation test (spearman)
d. Fisher probability exact test.
e. Chi-square test, dll

Ciri-ciri statistik non-parametrik :

- Data tidak berdistribusi normal 

- Umumnya data berskala nominal dan ordinal


- Umumnya dilakukan pada penelitian sosial
- Umumnya jumlah sampel kecil 

Keunggulan dan kelemahan statistik non-parametrik :  

Keunggulan :
1. Tidak membutuhkan asumsi normalitas.
2. Secara umum metode statistik non-parametrik lebih mudah dikerjakan dan lebih
mudah dimengerti jika dibandingkan dengan statistik parametrik  karena ststistika
non-parametrik tidak membutuhkan perhitungan matematik yang rumit seperti
halnya statistik parametrik.
3. Statistik non-parametrik dapat digantikan data numerik (nominal) dengan jenjang
(ordinal).
4. Kadang-kadang pada statistik non-parametrik tidak dibutuhkan urutan atau jenjang
secara formal karena sering dijumpai hasil pengamatan yang dinyatakan dalam data
kualitatif.
5. Pengujian hipotesis pada statistik non-parametrik dilakukan secara langsung pada
pengamatan yang nyata.
6. Walaupun pada statistik non-parametrik tidak terikat pada distribusi normal populasi,
tetapi dapat digunakan pada populasi berdistribusi normal.

Kelemahan :
1. Statistik non-parametrik terkadang mengabaikan beberapa informasi tertentu.
2. Hasil pengujian hipotesis dengan statistik non-parametrik tidak setajam statistik
parametrik.
3. Hasil statistik non-parametrik tidak dapat diekstrapolasikan ke populasi studi seperti
pada statistik parametrik. Hal ini dikarenakan statistik non-parametrik mendekati
eksperimen dengan sampel kecil dan umumnya membandingkan dua kelompok
tertentu. (Khairul Amal)

Dalam implementasi, penggunaan prosedur yang tepat merupakam tujuan dari


peneliti. Beberapa parameter yang dapat digunakan sebagai dasar dalam
penggunaan statistik non parametrik adalah:
1. Hipotesa yang diuji tidak melibatkan parameter populasi. 
2. Skala yang digunakan lebih lemah dari skala prosedur parametrik. 
3. Asumsi-asumsi parametrik tidak terpenuhi.

LANGKAH MENENTUKAN STATISTIK YANG AKAN DIGUNAKAN


DALAM RISET
1. Apakah jenis skala pengukuran data Anda, nominal, ordinal, interval atau rasio?
2. Apakah data yang Anda miliki berjumlah besar?
3. Apakah data Anda memiliki distribusi tertentu?

Setidaknya dengan menjawab tiga pertanyaan diatas anda sudah mampu


menentukan jenis statistik apa yang akan Anda gunakan.
Semoga Bermanfaat!

Posted 21st April 2013 by marisa wajdi


Labels: statistik
istribusi normal merupakan suatu alat statistik yang sangat penting untuk menaksir
dan meramalkan peristiwa-peristiwa yang lebih luas. Distribusi normal disebut juga
dengan distribusi Gauss untuk menghormati Gauss sebagai penemu persamaannya
(1777-1855). Menurut pandangan ahli statistik, distribusi variabel pada populasi
mengikuti distribusi normal. 

Distribusi normal pertama kali diperkenalkan oleh Abraham DeMoivre (1733)


sebagai pendekatan distribusi binomial untuk n besar. Selanjutnya dikembangkan
oleh Pierre Simon de Laplace dan dikenal dengan Teorema Moivre - Laplace.
Laplace menggunakan distribusi normal untuk analisis galat suatu eksperimen. 

Suatu data membentuk distribusi normal jika jumlah data di atas dan di bawah mean
adalah sama.
Distribusi normal berupa kurva berbentuk lonceng setangkup yang melebar tak
berhingga pada kedua arah positif dan negatifnya.
Ciri-ciri kurva normal :
1. Bentuk kurva normal
1. Menyerupai lonceng (genta/bel).
2. Merupakan suatu poligon yang dilicinkan yang mana ordinat (sumbu tegak)
merupakan frekuensi dan absisnya (sumbu alas) memuat nilai variabel.
3. Simetris.
4. Luas daerah merupakan nilai rata-rata (mean).
5. Luas daerah sebelah kiri dan kanan mendekati 50%.
6. Memiliki satu modus (disebut juga bimodal).
2. Daerah kurva normal
1. Merupakan ruangan yang dibatasi daerah kurva dengan absisnya (sumbu alas).
2. Luas daerah biasanya dinyatakan dalam persen atau proporsi.

Distribusi normal dipengaruhi oleh dua parameter, yaitu mean dan standar deviasi.
Mean menentukan lokasi pusat statistik dan standar deviasi menentukan lebar dari
kurva normal.

Rumus umum distribusi normal :

dengan 

Kurva normal menggambarkan daerah penerimaan dan penolakan Ho. 


Jika pengujian dua arah / sisi, maka gambarnya sebagai berikut :

Jika pengujian satu arah, maka gambarnya sebagai berikut :

Uji satu arah biasanya untuk uji F dan uji t satu arah.
engenal Distribusi Normal dan Cara Membaca Tabel
Distribusi Normal
Distribusi normal merupakan salah satu distribusi probabilitas yang penting dalam analisis statistika.
Distribusi ini memiliki parameter berupa mean dan simpangan baku. Distribusi normal dengan mean
= 0 dan simpangan baku = 1 disebut dengan distribusi normal standar. Apabila digambarkan dalam
grafik, kurva distribusi normal berbentuk seperti genta (bell-shaped) yang simetris. Perhatikan kurva
distribusi normal normal standar berikut:

Sumbu X (horizontal) memiliki range (rentang) dari minus takhingga (‒∞) hingga positif takhingga
(+∞). Kurva normal memiliki puncak pada X = 0. Perlu diketahui bahwa luas kurva normal adalah
satu (sebagaimana konsep probabilitas). Dengan demikian, luas kurva normal pada sisi kiri = 0,5;
demikian pula luas kurva normal pada sisi kanan = 0,5.

Dalam analisis statistika, seringkali kita menentukan probabilitas kumulatif yang dilambangkan
dengan notasi P (X<x). Sebagai contoh, P (X<1), apabila diilustrasikan dengan grafik adalah luas
kurva normal dari minus takhingga hingga X = 1.

Secara matematis, probabilitas distribusi normal standar kumulatif dapat dihitung dengan
menggunakan rumus:

Akan tetapi, kita lebih mudah dengan bantuan tabel distribusi normal. Berikut adalah tabel distribusi
normal standar, untuk P (X < x), atau dapat diilustrasikan dengan luas kurva normal standar dari X =
minus takhingga sampai dengan X = x.
Contoh penggunaan:
Hitung P (X<1,25)

Penyelesaian: Pada tabel, carilah angka 1,2 pada kolom paling kiri. Selanjutnya, carilah angka 0,05
pada baris paling atas. Sel para pertemuan kolom dan baris tersebut adalah 0,8944.
Dengan demikian, P (X<1,25) adalah 0,8944.
Berikut adalah tabel distribusi normal standar kumulatif:

Anda mungkin juga menyukai