Hasil pengukuran yang kita peroleh disebut dengan data mentah. Besarnya hasil
pengukuran yang kita peroleh biasanya bervariasi. Apabila kita perhatikan data mentah
tersebut, sangatlah sulit bagi kita untuk menarik kesimpulan yang berarti. Untuk
memperoleh gambaran yang baik mengenai data tersebut, data mentah tersebut perlu di
olah terlebih dahulu.
Pada saat kita dihadapkan pada sekumpulan data yang banyak, seringkali
membantu untuk mengatur dan merangkum data tersebut dengan membuat tabel yang
berisi daftar nilai data yang mungkin berbeda (baik secara individu atau berdasarkan
pengelompokkan) bersama dengan frekuensi yang sesuai, yang mewakili berapa kali nilai-
nilai tersebut terjadi. Daftar sebaran nilai data tersebut dinamakan dengan Daftar
Frekuensi atau Sebaran Frekuensi (Distribusi Frekuensi).
Dengan demikian, distribusi frekuensi adalah daftar nilai data ( bisa nilai
individual atau nilai data yang sudah dikelompokkan ke dalam selang interval tertentu)
yang disertai dengan nilai frekuensi yang sesuai.
Pengelompokkan data ke dalam beberapa kelas dimaksudkan agar ciri-ciri penting
data tersebut dapat segera terlihat. Daftar frekuensi ini akan memberikan gambaran
yang khas tentang bagaimana keragaman data. Sifat keragaman data sangat penting
untuk diketahui, karena dalam pengujian-pengujian statistik selanjutnya kita harus selalu
memperhatikan sifat dari keragaman data. Tanpa memperhatikan sifat keragaman data,
penarikan suatu kesimpulan pada umumnya tidaklah sah.
Ada beberapa istilah yang harus dipahami terlebih dahulu dalam menyusun daftar
frekuensi.
Range : Selisih antara nilai tertinggi dan terendah.
Batas bawah kelas: Nilai terkecil yang berada pada setiap kelas
Batas atas kelas: Nilai terbesar yang berada pada setiap kelas
Batas nyata kelas (Class boundary): Nilai yang digunakan untuk memisahkan
antar kelas, tapi tanpa adanya jarak antara batas atas kelas dengan batas bawah
kelas berikutnya. Batas kelas selalu dinyatakan dengan jumlah digit satu
desimal lebih banyak daripada data pengamatan asalnya. Hal ini dilakukan
untuk menjamin tidak ada nilai pengamatan yang jatuh tepat pada batas
kelasnya, sehingga menghindarkan keraguan pada kelas mana data tersebut
harus ditempatkan.
Panjang/lebar kelas (selang kelas): Selisih antara batas bawah kelas dengan
batas atas kelas Biasanya lebar kelas tersebut memiliki lebar yang sama.
Nilai tengah kelas (Class midpoint/Class mark): Nilai kelas merupakan nilai
tengah dari kelas yang bersangkutan yang diperoleh dengan formula berikut:
½ (batas atas kelas+batas bawah kelas). Nilai ini yang dijadikan pewakil dari
selang kelas tertentu untuk perhitungan analisis statistik selanjutnya.
Frekuensi kelas: Banyaknya kejadian (nilai) yang muncul pada selang kelas
tertentu
Banyak software (teknologi komputasi) yang bisa digunakan untuk membuat tabel
distribusi frekuensi secara otomatis. Meskipun demikian, di sini tetap akan diuraikan
mengenai prosedur dasar dalam membuat tabel distribusi frekuensi.
Langkah-langkah dalam menyusun tabel distribusi frekuensi :
Pada saat menyusun Tabel Distribusi Frekuensi, pastikan bahwa kelas tidak
tumpang tindih sehingga setiap nilai-nilai pengamatan harus masuk tepat ke dalam satu
kelas. Pastikan juga bahwa tidak akan ada data pengamatan yang tertinggal (tidak dapat
dimasukkan ke dalam kelas tertentu).
Variasi penting dari distribusi frekuensi dasar adalah dengan menggunakan nilai
frekuensi relatifnya, yang disusun dengan membagi frekuensi setiap kelas dengan total
dari semua frekuensi (banyaknya data). Sebuah distribusi frekuensi relatif mencakup
batas-batas kelas yang sama seperti Tabel Distribusi Frekuensi, tetapi
frekuensi yang digunakan bukan frekuensi aktual melainkan frekuensi relatif.
Frekuensi relatif kadang-kadang dinyatakan sebagai persen.
Frekuensi relatif =
Variasi lain dari distribusi frekuensi standar adalah frekuensi kumulatif. Frekuensi
kumulatif untuk suatu kelas adalah nilai frekuensi untuk kelas tersebut ditambah dengan
jumlah frekuensi semua kelas sebelumnya.
Perhatikan bahwa kolom frekuensi selain label headernya diganti dengan frekuensi
kumulatif kurang dari, batas- batas kelas diganti dengan “kurang dari” ekspresi yang
menggambarkan kisaran nilai-nilai baru. Variasi lain adalah Frekuensi kumulatif
lebih dari. Prinsipnya hampir sama dengan prosedur di atas.
Histogram
Histogram adalah merupakan bagian dari grafik batang di mana skala horisontal
mewakili nilai-nilai data kelas dan skala vertikal mewakili nilai frekuensinya. Tinggi
batang sesuai dengan nilai frekuensinya, dan batang satu dengan lainnya saling
berdempetan, tidak ada jarak/ gap diantara batang. Kita dapat membuat histogram setelah
tabel distribusi frekuensi data pengamatan dibuat.
Poligon Frekuensi
Poligon Frekuensi menggunakan segmen garis yang terhubung ke titik yang
terletak tepat di atas nilai-nilai titik tengah kelas. Ketinggian dari titik-titik sesuai dengan
ekuensi kelas, dan segmen garis diperluas ke kanan dan kiri sehingga grafik dimulai dan
berakhir pada sumbu horisontal.
Ogive
Ogive adalah grafik garis yang menggambarkan frekuensi kumulatif, seperti daftar
distribusi frekuensi kumulatif. Perhatikan bahwa batas-batas kelas dihubungkan oleh
segmen garis yang dimulai dari batas bawah kelas pertama dan berakhir pada batas atas
dari kelas terakhir. Ogive berguna untuk menentukan jumlah nilai di bawah nilai tertentu.
Sebagai contoh, pada gambar berikut menunjukkan bahwa 68 mahasiswa mendapatkan
nilai kurang dari 90.5.
Kurva Frekuensi
Kurva halus yang diperoleh dari poligon frekuensi atau disebut pula kurva frekuensi
umumnya digunakan untuk melihat bagaimana bentuk distribusi frekuensi atau model dari
populasi yang diselidiki. Ada berbagai bentuk kurva halus yang dapat dijumpai di dunia
nyata. Beberapa diantaranya adalah :
Kurva Simetris
Sebuah distribusi dikatakan simetris jika kurva frekuensinya bisa dilipat sepanjang
garis vertikal sehingga setengah bagian dari kurva bisa menutup setengah bagian lainnya
Dalam Gambar diatas kurva A, B, C, D, dan E adalah kurva simetris. Kurva A, B, dan
C sendiri adalah bentuk umum dari apa yang disebut distribusi normal. Ketiganya hanya
berbeda pada ketinggian atau kemerataan dari puncak kurva. Kurva normal seperti yang
ditunjukkan oleh kurva A merupakan kurva unik yang hanya bisa diplot secara tepat
berdasarkan pendekatan matematis.
Distribusi normal ini memegang peranan penting dalam analisis statistika lanjutan,
karena banyak analisis yang mengharuskan data yang dikumpulkan harus mengikuti distribusi
ini.
Kurva Non-Simetris
Pada prakteknya tidak semua data di dunia ini yang mengikuti distribusi normal. Ada juga
data yang sedikit menyimpang dari distribusi normal seperti yang ditunjukkan oleh kurva F
dan G. Sebuah distribusi dikatakan miring ke kiri atau negatif jika puncak kurva berada di
sebelah kanan atau landainya agak memanjang ke arah kiri (kurva F) dan miring ke kanan
atau positif jika puncaknya berada disebelah kiri atau landainya agak memanjang ke arah
kanan (kurva G). Dalam prakteknya banyak fenomena ekonomi atau biologi yang
memperlihatkan bentuk distribusi seperti ini.
Bentuk lain yang cukup sering dijumpai adalah apa yang disebut kurva J atau kurva J-
terbalik.
1. Jangkauan (Range)
Selisih antara batas atas dari kelas tertinggi dengan batas bawah dari kelas
terendah.
3. Varians (Variance)
Rata-rata hitung deviasi kuadrat setiap data terhadap rata-rata hitungnya.
Data Berkelompok
4. Standar Deviasi
Akar kuadrat dari varians dan menunjukkan standar penyimpangan data terhadap nilai rata-
ratanya.
Data Berkelompok
6. Koefisien Variasi
Koefisien Variasi, disebut dispersi relatif, dapat digunakan untuk membandingkan nilai-nilai
besar dengan nilai-nilai kecil. Sedangkan lima bentuk dispersi sebelumnya tidak bisa.
Dispersi Data adalah data yang menggambarkan bagaimana suatu kelompok data
menyebar terhadap pusatnya data atau ukuran penyebaran suatu kelompok data terhadap
pusatnya data.
Dispersi data sangat penting untuk membandingkan penyebaran dua distribusi data atau
lebih. Pusat data seperti rata-rata hitung, median dan modus hanya memberi informasi yang
sangat terbatas sehingga tanpa disandingkan dengan dispersi data menjadi kurang
bermanfaat dalam menganalisa data.
1. Ukuran penyebaran dapat digunakan untuk menentukan apakah nilai rata- ratanya benar-
benar representatif atau tidak. Apabila suatu kelompok data mempunyai penyebaran
yang tidak sama terhadap nilai rata-ratanya, maka dikatakan bahwa nilai rata-rata
tersebut tidak representatif.
Kemiringan adalah derajat atau ukuran dari ketidaksimetrisan suatu distribusi data. Tiga pola
kemiringan distribusi data adalah sebagai berikut:
Pengukuran kemiringan suatu distribusi data dapat diketahui dengan beberapa
cara, antara lain:
a. Rumus Pearson :
b. Rumus Momen :
Data berkelompok
c. Rumus Bowley :
2. Keruncingan Distribusi Data
Keruncingan distribusi data adalah derajat atau ukuran tinggi rendahnya puncak suatu
distribusi data terhadap distribusi normalnya data. Keruncingan distribusi data
disebut juga kurtosis.
Skewness adalah derajat ketidaksimetrisan suatu distribusi. Jika kurva frekuensi suatu
distribusi memiliki ekor yang lebih memanjang ke kanan (mengacu dari meannya)
maka disimpulkan menceng kanan (positif) dan jika distribusi memiliki ekor yang
lebih memanjang ke kiri maka dapat disimpulkan menceng kiri (negatif). Secara
perhitungan, skewness adalah momen ketiga terhadap mean. Distribusi normal dan
distribusi simetris lainnya, misalnya distribusi t memiliki skewness 0.
Cara penulisan rumus skewness di excel :
Skew (number1, number2,...)
Dimana:
Number1, number2... berupal-255 argumen yang Kita ingin hitung skewnessnya. Kita juga
dapat menggunakan array tunggal atau referensi ke array, bukan argumen yang
dipisahkan oleh koma.
Kurtosis adalah derajat keruncingan suatu distribusi (biasanya diukur relatif terhadap
distribusi normal). Kurva yang lebih runcing dari distribusi normal dinamakan
Leptokurtik, yang lebih datar Platikurtik dan distribusi normal disebut Mesokurtik.
Kurtosis dihitung dari momen keempat terhadap mean.
Dimana:
Number 1. number2, ... dapat berupa 1-255 argumen yang ingin dihitung kurtosisnya.
Anda juga dapat menggunakan array tunggal atau referensi ke array. bukan
argumen yang dipisahkan oleh koma.
3. Analisa Ukuran Penyebaran Data
Statistik Deskriptif adalah Statistik yang berfungsi untuk mendeskripsikan atau
memberikan gambaran terhadap objek yang di teliti melalui data sampel atau
populasi sebagaimana adanya, tanpa melakukan analisis dan membuat kesimpulan
yang berlaku untuk umum. Dalam Statistik Deskriptif ini akan dikemukakan
cara-cara penyajian data. dengan tabel biasa maupun distribusi frekuensi; grafik
garis maupun batang: diagram lingkaran: histogram dll, dan menghitung ukuran
penyebaran dan pemustan data seperti: Mean, Median, Mode, Standard Deviation,
Variance, Kurtosis, Skewness, Range, Minimum, Maximum, Sum, dan Count.
1. Nilai Skewness
Skewness diartikan sebagai kemiringan distribusi data. Yang dimaksud dengan
kemiringan data adalah besarnya pembagian data atau rata-rata sebaran data yang
biasanya di wujudkan denan bentuk lonceng, untuk data yang berdistribusi normal. Begitu
juga jika kita terapkan pada Skewness. Apabila skewness menunjukkan simetri maka
dikatakan data membentuk distribusi normal, apabila kemiringan distribusi data agak
condong ke kanan ditunjukkan dengan nilai skewness yang negative, selanjutnya apabila
kemiringan distribusi data condong ke kiri yang ditunjukkan bahwa nilai skewness positif.
Apabila nilai sk = 0, maka menunjukkan data berdistribusi normal. Sk < 0 kemiringan
ke kanan, dan sk > 0 kemiringan ke kiri. Sebagai contoh, jika diperoleh nilai sk = -0.807
adalah artinya merupakan nilai negatif, akan tetapi tidak jauh dari nilai, Berarti data
cenderung bendistribusi normal atau hampir normal.
2. Nilai Kurtosis
Kurtosis diartikan sebagai keruncingan distribusi data. Semakin runcing nilai kurtosis
akan menunjukkan data hampir mengumpul (homogen). Akan tetapi apabila nilai kurtosis
0 menunjukkan data normal, dan apabila nilai kurtosis semakin kecil, maka menunjukkan
data semakin tumpul (semakin menyebar dikatakan data tidak homogen).
Jika nilai kurtosis dekat nol maka data cenderung normal, apabila nilai kurtosis
negative berarti datanya tumpul atau cenderung melebar ke bawah, sebaliknya apabila
nilai kurtosis positif maka datanya bersifat runcing atau cenderung mengelompok
(homogen).
Sebagai contoh misalnya. Jika diketahui nilai ku = 1,06. Maks nilai kurtosis positif
yang lebih besar dari nol dan cukup jauh dari nol. Oleh karena itu, dikatakan datanya
cenderung runcing atan dengan kata lain cenderung homogen.
Salah satu uji statistik adalah uji normalitas data. Uji normalitas berguna untuk
menentukan apakah data yang telah dikumpulkan merupakan distribusi normal atau
bukan. Pengujian normalitas akan mengarahkan teknik statistik apa yang akan digunakan
untuk uji pengambilan keputusan (statistik inferensi).
Metode statistik klasik dalam pengujian normalitas suatu data tidak begitu rumit.
Berdasarkan pengalaman empiris ahli statistik, data yang banyaknya lebih dari 30 (n>30),
sudah dapat diasumsikan berdistribusi normal. Tetapi untuk memberikan kepastian data
merupakan distribusi normal atau tidak, sebaiknya digunakan uji normalitas. Karena
belum tentu data yang lebih dari 30 bisa dipastikan berdistribusi normal, demikian juga
yang kurang dari 30 belum tentu tidak berdistribusi normal, untuk itu perlu suatu
pembuktian.
Berikut ini Beberapa Cara yang umum pada pengolahan data menggunakan SPSS dalam
menguji normalitas data:
1. Dengan melihat hasil nilai skewness kurtosis yang didapat melalui statistik
deskriptif
2. Kolmogorov-Smirnov dengan pendekatan koreksi Lillifors.
3. Kolmogorov Smimov untuk 1-sample K-S.
Cara dalam menguji Normalitas dari nilai Skewness dan Kurtosis yang diperoleh :
Uji normalitas dengan Skewness dan Kurtosis mempunyai kelebihan yang tidak
didapat diperoleh dari uji normalitas yang lain. Dimana dengan uji skewness/kurtosis akan
dapat diketahui diketahui grafik normalitas menceng ke kanan atau ke kiri, terlalu datar
atau mengumpul di tengah. Oleh karena itu, uji normalitas dengan Skewness dan Kurtosis
juga sering disebut dengan ukuran kemencengan data.
Dengan membandingkan antara nilai Statistic Skewness dibagi dengan Std Error
Skewness atau nilai Statistic Kurtosis dibagi dengan Std Error Kurtosis: Dimana jika skor
berada antara -2 dan 2 maka distribusi data normal.
Misal kita peroleh nilai Skewness = 0.022
Std error skewness = 0.427
Kurtosis = - 0.807
Std error kurtosis = -0.833
Nilai Ratio Skewness/Std Error Skewness = 0.022 / 0.427 = 0,05 <2
Nilai Ratio Kurtosis/Sid Error Kurtosis = -0.807 / 0.833 = -0.96 >-2
Uji normalitas dengan Skewness dan Kurtosis memberikan kelebihan tersendiri, yaitu
bahwa akan diketahui grafik normalitas menceng ke kanan atau ke kiri, terlalu datar atau
mengumpul di tengah. Oleh karena itu, uji normalitas dengan Skewness dan Kurtosis juga
sering disebut dengan ukuran kemencengan data.
Satu istilah dalam Kurva Normal adalah Skewness dan Kurtosis. Skewness berkaitan
dengan lebar kurva, sedangkan Kurtosis dengan tinggi kurva. Jika data terlihat sebarannya
normal. tapi kalau nilai kurtosisnya besar (salah satu kategori terlalu tinggi) maka tidak
normal. Dua nilai ini harus diperhatikan.
Nilai Kritis (Z) = Skewness / √ (6/N). Z tidak boleh lebih dari 2.58 (sig. 1%) dan 1.96
(sig. 5%). Untuk Kurtosis rumusnya juga sama.
Atau jika variabel x bertambah, maka variabel y bertambah pula, dan sebaliknya.
• Contoh :
a. hubungan antara pengeluaran iklan (x) dan jumlah penjualan (y).
Dua variabel dikatakan mempunyai hubungan yang bersifat kebalikan atau negatip,
apabila perubahan variabel independent (x) akan mempengaruhi variabel dependent
(Y) pada arah yang berlawanan.
Artinya apabila variabel x bertambah, maka variabel y berkurang atau sebaliknya, jika
variabel x berkurang maka variabel y bertambah.
Contoh :
Dua variabel dikatakan tidak punya hubungan apabila perubahan pada variabel
independent (x) tidak mempengaruhi perubahan pada variabel dependent (y).
Contoh :
REGRESI
Grafik ini disebut diagram pencar, yang menunjukkan titik-titik tertentu. Setiap titik
memperlihatkan suatu hasil yang kita nilai sebagai varibel tak bebas maupun bebas
Diagram pencar ini memiliki 2 manfaat, yaitu :
Regresi merupakan suatu alat ukur yang juga digunakan untuk mengukur ada atau tidaknya
korelasi antar variabelnya. Istilah regresi itu sendiri berarti ramalan atau taksiran.
Persamaan yang digunakan untuk mendapatkan garis regresi pada data diagram pencar
disebut persamaan regresi.
Untuk menempatkan garis regresi pada data yang diperoleh maka digunakan metode kuadrat
terkecil, sehingga bentuk persamaan regresi adalah sebagai berikut:
Y’ = a + b X
Dimana:
b: gradien garis regresi (perub nilai estimate Y’ per satuan perubahan nilai x)
Kesamaan diantara garis regresi dan garis trend tidak dapat berakhir dengan persamaan garis
lurus. Garis regresi (seperti garis trend dan nilai tengah aritmatika) memiliki dua sifat
matematis berikut : (Y – Y’) = 0 dan (Y – Y’)2 = nilai terkecil atau terendah
Dengan perkataan lain, garis regresi akan ditempatkan pada data dalam diagram sedemikian
rupa sehingga penyimpangan (perbedaan) positif titik-titik terhadap titik-titik pencar di atas
garis akan mengimbangi penyimpangan negatif titik-titik pencar yang terletak di bawah garis,
sehingga hasil penyimpangan keseluruhan titik-titik terhadap garis lurus adalah nol.
Untuk tujuan di atas, perhitungan analisis regresi dan analisis korelasi dapat dipermudah
dengan menggunakan rumus dalam bentuk penyimpangan nilai tengah variabel X dan Y,
yaitu penyimpangan dari Oleh karena itu, dapat digunakan simbol berikut ini :
Nilai dari a dan b pada persamaan regresi dapat dihitung dengan rumus berikut :
Koefisien Regresi
SISI GAMBAR 54 61 59 41
SISI TULISAN 46 39 41 59
JUMLAH
100 100 100 100
PERCOBAAN
Kesimpulan dari percobaan tersebut akan sampai pada teori bahwa mata uang adalah
setimbang, artinya probabilita munculnya sisi gambar dan sisi tulisan adalah sama, yaitu 50%.
Distribusi teoritis munculnya sisi gambar dan tulisan dari pelemparan sebuah mata uang
logam sebanyak 100 kali seperti yang terlihat pada tabel. Berdasarkan tabel diketahui bahwa
frekwensi teoritis diperoleh dengan mengalikan probabilita dengan jumlah percobaan.
Suatu daftar/ distribusi dr semua nilai variabel random diskrit dgn probabilitas terjadinya
masing-masing nilai tersebut. Suatu fungsi f dikatakan merupakan fungsi probabilitas/
distribusi dr variabel random diskrit jika memenuhi syarat:
a. f(x) ≥ 0, x Є R
b. f(x) = 1
c. P(X=x) = f(x)
Contoh Soal :
Di dalam sebuah kotak terdapat 4 bola biru dan 2 bola kuning. Secara acak
diambil 3 bola. Tentukan distribusi probabilitas X, jika X menyatakan
banyaknya bola kuning yang terambil?
P(X=x) =
a. Distribusi binomial
b. Distribusi hipergeometrik
c. Distribusi Poisson
Suatu daftar/ distribusi dr semua nilai variabel random kontinu dgn probabilitas terjadinya
masing-masing nilai tsb. Suatu fungsi f dikatakan mrp fungsi probabilitas/ distribusi
probabilitas variabel random kontinu x, jk memenuhi syarat:
a. f(x) ≥ 0, x Є R
b.
f ( x ) dx 1
c.
b
P (a X b) f ( x) dx
a
a. Distribusi normal
b. Distribusi
c. Distribusi F
d. Distribusi t
Distribusi Normal
Distribusi peluang kontinu yang terpenting dalam seluruh bidang statistika adalah
distribusi normal. Distribusi normal merupakan suatu alat statistik yang sangat penting untuk
menaksir dan meramalkan peristiwa-peristiwa yang lebih luas. Grafiknya disebut kurva
normal, terbentuk lonceng seperti pada gambar 2.1. yang menggambarkan dengan cukup baik
banyak gejala yang muncul di alam, industri, dan penelitian. Pengukuran fisik di bidang
seperti percobaan meteorologi, penelitian curah hujan, dan pengukuran suku cadang yang
diproduksi sering dengan baik dapat diterangkan menggunakan distribusi normal.
Di samping itu, galat dalam pengukuran ilmiah dapat dihampiri dengan sangat baik
oleh distribusi normal. Pada tahun 1733, Abraham de Moivre menemukan persamaan
matematika kurva normal. Ini merupakan dasar bagi banyak teori statistika induktif. Distribusi
normal sering pula disebut distribusi Gauss untuk menghormati Karl Friedrich Gauss (1777-
1855) yang juga menemukan persamaannya waktu meneliti galat dalam pengukuran yang
berulang- ulang mengenai bahan yang sama.
Suatu peubah acak kontinu X yang distribusinya berbentuk lonceng seperti pada gambar 2.1
disebut peubah acak normal. Persamaan matematika distribusi peluang peubah normal
kontinu bergantung pada dua parameter dan yaitu rataan dan simpangan bakunya. Jadi
fungsi padat X akan dinyatakan dengan n (x, , ) .
Fungsi padat peubak acak normal X, dengan rataan dan variansi , ialah
2
1 x
1
n ( x; , ) e 2
2
Fungsi kerapatan probabilitas dari distribusi normal diberikan dalam rumus berikut:
Keterangan:
π = 3,1416
e = 2,7183
µ = rata-rata
σ = simpangan baku
Beberapa sifat dari kurva fungsi kepadatan peluang (densitas) distribusi normal umum:
1. Kurvanya berbentuk lonceng dan simetrik di x = µ.
2. Rataan, median, modus dari distribusi berimpitan.
1
3. Fungsi kepadatan peluang mencapai nilai maksimum di x = µ sebesar 2 2 .
4. Kurvanya berasimtot sumbu datar x.
1
1
f ( x) e 2
Mean, variansi dari fungsi pembangkit momen dari distribusi normal umum adalah:
Mean E ( X )
2
Variansi Var ( X )
t 2 t 2
2
Pembangkit momen Mx(t ) e
Pr oof .
E( X ) x. f ( x)dx
( x )2
1
x.
2 2
e 2 2
dx
(x )
Misal z , maka x z dan dx dz
Batas-batasnya x 0 maka z 0, dan x maka z .
z2
1
E( X ) ( z ).
2 2
e 2
z dz
z2 z2
2
ze 2
dx
2
e 2
dx
z2
z2
karena f x z e merupakan fungsi ganjil, maka ze 2
dz 0
2 2
2
2z
sehingga kita mencari dulu e dx
2
(x )
Misal z , maka x z dan dx dz
Batas-batasnya x 0 maka z 0, dan x maka z
z2
2
e 2
dx
( x ) 2
1 2 2 1
e dx
2
( x ) 2
1 2 2
e dx
2 2
.(1)
Sehingga
2
z2
z
E( X )
2
z e 2
dx
2
e 2
dx
0
Pr oof .
Var ( X ) E ( X ) 2
( z ) 2 f ( x)dx
( z ) 2 f ( x)dx
( x )2
1
2
(z ) e 2 2
dx
2
2
x
Misakan p , maka x p, dx dp
Batas-batasnya x 0 maka p 0, dan x maka p
p2
2
p
2 2
Var ( X ) e 2
dp
2 2 0
Penjelasan singkat mengenai distribusi normal dapat dilihat di artikel “Distribusi Normal”.
Artikel ini akan membahas tentang fungsi pembangkit momen atau moment generating
function (MGF) dari distribusi normal.
Pembahasan awal dari bagian ini adalah menurunkan persamaan MGF-nya. Selanjutnya
menurunkan momen pertama dan momen kedua berdasarkan persamaan MGF yang telah
diperoleh sebelumnya. Dari momen pertama dan kedua dapat diketahui rata-rata (mean) dan
varian.
p2 dt
misalkan t maka p 2 2t , 2 p dp 2 dt maka
2 2t
2 2 1
2t.e
t
Var ( X ) . dt
2 0 2t
2 1
2
2 0
t .e t dt
2
2 2 3
2
2 2 1 1
2 2
2
2
Mx (t ) E (etx )
e
tx
Mx (t ) f ( x) dx
2
1 x
1
e
tx
Mx (t ) e 2 dx
2
2
1 x
1
e
tx 2
Mx (t ) e dx
2
Misalkan , maka
Selanjutnya , sehingga
1 2
1 z
Mx(t )
2
e t ( t z ) e 2
dz
1
z2
1 2 t ( t z )
Mx(t )
2 e
dz
1
z2
e t 2
e
tz
Mx(t ) dz
2
1
z2
e t 2 1
tz 2t 2
1 2 2
t
Mx(t )
2 e
2 2
dz
1
z2
e t
2
z 2 2 tz 2t 2 1
2t 2
Mx(t )
2
e e2 dz
1 2 2 1
t t z2
e 2 2
z 2 2 tz 2t 2
Mx(t )
2
e dz
1 2 2
t t 1
z2
e 2 2 z t 2
Mx(t )
2
e dz
1 2 2 1
t t
e 2
2
Mx(t ) 1
2 1 2
2
1 2 2
t t
e 2
Mx(t ) 2
2
1
t 2t 2
Mx(t ) e 2
Nilai Harapan X
Nilai Harapan X2
Sebagai catatan, nilai harapan X merupakan rata-rata (mean) dan nilai harapan (X – E(X))2
merupakan varian.
Pada tabel, carilah angka 1,2 pada kolom paling kiri. Selanjutnya, carilah angka 0,05 pada
baris paling atas. Sel para pertemuan kolom dan baris tersebut adalah 0,8944.
Dengan demikian, P (X<1,25) adalah 0,8944.
PENDUGAAN PARAMETER
A. Pendahuluan
Statistika inferensia adalah cabang ilmu pengetahuan statistika yang mempelajari
tentang proses pengambilan keputusan tentang parameter berdasarkan suatu statistik.
Inferensi statistik mencakup semua metode yang digunakan dalam penarikan kesimpulan
atau generalisasi mengenai populasi. Karena adanya berbagai alasan seperti banyaknya
individu dalam populasi amatan, maka penelitian keseluruhan terhadap populasi tersebut
tidaklah ekonomis, baik tenaga, waktu, maupun biaya, maka penelitian hanya menggunakan
sampel saja. Harga – harga parameter hanya di-ESTIMASI-kan/diduga berdasarkan harga –
harga statistik sampelnya.
Pendugaan dalam kehidupan sehari – hari tidak dapat dihindari. Permasalahannya
adalah bagaimana pendugaan tersebut mendekati kebenaran. Oleh karena itu, statistika
induktif mengembangkan teori pendugaan (estimasi/penaksiran). Teori pendugaan
(ESTIMASI/ PENAKSIRAN) adalah suatu proses dengan menggunakan statistik sampel
untuk menduga parameter populasi dan dapat dikelompokkan dalam 2 bidang utama:
1. Pendugaan Parameter
Contoh:
Seorang calon dalam suatu pemilihan ingin menduga proporsi yang sebenarnya pemilih
yang akan memilihnya, dengan cara mengambil 100 orang secara acak untuk
ditanyai pendapatnya. Proporsi pemilih yang menyukai calon tersebut dapat
digunakan sebagai dugaan bagi proporsi populasi yang sebenarnya.
2. Pengujian Hipotesis
Contoh:
Seorang peneliti masalah kedokteran diminta untuk memutuskan, berdasarkan
bukti-bukti hasil percobaan, apakah suatu vaksin baru lebih baik daripada yang
sekarang beredar di pasaran.
Seorang insinyur ingin memutuskan, berdasarkan data contoh apakah ada
perbedaan ketelitian antara dua jenis alat ukur.
B. Metode Pendugaan Parameter
Metode Pendugaan Parameter suatu populasi dapat dibedakan menjadi dua:
1. Pendugaan Metode Klasik
Pendugaan dilakukan berdasarkan sepenuhnya pada informasi sampel yang diambil dari
populasi.
2. Pendugaan Bayes
Pendugaan dengan menggabungkan informasi yang terkandung dalam sampel dengan
informasi lain yang telah tersedia sebelumnya yaitu pengetahuan subyektif mengenai
distribusi probabilitas parameter.
Statistik yang digunakan untuk memperoleh sebuah dugaan bagi parameter populasi
disebut penduga atau fungsi keputusan. Sedangkan adalah sebuah nilai dugaan berdasarkan
sampel acak berukuran n.
Misal: Fungsi keputusan S2 (yang merupakan fungsi dari sampel acak yang
bersangkutan) adalah suatu penduga, sedangkan nilai dugaan s2 merupakan realisasinya.
Dalam membuat estimasi nilai parameter populasi, sebaiknya variable random nilai
statistik sampel tidak bervariasi terlalu jauh dari nilai parameter populasi yang konstan.
Misalnya, jika µ merupakan mean populasi dan X merupakan penduga bagi µ, maka
dalam menggunakan X sebagai penduga kita harus berharap variabel random X tidak akan
menyimpang terlalu jauh dari µ.
Contoh perbandingan penduga yang tidak bias dan penduga yang bias
Pada gambar (a) untuk menduga nilai sebagai penduga, hasilnya tidak
bias.
Sedangkan gambar (b) nilai disebut nilai bias, dan penduga disebut over
estimate
2. Efisien
𝜃̂ Merupakan penduga yang efisien (Efficient Estimator) bagi 𝜃 jika penduga 𝜃̂
memiliki varians atau standar deviasi yang lebih kecil dibandingkan dengan penduga
lainnya. Jika terdapat 2 penduga yang tak bias, dimana varians atau standar deviasi dari
penduga satu lebih kecil dibandingkan varians atau standar deviasi penduga kedua,
maka penduga satu relative lebif efisien dibandingkan dengan penduga kedua.
3. Konsisten
𝜃̂ Merupakan penduga yang konsisten (Consistent Estimator) bagi 𝜃 apabila nilai 𝜃̂
cenderung mendekati nilai parameter 𝜃 untuk n yang semakin besar mendekati tak
terhingga. Jadi ukuran sampel yang besar cenderung memberikan penduga titik yang
lebih baik dibandingkan ukuran sampel kecil.
4. Cukup
𝜃̂ Merupakan penduga yang cukup (Sufficient Estimator) bagi 𝜃 apabila 𝜃̂
mencakup seluruh informasi tentang penduga yang terkandung didalam sampel.
Contoh: rata – rata modal akan terletak dalam interval antara 95 juta – 105 juta. Kita
mengharapkan bahwa nilai rata – rata sebenarnya akan terletak di dalam interval
tersebut. Interval yang demikian disebut interval keyakinan atau interval keyakinan.
Contoh: rata – rata modal terletak antara interval 95 juta – 105 juta (a = 95 juta, b = 105
juta) dan 1 - α= 0,90.
Intrepetasi: Kita memutuskan bahwa interval 95 – 105 akan memuat µ dengan
probabilitas sebesar 0,90. Dan kesalahan yang ditolerir adalah sebesar 0,10. Kesalahan
yang mungkin terjadi adalah bahwa interval tersebut tidak memuat µ.
Rumus ini berlaku untuk sampel besar (n ≥ 30) dari populasi yang tak terbatas atau dari
populasi terbatas akan tetapi penarikan sampel dilakukan dengan pengembalian.
Rumus ini berlaku untuk populasi terbatas, akan tetapi sampel sebanyak n diambil tanpa
pengembalian dari populasi N elemen dan 𝝈 diketahui.
Rumus ini berlaku untuk sampel kecil (n < 30) yang diambil dari populasi (𝜎 tidak
diketahui) dengan pengembalian. Rumus ini diperoleh dari rumus 1 dengan jalan
mengganti 𝜎 dengan s dan 𝑍𝑎/2 dengan 𝑡𝑎/2. Dimana:
Confidence Interval
Artinya:
Dalam proses yang lama, dari semua confidence interval yang dapat dibangun akan
berisi parameter yang tidak diketahui.
Interval tertentu baik yang berisi parameter maupun yang tidak berisi
parameter
Variasi Data
Ukuran sampel:
dan maka penduga titik bagi selisih antara 1 dan 2 adalah 𝑋̅ 1 − 𝑋̅ 2. Bila
dan adalah nilai tengah sampel acak bebas berukuran n1 dan n2 yang diambil dari
Jika dan tidak diketahui, tetapi n1 dan n2 >30, maka dan dapat
Contoh:
Suatu ujian kimia diberikan kepada 50 siswa perempuan dan 75 siswa laki-laki. Siswa
perempuan mendapat nilai rata-rata 76 dengan simpangan baku 6, sedangkan siswa
laki-laki memperoleh rata-rata 82 dengan simpangan baku 8. Tentukan selang
kepercayaan 96% bagi selisih rata-rata nilainya.
Penyelesaian:
ii. Asumsi: Populasi independen, sampel kecil, ragam sama.
Selang kepercayaan 100(1-)% bagi 1-2 untuk sampel kecil; bila 1 2 2 2 dan
nilainya tidak diketahui:
Bila kita mempunyai dua populasi yang tidak saling bebas (berpasangan), selang
kepercayaan 100(1-)% bagi D=1-2 untuk pengamatan berpasangan tersebut
dengan v= n-1 adalah
Contoh:
Dua puluh mahasiswa tingkat satu dibagi dalam 10 pasang, tiap pasang diperkirakan
mempunyai IQ yang sama. Salah seorang dari tiap pasangan diambil secara acak dan
dimasukkan ke kelas khusus, sedangkan anggota pasangan yang lainnya dimasukkan
kedalam kelas biasa. Saat akhir semester, keduanya diberikan ujian yang sama dan
hasilnya adalah sebagai berikut:
Tentukan selang kepercayaan 98% bagi selisih sesungguhnya dalam kedua kelas.
Penyelesaian:
4. Pendugaan Ragam
Bila 𝑆 2 adalah ragam contoh acak berukuran n yang ditarik dari suatu populasi normal dengan
ragam , maka
Disebut Khi-kuadrat, yang sebaran penarikan contohnya disebut sebaran khi-kuadrat dengan
derajat bebas v = n-1.
Bila s2 adalah penduga titik bagi varians sampel acak berukuran n yang diambil dari suatu
populasi normal dengan varians 2, maka selang kepercayaan 100(1-)% bagi 2
adalah
Volume sepuluh botol berisi air mineral sebesar 46,4; 46,1; 45,8; 47; 46,1; 45,9; 45,8;
46,9; 45,2 dan 46 liter. Buat selang kepercayaan 95% bagi ragam volume botol.
Asumsikan data menyebar normal.
Penyelesaian:
Dalam sebuah percobaan, apakah frekuensi observasi akan sama dengan frekuensi ekspektasi?
Bentuk distribusi ² tergantung dari derajat bebas(db)/degree of freedom dan luas daerah di
bawah kurva ² db; α
Perhatikan Tabel hal 178 dan 179 (Buku Statistika-2, Gunadarma)
Contoh:
nilai ² untuk db = 5 dengan luas daerah di sisi kanan kurva (α) = 0.010 adalah 15.0863
Pengunaan Uji ²
a. Uji Kecocokan = Uji kebaikan-suai = Goodness of fit
b. Uji Kebebasan
c. Uji beberapa proporsi
Bentuk hipotesis
H0: f0 = fe
H0: f0 ≠ fe
Uji Kecocokan
2.1 Penetapan Hipotesis Awal dan Hipotesis Alternatif
H0 : frekuensi setiap kategori memenuhi suatu nilai/perbandingan.
H1 : ada frekuensi suatu kategori yang tidak memenuhi nilai/
perbandingan tersebut.
Contoh 1 :
Pelemparan dadu 120 kali, kita akan menguji kesetimbangan dadu . Dadu setimbang jika
setiap sisi dadu akan muncul 20 kali.
H0 : setiap sisi akan muncul = 20 kali.
H1 : ada sisi yang muncul ≠20 kali.
Contoh 2:
Sebuah mesin pencampur adonan es krim akan menghasilkan perbandingan antara coklat :
Gula : Susu : Krim = 5 : 2 : 2 : 1
H0 : perbandingan Coklat : Gula : Susu : Krim = 5 : 2 : 2 : 1
H1 : perbandingan Coklat : Gula : Susu : Krim ≠ 5 : 2 : 2 : 1
statistik Uji (² hitung) :
Contoh
Berikut adalah hasil pengamatan dari pelemparan dadu 120 kali.
Jawab
1. H0 : Dadu setimbang → semua sisi akan muncul = 20 kali. H0: f0 = fe
H1 : Dadu tidak setimbang → ada sisi yang muncul ≠20 kali. H0: f0 ≠ fe
2. Statistik Uji χ²
3. Nilai α = 5 % = 0.05
k = 6 ; db = k - 1 = 6-1 = 5
4. Nilai Tabel χ²
db = 5; α = 0.05 → χ² tabel = 11.0705
5. Daerah Penolakan H0 jika χ² > χ² tabel (db; α) χ² > 11.0705
6. X 2 hitung :
oi ei oi-ei (oi-ei)2/ei
Sisi - 1 20 20 0 0
Sisi – 2 22 20 2 0.20
Sisi – 3 17 20 -3 0.45
Sisi – 4 18 20 -2 0.20
Sisi – 5 19 20 -1 0.05
Sisi - 6 24 20 4 0.80
X2 hitung = 1.70
7. Kesimpulan :
χ² hitung = 1.70 < χ² tabel
Nilai χ² hitung ada di daerah penerimaan H0
H0 diterima; pernyataan dadu setimbang dapat diterima
Uji Kebebasan :
Menguji ada tidaknya hubungan antar dua variabel
Contoh:
Kita ingin mengetahui apakah hobi ‘mengemil’ ada hubungannya dengan obesitas
Bentuk hipotesis:
H0 : variabel-variabel saling bebas (Tidak ada hubungan antar variabel)
H1 : variabel-variabel tidak saling bebas (Ada hubungan antar variabel)
Data pada pengujian ketergantungan (hubungan) variabel disajikan dalam bentuk Tabel
Kontingensi (Cross Tab)
Bentuk umum Tabel Kontingensi → berukuran r baris x k kolom
Uji X2 hitung
Contoh
Berikut adalah data jam kerja berdasarkan jenis kelamin (gender)
6. Perhitungan χ²
Frekuensi harapan :
Kesimpulan
χ² hitung = 0.4755 < χ² tabel = 5.99147)
χ² hitung ada di daerah penerimaan H0
H0 diterima, antar gender dan jam kerja saling bebas
Uji ini merupakan perluasan dari uji dua proporsi, pada uji ini kita dapat menguji lebih dari
dua proporsi
bentuk hipotesis :
Apakah proporsi masyarakat yang mendukung /setuju terhadap kebijakan sama? Gunakan
taraf nyata 5 %.
Jawab
1. H0 : proporsi masyarakat yang setuju sama
H1 : proporsi masyarakat yang setuju tidak semuanya sama
2. Statistik uji X2
3. Taraf nyata (α) = 5 %
4. Nilai Tabel X² : db = 2; α = 0.05 → χ² tabel = 5.99147
5. Daerah Penolakan H0 → χ²hitung > χ² tabel χ²hitung > 5.99147
6. Perhitungan
oi ei oi-ei (oi-ei)2/ei
Kel-1, setuju 35 35.1 - 0.1 0.0003
Kel-2, setuju 45 44.81 0.19 0.0008
Kel-3, setuju 38 38.09 - 0.09 0.0002
Kel-1, tidak setuju 12 11.9 0.1 0.0008
Kel-2, tidak setuju 15 15.19 - 0.19 0.002
Kel-3, tidak setuju 13 12.91 0.09 0.0006
X2 hitung = 0.0047
7. Kesimpulan
X2 hitung < X2 tabel 0.0047< 5.99147
H0 diterima
proporsi kelompok masyarakat yang setuju terhadap kebijakan sama