Anda di halaman 1dari 51

Distribusi Frekuensi

Hasil pengukuran yang kita peroleh disebut dengan data mentah. Besarnya hasil
pengukuran yang kita peroleh biasanya bervariasi. Apabila kita perhatikan data mentah
tersebut, sangatlah sulit bagi kita untuk menarik kesimpulan yang berarti. Untuk
memperoleh gambaran yang baik mengenai data tersebut, data mentah tersebut perlu di
olah terlebih dahulu.
Pada saat kita dihadapkan pada sekumpulan data yang banyak, seringkali
membantu untuk mengatur dan merangkum data tersebut dengan membuat tabel yang
berisi daftar nilai data yang mungkin berbeda (baik secara individu atau berdasarkan
pengelompokkan) bersama dengan frekuensi yang sesuai, yang mewakili berapa kali nilai-
nilai tersebut terjadi. Daftar sebaran nilai data tersebut dinamakan dengan Daftar
Frekuensi atau Sebaran Frekuensi (Distribusi Frekuensi).
Dengan demikian, distribusi frekuensi adalah daftar nilai data ( bisa nilai
individual atau nilai data yang sudah dikelompokkan ke dalam selang interval tertentu)
yang disertai dengan nilai frekuensi yang sesuai.
Pengelompokkan data ke dalam beberapa kelas dimaksudkan agar ciri-ciri penting
data tersebut dapat segera terlihat. Daftar frekuensi ini akan memberikan gambaran
yang khas tentang bagaimana keragaman data. Sifat keragaman data sangat penting
untuk diketahui, karena dalam pengujian-pengujian statistik selanjutnya kita harus selalu
memperhatikan sifat dari keragaman data. Tanpa memperhatikan sifat keragaman data,
penarikan suatu kesimpulan pada umumnya tidaklah sah.
Ada beberapa istilah yang harus dipahami terlebih dahulu dalam menyusun daftar
frekuensi.
 Range : Selisih antara nilai tertinggi dan terendah.
 Batas bawah kelas: Nilai terkecil yang berada pada setiap kelas
 Batas atas kelas: Nilai terbesar yang berada pada setiap kelas
 Batas nyata kelas (Class boundary): Nilai yang digunakan untuk memisahkan
antar kelas, tapi tanpa adanya jarak antara batas atas kelas dengan batas bawah
kelas berikutnya. Batas kelas selalu dinyatakan dengan jumlah digit satu
desimal lebih banyak daripada data pengamatan asalnya. Hal ini dilakukan
untuk menjamin tidak ada nilai pengamatan yang jatuh tepat pada batas
kelasnya, sehingga menghindarkan keraguan pada kelas mana data tersebut
harus ditempatkan.
 Panjang/lebar kelas (selang kelas): Selisih antara batas bawah kelas dengan
batas atas kelas Biasanya lebar kelas tersebut memiliki lebar yang sama.
 Nilai tengah kelas (Class midpoint/Class mark): Nilai kelas merupakan nilai
tengah dari kelas yang bersangkutan yang diperoleh dengan formula berikut:
½ (batas atas kelas+batas bawah kelas). Nilai ini yang dijadikan pewakil dari
selang kelas tertentu untuk perhitungan analisis statistik selanjutnya.
 Frekuensi kelas: Banyaknya kejadian (nilai) yang muncul pada selang kelas
tertentu

Teknik Pembuatan Tabel Distribusi Frekuensi

Distribusi frekuensi dibuat dengan alasan berikut:


 kumpulan data yang besar dapat diringkas
 kita dapat memperoleh beberapa gambaran mengenai karakteristik data,
dan
 merupakan dasar dalam pembuatan grafik penting (seperti histogram).

Banyak software (teknologi komputasi) yang bisa digunakan untuk membuat tabel
distribusi frekuensi secara otomatis. Meskipun demikian, di sini tetap akan diuraikan
mengenai prosedur dasar dalam membuat tabel distribusi frekuensi.
Langkah-langkah dalam menyusun tabel distribusi frekuensi :

 Urutkan data, biasanya diurutkan dari nilai yang paling kecil


Tujuannya agar range data diketahui dan mempermudah penghitungan
frekuensi tiap kelas
 Tentukan range (rentang atau jangkauan)
o Range = nilai maksimum – nilai minimum
 Tentukan banyak kelas yang diinginkan. Jangan terlalu banyak/sedikit, berkisar
antara 5 dan 20, tergantung dari banyak dan sebaran datanya.
o Aturan Sturges:
o Banyak kelas = 1 + 3.3 log n, dimana n = banyaknya data
 Tentukan panjang/lebar kelas interval (p)
o Panjang kelas (p) = [rentang]/[banyak kelas]
 Tentukan nilai ujung bawah kelas interval pertama

Pada saat menyusun Tabel Distribusi Frekuensi, pastikan bahwa kelas tidak
tumpang tindih sehingga setiap nilai-nilai pengamatan harus masuk tepat ke dalam satu
kelas. Pastikan juga bahwa tidak akan ada data pengamatan yang tertinggal (tidak dapat
dimasukkan ke dalam kelas tertentu).

Distribusi Frekuensi Relatif

Variasi penting dari distribusi frekuensi dasar adalah dengan menggunakan nilai
frekuensi relatifnya, yang disusun dengan membagi frekuensi setiap kelas dengan total
dari semua frekuensi (banyaknya data). Sebuah distribusi frekuensi relatif  mencakup
batas-batas kelas yang sama seperti Tabel Distribusi Frekuensi, tetapi
frekuensi yang digunakan bukan frekuensi aktual melainkan frekuensi relatif.
Frekuensi relatif kadang-kadang dinyatakan sebagai persen.

Frekuensi relatif =

Distribusi Frekuensi Kumulatif 

Variasi lain dari distribusi frekuensi standar adalah frekuensi kumulatif. Frekuensi
kumulatif untuk suatu kelas adalah nilai frekuensi untuk kelas tersebut ditambah dengan
jumlah frekuensi semua kelas sebelumnya.

Perhatikan bahwa kolom frekuensi selain label headernya diganti dengan frekuensi
kumulatif kurang dari, batas- batas kelas diganti dengan “kurang dari” ekspresi yang
menggambarkan kisaran nilai-nilai baru. Variasi lain adalah Frekuensi kumulatif 
lebih dari. Prinsipnya hampir sama dengan prosedur di atas.

Presentasi Grafik Distribusi Frekuensi

Histogram
Histogram adalah merupakan bagian dari grafik batang di mana skala horisontal
mewakili nilai-nilai data kelas dan skala vertikal mewakili nilai frekuensinya. Tinggi
batang sesuai dengan nilai frekuensinya, dan batang satu dengan lainnya saling
berdempetan, tidak ada jarak/ gap diantara batang. Kita dapat membuat histogram setelah
tabel distribusi frekuensi data pengamatan dibuat.
Poligon Frekuensi
Poligon Frekuensi menggunakan segmen garis yang terhubung ke titik yang
terletak tepat di atas nilai-nilai titik tengah kelas. Ketinggian dari titik-titik sesuai dengan

ekuensi kelas, dan segmen garis diperluas ke kanan dan kiri sehingga grafik dimulai dan
berakhir pada sumbu horisontal.

Ogive
Ogive adalah grafik garis yang menggambarkan frekuensi kumulatif, seperti daftar
distribusi frekuensi kumulatif. Perhatikan bahwa batas-batas kelas dihubungkan oleh
segmen garis yang dimulai dari batas bawah kelas pertama dan berakhir pada batas atas
dari kelas terakhir. Ogive berguna untuk menentukan jumlah nilai di bawah nilai tertentu.
Sebagai contoh, pada gambar berikut menunjukkan bahwa 68 mahasiswa mendapatkan
nilai kurang dari 90.5.
Kurva Frekuensi
Kurva halus yang diperoleh dari poligon frekuensi atau disebut pula kurva frekuensi
umumnya digunakan untuk melihat bagaimana bentuk distribusi frekuensi atau model dari
populasi yang diselidiki. Ada berbagai bentuk kurva halus yang dapat dijumpai di dunia
nyata. Beberapa diantaranya adalah :

Kurva Simetris
Sebuah distribusi dikatakan simetris jika kurva frekuensinya bisa dilipat sepanjang
garis vertikal sehingga setengah bagian dari kurva bisa menutup setengah bagian lainnya

Dalam Gambar diatas kurva A, B, C, D, dan E adalah kurva simetris. Kurva A, B, dan
C sendiri adalah bentuk umum dari apa yang disebut distribusi normal. Ketiganya hanya
berbeda pada ketinggian atau kemerataan dari puncak kurva. Kurva normal seperti yang
ditunjukkan oleh kurva A merupakan kurva unik yang hanya bisa diplot secara tepat
berdasarkan pendekatan matematis.
Distribusi normal ini memegang peranan penting dalam analisis statistika lanjutan,
karena banyak analisis yang mengharuskan data yang dikumpulkan harus mengikuti distribusi
ini.

Kurva Non-Simetris

Pada prakteknya tidak semua data di dunia ini yang mengikuti distribusi normal. Ada  juga
data yang sedikit menyimpang dari distribusi normal seperti yang ditunjukkan oleh kurva F
dan G. Sebuah distribusi dikatakan miring ke kiri atau negatif  jika puncak kurva berada di
sebelah kanan atau landainya agak memanjang ke arah kiri (kurva F) dan miring ke kanan
atau  positif jika puncaknya berada disebelah kiri atau landainya agak memanjang ke arah
kanan (kurva G). Dalam prakteknya banyak fenomena ekonomi atau biologi yang
memperlihatkan bentuk distribusi seperti ini.
Bentuk lain yang cukup sering dijumpai adalah apa yang disebut kurva J atau kurva J-
terbalik.

Kurva J misalnya memperlihatkan fenomena tingkat pendapat di negara-negara kaya dimana


kurva menunjukkan peningkatan pada jumlah penghasilan yang tinggi, sedangkan kurva J
terbalik adalah fenomena pendapatan masyarakat di negara miskin.

Pengukuran dispersi, kemiringan, dan keruncingan data


A. Pengertian Dispersi Data
Dispersi atau penyebaran adalah pergerakan dari nilai observasi terhadap nilai rata-
ratanya. Rata-rata dari serangkaian nilai observasi tidak dapat diinterpretasikan secara
terpisah dari hasil dispersi nilai-nilai tersebut sekitar rata-ratanya. Makin besar variasi nilai,
makin kurang representative rata-rata distribusinya.
Ukuran penyebaran suatu kelompok data terhadap pusat data disebut dispersi atau
variasi atau keragaman data. Dispersi data digunakan untuk membandingkan penyebaran
dua distribusi data atau lebih.

Beberapa jenis pengukuran Dispersi adalah sebagai berikut:

1. Jangkauan (Range)
Selisih antara batas atas dari kelas tertinggi dengan batas bawah dari kelas
terendah.

r = nilai maksimum r = nilai maksimum – nilai minimum

2. Simpangan Rata-Rata (Mean Deviation)


Jumlah nilai mutlak dari selisih semua nilai dengan nilai rata-rata dibagi
banyaknya data.
 Data Berkelompok
 Data Tidak Berkelompok

3. Varians (Variance)
Rata-rata hitung deviasi kuadrat setiap data terhadap rata-rata hitungnya.
 Data Berkelompok

 Data Tidak Berkelompok

4. Standar Deviasi
Akar kuadrat dari varians dan menunjukkan standar penyimpangan data terhadap nilai rata-
ratanya.
 Data Berkelompok

 Data Tidak Berkelompok

 Menghitung Variansi dan Standar Deviasi dengan menggunakan kode (U)


5. Jangkauan kuartil dan jangkauan persentil 10-90
Jangkauan kuartil disebut juga simpangan kuartil atau semi antar kuartil atau deviasi kuartil
sedangkan jangkauan persentil 10-90 disebut
juga rentang persentil 10.90.

6. Koefisien Variasi
Koefisien Variasi, disebut dispersi relatif, dapat digunakan untuk membandingkan nilai-nilai
besar dengan nilai-nilai kecil. Sedangkan lima bentuk dispersi sebelumnya tidak bisa.

B. Kegunaan Ukuran Penyebaran Data

Dispersi Data adalah data yang menggambarkan bagaimana suatu kelompok data
menyebar terhadap pusatnya data atau ukuran penyebaran suatu kelompok data terhadap
pusatnya data.

Dispersi data sangat penting untuk membandingkan penyebaran dua distribusi data atau
lebih. Pusat data seperti rata-rata hitung, median dan modus hanya memberi informasi yang
sangat terbatas sehingga tanpa disandingkan dengan dispersi data menjadi kurang
bermanfaat dalam menganalisa data.

Kegunaan ukuran penyebaran antara lain sebagai berikut:

1. Ukuran penyebaran dapat digunakan untuk menentukan apakah nilai rata- ratanya benar-
benar representatif atau tidak. Apabila suatu kelompok data mempunyai penyebaran
yang tidak sama terhadap nilai rata-ratanya, maka dikatakan bahwa nilai rata-rata
tersebut tidak representatif.

2. Ukuran penyebaran dapat digunakan untuk mengadakan perbandingan terhadap


variabilitas data.

3. Ukuran penyebaran dapat membantu penggunaan ukuran statistika, misalnya dalam


pengujian hipotesis, apakah dua sampel berasal dari populasi yang sama atau tidak.

C. Kemiringan dan Keruncingan Data

1. Kemiringan Distribusi Data

Kemiringan adalah derajat atau ukuran dari ketidaksimetrisan suatu distribusi data. Tiga pola
kemiringan distribusi data adalah sebagai berikut:
Pengukuran kemiringan suatu distribusi data dapat diketahui dengan beberapa
cara, antara lain:

 Memperhatikan hubungan antara rata-rata hitung, median dan modus.


 Menggunakan koefisien Pearson.
 Menggunakan Momen ketiga.
 Menggunakan kotak diagram garis.

Rumus untuk menghitung derajat kemiringan distribusi data:

a. Rumus Pearson :

b. Rumus Momen :

 Data berkelompok

 Data tidak berkelompok

c. Rumus Bowley :
2. Keruncingan Distribusi Data

Keruncingan distribusi data adalah derajat atau ukuran tinggi rendahnya puncak suatu
distribusi data terhadap distribusi normalnya data. Keruncingan distribusi data
disebut juga kurtosis.

Ada tiga jenis derajat keruncingan:


 Leptokurtis : Distribusi data yang puncaknya relatif tinggi
 Mesokurtis : Distribusi data yang puncaknya normal
 Platikurtis : Distribusi data yang puncaknya terlalu rendah dan terlalu
mendatar.

Derajat keruncingan distribusi data ά4 dapat dihitung berdasarkan rumus berikut :


 Data berkelompok

 Data tidak berkelompok


D. Analisa Ukuran Penyebaran Data Menggunakan Ms. Excel

1. Analisa Kemiringan Distribusi Data (Skewness)

Skewness adalah derajat ketidaksimetrisan suatu distribusi. Jika kurva frekuensi suatu
distribusi memiliki ekor yang lebih memanjang ke kanan (mengacu dari meannya)
maka disimpulkan menceng kanan (positif) dan jika distribusi memiliki ekor yang
lebih memanjang ke kiri maka dapat disimpulkan menceng kiri (negatif). Secara
perhitungan, skewness adalah momen ketiga terhadap mean. Distribusi normal dan
distribusi simetris lainnya, misalnya distribusi t memiliki skewness 0.
Cara penulisan rumus skewness di excel :
Skew (number1, number2,...)
Dimana:
Number1, number2... berupal-255 argumen yang Kita ingin hitung skewnessnya. Kita juga
dapat menggunakan array tunggal atau referensi ke array, bukan argumen yang
dipisahkan oleh koma.

2. Analisa Keruncingan Distribusi Data (Kurtosis)

Kurtosis adalah derajat keruncingan suatu distribusi (biasanya diukur relatif terhadap
distribusi normal). Kurva yang lebih runcing dari distribusi normal dinamakan
Leptokurtik, yang lebih datar Platikurtik dan distribusi normal disebut Mesokurtik.
Kurtosis dihitung dari momen keempat terhadap mean.

Cara penulisan rumus kurtosis di excel:


Kurt (number1, number2....)

Dimana:
Number 1. number2, ... dapat berupa 1-255 argumen yang ingin dihitung kurtosisnya.
Anda juga dapat menggunakan array tunggal atau referensi ke array. bukan
argumen yang dipisahkan oleh koma.
3. Analisa Ukuran Penyebaran Data
Statistik Deskriptif adalah Statistik yang berfungsi untuk mendeskripsikan atau
memberikan gambaran terhadap objek yang di teliti melalui data sampel atau
populasi sebagaimana adanya, tanpa melakukan analisis dan membuat kesimpulan
yang berlaku untuk umum. Dalam Statistik Deskriptif ini akan dikemukakan
cara-cara penyajian data. dengan tabel biasa maupun distribusi frekuensi; grafik
garis maupun batang: diagram lingkaran: histogram dll, dan menghitung ukuran
penyebaran dan pemustan data seperti: Mean, Median, Mode, Standard Deviation,
Variance, Kurtosis, Skewness, Range, Minimum, Maximum, Sum, dan Count.

E. Cara Membaca Nilai Kurtosis dan Skewness

1. Nilai Skewness
Skewness diartikan sebagai kemiringan distribusi data. Yang dimaksud dengan
kemiringan data adalah besarnya pembagian data atau rata-rata sebaran data yang
biasanya di wujudkan denan bentuk lonceng, untuk data yang berdistribusi normal. Begitu
juga jika kita terapkan pada Skewness. Apabila skewness menunjukkan simetri maka
dikatakan data membentuk distribusi normal, apabila kemiringan distribusi data agak
condong ke kanan ditunjukkan dengan nilai skewness yang negative, selanjutnya apabila
kemiringan distribusi data condong ke kiri yang ditunjukkan bahwa nilai skewness positif.
Apabila nilai sk = 0, maka menunjukkan data berdistribusi normal. Sk < 0 kemiringan
ke kanan, dan sk > 0 kemiringan ke kiri. Sebagai contoh, jika diperoleh nilai sk = -0.807
adalah artinya merupakan nilai negatif, akan tetapi tidak jauh dari nilai, Berarti data
cenderung bendistribusi normal atau hampir normal.

2. Nilai Kurtosis
Kurtosis diartikan sebagai keruncingan distribusi data. Semakin runcing nilai kurtosis
akan menunjukkan data hampir mengumpul (homogen). Akan tetapi apabila nilai kurtosis
0 menunjukkan data normal, dan apabila nilai kurtosis semakin kecil, maka menunjukkan
data semakin tumpul (semakin menyebar dikatakan data tidak homogen).
Jika nilai kurtosis dekat nol maka data cenderung normal, apabila nilai kurtosis
negative berarti datanya tumpul atau cenderung melebar ke bawah, sebaliknya apabila
nilai kurtosis positif maka datanya bersifat runcing atau cenderung mengelompok
(homogen).
Sebagai contoh misalnya. Jika diketahui nilai ku = 1,06. Maks nilai kurtosis positif
yang lebih besar dari nol dan cukup jauh dari nol. Oleh karena itu, dikatakan datanya
cenderung runcing atan dengan kata lain cenderung homogen.

F. Uji Normalitas Skewness dan Kurtosis

Salah satu uji statistik adalah uji normalitas data. Uji normalitas berguna untuk
menentukan apakah data yang telah dikumpulkan merupakan distribusi normal atau
bukan. Pengujian normalitas akan mengarahkan teknik statistik apa yang akan digunakan
untuk uji pengambilan keputusan (statistik inferensi).
Metode statistik klasik dalam pengujian normalitas suatu data tidak begitu rumit.
Berdasarkan pengalaman empiris ahli statistik, data yang banyaknya lebih dari 30 (n>30),
sudah dapat diasumsikan berdistribusi normal. Tetapi untuk memberikan kepastian data
merupakan distribusi normal atau tidak, sebaiknya digunakan uji normalitas. Karena
belum tentu data yang lebih dari 30 bisa dipastikan berdistribusi normal, demikian juga
yang kurang dari 30 belum tentu tidak berdistribusi normal, untuk itu perlu suatu
pembuktian.

Berikut ini Beberapa Cara yang umum pada pengolahan data menggunakan SPSS dalam
menguji normalitas data:

1. Dengan melihat hasil nilai skewness kurtosis yang didapat melalui statistik
deskriptif
2. Kolmogorov-Smirnov dengan pendekatan koreksi Lillifors.
3. Kolmogorov Smimov untuk 1-sample K-S.

Cara dalam menguji Normalitas dari nilai Skewness dan Kurtosis yang diperoleh :
Uji normalitas dengan Skewness dan Kurtosis mempunyai kelebihan yang tidak
didapat diperoleh dari uji normalitas yang lain. Dimana dengan uji skewness/kurtosis akan
dapat diketahui diketahui grafik normalitas menceng ke kanan atau ke kiri, terlalu datar
atau mengumpul di tengah. Oleh karena itu, uji normalitas dengan Skewness dan Kurtosis
juga sering disebut dengan ukuran kemencengan data.
Dengan membandingkan antara nilai Statistic Skewness dibagi dengan Std Error
Skewness atau nilai Statistic Kurtosis dibagi dengan Std Error Kurtosis: Dimana jika skor
berada antara -2 dan 2 maka distribusi data normal.
Misal kita peroleh nilai Skewness = 0.022
Std error skewness = 0.427
Kurtosis = - 0.807
Std error kurtosis = -0.833
Nilai Ratio Skewness/Std Error Skewness = 0.022 / 0.427 = 0,05 <2
Nilai Ratio Kurtosis/Sid Error Kurtosis = -0.807 / 0.833 = -0.96 >-2

Uji normalitas dengan Skewness dan Kurtosis memberikan kelebihan tersendiri, yaitu
bahwa akan diketahui grafik normalitas menceng ke kanan atau ke kiri, terlalu datar atau
mengumpul di tengah. Oleh karena itu, uji normalitas dengan Skewness dan Kurtosis juga
sering disebut dengan ukuran kemencengan data.

Satu istilah dalam Kurva Normal adalah Skewness dan Kurtosis. Skewness berkaitan
dengan lebar kurva, sedangkan Kurtosis dengan tinggi kurva. Jika data terlihat sebarannya
normal. tapi kalau nilai kurtosisnya besar (salah satu kategori terlalu tinggi) maka tidak
normal. Dua nilai ini harus diperhatikan.

Nilai Kritis (Z) = Skewness / √ (6/N). Z tidak boleh lebih dari 2.58 (sig. 1%) dan 1.96
(sig. 5%). Untuk Kurtosis rumusnya juga sama.

ANALISA REGRESI & KORELASI SEDERHANA


• Analisis regresi digunakan untuk mempelajari dan mengukur hubungan statistik yang
terjadi antara dua varibel atau lebih variabel.
• Variabel tersebut adalah variabel X (variabel independent / variabel yang
mempengaruhi / variabel yang diketahui), dan variabel Y (variabel dependent /
variabel yang dipengaruhi/ variabel yang tidak diketahui)
• Analisis korelasi bertujuan untuk mengukur “seberapa kuat” atau “derajat kedekatan”,
suatu relasi yang terjadi antar variabel.
Macam hubungan antara 2 variabel

• Pada dasarnya hubungan antar 2 variabel dapat dibedakan atas:


1. Hubungan searah/positif

2. Hubungan bersifat kebalikan/negatif

3. Tidak ada hubungan


1. Hubungan searah/positif

Hubungan yang searah diartikan apabila perubahan variabel x (independent) akan


mempengaruhi variabel y (dependent) yang searah.

Atau jika variabel x bertambah, maka variabel y bertambah pula, dan sebaliknya.

• Contoh :
a. hubungan antara pengeluaran iklan (x) dan jumlah penjualan (y).

b. Hubungan antara penghasilan (X) dan pengeluaran konsumsi (Y)

2. Hubungan bersifat kebalikan/negatif

Dua variabel dikatakan mempunyai hubungan yang bersifat kebalikan atau negatip,
apabila perubahan variabel independent (x) akan mempengaruhi variabel dependent
(Y) pada arah yang berlawanan.

Artinya apabila variabel x bertambah, maka variabel y berkurang atau sebaliknya, jika
variabel x berkurang maka variabel y bertambah.

Contoh :

a. Hubungan antara usia kendaraan (X) dengan tingkat harga (Y).


b. Hubungan antara harga barang (x) dengan jumlah yang diminta (Y)
3. Tidak ada hubungan

Dua variabel dikatakan tidak punya hubungan apabila perubahan pada variabel
independent (x) tidak mempengaruhi perubahan pada variabel dependent (y).

Contoh :

Hubungan antara konsumsi pangan (x) dengan tingginya gedung (y).

REGRESI

regresi adalah persamaan matematika yang memungkinkan kita meramalkan nilai-nilai


variabel terikat (Y) dari nilai-nilai satu atau lebih variabel bebas (X)

Ada 2 cara penggambaran garis regresi :

1. Metode diagram berserak (The scatter diagram)


2. Metode jumlah kuadrat terkecil (The least square’s method)
Setelah ditetapkan bahwa terdapat hubungan logis di antara variabel, maka untuk mendukung
analisis lebih jauh, tahap selanjutnya adalah menggunakan grafik.

Grafik ini disebut diagram pencar, yang menunjukkan titik-titik tertentu. Setiap titik
memperlihatkan suatu hasil yang kita nilai sebagai varibel tak bebas maupun bebas
Diagram pencar ini memiliki 2 manfaat, yaitu :

- membantu menunjukkan apakah terdapat hubungan yang bermanfaat antara dua


variabel,
- dan membantu menetapkan tipe persamaan yang menunjukkan hubungan antara kedua
variabel tersebut.
Metode jumlah kuadrat terkecil

Regresi merupakan suatu alat ukur yang juga digunakan untuk mengukur ada atau tidaknya
korelasi antar variabelnya. Istilah regresi itu sendiri berarti ramalan atau taksiran.

Persamaan yang digunakan untuk mendapatkan garis regresi pada data diagram pencar
disebut persamaan regresi.

Untuk menempatkan garis regresi pada data yang diperoleh maka digunakan metode kuadrat
terkecil, sehingga bentuk persamaan regresi adalah sebagai berikut:

Y’ = a + b X

Dimana:

Y’: nilai estimate variabel terikat

a: titik potong garis regresi pd sumbu y (nilai estimate Y’ bila x=0)

b: gradien garis regresi (perub nilai estimate Y’ per satuan perubahan nilai x)

X: nilai variabel bebas

Kesamaan diantara garis regresi dan garis trend tidak dapat berakhir dengan persamaan garis
lurus. Garis regresi (seperti garis trend dan nilai tengah aritmatika) memiliki dua sifat
matematis berikut : (Y – Y’) = 0 dan (Y – Y’)2 = nilai terkecil atau terendah

Dengan perkataan lain, garis regresi akan ditempatkan pada data dalam diagram sedemikian
rupa sehingga penyimpangan (perbedaan) positif titik-titik terhadap titik-titik pencar di atas
garis akan mengimbangi penyimpangan negatif titik-titik pencar yang terletak di bawah garis,
sehingga hasil penyimpangan keseluruhan titik-titik terhadap garis lurus adalah nol.

Untuk tujuan di atas, perhitungan analisis regresi dan analisis korelasi dapat dipermudah
dengan menggunakan rumus dalam bentuk penyimpangan nilai tengah variabel X dan Y,
yaitu penyimpangan dari Oleh karena itu, dapat digunakan simbol berikut ini :
Nilai dari a dan b pada persamaan regresi dapat dihitung dengan rumus berikut :
Koefisien Regresi

• Adalah lereng garis regresi (nilai b)


• Nilai b positif , menunjukkan hubungan antara variabel x dan y searah atau
hubungannya positif.
• Nilai b negatif, menunjukkan hubungan antara variabel x dan y berlawanan arah atau
hubungannya negatif
• Besar kecilnya perubahan variabel x terhadap variabel y ditentukan besar kecilnya
koefisien regresi.
Perbedaan Regresi dan Korelasi

• Regresi menunjukkan hubungan antara variabel satu dengan variabel lainnya.


• Sifat hubungan dapat dijelaskan: variabel yang satu sebagai penyebab, variabel yang
lain sebagai akibat.
• Korelasi tidak menunjukkan hubungan sebab akibat, akan tetapi menunjukkan
hubungan antara variabel satu dengan yang lain.
Interpretasi penyimpangan standar terhadap garis regresi (standart error of estimate)

• Penyimpangan standar terhadap garis regresi diinterpretasikan sebagai penyimpangan


terhadap rata-rata.
• Semakin besar nilai Se semakin tersebar titik-titik yang berada di sekitar garis regresi.
• Apabila Se=0 atau penyimpangan standar terhadap garis regresi = 0, maka semua titik
berada di sepanjang garis regresi.
• Se=0 maka persamaan garis regresi dapat digunakan secara sempurna untuk menaksir
variabel dependen.
Koefisien Determinasi
• Adalah alat utama untuk mengetahui sejauh mana tingkat hubungan antara variabel x
dan y.
• Nilai koefisien determinasi antara 0  1
• Nilai koefisien determinasi = 1 menunjukkan hubungan sempurna.
• Nilai koefisien determinasi = 0 menunjukkan tidak ada hubungan.
• 81 artinya 81% perubahan dari variabel y ditentukan oleh variabel x.
Koefisien korelasi

• Adalah alat kedua untuk menjelaskan hubungan antara variabel x dan y.


• Koefisien korelasi merupakan akar dari koefisien determinasi ( )
• Koefisien korelasi menunjukkan arah hubungan antara variabel x dan y.
• Hubungan dua variabel ada yang positif dan negatif. Hubungan X dan Y dikatakan
positif apabila kenaikan (penurunan) X pada umumnya diikuti oleh kenaikan
(penurunan) Y.
• Sebaliknya dikatakan negatif kalau kenaikan (penurunan) X pada umumnya diikuti
oleh penurunan (kenaikan) Y.

Distribusi Peluang Teoritis

Distribusi teoritis adalah distribusi yang frekwensinya diturunkan secara matematis.


Pada distribusi frekwensi, frekwensinya diperoleh dari hasil observasi / pengamatan.
Perbedaan antara distribusi teoritis dan distribusi frekwensi dapat dilihat pada tabel hasil
observasi pelemparan sebuah mata uang sebanyak 100 kali
PERCOBAAN PERCOBAAN PERCOBAAN PERCOBAAN
SISI MATA UANG 1 2 3 4

SISI GAMBAR 54 61 59 41

SISI TULISAN 46 39 41 59

JUMLAH
100 100 100 100
PERCOBAAN

Kesimpulan dari percobaan tersebut akan sampai pada teori bahwa mata uang adalah
setimbang, artinya probabilita munculnya sisi gambar dan sisi tulisan adalah sama, yaitu 50%.
Distribusi teoritis munculnya sisi gambar dan tulisan dari pelemparan sebuah mata uang
logam sebanyak 100 kali seperti yang terlihat pada tabel. Berdasarkan tabel diketahui bahwa
frekwensi teoritis diperoleh dengan mengalikan probabilita dengan jumlah percobaan.

Jenis – jenis Distribusi teoritis

1. Distribusi teoretis diskrit

Suatu daftar/ distribusi dr semua nilai variabel random diskrit dgn probabilitas terjadinya
masing-masing nilai tersebut. Suatu fungsi f dikatakan merupakan fungsi probabilitas/
distribusi dr variabel random diskrit jika memenuhi syarat:

a. f(x) ≥ 0, x Є R
b. f(x) = 1
c. P(X=x) = f(x)

Contoh Soal :

Di dalam sebuah kotak terdapat 4 bola biru dan 2 bola kuning. Secara acak
diambil 3 bola. Tentukan distribusi probabilitas X, jika X menyatakan
banyaknya bola kuning yang terambil?

- Jumlah titik sampel = C36= 20 titik sampel

- Banyaknya cara mendapatkan bola kuning adalah Cx2

- Banyaknya cara mendapatkan bola biru adalah


- Distribusi probabilitasnya

P(X=x) =

Distribusi yg tergolong ke dlm distribusi ini antara lain :

a. Distribusi binomial
b. Distribusi hipergeometrik
c. Distribusi Poisson

2. Distribusi teoretis kontinu

Suatu daftar/ distribusi dr semua nilai variabel random kontinu dgn probabilitas terjadinya
masing-masing nilai tsb. Suatu fungsi f dikatakan mrp fungsi probabilitas/ distribusi
probabilitas variabel random kontinu x, jk memenuhi syarat:
a. f(x) ≥ 0, x Є R
b.


 f ( x ) dx  1

c.
b
P (a  X  b)   f ( x) dx
a

Distribusi yg tergolong distribusi teoritis kontinu antara lain :

a. Distribusi normal
b. Distribusi
c. Distribusi F
d. Distribusi t

Distribusi Normal
Distribusi peluang kontinu yang terpenting dalam seluruh bidang statistika adalah
distribusi normal. Distribusi normal merupakan suatu alat statistik yang sangat penting untuk
menaksir dan meramalkan peristiwa-peristiwa yang lebih luas. Grafiknya disebut kurva
normal, terbentuk lonceng seperti pada gambar 2.1. yang menggambarkan dengan cukup baik
banyak gejala yang muncul di alam, industri, dan penelitian. Pengukuran fisik di bidang
seperti percobaan meteorologi, penelitian curah hujan, dan pengukuran suku cadang yang
diproduksi sering dengan baik dapat diterangkan menggunakan distribusi normal.
Di samping itu, galat dalam pengukuran ilmiah dapat dihampiri dengan sangat baik
oleh distribusi normal. Pada tahun 1733, Abraham de Moivre menemukan persamaan
matematika kurva normal. Ini merupakan dasar bagi banyak teori statistika induktif. Distribusi
normal sering pula disebut distribusi Gauss untuk menghormati Karl Friedrich Gauss (1777-
1855) yang juga menemukan persamaannya waktu meneliti galat dalam pengukuran yang
berulang- ulang mengenai bahan yang sama.

Suatu peubah acak kontinu X yang distribusinya berbentuk lonceng seperti pada gambar 2.1
disebut peubah acak normal. Persamaan matematika distribusi peluang peubah normal
kontinu bergantung pada dua parameter dan yaitu rataan dan simpangan bakunya. Jadi
fungsi padat X akan dinyatakan dengan n (x, , ) .
Fungsi padat peubak acak normal X, dengan rataan dan variansi , ialah
2
 1  x   
1   
n ( x;  ,  )  e  2   

2
Fungsi kerapatan probabilitas dari distribusi normal diberikan dalam rumus berikut:

Keterangan:
π = 3,1416
e = 2,7183
µ = rata-rata
σ = simpangan baku

Beberapa sifat dari kurva fungsi kepadatan peluang (densitas) distribusi normal umum:
1. Kurvanya berbentuk lonceng dan simetrik di x = µ.
2. Rataan, median, modus dari distribusi berimpitan.
1
3. Fungsi kepadatan peluang mencapai nilai maksimum di x = µ sebesar 2 2 .
4. Kurvanya berasimtot sumbu datar x.
1
1 
f ( x)  e 2

5. Kurvanya mempunyai titik infleksi (x, f(x), dengan x = µ ± σ, 2 2


Mean , Variansi dan Fungsi Pembangkit Momen

Mean, variansi dari fungsi pembangkit momen dari distribusi normal umum adalah:
Mean E ( X )  
2
Variansi Var ( X )  
 t   2 t 2 
 
2
Pembangkit momen Mx(t )  e
 

Pr oof .

E( X )     x. f ( x)dx

  ( x   )2
1
  x.
 2 2
e 2 2
dx

(x  )
Misal z  , maka x   z dan dx  dz

Batas-batasnya x  0 maka z  0, dan x   maka z  .
  z2
1
E( X )   ( z   ).
 2 2
e 2
z dz

  z2   z2
 

2 
ze 2
dx 
2 

e 2
dx

  z2
z2 
karena f  x   z e merupakan fungsi ganjil, maka  ze 2
dz  0
2 2 
2
  2z
sehingga kita mencari dulu  e dx
2 
(x  )
Misal z  , maka x   z   dan dx   dz

Batas-batasnya x  0 maka z  0, dan x   maka z  
  z2

2 

e 2
dx

  ( x  ) 2
1 2 2 1
  e dx
 2 
  ( x  ) 2
1 2 2
  e dx
 2 2
  .(1)

Sehingga
2
 z2
  z
 
E( X )  
2 
z e 2
dx 
2 

e 2
dx

0 

Pr oof .
Var ( X )  E ( X   ) 2

 

( z   ) 2 f ( x)dx


 

( z   ) 2 f ( x)dx

  ( x   )2
1

2
 (z  ) e 2 2
dx
2
 2

x
Misakan p  , maka x     p, dx   dp

Batas-batasnya x  0 maka p  0, dan x   maka p  
  p2
2
p
2 2
Var ( X )  e 2
 dp
2 2 0

MGF Distribusi Normal

Penjelasan singkat mengenai distribusi normal dapat dilihat di artikel “Distribusi Normal”.
Artikel ini akan membahas tentang fungsi pembangkit momen atau moment generating
function (MGF) dari distribusi normal.
Pembahasan awal dari bagian ini adalah menurunkan persamaan MGF-nya. Selanjutnya
menurunkan momen pertama dan momen kedua berdasarkan persamaan MGF yang telah
diperoleh sebelumnya. Dari momen pertama dan kedua dapat diketahui rata-rata (mean) dan
varian.
p2 dt
misalkan t  maka p 2  2t , 2 p dp  2 dt maka
2 2t

2 2 1
 2t.e
t
Var ( X )  . dt
2 0 2t
2  1
2
 
2 0
t .e t dt
2

2 2  3 
  
 2
2 2 1  1 
  
 2 2
2
 

2
Mx (t )  E (etx )

e
tx
Mx (t )  f ( x) dx

2
 1  x 
1  
 
e
tx
Mx (t )  e 2 dx
 2 
2
 1  x 
1   
e
tx 2  
Mx (t )  e dx
2  

Misalkan , maka
Selanjutnya , sehingga
 1 2
1  z
Mx(t ) 
2  

e t ( t z   ) e 2
 dz
1
  z2
1 2  t ( t z   )
Mx(t ) 
2 e

dz
1
  z2
e t 2 

e
 tz
Mx(t )  dz
2 
1
 z2

e t 2  1
 tz   2t 2 
1 2 2
 t
Mx(t ) 
2 e

2 2
dz
1
 z2
e t
 2 
z 2  2  tz   2t 2  1
 2t 2
Mx(t ) 
2 

e e2 dz

1 2 2 1
t   t  z2
e 2  2

z 2 2  tz   2t 2 
Mx(t ) 
2 
e dz

1 2 2
t   t  1
 z2
e 2 2 z t 2
Mx(t ) 
2 
e dz

1 2 2 1
t   t  
e 2
2
Mx(t )  1
2  1 2
 
2
1 2 2
t   t
e 2
Mx(t )   2
2
1
t   2t 2
Mx(t )  e 2

Nilai Harapan X
Nilai Harapan X2

Nilai Harapan (X – E(X))2

Sebagai catatan, nilai harapan X merupakan rata-rata (mean) dan nilai harapan (X – E(X))2
merupakan varian.

Cara Membaca Tabel Distribusi Normal


Berikut adalah tabel distribusi normal standar, untuk P (X < x), atau dapat
diilustrasikan dengan luas kurva normal standar dari X = minus takhingga sampai dengan
X = x.
Contoh penggunaan tabel:
Hitung P (X<1,25)
Penyelesaian: 

Pada tabel, carilah angka 1,2 pada kolom paling kiri. Selanjutnya, carilah angka 0,05 pada
baris paling atas. Sel para pertemuan kolom dan baris tersebut adalah 0,8944.
Dengan demikian, P (X<1,25) adalah 0,8944.

Kelebihan dan Kelemahan Distribusi Normal

Metode yang juga dikenal dengan sebutan forceddistribution ini mendapatkan


namanya dari kenyataan bahwa para penilai yang terlibat memang “dipaksa” untuk
mendistribusikan nilai karyawan ke dalam sejumlah kategori kinerja yang sudah ditetapkan
persentase proporsinya. Biasanya, bentuk distribusi yang diterapkan adalah distribusi
normal, dimana persentase yang setara kecilnya ditempatkan di kutub kanan (terbaik) dan
kutub kiri (terburuk) sedangkan persentase yang lebih besar ditempatkan di bagian tengah —
di antara kedua kutub tersebut. Sebagai contoh, proporsi yang mungkin digunakan adalah:
Istimewa 10%, Memuaskan 20%, Berkinerja Bagus 40%, Perlu Peningkatan 20%, dan Tidak
Memuaskan 10%.
Adapun asumsi yang mendasari metode ini adalah bahwa, secara statistik, tingkat kinerja
karyawan terdistribusi mengikuti pola kurva normal. Jika berhasil diimplementasikan secara
efektif, metode distribusi normal bisa mendatangkan kelebihan berikut ini:
1. Mengurangi kemungkinan terjadinya bias penilaian.
Dengan memaksa penilai untuk mendistribusikan hasil penilaiannya, bias yang terjadi akibat
penilai terlalu murah hati (dimana semua karyawan dinilai bagus) atau terlalu pelit (dimana
semua karyawan dinilai buruk) bisa diminimalkan. Melalui penerapan metode ini, Ford —
misalnya— berhasil menurunkan bias kemurahan hati yang terjadi di metode penilaian kinerja
sebelumnya dimana 98% stafnya dinilai “memenuhi harapan” (Olson & Davis, 2003).
2. Meningkatkan objektivitas penilaian.
Karena harus memastikan penempatan setiap karyawan dalam suatu kategori, pada metode
distribusi normal, para penilai perlu mengevaluasi semua karyawan berdasarkan kriteria yang
sama. Dengan demikian, hasil penilaian mereka akan cenderung lebih objektif dibandingkan
jika setiap manajer menilai anak buah mereka berdasarkan kriteria mereka masing-masing.
3. Memfasilitasi terjadinya komunikasi yang spontan dan terbuka antara atasan dan
bawahan.
Metode ini menuntut para atasan untuk secara berkala memberikan umpan balik kepada anak
buah mereka. Tanpa kesediaan untuk sering menyampaikan umpan balik secara spontan dan
terbuka, sang atasan akan menghadapi kesulitan pada saat harus menjelaskan kepada anak
buahnya mengapa dia menempatkan si karyawan di kategori “tidak memuaskan”.
4. Membantu menetapkan konsekuensi kinerja yang tepat.
Dengan memaksa para atasan untuk mendistribusikan karyawan ke dalam kategori tertentu,
perusahaan bisa mengenali siapa saja yang berkinerja unggul, menengah, dan yang berkinerja
terendah. Jadi, secara terarah, perusahaan bisa memutuskan karyawan mana yang harus
diganjar dengan kompensasi dan promosi, karyawan mana yang patut dipertahankan dan
dikembangkan, serta karyawan mana yang perlu diputuskan hubungan kerjanya.
Di sisi lain, metode distribusi normal juga tidak lepas dari sejumlah kelemahan pokok yang
mengundang kritik:
1. Metode ini menggunakan sistem distribusi normal yang salah penerapannya.
Menurut Abelson (2001), model kurva lonceng mengasumsikan bahwa distribusi normal
akan terjadi pada sekelompokbesar subjek yang terbentuk secara acak, dan tidak
mengasumsikan hal yang sama untuk kelompok-kelompok kecil. Adapun yang dimaksud
dengan kelompok besar adalah kelompok yang setidaknya terdiri dari 1.000 – 1.500 anggota.
Pada kenyataannya, sejumlah perusahaan menerapkan model kurva lonceng ini pada
sekelompok kecil karyawan, yang jumlah anggotanya bahkan tidak lebih dari 50 orang.
Akibatnya, sebagian karyawan yang berkinerja bagus tetapi berada di kelompok unggul mau
tidak mau akan menderita karena terpaksa mendapatkan nilai buruk. Sebaliknya, beberapa
karyawan yang sebenarnya berkinerja biasa-biasa saja tetapi berada di kelompok yang
berkinerja lemah, akan menikmati inflasi nilai dan dianugerahi posisi sebagai 10%-20%
karyawan yang berkinerja terbaik — hanya karena memang harus ada yang dinilai paling
tinggi.
Sementara itu, asumsi acak yang digunakan juga dianggap tidak tepat. Kalau secara
statistik dinyatakan bahwa acak adalah situasi dimana setiap anggota populasi memiliki
peluang yang sama untuk terpilih menjadi anggota sampel, maka dengan jelas dapat
disimpulkan bahwa kelompok karyawan Anda bukanlah kelompok yang acak. Anda tidak
merekrut mereka secara acak, Anda tidak menempatkan mereka secara acak, Anda juga tidak
melatih dan memperlakukan mereka secara acak.
2. Ketika diterapkan secara konsisten, metode distribusi normal justru
membangkitkan tantangan baru yang menyulitkan.
Karena mengharuskan perusahaan untuk memecat karyawan yang dinilai berkinerja paling
rendah, setelah diimplementasikan selama beberapa tahun, metode ini justru semakin
mempersulit upaya membedakan karyawan yang berkinerja memuaskan dengan karyawan
yang berkinerja istimewa. Perbedaan di antara keduanya semakin menipis dan semakin tidak
kasat mata. Di sisi lain, karena standar kinerja karyawan yang semakin lama semakin
meningkat, perusahaan juga semakin sulit mendapatkan calon karyawan yang memenuhi
standar tersebut, yaitu karyawan yang kualifikasinya harus melebihi karyawan yang
sebelumnya dipecat.
3. Kategori yang digunakan tidak menunjukkan kinerja yang sebenarnya.
Pemaksaan nilai dan pengkategorian yang dipersyaratkan dalam metode distribusi normal
membuat karyawan diberi nilai dan ditempatkan di kategori yang belum tentu sesuai dengan
tingkat kinerja aktual mereka. Perusahaan yang berhasil mencapai target bisnisnya, misalnya,
dimana semua karyawannya memang berprestasi bagus dan berhasil mencapai target
perorangan mereka, dengan terpaksa harus tetap menempatkan 10% karyawannya di kategori
“tidak memuaskan”. Situasi semacam ini tentu tidak bisa dianggap objektif. Akibatnya,
seperti yang dikemukakan oleh Olson dan Davis, karyawan lebih sering merasa bahwa nilai
yang mereka terima sesungguhnya hanyalah nilai yang dibuat untuk memuaskan distribusi
yang telah ditetapkan perusahaan. Bukan merupakan refleksi dari kinerja aktual mereka.
4. Dipersepsi lebih sulit dan kurang fair dibandingkan metode penilaian
konvensional.
Persepsi yang timbul di kalangan mereka yang terlibat dalam implementasi metode
distribusi normal ini ditemukan dalam penelitian Schleicher, Bull dan Green (2008). Dengan
adanya persepsi semacam itu, tidak mengherankan jika kemudian teridentifikasi bahwa para
manajer umumnya kurang bereaksi positif terhadap metode tersebut (Lawler, 2002). Mereka
sering mengungkapkan komentar miring tentang metode itu, sehingga akhirnya para
karyawan pun berpandangan bahwa metode tersebut kurang fair dan dengan demikian tidak
mereka terima.
5. Terlalu memaksakan perbandingan kinerja antar-jabatan dalam upaya
mendapatkan peringkat kinerja seluruh karyawan.
Pertanyaannya adalah: Bagaimana Anda akan secara fair dan objektif membandingkan
kinerja seorang kepala departemen dengan kinerja seorang petugas administrasi? Atau kinerja
Kepala Departemen Pemasaran dengan Kepala Departemen SDM? Kriteria apa yang akan
Anda gunakan? Selain tidak mudah untuk dijawab dan diimplementasikan, pertanyaan itu
jelas mengusik rasa keadilan para pengemban jabatan yang diperbandingkan.
6. Merangsang tumbuhnya lingkungan kerja yang kompetitif sekaligus destruktif.
Upaya membandingkan tingkat kinerja, dan memasukkan karyawan ke dalam kategori
yang proporsinya sudah dibatasi dengan persentase tertentu, jelas membuat karyawan
terperangkap dalam situasi persaingan. Selalu mencoba menampilkan kinerja yang tidak
hanya sebaik mungkin, tetapi juga harus lebih baik dibandingkan kinerja rekan-rekan yang
lain, agar bisa masuk dalam kategori penilaian yang lebih tinggi dan terhindar dari
kemungkinan menjadi penghuni kategori terbawah.
Situasi semacam ini jelas menghambat terjadinya kerja sama di kalangan anggota kelompok
kerja. Apalagi jika karyawan mengetahui bahwa perusahaan memberikan perlakuan dan
kompensasi yang berbeda untuk setiap kategori penilaian.

PENDUGAAN PARAMETER

A. Pendahuluan
Statistika inferensia adalah cabang ilmu pengetahuan statistika yang mempelajari
tentang proses pengambilan keputusan tentang parameter berdasarkan suatu statistik.
Inferensi statistik mencakup semua metode yang digunakan dalam penarikan kesimpulan
atau generalisasi mengenai populasi. Karena adanya berbagai alasan seperti banyaknya
individu dalam populasi amatan, maka penelitian keseluruhan terhadap populasi tersebut
tidaklah ekonomis, baik tenaga, waktu, maupun biaya, maka penelitian hanya menggunakan
sampel saja. Harga – harga parameter hanya di-ESTIMASI-kan/diduga berdasarkan harga –
harga statistik sampelnya.
Pendugaan dalam kehidupan sehari – hari tidak dapat dihindari. Permasalahannya
adalah bagaimana pendugaan tersebut mendekati kebenaran. Oleh karena itu, statistika
induktif mengembangkan teori pendugaan (estimasi/penaksiran). Teori pendugaan
(ESTIMASI/ PENAKSIRAN) adalah suatu proses dengan menggunakan statistik sampel
untuk menduga parameter populasi dan dapat dikelompokkan dalam 2 bidang utama:
1. Pendugaan Parameter
Contoh:
Seorang calon dalam suatu pemilihan ingin menduga proporsi yang sebenarnya pemilih
yang akan memilihnya, dengan cara mengambil 100 orang secara acak untuk
ditanyai pendapatnya. Proporsi pemilih yang menyukai calon tersebut dapat
digunakan sebagai dugaan bagi proporsi populasi yang sebenarnya.
2. Pengujian Hipotesis
Contoh:
 Seorang peneliti masalah kedokteran diminta untuk memutuskan, berdasarkan
bukti-bukti hasil percobaan, apakah suatu vaksin baru lebih baik daripada yang
sekarang beredar di pasaran.
 Seorang insinyur ingin memutuskan, berdasarkan data contoh apakah ada
perbedaan ketelitian antara dua jenis alat ukur.
B. Metode Pendugaan Parameter
Metode Pendugaan Parameter suatu populasi dapat dibedakan menjadi dua:
1. Pendugaan Metode Klasik
Pendugaan dilakukan berdasarkan sepenuhnya pada informasi sampel yang diambil dari
populasi.
2. Pendugaan Bayes
Pendugaan dengan menggabungkan informasi yang terkandung dalam sampel dengan
informasi lain yang telah tersedia sebelumnya yaitu pengetahuan subyektif mengenai
distribusi probabilitas parameter.

Statistik yang digunakan untuk memperoleh sebuah dugaan bagi parameter populasi
disebut penduga atau fungsi keputusan. Sedangkan adalah sebuah nilai dugaan berdasarkan
sampel acak berukuran n.

Misal: Fungsi keputusan S2 (yang merupakan fungsi dari sampel acak yang
bersangkutan) adalah suatu penduga, sedangkan nilai dugaan s2 merupakan realisasinya.
Dalam membuat estimasi nilai parameter populasi, sebaiknya variable random nilai
statistik sampel tidak bervariasi terlalu jauh dari nilai parameter populasi yang konstan.

Misalnya, jika µ merupakan mean populasi dan X merupakan penduga bagi µ, maka
dalam menggunakan X sebagai penduga kita harus berharap variabel random X tidak akan
menyimpang terlalu jauh dari µ.

C. Sifat Penduga Yang Baik

Penduga yang baik memiliki beberapa sifat:

1. Tidak bias/ Unbiased


𝜃̂ Merupakan penduga tak bias (unbiased estimator) dari 𝜃 jika 𝐸(𝜃̂) = 𝜃. Sebuah
penduga dikatakan tak bias kalau rata-rata dari seluruh kemungkinan sampel akan sama
dengan nilai parameter dari populasi yang diduga

Contoh perbandingan penduga yang tidak bias dan penduga yang bias

Pada gambar (a) untuk menduga nilai sebagai penduga, hasilnya tidak
bias.

Sedangkan gambar (b) nilai disebut nilai bias, dan penduga disebut over
estimate

2. Efisien
𝜃̂ Merupakan penduga yang efisien (Efficient Estimator) bagi 𝜃 jika penduga 𝜃̂
memiliki varians atau standar deviasi yang lebih kecil dibandingkan dengan penduga
lainnya. Jika terdapat 2 penduga yang tak bias, dimana varians atau standar deviasi dari
penduga satu lebih kecil dibandingkan varians atau standar deviasi penduga kedua,
maka penduga satu relative lebif efisien dibandingkan dengan penduga kedua.

3. Konsisten
𝜃̂ Merupakan penduga yang konsisten (Consistent Estimator) bagi 𝜃 apabila nilai 𝜃̂
cenderung mendekati nilai parameter 𝜃 untuk n yang semakin besar mendekati tak
terhingga. Jadi ukuran sampel yang besar cenderung memberikan penduga titik yang
lebih baik dibandingkan ukuran sampel kecil.

4. Cukup
𝜃̂ Merupakan penduga yang cukup (Sufficient Estimator) bagi 𝜃 apabila 𝜃̂
mencakup seluruh informasi tentang penduga yang terkandung didalam sampel.

D. Cara Menduga Nilai Parameter

Nilai Pendugaan parameter dapat diestimasikan/diduga denga dua cara, yaitu:


1. Pendugaan Titik (Estimasi Titik)
Penduga titik adalah suatu nilai angka tertentu sebagai estimasi untuk parameter
yang tidak diketahui. Misal: menduga µ dengan 𝑋. Penduga titik menentukan suatu
bilangan tunggal berdasarkan sampel sebagai penduga dari parameter dengan cara:
2. Pendugaan Interval (Estimasi Interval)
Dalam prakteknya, pendugaan tunggal yang terdiri atas satu angka tidak
memberikan gambaran mengenai berapa jarak/ selisih nilai penduga tersebut terhadap
nilai sebenarnya. Hal ini didasarkan atas pertimbangan bahwa suatu nilai dugaan tidak
mungkin dapat dipercaya 100%.
Pendugaan interval menunjukkan pada interval berapa suatu parameter populasi
akan berada yang dibatasi oleh dua nilai, yang disebut nilai batas bawah dan nilai batas
atas.

Contoh: rata – rata modal akan terletak dalam interval antara 95 juta – 105 juta. Kita
mengharapkan bahwa nilai rata – rata sebenarnya akan terletak di dalam interval
tersebut. Interval yang demikian disebut interval keyakinan atau interval keyakinan.

Untuk membuat pendugaan interval, harus ditentukan terlebih dahulu besarnya


koefisien keyakinan atau tingkat keyakinan, yang diberi simbol 1 - . Besarnya nilai 1 -
, misalnya adalah 90%, 95%, 99%, atau yang lainnya. Perhatikan kurva normal berikut:
(luas kurva = 1 atau 100%)

Contoh: rata – rata modal terletak antara interval 95 juta – 105 juta (a = 95 juta, b = 105
juta) dan 1 - α= 0,90.
Intrepetasi: Kita memutuskan bahwa interval 95 – 105 akan memuat µ dengan
probabilitas sebesar 0,90. Dan kesalahan yang ditolerir adalah sebesar 0,10. Kesalahan
yang mungkin terjadi adalah bahwa interval tersebut tidak memuat µ.

 Rumus pendugaan interval rata – rata µ

Rumus ini berlaku untuk sampel besar (n ≥ 30) dari populasi yang tak terbatas atau dari
populasi terbatas akan tetapi penarikan sampel dilakukan dengan pengembalian.

Rumus ini berlaku untuk populasi terbatas, akan tetapi sampel sebanyak n diambil tanpa
pengembalian dari populasi N elemen dan 𝝈 diketahui.

Rumus ini berlaku untuk sampel kecil (n < 30) yang diambil dari populasi (𝜎 tidak
diketahui) dengan pengembalian. Rumus ini diperoleh dari rumus 1 dengan jalan
mengganti 𝜎 dengan s dan 𝑍𝑎/2 dengan 𝑡𝑎/2. Dimana:

 Elemen Estimasi Confidence Interval

 Level confidence (Tingkat kepercayaan)


i. Kepercayaan dalam interval yang berisi parameter populasi tak diketahui
 Presisi (jangkauan)
ii. Kedekatan pada parameter yang tidak diketahui
 Biaya
iii. Biaya digunakan untuk menentukan ukuran sampel

 Confidence Interval

 Ditentukan dengan 100 1 % ( −α )

Artinya:

 Interpretasi frekuensi relatif

Dalam proses yang lama, dari semua confidence interval yang dapat dibangun akan
berisi parameter yang tidak diketahui.

 Interval tertentu baik yang berisi parameter maupun yang tidak berisi
parameter

Tidak ada probabilitas yang terlibat dalam interval tertentu.

 Interval dan Level Confidence


 Faktor yang Mempengaruhi Besar Interval (Presisi) 

 Variasi Data
 Ukuran sampel:

 Level confidence: 100% (1 −α)

 Nilai Confidence Interval

 Confidence Interval 99%, Z = ± 2.575


 Confidence Interval 95%, Z = ± 1.96
 Confidence Interval 90%, Z = ± 1.645
 Confidence Interval 80%, Z = ± 1.28
 Margin Error :

3. Pendugaan Beda Dua Nilai Tengah

i. Asumsi: populasi independen, sampel besar


 Bila kita mempunyai dua populasi saling bebas dengan mean 1 dan 2 serta ragam

dan maka penduga titik bagi selisih antara 1 dan 2 adalah 𝑋̅ 1 − 𝑋̅ 2. Bila
dan adalah nilai tengah sampel acak bebas berukuran n1 dan n2 yang diambil dari

populasidengan ragam dan diketahui, maka selang kepercayaan 100(1-)%

bagi 1-2 adalah

 Jika dan tidak diketahui, tetapi n1 dan n2 >30, maka dan dapat

diganti dengan dan

Contoh:

Suatu ujian kimia diberikan kepada 50 siswa perempuan dan 75 siswa laki-laki. Siswa
perempuan mendapat nilai rata-rata 76 dengan simpangan baku 6, sedangkan siswa
laki-laki memperoleh rata-rata 82 dengan simpangan baku 8. Tentukan selang
kepercayaan 96% bagi selisih rata-rata nilainya.

Penyelesaian:
ii. Asumsi: Populasi independen, sampel kecil, ragam sama.

 Adapun penduga selang kepercayaan100(1-𝛼)% bagi 𝜇1-𝜇2 untuk sampel kecil;

bila dan tapi nilainya tidak diketahui adalah

 Dengan derajat bebas untuk distribusi t = v = n1 + n2 – 2 dan ragam gabungannya


adalah

iii. Asumsi: Populasi independen, sampel kecil, ragam beda.

 Selang kepercayaan 100(1-)% bagi 1-2 untuk sampel kecil; bila 1 2  2 2 dan
nilainya tidak diketahui:

 Dengan derajat bebas untuk distribusi t adalah:


iv. Asumsi: Berpasangan

Bila kita mempunyai dua populasi yang tidak saling bebas (berpasangan), selang
kepercayaan 100(1-)% bagi D=1-2 untuk pengamatan berpasangan tersebut
dengan v= n-1 adalah

Contoh:
Dua puluh mahasiswa tingkat satu dibagi dalam 10 pasang, tiap pasang diperkirakan
mempunyai IQ yang sama. Salah seorang dari tiap pasangan diambil secara acak dan
dimasukkan ke kelas khusus, sedangkan anggota pasangan yang lainnya dimasukkan
kedalam kelas biasa. Saat akhir semester, keduanya diberikan ujian yang sama dan
hasilnya adalah sebagai berikut:

Tentukan selang kepercayaan 98% bagi selisih sesungguhnya dalam kedua kelas.

Penyelesaian:

Pengamatan berpasangan, 𝜇1-𝜇2 = 𝜇𝐷 dan nilai 𝜇𝐷 diduga dengan rata-rata d = -1,6.


sehingga ragam selisih-selisih tersebut adalah
Selang ini memungkinkan 𝜇𝐷 sama dengan nol, sehingga tidak dapat disimpulkan
bahwa kelas yang satu lebih baik daripada kelas lainnya.

4. Pendugaan Ragam

Bila 𝑆 2 adalah ragam contoh acak berukuran n yang ditarik dari suatu populasi normal dengan

ragam , maka

Disebut Khi-kuadrat, yang sebaran penarikan contohnya disebut sebaran khi-kuadrat dengan
derajat bebas v = n-1.
Bila s2 adalah penduga titik bagi varians sampel acak berukuran n yang diambil dari suatu
populasi normal dengan varians 2, maka selang kepercayaan 100(1-)% bagi 2
adalah

adalah nilai-nilai dengan derajat bebas v = n-1.


Contoh:

Volume sepuluh botol berisi air mineral sebesar 46,4; 46,1; 45,8; 47; 46,1; 45,9; 45,8;
46,9; 45,2 dan 46 liter. Buat selang kepercayaan 95% bagi ragam volume botol.
Asumsikan data menyebar normal.

Penyelesaian:

Distribusi dan Uji Chi Kuadrat


Uji Chi Kuadrat adalah pengujian hipotesis mengenai perbandingan antara :
- frekuensi observasi/yg benar-benar terjadi/aktual
dengan
- frekuensi harapan/ekspektasi
frekuensi observasi → didapat dari hasil percobaan (o)
frekuensi harapan → didapat secara teoritis (e)
Contoh :
Sebuah dadu setimbang dilempar sekali (1 kali). Berapa nilai ekspektasi sisi-1, sisi-2, sisi-3,
sisi-4, sisi-5 dan sisi-6 muncul?
Kategori Sisi-1 Sisi-2 Sisi-3 Sisi-4 Sisi-5 Sisi-6
Frekuensi ekspektasi (e) 1/6 1/6 1/6 1/6 1/6 1/6
Jika dadu setimbang dilempar 120 kali maka masing-masing sisi akan muncul sebagai berikut
Kategori Sisi-1 Sisi-2 Sisi-3 Sisi-4 Sisi-5 Sisi-6
Frekuensi ekspektasi (e) 20 20 20 20 20 20
Frekuensi ekspektasi = 20 diperoleh dari 1/6 x 120

Dalam sebuah percobaan, apakah frekuensi observasi akan sama dengan frekuensi ekspektasi?

Bentuk Distribusi Chi Kuadrat (²)


Nilai ² adalah nilai kuadrat karena itu nilai ² selalu positif.

Bentuk distribusi ² tergantung dari derajat bebas(db)/degree of freedom dan luas daerah di
bawah kurva ² db; α
Perhatikan Tabel hal 178 dan 179 (Buku Statistika-2, Gunadarma)
Contoh:
nilai ² untuk db = 5 dengan luas daerah di sisi kanan kurva (α) = 0.010 adalah 15.0863

α 0.100 0.050 0.025 0.010 0.005


db
5 9.23635 11.0705 12.8325 15.0863 16.7496
Bentuk kurva x2

Daerah penolakan H0 → χ² > χ² tabel (db; α)

Pengunaan Uji ²
a. Uji Kecocokan = Uji kebaikan-suai = Goodness of fit
b. Uji Kebebasan
c. Uji beberapa proporsi
Bentuk hipotesis
H0: f0 = fe
H0: f0 ≠ fe

Uji Kecocokan
2.1 Penetapan Hipotesis Awal dan Hipotesis Alternatif
H0 : frekuensi setiap kategori memenuhi suatu nilai/perbandingan.
H1 : ada frekuensi suatu kategori yang tidak memenuhi nilai/
perbandingan tersebut.

Contoh 1 :
Pelemparan dadu 120 kali, kita akan menguji kesetimbangan dadu . Dadu setimbang jika
setiap sisi dadu akan muncul 20 kali.
H0 : setiap sisi akan muncul = 20 kali.
H1 : ada sisi yang muncul ≠20 kali.

Contoh 2:
Sebuah mesin pencampur adonan es krim akan menghasilkan perbandingan antara coklat :
Gula : Susu : Krim = 5 : 2 : 2 : 1
H0 : perbandingan Coklat : Gula : Susu : Krim = 5 : 2 : 2 : 1
H1 : perbandingan Coklat : Gula : Susu : Krim ≠ 5 : 2 : 2 : 1
statistik Uji (² hitung) :

k : banyaknya kategori/sel, 1,2 ... k


oi : frekuensi observasi untuk kategori ke-i
ei : frekuensi ekspektasi untuk kategori ke-i
Hitung frekuensi ekspektasi dengan nilai/perbandingan dalam H0
Derajat Bebas (db) = k - 1

Contoh
Berikut adalah hasil pengamatan dari pelemparan dadu 120 kali.

Kategori Sisi-1 Sisi-2 Sisi-3 Sisi-4 Sisi-5 Sisi-6


Frekuensi ekspektasi (e) 20 22 17 18 19 24
Dengan taraf nyata 5 % ujilah apakah dadu dapat dikatakan seimbang?

Jawab
1. H0 : Dadu setimbang → semua sisi akan muncul = 20 kali. H0: f0 = fe
H1 : Dadu tidak setimbang → ada sisi yang muncul ≠20 kali. H0: f0 ≠ fe
2. Statistik Uji χ²
3. Nilai α = 5 % = 0.05
k = 6 ; db = k - 1 = 6-1 = 5
4. Nilai Tabel χ²
db = 5; α = 0.05 → χ² tabel = 11.0705
5. Daerah Penolakan H0 jika χ² > χ² tabel (db; α) χ² > 11.0705
6. X 2 hitung :

oi ei oi-ei (oi-ei)2/ei
Sisi - 1 20 20 0 0
Sisi – 2 22 20 2 0.20
Sisi – 3 17 20 -3 0.45
Sisi – 4 18 20 -2 0.20
Sisi – 5 19 20 -1 0.05
Sisi - 6 24 20 4 0.80
X2 hitung = 1.70
7. Kesimpulan :
χ² hitung = 1.70 < χ² tabel
Nilai χ² hitung ada di daerah penerimaan H0
H0 diterima; pernyataan dadu setimbang dapat diterima
Uji Kebebasan :
Menguji ada tidaknya hubungan antar dua variabel
Contoh:
Kita ingin mengetahui apakah hobi ‘mengemil’ ada hubungannya dengan obesitas
Bentuk hipotesis:
H0 : variabel-variabel saling bebas (Tidak ada hubungan antar variabel)
H1 : variabel-variabel tidak saling bebas (Ada hubungan antar variabel)
Data pada pengujian ketergantungan (hubungan) variabel disajikan dalam bentuk Tabel
Kontingensi (Cross Tab)
Bentuk umum Tabel Kontingensi → berukuran r baris x k kolom

Kolom ke-1 Kolom ke-2 Total baris


Baris ke-1 Total baris ke-1
Baris ke-2 Total baris ke-2
Total kolom Total kolom ke-1 Total kolom ke-2 Total pengamatan
Wilayah kritis:
X2 htung > X2 db; α H0 ditolak
Derajat bebas =(r-1) (k-1)

Uji X2 hitung

oi j : frekuensi observasi baris ke-i, kolom ke-j


ei j : frekuensi ekspektasi baris ke-i, kolom ke-j
Frekuensi ekspektasi (harapan):

Contoh
Berikut adalah data jam kerja berdasarkan jenis kelamin (gender)

Angka dalam kotak merupakan fekuensi harapan


Apakah ada hubungan antara jam kerja dengan jenis kelamin? Gunakan taraf nyata 5 %.
Jawab

1. H0 : Gender dan Jam kerja saling bebas


H1 : Gender dan Jam kerja tidak saling bebas
2. Statistik Uji = χ²
3. Nilai α = 5 % = 0.05
4. Nilai Tabel χ² db = 2; α = 0.05 → χ² tabel = 5.99147
5. Daerah Penolakan H0 → χ²hitung > χ² tabel
χ²hitung > 5.99147

6. Perhitungan χ²

Frekuensi harapan :

Kesimpulan
χ² hitung = 0.4755 < χ² tabel = 5.99147)
χ² hitung ada di daerah penerimaan H0
H0 diterima, antar gender dan jam kerja saling bebas

Uji beberapa proporsi

Uji ini merupakan perluasan dari uji dua proporsi, pada uji ini kita dapat menguji lebih dari
dua proporsi

bentuk hipotesis :

H0 : p1= p2= p3=…=pk (semua proporsi sama)


H1 : p1; p2; p3;…; pk tidak semua sama
data pengamatan dapat disajikan sebagai berikut
contoh
1 2 … k
Keberhasilan x1 x2 … xk
(sukses)
Kegagalan n1-x1 n2-x2 … nk-xk
n1 n2 … nk
Derajat bebas = (baris-1) (kolom-1)= (2-1) (k-1)
Contoh
Berikut adalah data pengamatan tentang dukungan beberapa kelompok masyarakat terhadap
suatu kebijakan
Kelompok 1 Kelompok 2 Kelompok 3
Setuju 35 (35.10) 45 (44.81) 38 (38.09) 118
Tidak setuju 12 (11.9) 15 (15.19) 13 (12.91) 40
47 60 51 158
Angka dalam kurung merupakan frekuensi harapan.

Apakah proporsi masyarakat yang mendukung /setuju terhadap kebijakan sama? Gunakan
taraf nyata 5 %.
Jawab
1. H0 : proporsi masyarakat yang setuju sama
H1 : proporsi masyarakat yang setuju tidak semuanya sama
2. Statistik uji X2
3. Taraf nyata (α) = 5 %
4. Nilai Tabel X² : db = 2; α = 0.05 → χ² tabel = 5.99147
5. Daerah Penolakan H0 → χ²hitung > χ² tabel χ²hitung > 5.99147
6. Perhitungan

oi ei oi-ei (oi-ei)2/ei
Kel-1, setuju 35 35.1 - 0.1 0.0003
Kel-2, setuju 45 44.81 0.19 0.0008
Kel-3, setuju 38 38.09 - 0.09 0.0002
Kel-1, tidak setuju 12 11.9 0.1 0.0008
Kel-2, tidak setuju 15 15.19 - 0.19 0.002
Kel-3, tidak setuju 13 12.91 0.09 0.0006
X2 hitung = 0.0047
7. Kesimpulan
X2 hitung < X2 tabel 0.0047< 5.99147
H0 diterima
proporsi kelompok masyarakat yang setuju terhadap kebijakan sama

Anda mungkin juga menyukai