Modul Statistika

MODUL STATISTIKA I
BAB I
PENGETAHUAN DASAR STATISTIK
1.1 PengertianStatistika
Pada awalnya “statistik” berasal dari kata state yang berarti himpunan angka-angka,
kemudian berkembang bahwa setiap angka disebut statum dan lambat laun menjadi stato sampai
akhirnya menjadi kata statistik. Selanjutnya statistic diartikan sebagai besaran dalam sampel yang
dapat memberikan informasi mengenai suatu gejala atau fenomena. Besaran sampel ini
digunakan untuk menaksir parameter populasi. Parameter adalah ukuran-ukuran yang dikenakan
pada populasi.
Dalam perkembangan selanjutnya ada perbedaan pengertian antara statistic dan statistika.
Jika statistik adalah seperti yang dijelaskan di atas maka statistika adalah sekempulan konsep
dan metode untuk mengumpulkan data, menyajikan data, menganalisis data dan menarik
kesimpulan dalam situasi ada ketidak pastian dan variasi dari sekumpulan data.Variasi sering
ditimbulkan oleh perbedaan alat ukur, kesalahan operator yang melakukan pengukuran, metode
pengukuran atau bahan baku objek yang diukur berbeda. Sementara ketidakpastian sering terjadi
karena suatu sebab yang seringkali tidak bias diramalkan sebelumnya, atau karena gejala alam
yang fluktuasinya tidak bisa dipelajari.
1.2 Jenjang Keilmuan Statistika
Menurut jenjang keilmuannya statistika dibagi atas dua bagian yaitu statistika deskriptif
dan statistika inferensia. Statistika deskriptif sering disebut sebagai statistika deduktif yang
membahas tentang bagaimana merangkum sekumpulan data dalam bentuk yang mudah
dibaca dan cepat memberikan informasi, yang disajikan dalam bentuk table, grafik, nilai
pemusatan dan nilai penyebaran. Dalam statistika deskriptif belum dilakukan analisis sehingga
kesimpulan yang dapat ditarik sangat terbatas, yaitu hanya terbatas pada nilai pemusatan dan
penyebaran saja. Statistika inferensial disebut juga statistika induktif karena dapat
menganalisis dan mengambil kesimpulan dengan metode tertentu tentang suatu fenomena
berdasarkan sampel.
1.3 Kegunaan Statistika

Statistika memiliki banyak peranan dan fungsinya, diantaranya:
1. Statistika memberikan metode atau cara mencatat data yang matematis dan sistematis.
2. Statistika memberikan petunjuk bagi peneliti supaya berpola piker dan bekerja dengan
pasti serta mantap dalam melakukan suatu penelitian.
3. Statistika memberikan cara meringkas data kedalam bentuk yang mudah untuk dianalisa
dan jelas.
4. Statistika memberikan landasan berpikir yang logis untuk digunakan meramal secara
ilmiah terhadap suatu gejala atau kejadian.
5. Statistika merupakan alat bagi peneliti untuk menganalisa proses sebab akibat yang
kompleks dan rumit.
1
MODUL STATISTIKA I
Contoh penggunaan statistik dalam lingkup kehidupan sehari-hari antara lain:

 Dalam penelitian ilmiah atau dalam melakukan suatu riset, pada saat pengumpulan data,
data harus disajikan dalam bentuk yang ringkas, sehingga memudahkan untuk dianalisa
dan dapat memberikan informasi yang jelas serta dapat digunakan untuk menentukan
“kebijaksanaan” pada langkah berikutnya.
 Dalam dunia usaha, penentuan “produk polition” (kebijaksanaan produksi) suatu pabrik
misalnya, diperlukan suatu penguasaan konsep-konsep dasar serta prinsip kerja statistika,
maksudnya agar biaya produksi dapat ditekan sekecil mungkin.
 Dalam marketing, peran statistika erat sekali kaitannya dengan pembuat
keputusan/kebijakan dalam penjualan dan pemasaran.
 Dan masih banyak lagi contoh kegunaan statistika yang lainnya.
1.4 Data Statistika

1.4.1 PopulasidanSampel
Mempelajari statistika berarti mempelajari populasi melalui sampel. Karena itu penting
untuk memahami pengertian populasi dan sampel sejak awal. Populasi adalah keseluruhan dari
objek yang sedang diselidiki. Sedangkan sampel adalah sebagian dari populasi.
Suatu sampel harus diambil secara representative dari populasi supaya kesimpulan yang
diambil valid.Untuk mendapatkan sampel yang cukup mewakili keadaan yang sesungguhnya cara
pengambilan harus mengacu pada prinsip acak. Pengertian acak disini berarti tidak ada
kecenderungan dari siapapun untuk mendapatkan hasil tertentu. Prinsip acak juga dimaksudkan
untuk menjaminin dependensi antar hasil pengamatan. Artinya antara pengamatan satu dan
lainnya tidak saling bergantungan.
1.4.2 Pengumpulan Data
Ada beberapa cara untuk memperoleh data yaitu dengan:
1. Wawancara yang dipandu dengan daftar pertanyaan. Disini surveyor (pengumpul data)
bertanya secara aktif atau mengarahkan pertanyaan sesuai dengan panduan dan responden
hanya memberikan jawaban.
2. Pengisian angket (kuesioner). Berbeda dengan cara wawancara, kalau pada pengisian
angket, surveyor pasif dan yang mengisi daftar pertanyaan adalah responden tanpa
pengarahan dari surveyor.
3. Pengamatan data dikumpulkan berdasarkan pada hasil pengamatan (observasi) saja.
4. Pengukuran secara langsung. Pengumpulan data dengan cara melakukan pengukuran
dengan alat dapat dilakukan dilaboratorium atau di lapangan.
1.4.3 Macam-macam Data

Data atau kita sebut saja “data statistik”, menurut sifatnya dibagi menjadi dua bagian,
yaitu:
2
MODUL STATISTIKA I
1. Data Kuantitatif
Data kuantitatif adalah data yang berbentuk bilangan atau dinyatakan dalam
bentuk angka. Dilihat dari nilainya, kita kenal ada 2 macam data kuantitatif.
a. Data diskrit yaitu data hasil menghitung/membilang
Contoh : UNISLA memiliki 20 ruang belajar.
b. Data kontinyu yaitu data hasil mengukur
Contoh : Data berat badan, tinggi badan, dll.
2. Data Kualitatif
Data kualitatif adalah data yang dinyatakan dalam bentuk sifat/atribut
(bukanangka). Misalkan profesi (guru, mahasiswa), jenis kelamin (laki-laki, perempuan),
agama, dll.
1.4.4 SkalaPengukuran
Dalam operasional, terdapat beberapa cara pengukuran data, misalkan untuk menjawab
pertanyaan “apakah anda menyukai mata pelajaran statistika?” maka jawabannya dapat diukur
sepanjang skala tidak suka, suka dan sangat suka. Jika hendak mengukur berat suatu benda, maka
dapat dilakukan dengan timbangan yang mempunyai skala gram atau kilogram. Dua skala dalam
contoh tadi, yaitu skala untuk mengukur tingkat kesukaan dan skala untuk mengukur berat, jelas
merupakan skala yang berbeda. Ada beberapa skala yang bias digunakan yaitu:
a) Skala Nominal, yaitu skala yang hanya mempunyai cirri-ciri dapat membedakan atau
mengklasifikasikan objeksaja. Misalkan :suatu produk dapat dikelompokkan cacat dan
tidak cacat, jenis kelamin (laki-laki, perempuan), jenis pekerjaan (PNS, ABRI, Swasta,
Wiraswasta).
b) Skala Ordinal, yaitu mempunyai ciri-ciri dapat membedakan dan juga mempunyai
urutan (order), dimana setiap klasifikasi objek atau kategori pengukuran mempunyai
hubungan satu dengan yang lain. Misalkan klasifikasi sangat senang lebih tinggi
daripada senang, klasifikasi senang lebih tinggi dari pada tidak senang.
c) Skala Interval, yaitu skala pengukuran yang mempunyai ciri dapat membedakan,
mempunyai urutan dan interval yang sama, tetapi tidak mempunyai nilai nol mutlak.
Misalnya temperature: temperature 00 C tidak berarti tidak ada temperature/suhu.
d) Skala Rasio, yaitu skala yang mempunyai keempat ciri-ciri di atas yaitu dapat
membedakan, mempunyai urutan, mempunyai jarak (interval) dan mempunyai nilai nol
sejati. Pengertian nol sejati berarti jika suatu benda beratnya adalah nol maka benda
tersebut tidak mempunyai berat. Contoh rasioa dalah skala untuk mengukur berat,
panjang, isi dan sebagainya.
3
MODUL STATISTIKA I
BAB II
PENYAJIAN DATA
2.1 Distribusi Frekuensi
Distribusi frekuensi adalah pengelompokan data ke dalam beberapa kategori yang
menunjukkan banyaknya data setiap kategori, dan setiap data tidak dapat dimasukkan ke dalam
dua atau lebih kategori. Beberapa istilah yang perlu dipahami pada daftar distribusi frekuensi data
berkelompok, diantaranya adalah:
a) Kelas, yaitu kelompok dari data-data.
b) Batas Kelas adalah nilai-nilai ujung yang terdapat pada suatu kelas. Nilai ujung bawah pada
suatu kelas disebut batas bawah kelas dan nilai ujung atasnya disebut batas atas kelas. Batas
bawah kelas adalah nilai terendah dalam suatu interval kelas, sedangkan batas atas kelas
adalah nilai tertinggi dalam suatu interval kelas.
c) Tepi Kelas adalah nilai batas antara kelas yang memisahkan nilai antara kelas yang satu
dengan kelas lainnya. Nilai tepi kelas ada dua macam yaitu:
Tepi bawah = batas bawah – 0,5 Tepi atas = batas atas + 0,5
d) Panjang Kelas/Interval Kelas merupakan selisih antara tepi atas dengan tepi bawah kelas.
Setiap kelas mempunyai interval kelas yang sama. Interval kelas ditentukan sebagi berikut:
Interval kelas = tepi atas – tepi bawah
e) Titik Tengah Kelas/ Nilai Tengah Kelas merupakan nilai yang dianggap mewakili kelas itu.
Titik tengah kelas ditentukan sebagai berikut:
Titik tengah = (batas bawah + batas atas)
Langkah-langkah membuat distribusi frekuensi adalah:

1) Langkah pertama adalah mengurutkan data dari yang terkecil ke yang terbesar atau
sebaliknya.
2) Langkah ke dua adalah membuat kategori atau kelas yaitu data dimasukkan ke dalam
kategori yang sama, sehingga dalam satu kategori mempunyai karakteristik yang sama.
Untuk membuat kategori atau kelas yang baik, caranya adalah sebagai berikut:
a) Menentukan jumlah kategori/kelas dengan menggunakan rumus Sturges, yaitu:
Jumlah kelas (k) = 1+3,322 log n
b) Menentukan interval kategori. Interval kategori ditentukan sebagai berikut:
Interval kelas =
3) Langkah ke tiga adalah melakukan penturusan atau pentabulasian dari data mentah yang
sudah diurutkan ke dalam kelas interval yang sudah dihasilkan pada langkah ke dua.
Ketentuan dalam menyusun distribusi frekuensi adalah:
a) Tidak ada kelas yang tumpang tindih
4
MODUL STATISTIKA I
b) Setiap data hanya dapat masuk ke dalam satu kelas

c) Setiap interval kelas harus mempunyai ukuran yang sama
d) Jumlah kelas diusahakan minimal 5 dan tidak lebih 15 kelas
CONTOH:
Berikut ini adalah data perusahaan dan harga sahamnya yang diperoleh dari Indopos tanggal 28
Juni 2007. Data diambil dari 20 saham perusahaan di Bursa Efek Jakarta.
Perusahaan Harga Per 11. Central Protein 650
Lembar Saham Prima
(Rp) 12. Jababeka 215
1. Bakrie Plantation 1.580 13. Total 750
2. Bank Panin 1200 14. Telkom 9750
3. Bukit Asam 6600 15. Berlian 2050
4. Bumi Resource 2175 16. BCA 5350
5. Energy Mega 3600 17. Bank Mandiri 3150
6. Budi acid 310 18. Bank Niaga 840
7. Tunas Baru 580 19. Bhakti Investama 1280
8. Indofarma 290 20. Indofood 2075
9. Kimia Farma 365
10. Sentul city 530
Perusahaan Harga Per

Lembar Saham
(Rp)
Apabila anda tertarik menjadi investor pada pasar saham, apakah dengan data di atas , anda sudah
dapat menentukan pilihan ? Untuk membantu anda, statistik deskriptif memberikan bantuan
pemecahan dengan membuat distribusi frekuensi. Langkah-langkah membuat distribusi
frekuensinya adalah sebagai berikut:
5
MODUL STATISTIKA I
 Langkah pertama : mengurutkan harga saham di BEJ pada tgl 28 Juni 2007
Perusahaan Harga Per 11. Bhakti Investama 1280
Lembar Saham 12. Bakrie Plantation 1580
(Rp) 13. Berlian 2050
1. Jababeka 215 14. Indofood 2075
2. Indofarma 290 15. Bumi Resource 2175
3. Budi Acid 310 16. Bank Mandiri 3150
4. Kimia Farma 365 17. Energi Mega 3600
5. Sentul City 530 18. BCA 5350
6. Tunas Baru 580 19. Bukit Asam 6600
7. Central Protein 650 20. Telkom 9750
Prima 750
8. Total 840
9. Bank Niaga 1200
10. Bank Panin
Perusahaan Harga Per

Lembar Saham
(Rp)
 Langkah kedua : membuat kategori atau kelas.

1. Mengurutkan data dari yang terendah ke yang tertinggi
2. Menentukan jumlah kelas dengan menggunakan rumus Sturges
n = 20 jumlah kelas (k) = 1 + 3,322 log n
= 1 + 3,322 log 20
= 1 + 3,322 (1,301)
= 5,322 ≈ 6
3. Menentukan interval kelas
Interval Kelas =
= = 1589,17 ≈ 1590
Setelah diketahui bahwa jumlah kelas adalah 6 dan interval kelas 1590 sehingga dapat dibuat
kelas dengan interval sebagai berikut:
6
MODUL STATISTIKA I
Kelas ke- Interval Keterangan

1 215 – 1804 214,5 + 1590 = 1804,5
2 1805 – 3394 1804,5 + 1590 = 3394,5
3 3395 – 4984 3394,5 + 1590 = 4984,5
4 4985 – 6574 4984,5 + 1590 = 6574,5
5 6575 – 8164 6574,5 + 1590 = 8164,5
6 8165 – 9754 8164,5 +1590 = 9754,5
 Langkah ketiga : melakukan penturusan atau pentabulasian

Kelas ke- Interval Turus/Tally Jumlah
Frekuensi (f)
1 215 – 1804 |||| |||| || 12
2 1805 – 3394 |||| 4
3 3395 – 4984 | 1
4 4985 – 6574 | 1
5 6575 – 8164 | 1
6 8165 – 9754 | 1
Data mentah setelah dituruskan dalam interval kelas akan menjadi data berkelompok.
Setelah data dikelompokkan, maka anda akan lebih mudah menentukan kelompok saham mana
yang akan anda pilih. Karena setiap kelas mempunyai karakteristik yang sama, maka tidak ada
perbedaan antara memilih saham Bank Panin dibandingkan dengan saham Bank Niaga atau
Kimia Farma. Namun demikian, perusahaan dengan kelas berbeda akan mempunyai karakteristik
yang berbeda pula, misalnya Bank Niaga dan bank BCA, walaupun kedua perusahaan memiliki
bidang usaha yang sama, harga saham BCA jauh lebih baik dibandingkan dengan harga saham
Bank Niaga.
3.2 Frekuensi Relatif dan Frekuensi Kumulatif

3.2.1 Frekuensi relative
Frekuensi relative adalah frekuensi setiap kelas dibandingkan dengan frekunsi total.
Dengan mengubah bentuk dari frekuensi absolute menjadi frekuensi relative, maka anda bisa
melihat sebaran dalam bentuk prosentase, berapa banyak data yang masuk suatu kategori atau
kelas.
CONTOH:
Kita ingin mengetahui frekuensi relatif pada kelas dari distribusi frekuensi data harga saham di
BEJ pada tgl 28 Juni 2007.
Kelas ke- Interval Frekuensi (f) Frek Relatif (%) Keterangan
1 215 – 1804 12 60% (12/20) x 100%
7
MODUL STATISTIKA I
2 1805 – 3394 4 20% (4/20) x 100%

3 3395 – 4984 1 5% (1/20) x 100%
4 4985 – 6574 1 5% (1/20) x 100%
5 6575 – 8164 1 5% (1/20) x 100%
6 8165 – 9754 1 5% (1/20) x 100%
Dari frekuensi relative di atas, dapat diketahui lebih mudah berapa prosentase kelasnya. Kelas
pertama 60%, kedua 20%, ketiga 5%, keempat 5%, kelima 5% dan keenam 5%. Apabila investor
ingin membeli saham pada kisaran harga R p 215 – Rp 1804, maka ada 60% perusahaan yang bisa
dipilih, demikian seterusnya.
3.2.2 Frekuensi Kumulatif
Frekuensi kumulatif menunjukkan seberapa besar jumlah frekuensi pada tingkat kelas
tertentu. Frekuensi kumulatif diperoleh dengan menjumlahkan frekuensi pada kelas tertentu
dengan frekuensi kelas selanjutnya. Frekuensi kumulatif dibedakan dalam dua bentuk yaitu:
a) Frekuensi kumulatif kurang dari (fk ≤)
Merupakan penjumlahan dari mulai frekuensi kelas terendah sampai kelas tertinggi dan
jumlah akhirnya merupakan jumlah data (n).
b) Frekuensi kumulatif lebih dari (fk ≥)
Merupakan pengurangan dari jumlah data (n) dengan frekuensi setiap kelas dimulai dari
kelas terendah.
CONTOH:
Berikut ini adalah frekuensi kumulatif terhadap harga saham di BEJ tgl 28 Juni 2007.
Kelas ke- Interval Frekuensi (f) Frek kumulatif Frek Kumulatif lebih
kurang dari (fk ≤) dari (fk ≥)
1 215 – 1804 12 12 20
2 1805 – 3394 4 16 8
3 3395 – 4984 1 17 4
4 4985 – 6574 1 18 3
5 6575 – 8164 1 19 2
6 8165 – 9754 1 20 1
3.3 Diskripsi Data dengan Grafik

Apabila kita membaca laporan perkembangan sesuatu, maka banyak digunakan grafik.
Hal tersebut didasarkan atas asumsi bahwa manusia pada umumnya lebih tertarik dengan gambar
dan sesuatu yang ditampilkan dalam bentuk visual akan lebih mudah diingat daripada dalam
bentuk angka. Laporan dalam bentuk grafik akan memudahkan para eksekutif, tenaga
administrasi, maupun pembacanya untuk menarik sesuatu kesimpulan dengan cepat dan tanpa
kehilangan makna.
8
MODUL STATISTIKA I
3.3.1 Histogram
Histogram merupakan bentuk diagram yang mudah dipahami. Histogram merupakan
diagram balok, karena frekuensi disajikan dalam bentuk balok. Histogram menghubungkan
antara tepi kelas interval pada sumbu horizontal (X) dan frekuensi setiap kelas pada sumbu
vertical (Y).
CONTOH:
Berdasarkan data harga saham di BEJ, berikut disajikan dalam bentuk table dan dalam bentuk
grafik histogram.
Kelas Interval Batas Batas Atas Tepi Bawah Tepi Atas Kelas f
ke- Bawah Kelas Kelas
Kelas
1 215 – 1804 215 1804 215 - 0.5 = 214.5 1804 + 0.5 = 12
2 1805 – 3394 1805 3394 1805 - 0.5 = 1804.5 4
3 3395 – 4984 3395 4984 1804.5 3394 + 0.5 = 1
4 4985 – 6574 4985 6574 3395 – 0.5 = 3394.5 1
5 6575 – 8164 6575 8164 3394.5 4984 + 0.5 = 1
6 8165 – 9754 8165 9754 4985 – 0.5 = 4984.5 1
4984.5 6574 + 0.5 =
6575 – 0.5 = 6574.5
6574.5 8164 + 0.5 =
8165 – 0.5 8164.5
=8164.5 9754 + 0.5 =
9754.5
Histogram Harga Saham di BEJ

14
12
10
frekuensi
8
6
4
2
0
Tepi kelas interval harga saham
Dengan melihat grafik histogram di atas, terlihat bahwa frekuensi harga saham dari 20
perusahaan memiliki kurva condong ke kiri. Frekuensi dimulai dari yang besar, kemudian
9
MODUL STATISTIKA I
menurun. Grafik menunjukkan bahwa harga saham dari sebagian besar perusahaan berada pada
kisaran Rp 214,5 sampai Rp 1804,5
3.3.2 Poligon
Polygon hampir sama dengan histogram, perbedaannya histogram menggunakan balok,
sedangkan polygon menggunakan garis yang menghubungkan titik-titik yang merupakan
koordinat antara nilai tengah kelas dengan jumlah frekuensi pad kelas tersebut.
CONTOH:
Berdasarkan pada data harga saham 20 perusahaan di BEJ, berikut akan disajikan dalam bentuk
table dan grafik polygon.
Kelas ke- Interval Nilai tengah kelas Frekuensi
1 215 – 1804 (215 + 1804)/2 =1009.5 12
2 1805 – 3394 1805 + 3394)/2 = 2599.5 4
3 3395 – 4984 3395 + 4984)/2 = 4189.5 1
4 4985 – 6574 4985 + 6574)/2 = 5779.5 1
5 6575 – 8164 6575 + 8164)/2 = 7369.5 1
6 8165 – 9754 8165 + 9754)/2 = 8959.5 1
Grafik Poligon Harga Saham di BEJ

14
12
10
Frekuensi
8
6
4
2
0
1009,5 2599,5 4189,5 5779,5 7369,5 8959,5
Nilai tengah interval kelas harga saham
3.3.3 Kurva Ogif

Kurva ogif merupakan diagram garis yang menunjukkan kombinasi antara interval kelas
dengan frekuensi kumulatif. Kurva ogif menunjukkan frekuensi kumulatif pada setiap tingkat
atau kategori. Sumbu horizontal pada kurva ogif menunjukkan tepi interval kelas dan sumbu
vertical menunjukkan frekuensi kumulatif. Terdapat dua macam kurva ogif yaitu:
1. Kurva Ogif Positif
Kurva yang menghubungkan frekuensi kumulaif kurang dari (f k ≤) dengan tepi atas kelas
tiap-tiap kelas.
10
MODUL STATISTIKA I
2. Kurva Ogif Negatif

Kurva yang menghubungkan frekuensi kumulatif lebih dari (fk ≥) dengan tepi bawah kelas
tiap-tiap kelas.
CONTOH:
Berdasarkan kasus pada harga saham di BEJ, berikut akan disajikan dalam bentuk kurva ogif
positif dan ogif negative.
Kurva Ogif Positif Harga Saham di BEJ

25
Frek kumulatif kurang dari
20
15
10
0
214,5 1804,5 3394,5 4984,5 6574,5 8164,5 9754,5
Tepi atas kelas interval harga saham
Kurva Ogif Negatif Harga Saham di BEJ

25
Frek kumulatif lebih dari
20
15
10
0
214,5 1804,5 3394,5 4984,5 6574,5 8164,5 9754,5
Tepi bawah kelas interval harga saham
Latihan:
1. Data sangat diperlukan dalam setiap penelitian, dan data didistribusikan pada setiap kelas,
mengapa kelas diperlukan? Coba jelaskan!
2. Sebutkan berapa jenis distribusi yang Saudara ketahui, dan coba jelaskan satu per satu peran
setiap jenis distribusi tersebut!
3. Di bawah ini dikemukakan hasil pengamatan penjualan terhadap suatu perusahaan selama
100 hari, data tersebut dianggap mewakili penjualan perusahaan tersebut sepanjang tahun.
Data yang diamati adalah sebagai berikut:
11
MODUL STATISTIKA I
25 18 30 15 27 20 22 37 11 52
45 37 23 36 44 35 13 40 23 64
54 26 36 10 39 28 35 33 43 70
30 43 24 39 30 17 29 24 16 57
46 21 45 22 38 53 42 33 46 69
60 31 24 35 48 37 12 38 24 54
33 18 39 19 23 69 34 26 59 75
59 42 48 52 54 48 51 43 40 53
48 56 63 55 47 68 46 78 44 61
79 47 49 46 58 45 58 41 50 68
Susunlah data di atas kedalam distribusi frekuensi!

4. Susunlah data pada soal no. 3 kedalam distribusi komulatif dan distribusi presentase berikut
grafiknya!
5. Gambarlah histogram dari distribusi frekuensi soal no. 3, demikian juga dengan grafiknya!
12
MODUL STATISTIKA I
BAB III
UKURAN PEMUSATAN
Ukuran pemusatan adalah nilai tunggal yang mewakili suatu kumpulan data dan
menunjukkan karakteristik dari data. Ukuran pemusatan menunjukkan pusat dari nilai data.
3.1 Rata-rata Hitung
Rata-rata hitung merupakan nilai yang menunjukkan pusat dan nilai data dan
merupakan nilai yang dapat mewakili dari keterpusatan data. Rata-rata hitung merupakan
nilai yang diperoleh dengan menjumlahkan semua nilai data dan membaginya dengan jumlah
data.
3.1.1 Rata-rata Hitung Populasi
Rata-rata hitung populasi merupakan nilai rata-rata dari data populasi. Rata-rata hitung
populasi dihitung dengan cara:
∑
Dimana : µ : rata-rata hitung populasi X : Nilai data yang berada dalam

populasi
∑ : simbol dari operasi penjumlahan N : Jumlah total data dalam populasi
CONTOH:
Berikut ini adalah nilai kredit dalam triliun rupiah yang disalurkan oleh lima bank terbesar di
Indonesia pada tahun 2006. Berapa rata-rata hitung nilai kreditnya?
Bank Nilai Kredit
Danamon 41
BRI 90
BCA 61
Mandiri 117
BNI 66
Jawab:
∑
= 75
Jadi rata-rata hitung nilai kredit dari lima bank terbesar di Indonesia pada tahun 2006
adalah Rp 75 trilun.
3.1.2 Rata-rata Hitung Sampel
Rata-rata hitung sampel merupakan nilai rata-rata dari data sampel. Rata-rata hitung
sampel dihitung dengan cara:
∑
̅=
Dimana : ̅ : rata-rata hitung sampel X: nilai data yang berada dalam

sampel
∑ :simbol dari operasi penjumlahan n: jumlah total data dalam sampel
13
MODUL STATISTIKA I
CONTOH:
Pada tahun 2007 di BEJ tercatat 350 emiten. Misalkan dari seluruh emiten, sebanyak 37
perusahaan mengumumkan akan membagikan dividen untuk tahun buku 2006. Dari 37 emiten
tersebut, 9 perusahaan diambil laporan kinerja keuangannya. Data kinerja keuangan dari 9
perusahaan tersebut adalah sebagai berikut:
No. Nama Perusahaan Laba Bersih (Rp Total Aset (Rp
miliar) miliar)
1 PT. Indosat 436 22.598
2 PT. Telkom 7.568 42.253
3 PT. Aneka Tambang 123 2.508
4 PT. Astra Agro Lestari 180 2.687
5 PT. Bimantara Citra 392 4.090
6 PT. Alfa Retailindo 25 603
7 PT. H.M. Sampoerna 1480 10.137
8 PT. Mustika Ratu 15 287
9 PT. Astra Graphia 65 796
Dari data di atas, hitnglah rata-rata sampel untuk laba bersih dan total aset!
Jawab:
∑
̅̅̅ =
= = 1.142,67
Jadi rata-rata hitung laba bersih dari 9 perusahaan sampel yang membagikan dividen adalah Rp
1.142,67 miliar.
3.1.3 Rata-rata Data Berkelompok
Data berkelompok adalah data yang sudah dikelompokkan dalam bentuk distribusi
frekuensi. Rata-rata hitung untuk data berkelompok dirumuskan sebagai berikut:
∑
̅
Dimana: ̅̅̅ : rata-rata hitung data berkelompok x : nilai tengah masing-masing kelas
f : frekuensi masing-masing kelas n: jumlah total data
k : jumlah kelas/kategori
CONTOH:
Berikut adalah data yang sudah dikelompokkan dari 20 saham pilihan pada bulan Juni 2007.
Buatlah nilai rata-rata untuk harga saham pilihan tersebut!
14
MODUL STATISTIKA I
Interval Nilai Tengah Jumlah fixi

(Xi) Frekuensi (f)
160 – 303 231,5 2 463
304 – 447 375,5 5 1.877,5
448 – 591 519,5 9 4.675,5
592 – 735 663,5 3 1.990,5
736 – 879 807,5 1 807,5
Jumlah n= 20 9.814
Jawab:
∑
̅ = = 490,7
Jadi rata-rata harga saham pilihan untuk 20 perusahaan adalah Rp 490,7 / lembar.
3.2 Median
Median merupakan salah satu ukuran pemusatan. Median merupakan suatu nilai yang
berada ditengah-tengah data, setelah data tersebut diurutkan. Dapat dikatakan bahwa median
adalah nilai yang membagi data menjadi dua bagian yang sama. Dengan kata lain, 50% data
terletak di bawah median dan 50% data terletak di atasnya.
3.2.1 Median untuk Data Tidak Berkelompok

Median untuk data tidak berkelompok atau data yang tersebar, posisi/letaknya dapat dicari
dengan menggunakan cara sebagai berikut:
1. Letak dari median dapat dicari dengan rumus (n+1)/2
2. Apabila jumlah datanya ganjil, maka nilai median merupakan nilai yang letaknya
ditengah data.
3. Apabila jumlah datanya genap, maka nilai median merupakan nilai rata-rata dari dua data
yang letaknya berada di tengah.
CONTOH:
Berikut ini adalah data laba bersih dari 9 perusahaan. Carilah median untuk data tersebut:
1. Langkah pertama menentukan letak median yaitu (n+1)/2. Jumlah data ada 9 (n = 9),
maka letak median (9+1)/2 = 5.
2. Langkah kedua mengurutkan nilai laba bersih dari data.
Nama Perusahaan Laba Bersih (Rp Miliar)
PT. Mustika Ratu 15
PT. Alfa Retailindo 25
PT. Astra Graphia 65
PT. Aneka Tambang 123
PT. Astra Agro Industri 180 Letak median
PT. Bimantara Citra 392
PT. Indosat 436
15
MODUL STATISTIKA I
PT. H.M. Sampoerna 1.480

PT. Telkom 7.568
3. Nilai median terletak pada data ke-5 yaitu pada laba bersih sebesar Rp 180 miliar.
CONTOH:
Carilah nilai median untuk data berikut : 7, 3, 4, 8, 6, dan 2.
1. Langkah pertama menentukan letak median yaitu (n+1)/2 = (6+1)/2 = 3,5
2. Langkah kedua mengurutkan data : 2, 3, 4, 6, 7, 8
3. Letak median 3,5 terletak antara urutan letak 3 dan 4. Nilai mediannya adalah = 5.
3.2.2 Median untuk Data Berkelompok

Pengertian median untuk data berkelompok tetaplah sama yaitu nilai yang letaknya ada
ditengah data, sehingga data berada setengahnya di atas dan setengahnya di bawah. Pendugaan
nilai median untuk data berkelompok sebagai berikut:
1. Menentukan letak kelas dimana nilai median berada. Letak median untuk data
berkelompok adalah n/2, dimana n adalah jumlah frekuensi.
2. Melakukan interpolasi di kelas median untuk mendapatkan nilai median dengan rumus
sebagai berikut: Median = L +
Dimana: L = tepi bawah kelas yang memuat median f = frekuensi dimana kelas median
berada
n = jumlah total frekuensi i = besarnya interval kelas
Cf = frekuensi kumulatif sebelum kelas median berada
CONTOH:
Hitunglah median untuk data berkelompok di bawah ini.
Interval Frekuensi Tepi Bawah Frek
Kelas kumulatif
160 – 303 2 159,5 2
304 – 447 5 303,5 7
448 – 591 9 447,5 16
592 – 735 3 591,5 19
736 – 879 1 735,5 20
Penyelesaian:
1. Menentukan letak kelas median yaitu n/2. Karena data ada 20 (n = 20) maka letak median
20/2 = 10.
2. Berdasarkan pada kolom frekuensi kumulatif nilai 10 terletak pada kelas ke 3 dengan
interval 448 – 591.
3. Melakukan interpolasi nilai median dengan rumus:
Median = L + dimana i = tepi atas kelas – tepi bawah kelas
16
MODUL STATISTIKA I
= 447,5 + x 144 = 303,5 – 159,5 = 144
= 447,5 + 48 = 495,5
Jadi nilai median data tersebut adalah 495,5.
3.3 Modus
Modus adalah nilai pengamatan yang paling sering muncul. Kelebihan modus adalah
mudah ditemukan, dapat digunakan untuk semua skala pengukuran, serta tidak dipengaruhi oleh
nilai ekstrim. Namun modeus juga mempunyai kelemahan di antaranya kadang kala sekumpulan
data tidak mempunyai modus, sehingga semua data dianggap modus. Kelemahan lain kadangkala
sekumpulan data memiliki modus lebih dari satu. Oleh sebab itu, sebagai alah satu alat ukur,
modus relative jarang digunakan dibandingkan dengan rata-rata hitung dan median. Cara mencari
nilai modus:
1. Untuk data tidak berkelompok, maka modus adalah nilai yang sering muncul atau
frekuensi yang paling banyak.
2. Untuk data berkelompok, maka modus diperoleh dari rumus sebagai berikut:
Modus = L +
Dimana : L : tepi bawah kelas dimana modus berada

d1 : selisih frekuensi kelas modus dengan kelas sebelumnya
d2 : selisih frekuensi kelas modus dengan kelas sesudahnya
i : besarnya interval kelas
CONTOH :
Hitunglah modus dari data yang sudah dikelompokkan berikut ini:
Interval Frekuensi Tepi Bawah
Kelas
160 – 303 2 159,5
304 – 447 5 303,5
448 – 591 9 447,5 Letak modus
592 – 735 3 591,5

736 – 879 1 735,5
Penyelesaian :
1. Menentukan kelas modus yaitu kelas atau interval dengan frekuensi yang paling sering
muncul. Frekuensi paling banyak adalah 9, maka nilai modus berada pada kelas 448-591.
2. Melakukan interpolasi nilai modus dengan rumus:
Modus = L +
= 447,5 +
= 447,5 + x 144
17
MODUL STATISTIKA I
= 447,5 + 57,6
= 505,1
Jadi modusnya adalah 505,1 yaitu nilai/data yang paling sering muncul.
3.4 Ukuran Letak
Pada sub bab ini akan dibahas tentang ukuran letak yaitu ukuran yang menunjukkan pada
bagian mana data tersebut terletak pada suatu data yang sudah diurutkan. Ukuran letak yang
dibahas meliputi kuartil, desil dan persentil.
3.4.2 Kuartil
Kuartil adalah ukuran letak yang membagi data yang telah diurutkan menjadi 4 bagian
sama besar, atau setiap bagian dari kuartil sebesar 25%. Kuartil 1 (K1) membagi data sebelah kiri
sebesar 25% dan sebelah kanan 75%. Kuartil 2 (K2) membagi data menjadi dua bagian yang
sama yaitu sisi kanan dan sisi kiri sebanyak 50%. Kuartil 3 (K3) membagi data sebelah kiri
sebesar 75% dan sebelah kanan sebesar 25%.
Rumus mencari letak kuartil untuk data tidak berkelompok dan data berkelompok adalah
sebagai berikut:
Rumus Ukuran Letak

Ukuran Letak
Data Tidak Berkelompok Data Berkelompok
Kuartil 1 (K1) [1(n + 1)]/4 1n/4
Kuartil 2 (K2) [2(n + 1)]/4 2n/4
Kuartil 3 (K3) [3(n + 1)]/4 3n/4
Apabila letak kuartil berupa pecahan, atau tidak ada nilai yang pas pada letak tersebut
maka untuk menghitung nilai kuartil menggunakan rumus sebagai berikut:
NK = NKB + [(LK – LKB) / (LKA - LKB)] X (NKA - NKB)
Dimana:
NK : nilai kuartil
NKB : nilai kuartil yang berada di bawah letak kuartil
LK : letak kuartil
LKB : letak data kuartil yang berada di bawah letak kuartil
LKA : letak data kuartil yang berada di atas letak kuartil
NKA : nilai kuartil yang berada di atas letak kuartil
CONTOH :
Berikut adalah keuntungan bersih 8 perusahaan pada tahun 2007. Carilah K1, K2, dan K3.
PT. Alfa Retailindo 25
PT. Astra Agro Industri 180
18
MODUL STATISTIKA I

PT. Indosat 436
PT. Telkom 7.568
Penyelesaian:
Letak kuartil adalah: K1 = [1(n+1)]/4 = [1(8+1)]/4 = 9/4 = 2,25
K2 = [2(n+1)]/4 = [2(8+1)]/4 = 18/4 = 4,50
K3 = [1(n+1)]/4 = [3(8+1)]/4 = 27/4 = 6,75
Karena letak kuartil berupa pecahan, maka untuk menghitung nilai kuartil menggunakan rumus:
NK = NKB + [(LK – LKB) / (LKA – LKB)] X (NKA – NKB)
Jadi nilai kuartil untuk letak kuartil 2,25 (K1) adalah
NK = 65 + [(2,25 – 2 )/(3 - 2)] X (123 - 65)
= 65 + 14,5 = 79,5
Sedangkan nilai kuartil untuk letak kuartil 4,5 (K2) adalah
NK = 180 + [(4,5 - 4) / (5 - 4)] X (392 - 180)
= 180 + 106 = 286
Nilai kuartil untuk letak kuartil 6,75 (K3) adalah
NK = 436 + [(6,75 - 6) / (7 - 6)] X (1480 - 436)
= 436 + 783 = 1219
Untuk mencari nilai kuartil data berkelompok, maka dapat digunakan rumus sabagai
berikut:
NKi =L +
Dimana: NKi = nilai kuartil ke-i dimana i = 1, 2, 3

L = tepi bawah kelas dimana letak kuartil berada
n = jumlah data atau frekuensi total
Cf = frekuensi kumulatif sebelum kelas kuartil
Fk = frekuensi pada kelas kuartil
Ci = interval kelas kuartil
CONTOH:
Hitunglah K1, K2, dan K3 dari data kelompok di bawah ini:
Kelas kumulatif
160 – 303 2 159,5 2
K1
304 – 447 5 303,5 7
448 – 591 9 447,5 16 K2 dan K3
592 – 735 3 591,5 19
736 – 879 1 735,5 20
Penyelesaian:
19
MODUL STATISTIKA I
1. Menentukan letak kuartil K1 = (1 x 20) / 4 = 5 K2 = (2 x 20) / 4 = 10

K3 = (3 x 20) / 4 = 15
2. Melakukan interpolasi untuk mengetahui nilai kuartil dengan rumus:
NKi =L +
NK1 = 303,5 + x 144 = 303,5 + 86,4 = 389,9
NK2 = 447,5 + x 144 = 447,5 + 48 = 495,5
NK1 = 447,5 + x 144 = 447,5 + 128 = 575,5
3.4.3 Desil
Desil adalah ukuran letak yang membagi data yang telah diurutkan atau data berkelompok
menjadi 10 bagian sama besar atau setiap bagian dari desil sebesar 10%. Desil membagi data (n)
menjadi 10 bagian yang sama. D1 adalah kelompok data 10% pertama, D2 untuk data 20% dari
data pertama dan seterusnya sampai D9 yaitu kelompok data dari pertama sampai 90% dari urutan
data.
Rumus mencari letak desil untuk data tidak berkelompok dan berkeompok adalah:
Rumus Ukuran Letak

Ukuran Letak
Desil 1 (D1) [1(n + 1)]/10 1n/10
Desil 2 (D2) [2(n + 1)]/10 2n/10
Desil 3 (D3) [3(n + 1)]/10 3n/10
… … …
Desil 9 (D9) [9(n + 1)]/10 9n/10
Untuk jumlah data genap, maka letak desil berupa pecahan atau tidak ada nilai yang pas
pada letak tersebut, maka untuk menghitung nilai desil menggunakan rumus sebagai berikut:
ND = NDB + [(LD – LDB) / (LDA - LDB)] X (NDA - NDB)

Dimana:
ND : nilai desil
NDB : nilai desil yang berada di bawah letak desil
LD : letak desil
LDB : letak data desil yang berada di bawah letak desil
LDA : letak data desil yang berada di atas letak desil
NDA : nilai desil yang berada di atas letak desil
CONTOH:
Hitunglah desil ke-2, ke-5 dan ke-8 dari data berikut:
20
MODUL STATISTIKA I

PT. Alfa Retailindo 25 D2
PT. Astra Agro Industri 180 D5
PT. Indosat 436
D8
PT. Telkom 7.568
Penyelesaian:
1. Menentukan letak desil:
Letak D2 = [2(n+1)]/10 = [2(8+1)]/10 = 1,8
Letak D5 = [5(n+1)]/10 = [5(8+1)]/10 = 4,5
Letak D8 = [8(n+1)]/10 = [8(8+1)]/10 = 7,2
Karena letak desil berupa pecahan, maka nilai desil dapat diperoleh dengan:
ND = NDB + [(LD – LDB) / (LDA - LDB)] X (NDA - NDB)
2. Menentukan nilai desil.
 Nilai desil untuk letak desil 1,8 adalah
ND2 = 25 + [(1,8 – 1) / (2 – 1)] X (65 - 25)
= 25 + (0,8 x 40) = 57
ND5 = 180 + [(4,5 – 4) / (5 – 4)] X (392 - 180)
= 180 + (0,5 x 212) = 286
ND8 = 1.480 + [(7,2 – 7) / (8 – 7)] X (7.568 – 1.480)
= 1.480 + (0,2 x 6.088) = 2.697,6
Untuk mencari nilai desil data berkelompok, ada beberapa langkah, yaitu:
1. Menentukan letak desil dalam data yang sudah berbentuk distribusi frekuensi
2. Menentukan nilai desil dengan melakukan interpolasi dengan rumus sebagai berikut:
NDi =L +
Dimana:
NDi = nilai kuartil ke-i dimana i = 1, 2, 3 Cf = frekuensi kumulatif sebelum kelas
kuartil
L = tepi bawah kelas dimana letak kuartil berada Fk = frekuensi pada kelas kuartil
n = jumlah data atau frekuensi total Ci = interval kelas kuartil
CONTOH:
Hitunglah D2, D5 dan D9 dari data yang sudah dikelompokkan pada kasus 20 saham pilihan di
BEJ!
21
MODUL STATISTIKA I

Kelas kumulatif
160 – 303 2 159,5 2
D2
304 – 447 5 303,5 7
448 – 591 9 447,5 16 D5
592 – 735 3 591,5 19 D9
736 – 879 1 735,5 20
Penyelesaian:
1. Menentukan letak desil D2 = (2 x 20) / 10 = 4
D5 = (2 x 20) / 10 = 10
D9 = (3 x 20) / 10 = 18
2. Mencari nilai desil
NDi =L +
 Nilai desil (D2) untuk letak desil 4 adalah
ND2 = 303,5 + x 144 = 303,5 + 57,6 = 361,1
ND5 = 447,5 + x 144 = 447,5 + 48= 495,5
ND9 = 591,5 + x 144 = 591,5 + 96 = 687,5
3.4.4 Persentil
Percentil merupakan ukuran letak yang membagi data yang telah diurutkan atau data yang
berkelompok menjadi 100 bagian yang sama besar, atau setiap bagian dari desil sebesar 1%.
Percentil membagi data (n) menjadi 99 bagian yang sama. P 1 adalah kelompok data 1% pertama,
P2 untuk data 2% dari data pertama, dan seterusnya sampai P 99 yaitu kelompok data dari pertama
sampai 99% dari urutan data.
Rumus mencari letak persentil untuk data tidak berkelompok dan data berkelompok
adalah sebagai berikut:
Rumus Ukuran Letak
Ukuran Letak
Percentil 1 (P1) [1(n + 1)]/100 1n/100
Percentil 2 (P2) [2(n + 1)]/100 2n/100
Percentil 3 (P3) [3(n + 1)]/100 3n/100
… … …
Percentil 99 (P99) [99(n + 1)]/100 99n/100
22
MODUL STATISTIKA I
Untuk jumlah data genap, maka letak persentil berupa pecahan atau tidak ada nilai yang
terletak pada persentil tersebut, maka untuk menghitung nilai persentil menggunakan rumus
sebagai berikut:
NP = NPB + [(LP – LPB) / (LPA - LPB)] X (NPA - NPB)
Dimana:
NP : nilai Persentil
NPB : nilai Persentil yang berada di bawah letak Persentil
LP : letak Persentil
LPB : letak data Persentil yang berada di bawah letak Persentil
LPA : letak data Persentil yang berada di atas letak Persentil
NPA : nilai Persentil yang berada di atas letak Persentil
CONTOH:
Persaingan antara kereta api eksekutif dengan penerbangan untuk jurusan Jakarta-Surabaya dan
Jakarta-Yogyakarta semakin terasa. Oleh sebab itu, PT. KAI merencanakan akan mendiskon 25%
jenis tiket dengan harga tertinggi dan akan meningkatkan 35% jenis tiket dengan harga terendah.
Cobalah hitung mulai harga berapa yang harus di diskon dan sampai harga berapa harus
dinaikkan?
No. Jenis Kereta Harga (Rp Ribuan)
1 Taksaka 150
2 Sembrani 185
3 Bima 200
4 Gumarang 225
5 Argo Dwipangga 230
6 Argo Bromo Anggrek Pagi 250
7 Argo Bromo Anggrek Malam 260
8 Argo Bromo Anggrek Siang 285
Penyelesaian:
1. Pengertian 25% dari harga tertinggi adalah P75 yang diperoleh dari 100% - 25%.
Sedangkan untuk harga terendah 35% terendah adalah P35.
2. Menentukan letak persentil
Letak P75 = [75(n+1)]/100 = [75(8+1)]/100 = 6,75
Letak P35 = [35(n+1)]/100 = [35(8+1)]/100 = 3,15
3. Karena letak persentil berupa pecahan, maka nilai persentil dicari dengan menggunakan
rumus sebagai berikut.
NP = NPB + [(LP – LPB) / (LPA - LPB)] X (NPA - NPB)
 Nilai percentil 75% (P75) untuk letak percentil 6,75 adalah
23
MODUL STATISTIKA I
NP75 = 250 + [(6,75 - 6)/(7-6)] X (260 - 250)

= 250 + (0,75 X 10) = 257,5
Jadi untuk tiket kereta pai dengan harga di atas Rp 257.500 harus diberikan diskon.
 Nilai percentil 35% (P35) untuk letak percentil 3,15 adalah
NP35 = 200 + [(3,15 - 3)/(4-3)] X (225-200)
= 200 + (0,15 X 25) = 203,75
Jadi untuk harga tiket di bawah harga Rp. 203.750 harus dinaikkan dan besarnya
kenaikkan tergantung pada beberapa factor penting yang harus diperhatikan PT. KAI.
Untuk mencari nilai persentil data berkelompok ada beberapa langkah yang harus
dilakukan:
1. Menentukan letak persentil dalam data yang sudah terdistribusi frekuensinya
2. Menentukkan nilai persentil dengan melakukan interpolasi dengan rumus sebagai berikut:
NPi =L +
Dimana: NPi = nilai persentil ke-i dimana i = 1, 2, 3

L = tepi bawah kelas dimana letak persentil berada
n = jumlah data atau frekuensi total
Cf = frekuensi kumulatif sebelum kelas persentil
Fk = frekuensi pada kelas persentil
Ci = interval kelas persentil
CONTOH:
Berikut ini adalah 20 harga saham plihan di BEJ. Berdasarkan data tersebut hitunglah apakah
harga saham Rp 675 termasuk ke dalam 15% harga saham tertinggi?

Kelas kumulatif
160 – 303 2 159,5 2
304 – 447 5 303,5 7
448 – 591 9 447,5 16
592 – 735 3 591,5 19 P85
736 – 879 1 735,5 20

Penyelesaian:
1. Menentukan letak persentil
Pengertian 15% saham tertinggi adalah P85 yang diperoleh dari 100% - 15%.
P85 = (85 x n)/100 = (85 x 20) / 100 = 17
2. Mencari nilai persentil
NP85 =L +
24
MODUL STATISTIKA I
NP85 = 591,5 + X 144
= 591,5 + 48 = 639,5
P85 mempunyai nilai Rp 639,5 maka harga saham di atasnya termasuk dalam 15% harga
saham tertinggi. Dan saol harga saham yang dinyatakan adalah Rp. 675, maka perusahaan
tersebut termasuk ke dalam kelompok ini.
Latihan :
1. Berikut disajikan data: 24 25 20 28 33 30 35 33 25 25
Tentukan:
a. Rata-rata hitungnya
b. Median
c. Modus
2. Wawancara dilakukan terhadap 140 orang pedagang pada pasar tradisional, untuk
mengetahui keuntungan yang dibawa pulang setelah dagangan habis terjual. Hasil
wawancara adalah seperti pada tabel berikut:
Tabel Distibusi Keuntungan Pedagang Pasar Tradisional
No Keuntungan Jumlah Pedagang
1. 50.000-74.000 3
2. 75.000-99.000 16
3. 100.000-124.000 25
4. 125.000-149.000 46
5. 150.000-174.000 35
6. 175.000-199.000 13
7. 200.000-224.000 2
Tentukanlah:
a. Rata-rata hitung data di atas
b. Modus data di atas
c. Median data di atas
3. Berikut dikemukakan sebuah distribusi yang belum lengkap, menyangkut hasil penjualan
mingguan dari para penjual sayur di kota Lamongan. Distribusi penjualannya dikemukakan
seperti pada tabel berikut:
Tabel Penjualan Pedagang Sayuran
No Penjualan Mingguan Jumlah Pedagang
1. ... -- ... 13
2. ... -- ... 18
3. ... -- ... 22
4. ... -- ... 34
5. ... -- ... 21
6. ... -- ... 15
7. ... -- ... 11
8. ...-- 499.990 6
Tentukan:
25
MODUL STATISTIKA I
a. Bila batas bawah kelas pertama dimulai dengan penjualan Rp. 100.000,-. Lengkapilah
seluruh batas kelas tersebut dengan interval kelas Rp. 50.000,-
b. Hitunglah D6
c. Hitunglah P10
26
MODUL STATISTIKA I
BAB IV
UKURAN KERAGAMAN
Ukuran keragaman adalah suatu ukuran baik parameter atau statistic untuk mengetahui seberapa
besar penyimpangan data dengan nilai rata-rata hitungnya.
4.1 Ukuran Keragaman untuk Data yang Tidak Dikelompokkan
4.1.1 Jarak (Range)
Jarak atau kisaran nilai (Range) merupakan perbedaan antara nilai terbesar dan terkecil
dalam suatu kelompok data baik data populasi atau sampel. Semakin kecil ukuran jarak
menunjukkan karakter yang lebih baik, karena data mendekati nilai pusat.
Jarak (Range) = Nilai Terbesar – Nilai Terkecil
CONTOH:
Berikut adalah laju inflasi dari Negara Indonesia, Malaysia dan Thailand. Hitunglah jarak (Range)
– nya! Apa komentar anda?
Laju Inflasi (%)
Tahun
Indonesia Thailand Malaysia
2002 10 2 2
2003 5 2 1
2004 6 3 2
2005 17 6 4
2006 6 3 3
Penyelesaian :
Nilai Indonesia Thailand Malaysia
Tertinggi 17 6 4
Terendah 5 2 1
Jarak 17 – 5 = 12 6–2=4 4–1=3
Apa komentar anda ?

Jawab:
Range laju inflasi Negara Indonesia sebesar 12. Nilai Range terkecil adalah Malaysia yang diikuti
dengan Thailand. Besarnya Range menunjukkan selisih nilai terbesar dan terkecil sehingga
menunjukkan fluktuasi. Oleh sebab itu dapat disimpulkan bahwa Indonesia mempunyai Range
laju inflasi terbesar maka fluktuasi dan gejolak harga atau ekonomi yang terjadi juga paling besar.
4.1.2 Varians dan Standar Deviasi
Varians dan standar deviasi adalah sebuah ukuran penyebaran yang menunjukkan standar
penyimpangan atau deviasi data terhadap nilai rata-ratanya.
Varians adalah rata-rata hitung deviasi kuadrat setiap data terhadap rata-rata hitungnya.
27
MODUL STATISTIKA I
Varians dapat dibedakan antara varians populasi dan varians sampel. Varians populasi adalah
deviasi kuadrat dari setiap data terhadap rata-rata hitung semua data dalam populasi. Varians
populasi dapat dirumuskan sebagai berikut:
∑ ∑
ingat bahwa
Dimana: σ2 = varians populasi

X = nilai setiap data / pengamatan dalam populasi
µ = nilai rata-rata hitung populasi
N = jumlah total data / pengamatan dalam populasi
CONTOH:
Hitunglah varians dari pertumbuhan ekonomi negara maju berikut ini!
Tahun Xi Xi - µ (Xi - µ)2
1994 3,2 0,6 0,36
1995 2,6 0,0 0
1996 3,2 0,6 0,36
1997 3,2 0,6 0,36
1998 2,2 -0,4 0,16
1999 2,0 -0,6 0,36
2000 2,3 -0,3 0,09
2001 2,1 -0,5 0,25
Jumlah 20,8 1,94
∑ ∑
Jadi varians data pertumbuhan ekonomi negara maju adalah 0,24.

Nilai varians sebagai ukuran keragaman juga mempunyai kelemahan. Nilai varians dalam bentuk
kuadrat, dalam hal tertentu lebih sulit menginterpretasikannya. Oleh sebab itu, untuk memperoleh
satuan yang sama dengan satuan data awal, maka dilakukan dengan mencari akar kuadrat dari
varians populasi. Akar kuadrat dari varians populasi disebut dengan standar deviasi. Standar
deviasi adalah akar kuadrat dari varians dan menunjukkan standar penyimpangan data terhadap
nilai rata-ratanya.
Rumus standar deviasi populasi dinyatakan dengan:
∑
√
CONTOH:
Hitunglah standar deviasi dari pertumbuhan ekonomi negara maju !
Jawab:
Diketahui pada contoh sebelumnya bahwa σ2 untuk negara maju adalah 0,24. Maka nilai standar
deviasinya dapat dihitung sebagai berikut:
28
MODUL STATISTIKA I
∑
√ √ √
Jadi standar deviasi data pertumbuhan ekonomi negara maju adalah 0,49.
Varians Sampel
Varians Sampel adalah deviasi kuadrat dari setiap data rata-rata hitung terhadap semua data
dalam sampel, dimana sampel adalah bagian dari populasi. Varians sampel dirumuskan sebagai
berikut:
∑ ̅ ∑
̅
Dimana: s2 = varians sampel

X = nilai setiap data / pengamatan dalam sampel
̅ = rata-rata hitung dalam sampel
n = jumlah total data / pengamatan dalam sampel
Standar Deviasi Sampel
Standar deviasi sampel merupakan akar kuadrat dari varians sampel, sehingga dirumuskan
sebagai berikut:
∑ ̅
√
CONTOH:
Hitunglah varians sampel dan standar deviasi pertumbuhan ekonomi negara maju dari tahun
1994-2001 dengan sampel untuk data tahun yang ganjil saja.
Tahun Pertumbuhan Ekonomi (%) Negara
Maju
1995 2,6
1997 3,2
1999 2,0
2001 2,1
Penyelesaian :
Xi Xi - ̅ (Xi - ̅ )2
2,6 0,1 0,01
3,2 0,7 0,49
2,0 -0,5 0,25
2,1 -0,4 0,16
29
MODUL STATISTIKA I
∑ ∑ ̅
Nilai rata-rata hitung sampel:

∑
̅
Varians sampel negara maju:

∑ ̅
Standar Deviasi negara maju :

√ √
4.2 Ukuran Keragaman untuk Data yang Dikelompokkan
4.2.1 Jarak (Range)
Range pada data berkelompok adalah selisih antara batas atas dari kelas tertinggi
dengan batas bawah dari kelas terendah.
CONTOH :
Berikut adalah data yang sudah dikelompokkan dari harga saham pilihan pada bulan Juni 2007 di
BEJ. Hitunglah range dari data tersebut!
Kelas Interval Jumlah Frekuensi
1 160 - 303 2
2 304 – 447 5
3 448 – 591 9
4 592 – 735 3
5 736 – 879 1
Penyelesaian :
Range = batas atas kelas tertinggi – batas bawah kelas terendah
= 879 – 160 = 719
4.2.2 Varians dan Standar Deviasi Data Berkelompok
Varians untuk data berkelompok hampir sama dengan varians data tunggal, namun
dikalikan dengan frekuensi setiap kelasnya. Varians data berkelompok dirumuskan sebagai
berikut:
∑ ̅ ∑
̅
Dimana : s2 = varians sampel

f = jumlah frekuensi setiap kelas
x = nilai tengah setiap kelas
̅ = nilai rata-rata hitung dalam sampel
n = jumlah sampel
30
MODUL STATISTIKA I
k = banyaknya kelas / kategori

sedangkan untuk standar deviasi data berkelompok dirumuskan sebagai berikut:
∑ ̅
√
CONTOH:
Hitunglah varians dan standar deviasi dari data harga saham pilihan pada bulan Juni 2007 di BEJ.
Interval Nilai F fi.xi xi - ̅ (xi - ̅ )2 fi (xi - ̅ )2
tengah(xi)
160 – 303 231,5 2 463 -259,2 67184,64 134369,28
304 – 447 375,5 5 1877,5 -115,2 13271,04 66355,2
448 – 591 519,5 9 4675,5 28,8 829,44 7464,96
592 – 735 663,5 3 1990,5 172,8 29859,84 89579,52
736 – 879 807,5 1 807,5 316,8 100362,24 100362,24
Jumlah 20 9814 398131,2
∑
̅
Varians dari sampel adalah

∑ ̅
Standar deviasi dari sampel adalah

s=√ √
4.3 Koefisien Standar Deviasi

Koefisien standar deviasi adalah ukuran penyebaran yang menggunakan standar deviai
relatif terhadap nilai rata-rata yang dinyatakan sebagai persentase. Koefisien standar deviasi
dinyatakan dalam bentuk rumus:
KSD = ̅
Dimana : KSD = koefisien standar deviasi dalam %

s = standar deviasi
̅ = nilai rata-rata data
CONTOH :
Berdasarkan standar deviasi dan nilai rata-rata untuk pertumbuhan ekonomi negara maju dan
Indonesia, hitunglah koefisien standar deviasinya!
Penyelesaian:
Negara maju s = 0,55 ̅ = 2,5
KSD = (0,55 / 2,5) X 100%
= 22%
31
MODUL STATISTIKA I
Indonesia s = 2,1 ̅ = 5,3

KSD = (2,1 / 5,3) x 100%
= 39,6 %
Koefisien standar deviasi untuk Indonesia 39,6% sedangkan negara maju 22%. Penyebaran
pertumbuhan ekonomi Indonesia hampir 2 kali dibandingkan negara maju. Hal tersebut
disebabkan oleh kenyataan bahwa pada tahun 1990-an Indonesia mengalami pertumbuhan
ekonomi yang tinggi, namun sejak tahun 1997 terjadinya krisis telah mengakibatkan
pertumbuhan ekonomi turun bahkan sampai -13,7%.
Latihan:
1. Pada suatu hari mall menginventarisir pembeli, maka dari hasil inventarisasi diketahui bahwa
dari 100 orang konsumen berpengeluaran sebagai berikut:
No Jumlah Belanja Jumlah Konsumen
1. 5000-49.900 10
2. 50.000-99.900 15
3. 100.000-149.900 20
4. 150.000-199.900 25
5. 200.000-249.900 15
6. 250.000-299.900 10
7. 300.000 atau lebih 5
Tentukan:
a. Simpangan rata-rata dari data tersebut
b. Simpangan baku dari data tersebut
c. Hitunglah variannya
32
MODUL STATISTIKA I
BAB V
DISTRIBUSI PELUANG
5.1 Pengertian
Distribusi peluang : sebuah daftar dari keseluruhan hasil suatu percobaan kejadian
yang disertai dengan nilai probabilitas masing-masing hasil.
CONTOH 1:
Ada tiga orang nasabah yang akan menabung di bank. Terdapat dua bank di Jl. Meruya Jakarta
Barat, yaitu BCA dan BNI. Ketiga orang tersebut bebas memilih bank tempatnya akan menabung,
bisa di BCA semua, di BCA dan BNI, atau di BNI semua. Berikut adalah kemungkinan dari
pilihan ketiga orang tersebut.
Kemungkinan Nasabah Jumlah
Pilihan 1 2 3 Pilihan BNI
1 BCA BCA BCA 0
2 BCA BCA BNI 1
3 BCA BNI BCA 1
4 BCA BNI BNI 2
5 BNI BCA BCA 1
6 BNI BCA BNI 2
7 BNI BNI BCA 2
8 BNI BNI BNI 3
Dari 8 kemungkinan tersebut, kita dapat menyusun distribusi peluangnya sebagai berikut:
Jml BNI dipilih Jumlah Total Distribusi peluang
nasabah frekuensi Kemungkinan
0 1 8 1/8 0,125
1 3 8 3/8 0,375
2 3 8 3/8 0,375
3 1 8 1/8 0,125
Jumlah total distribusi peluang 1,000
Distribusi peluang variable acak X adalah himpunan nilai peluang dari variable acak X.
Variable acak X adalah sebuah ukuran yang merupakan hasil suatu percobaan atau kejadian yang
terjadi secara acak.
Variable acak ada 2:
a. Variable acak diskrit
33
MODUL STATISTIKA I
Variable acak diskrit adalah ukuran hasil dari percobaan yang bersifat acak dan
mempunyai nilai tertentu yang terpisah dalam suatu interval. Variable acak diskrit
biasanya dalam bentuk bilangan bulat dan dihasilkan dari perhitungan.
b. Variable acak kontinyu
Variable acak kontinyu mempunyai nilai yang menempati pada seluruh interval hasil
percobaan. Variable acak kontinyu biasanya dihasilkan dari pengukuran dan bukan
perhitungan.
5.2 Rata-rata Hitung, Varian dan Standar Deviasi dari Distribusi Peluang
5.2.1 Rata-rata Hitung
Nilai rata-rata hitung digunakan sebagai nilai untuk mewakili nilai-nilai peluang yang ada
pada distribusi peluang. Nilai rata-rata hitung juga merupakan nilai harapan (Expected Value)
yang dilambangkan E(X).
Dimana: µx = nilai rata-rata hitung variable acak X

E(X) = nilai harapan
X = kejadian
P(X) = peluang suatu kejadian X
n = banyaknya kejadian
CONTOH 2:
Hitunglah nilai rata-rata hitung pada kasus pilihan tiga nasabah atas BNI pada contoh 1!
Penyelesaian:
X P(X) X. P(X)
0 0,125 0,000
1 0,375 0,375
2 0,375 0,750
3 0,125 0,375
Jumlah 1,500
Nilai rata-rata hitung = 1,500 menunjukkan bahwa dari 3 orang nasabah yang akan menabung,
maka 1,5 orang akan memilih BNI. Namun karena orang tidak dalam pecahan, maka bisa
didekatkan dengan 2 orang.
34
MODUL STATISTIKA I
5.2.2 Varian dan Standar Deviasi

Varian dan standar deviasi merupakan ukuran penyebaran yang mengukur seberapa besar
data menyebar dari nilai tengahnya. Varian dan standar deviasi variable acak X dirumuskan
sebagai berikut:
Dimana:
Keterangan: = varian variable acak X

= rata-rata hitung variable acak X
X = kejadian
P(X) = peluang suatu kejadian X
= standar deviasi variable acak X
CONTOH 3:
Hitunglah varian dan standar deviasi untuk distribusi peluang pilihan nasabah pada contoh 1 !
Penyelesaian:
X P(X) X2 X2. P(X)
0 0,125 0 0,000
1 0,375 1 0,375
2 0,375 4 1,500
3 0,125 9 1,125
Jumlah 3,000
= 3,000 – 1,52 = 0,75
√ √
5.3 Distribusi Peluang Penting
5.3.1 Distribusi Binomial
Distribusi peluang binomial menggambarkan data yang dihasilkan oleh suatu percobaan
yang dinamakan percobaan Bernoulli. Ciri – cirri percobaan Bernoulli adalah sebagai berikut:
1. Setiap percobaan atau kegiatan hanya menghasilkan dua kejadian, yaitu sukses dan gagal.
2. Peluang terjadinya sukses pada setiap kejadian dari serangkaian kejadian adalah konstan.
3. Antara kejadian satu dan lainnya saling bebas.
Distribusi peluang Binomial dapat dinyatakan sebagai berikut:
35
MODUL STATISTIKA I
Dimana:
P(X = x) : nilai peluang Binomial
p : peluang sukses suatu kejadian dalam setiap percobaan
q : peluang gagal suatu kejadian yang diperoleh dari q = 1- p
x : banyaknya peristiwa sukses suatu kejadian untuk keseluruhan percobaan
n : jumlah total percobaan
Rata-rata, varian dan standar deviasi distribusi Binomial adalah:
Rata-rata = np
Varians = n p q = n p (1 - p)
Standar deviasi = √
CONTOH 4:
PT. Moena Jaya Farm (MJF) mengirim buah semangka ke Hero Supermarket. Dengan jaminan
kualitas yang baik, maka 90% semangka yang akan dikirim lolos seleksi oleh Hero Supermarket.
PT. MJF setiap hari mengirim 15 buah semangka dengan berat antara 5-6Kg.
a. Berapa peluang 15 buah diterima?
b. Berapa peluang 10 buah diterima?
Penyelesaian:
a. Peluang 15 buah diterima semua.
n = 15 p = 0,9
x = 15 q = 0,1
P(X = 15) = 0,206

b. Peluang 10 buah diterima semua.
n = 15 p = 0,9
x = 10 q = 0,1
P(X = 10) = 0,011
36
MODUL STATISTIKA I
Distribusi Peluang Binomial Kumulatif

Pada sub-bab di atas telah dibahas tentang peluang jumlah sukses dalam jumlah tertentu,
misalnya 15 dan 10. Namun, seringkali kita dihadapkan pada persoalan yang tidak tunggal
jumlahnya, tetapi kumulatif. Pertanyaan seperti berapa peluang minimal 13 buah diterima atau
berapa peluang maksimal 3 buah tidak diterima. Untuk itu diperlukan adanya distribusi peluang
Binomial kumulatif.
CONTOH 5:
Hitunglah peluang paling sedikit 13 buah diterima pada kasus pengiriman buah semangka oleh
PT. MJF ke Hero Supermarket pada contoh 4!
Penyelesaian:
= 0,267 + 0,343 + 0,206 = 0,816

5.3.2 Distribusi Poisson
Distribusi Binomial sangat bermanfaat dan dapat menjelaskan dengan sangat memuaskan
terhadap peluang binomial untuk X = 1,2,3,…,n. Namun demikian, untuk suatu kejadian dimana
n sangat besar sedangkan peluang sukses sangat kecil, maka nilai binomialnya sangat sulit dicari.
Oleh karena itu dikembangkan distribusi Poisson untuk mengatasi kejadian tersebut. Distribusi
Poisson dapat dinyatakan sebagai berikut:
Dimana: P(X = x) = nilai peluang distribusi Poisson

𝛌 = rata-rata hitung dari jumlah nilai sukses dimana 𝛌 = n p
e = bilangan konstan = 2,718
X = jumlah nilai sukses
Rata-rata, varian dan standar deviasi untuk distribusi Poisson adalah:
Rata-rata = E(X) = =np
Varian = Var(X) = 𝛌 = n p
Standar deviasi =stdev(X) =√
CONTOH 6:
Anggaplah jumlah emiten yang kinerjanya baik di BEJ ada 150 perusahaan. Peluang perusahaan-
perusahaan tersebut memberikan deviden pada tahun 2006 hanya 0,1. Apabila BEJ meminta
laporan dari emiten sebanyak 5 perusahaan, berapa peluang 5 perusahaan tersebut adalah
perusahaan yang membagikan deviden?
Penyelesaian:
n = 150, p = 0,1
𝛌 = n p = 150 x 0,1 = 15
37
MODUL STATISTIKA I
= = 0,0019
5.3.3 Distribusi Normal

Distribusi normal merupakan distribusi peluang variable acak kontinyu. Distribusi normal
sebagai distribusi variable acak kontinyu mempunyai nilai yang jumlahnya tidak terbatas.
Distribusi normal mempunyai nilai sepanjang interval, biasanya berupa bilangan pecahan dan
datanya dihasilkan dari pengukuran.
-∞ µ = Md = Mo ∞
Beberapa karakteristik dari distribusi probabilitas dan kurva normal adalah:
1. Kurva berbentuk lonceng dan memiliki satu puncak yang terletak di tengah. Nilai rata-rata
hitung sama dengan median dan modus. Nilai µ = Md = Mo yang berada ditengah
membelah kurva menjadi dua bagian yaitu setengah di bawah nilai µ = Md = Mo dan
setengah di atas nilai µ = Md = Mo.
2. Distribusi peluang kurva normal berbentuk kurva simetris. Apabila kurva dilipat menjadi
dua bagian dengan nilai tengah rata-rata sebagai pusat lipatan, maka kurva akan menjadi
dua bagian yang sama.
3. Kurva distribusi normal menurun di kedua arah yaitu ke kanan untuk nilai positif tak
terhingga dan ke kiri (∞) untuk nilai negative tak terhingga (∞). Dengan demikian, kedua
ekor kurva tidak pernah menyentuh nol, hanya mendekati nilai nol.
4. Luas daerah yang terletak di bawah kurva normal tetapi di atas sumbu mendatar sama
dengan 1. Luas daerah tersebut terdiri dari setengah di sebelah kiri nilai tengah (µ) dan
setengah di sebelah kanan nilai tengah (µ).
Distribusi peluang normal mempunyai persamaan matematik yang sangat tergantung pada
nilai tengah (µ) dan standar deviasinya (σ). Oleh karena itu, distribusi normal dari suatu variable
acak X yang nilainya terletak -∞ sampai ∞ dinyatakan dengan lambang X ~ N(X; µ,σ) dan dibaca
nilai variable acak X terdistribusi secara normal dengan nilai tengah (µ) dan standar deviasi (σ).
38
MODUL STATISTIKA I
Bila X suatu pengubah acak normal dengan nilai tengah µ dan standar deviasi σ., maka
persamaan kurva normalnya adalah:
N(X; µ,σ) =√ , untuk -∞ < X< ∞
Dimana: π = 3,14 dan e = 2,718

5.3.4 Distribusi Normal Standart
Pada distribusi normal, apabila nilai µ dan X sedemikian banyak karena menempati
sepanjang interval nilai, maka sangatlah tidak mungkin untuk menyediakan distribusi peluangnya.
Namun demikian, permasalahan tersebut dapat diselesaikan dengan distribusi normal standart.
Distribusi normal standart adalah distribusi peluang acak normal dengan nilai tengah (µ) nol dan
simpangan baku (σ) 1.
Beberapa hal yang perlu dilakukan dalam rangka distribusi normal standart adalah
mengubah atau mentransformasi distribusi actual dalam bentuk istribusi normal standart yang
dikenal dengan nilai Z atau skor Z. rumus nilai Z adalah sebagai berikut:
Z =
Dimana: Z = skor Z
X = nilai dari suatu pengamatan atau pengukuran
µ = nilai rata-rata hitung
σ = standar deviasi
apabila Z disubstitusikan pada bentuk distribusi normal umum, maka distribusi peluang
normal standar adalah
√
CONTOH 7:
PT. Work Electric yang berkantor pusat di Bandung memproduksi bohlam lampu. Bohlam yang
diproduksi dapat hidup hingga 900 jam dengan standar deviasi 50 jam. Untuk kepentingan
promosi, PT. Work Electric ingin mengetahui peluang keyakinan bahwa bohlam lampunya dapat
hidup pada kisaran antara 800 - 1.000 jam.
Penyelesaian:
Z1 = = -2 Z2 = =2
Jadi, P(800 < X < 1.000) = P(-2 < Z < 2)

= P(Z < 2) – P(Z < -2)
= 0,9772 – 0,0228 = 0,9544
Jadi, 95,44% produksi berada kisaran 800-1.000 jam.
Pendekatan Normal Terhadap Binomial
Suatu distribusi peluang Binomial, dengan nilai n yang semakin besar, maka semakin
mendekati nilai distribusi normal. Oleh sebab itu, apabila n cukup besar maka pendekatan normal
dapat dilakukan untuk distribusi Binomial.
39
MODUL STATISTIKA I
Bila nilai X adalah distribusi acak Binomial dengan nilai tengah µ = np dan standar
deviasi σ = npq, maka nilai Z untuk distribusi normal standart adalah:
Z =
√
Untuk mengubah pendekatan dari binomial ke normal, maka diperlukan factor koreksi.
Factor koreksi adalah sebesar 0,5 yang dikurangkan dan ditambahkan pada data yang diamati.
Factor koreksi ini diperlukan untuk mentransformasi dari binomial menuju normal yang
merupakan variable acak kontinyu.
CONTOH 8:
Sebuah survey telah dilakukan oleh perusahaan alat elektronik yang mensinyalir bahwa 20% dari
penduduk yang memiliki telepon yang sangat menyukai warna telepon yang putih dibandingkan
dengan warna lain yang tersedia. Hitunglah peluang akan terdapat sejumlah langganan baru yang
menggunakan telepon berwarna putih antara 170 hingga 185 langganan, dari rencana
pemasangan saluran telepon yang baru sebanyak 1000 buah.
Penyelesaian:
µ = np = 1000 x 0,2 = 200
q = 1 – p = 1 – 0,2 = 0,8
Xi terletak antara 169,5 dan 185,5 maka
Z1 = = -2,41
√
Z2 = = -1,14
√
Jadi P(170 < X < 185) = P(-2,41 < Z < -1,14)

= P(Z < -1,14) – P(Z < -2,41)
= 0,1271 – 0,0082 = 0,1191
Jadi peluang pelanggan baru menggunakan telepon warna putih antara 170 hingga 185 langganan
adalah 11,91%.
40
MODUL STATISTIKA I
BAB VI
UJI HIPOTESIS
Dalam statistik, hipotesis dapat diartikan sebagai pernyataan statistik tentang parameter
populasi. Statistik adalah ukuran-ukuran yang dikenakan pada sampel ( x = rata-rata; s =
simpangan baku; s2 = varians; r = koefisien korelasi), dan parameter adalah ukuran-ukuran yang
dikenakan pada populasi ( = rata-rata; σ = simpangan baku; σ2 = varians; ρ = koefisien korelasi).
Dengan kata lain, hipotesis adalah taksiran terhadap parameter populasi melalui data-data sampel.
Dalam statistik dan penelitian terdapat dua macam hipotesis penelitian, yaitu hipotesis nol
dan alternatif. Pada statistik, hipotesis nol diartikan sebagai tidak adanya perbedaan antara
parameter dengan statistik, atau tidak adanya perbedaan antara ukuran populasi dan ukuran
sampel. Dalam penelitian, hipotesis nol juga menyatakan “tidak ada”, tetapi bukan tidak adanya
perbedaan antara populasi dan data sampel, tetapi bisa berbentuk tidak adanya hubungan antara
satu variabel dengan variabel lain, tidak adanya perbedaan antara satu variabel atau lebih pada
populasi/sampel yang berbeda, dan tidak adanya perbedaan antara yang diharapkan dengan
kenyataan pada satu variabel atau lebih untuk populasi atau sampel yang sama. Selanjutnya
hipotesis alternatif adalah lawannya hipotesis nol, yang berbunyi adanya perbedaan antara data
populasi dengan data sampel. Sedangkan test hipotesis adalah prosedur yang digunakan
selanjutnya untuk menerima H0 serta menentukan apakah sampel observasi/pengamatan memiliki
perbedaan dari hasil yang diharapkan.
Contoh 1.
Sebelum tahun 1993, pendaftaran mahasiswa unisla dilakukan dengan pengisian formulir secara
manual. Pada tahun 1993, PSA unisla memperkenalkan sistem pendaftaran "ON-LINE".
Seorang Staf PSA ingin membuktikan pendapatnya “bahwa rata-rata waktu pendaftaran dengan
sistem ON-LINE akan lebih cepat dibanding dengan sistem yang lama” Untuk membuktikan
pendapatnya, ia akan membuat hipotesis awal, sebagai berikut :
Hipotesis Awal : rata-rata waktu pendaftaran SISTEM "ON-LINE" sama saja dengan
SISTEM LAMA.
Staf PSA tersebut akan mengambil sampel dan berharap hipotesis awal ini ditolak, sehingga
pendapatnya dapat diterima!
Contoh 2 :
Manajemen PERUMKA mulai tahun 1992, melakukan pemeriksaan karcis KRL lebih intensif
dibanding tahun-tahun sebelumnya, pemeriksaan karcis yang intensif berpengaruh positif
terhadap penerimaan PERUMKA. Untuk membuktikan pendapat ini, hipotesis awal yang
diajukan adalah :
Hipotesis Awal : TIDAK ADA PERBEDAAN penerimaan SESUDAH maupun

SEBELUM dilakukan perubahan sistem pemeriksaan karcis.
Manajemen berharap hipotesis ini ditolak, sehingga membuktikan bahwa pendapat mereka benar!
41
MODUL STATISTIKA I
PENJELASAN
 Hipotesis Awal yang diharap akan ditolak disebut : Hipotesis Nol ( H0 )
Hipotesis Nol juga sering menyatakan kondisi yang menjadi dasar pembandingan.
 Penolakan H0 membawa kita pada penerimaan Hipotesis Alternatif ( H1 ) (beberapa buku

menulisnya sebagai H A )
 Nilai Hipotesis Nol ( H0 ) harus menyatakan dengan pasti nilai parameter.

H0  ditulis dalam bentuk persamaan
 Sedangkan Nilai Hipotesis Alternatif ( H1 ) dapat memiliki beberapa kemungkinan.

H1  ditulis dalam bentuk pertidaksamaan (< ; > ; )
Contoh 4.(lihat Contoh 1.)

Pada sistem lama, rata-rata waktu pendaftaran adalah 50 menit
Kita akan menguji pendapat Staf PSA tersebut, maka
Hipotesis awal dan Alternatif yang dapat kita buat :

H0 :  = 50 menit (sistem baru dan sistem lama tidak berbeda)
H1 :   50 menit (sistem baru tidak sama dengan sistem lama)
atau
H0 :  = 50 menit (sistem baru sama dengan sistem lama)
H1 :  < 50 menit ( sistem baru lebih cepat)
6.1 Tipe Kesalahan dalam Pengujian Hipotesis

Dalam menaksir parameter populasi berdasrkan data sampel kemungkinan akan terdapat
dua kesalahan yaitu:
1) Kesalahan Tipe 1 adalah suatu kesalahan bila menolak hipotesis nol (H0) padahal H0
benar. Dalam hal ini tingkat kesalahan dinyatakan dengan α (Alpha)
2) Kesalahan Tipe II adalah suatu kesalahan bila menerima hipotesis nol (H 0) padahal H0
salah. Tingkat kesalahan ini dinyatakan dengan β (Betha)
Berdasarkan hal tersebut, maka hubungan antara keputusan menolak atau menerima
hipotesis dapat digambarkan seperti berikut:
Keputusan Keadaan sebenarnya

Hipotesis benar Hipotesis Salah
Terima Hipotesis Tidak membuat kesalahan Kesalahan Tipe II
Menolak Hipotesis Kesalahan Tipe I Tidak membuat kesalahan
Dalam pengujian hipotesis kebanyakan digunakan kesalahan Tipe I yaitu berapa persen kesalahan
untuk menolak hipotesis nol (H0) padahal H0 benar. Tingkat kesalahan ini selanjutnya dinamakan
Level of Significan.
6.2 Pengujian Hipotesis

42
MODUL STATISTIKA I
6.2.1 Uji Hipotesis Mean Populasi

Uji hipotesis mean digunakan untuk mengetahui apakah ada perbedaan yang cukup berarti
(signifikan) atau tidak antara nilai-nilai statistik terhadap nilai parameternya, khususnya mean
populasi ( ) yang didasarkan pada tingkat/derajat kepercayaan tertentu. Sebelum kita melakukan
pengujian terhadap H0, maka perlu disususn langkah-langkah sebagai berikut:
I. Buatlah hipotesis terlebih dahulu:
a. Pengujian 2 sisi (two tailed test) b. Pengujian 1 sisi (one tailed test)
H0 : = 0 H0 : = 0
H1 : ≠ 0 H1 : > 0 atau H1 : < 0
II. Tentukan nilai tabel sesuai dengan jenis pengujian dan α nya (nilai kritis tabel)
III. Carilah mana daerah penerimaan dan penolakan H0 tersebut sesuai dengan tabel yang
ditunjukkan pada α tertentu.
IV. Hitunglah test statistiknya apakah dilakukan pengujian dengan Z, t, F atau pengujian
lainnya.
V. Buatlah keputusan apakah harus menerima atau menolak hipotesa
VI. Kesimpulan apakah yang dapat diperoleh dari no. 5 tersebut.
6.2.1.1 Uji Hipotesis Mean Populasi untuk Sampel Besar (n ≥ 30)

Statistik uji /test statistik yang digunakan untuk uji hipotesis mean populasi dengan
sampel yang besar (n ≥ 30) adalah
x  0 x  0
Zhitung = 
x / n
Dimana : x = rata-rata sampel
0 = taksiran awal nilai rata-rata populasi
σ = standar deviasi populasi
n = jumlah sampel
Beberapa Nilai z yang penting
z5%  z0.05 =1.645 z2.5%  z0.025 =1.96

z1%  z0.01 = 2.33 z0.5%  z0.005 = 2.575
Daerah penolakan dan penerimaan untuk pengujian 2 sisi (two tailed test) dan pengujian 1
sisi (one tailed test) adalah sbb:
43
MODUL STATISTIKA I
a) Pengujian 2 sisi
Gambar Kurva Normal Standart/Baku
H0 ditolak H0 ditolak
1-α
H0 diterima H0 diterima
α/2 α/2
-Zα/2 0 Zα/2
H0 diterima bila -Zα/2 ≤ Zhitung ≤ Zα/2
H0 ditolak bila Zhitung > Zα/2 atau Zhitung < -Zα/2
b) Pengujian 1 sisi
 Jika H1 : > 0
H0 ditolak
1-α
H0 diterima
H0 diterima
α
0 Zα
H0 diterima bila Zhitung < Zα dan H0 ditolak bila Zhitung > Zα
 Jika H1 : < 0
H0 ditolak
1-α
-Zα 0
H0 diterima bila Zhitung > -Zα dan H0 ditolak bila Zhitung < -Zα
Contoh:
Pabrik „DUNLOP‟ menyatakan bahwa rata-rata pemakaian ban radial G tahan sampai 50 bulan
dengan standar deviasi 5 bulan. Untuk menguji hipotesa (pernyataan) tersebut maka lembaga
44
MODUL STATISTIKA I
konsumen mengambil sebanyak 100 random sampel ban G 800 dan setelah diuji ternyata rata-
rata pemakaian 40 bulan. Ujilah dengan α = 5%, apakah pernyataan pabrik tersebut benar bahwa
rata-rata pemakaian 50 bulan?
Jawab
I. H0 : = 50 bulan H1 : ≠ 50 bulan
II. α = 5% Z1/2 α = Z1/2 (0,05) = 1,96
III. Daerah penerimaan H0 berada antara -1,96 ≤ Zhitung ≤ 1,96
Daerah penolakan H0 berada Zhitung > 1,96 atau Zhitung < -1,96
IV. Tes
V. t Statistik
x  0 40  50
Zhitung =  = -20
/ n 5 / 100
VI. Keputusan
2,5% 2,5%
95%
Daerah Penerimaan H0
-20 -1,96 0 1,96

H0 ditolak karena Zhitung < -1,96 atau -20 < -1,96 maka H1 yang diterima.
VII. Kesimpulan
Rata-rata pemakaian ban G 800 tersebut nyatanya tidak sama dengan 50 bulan sehingga
pernyataan pabrik tersebut ditolak.
6.2.1.2 Uji Hipotesis Mean Populasi untuk Sampel Kecil (n <30) dengan distribusi t
Untuk menguji meanpopulasi yang didasarkan pada pengamatan random sampelyang
jumlahnya relatif kurang dari 30, ataupun pengujian terhadap bila dalam random sampel
tersebut yang kita peroleh adalah nilai-nilai statistiknya seperti nilai x , s, s2 sehingga dari nilai-
nilai itulah dapat disimpulkan apakah ada perbedaan yang cukup berarti antara x random sampel
dengan (mean populasi) pada α tertentu.
Statistik uji yang digunakan adalah:
x  0
thitung =
s/ n
dimana: x = rata-rata sampel
0 = taksiran awal nilai rata-rata populasi
s = standar deviasi sampel
n = jumlah sampel
Daerah penolakan dan penerimaan H0 untuk uji 2 sisi dan uji 1 sisi adalah sbb:
45
MODUL STATISTIKA I
a. Pengujian 2 sisi
Gambar Kurva Distribusi t
H0 ditolak H0 ditolak
1-α
α/2 α/2
-tα/2; (n-1) 0 tα/2; (n-1)

H0 diterima bila -tα/2 df (n-1) ≤ thitung ≤ tα/2 df (n-1)
H0 ditolak bila thitung > tα/2 df (n-1) atau thitung < -tα/2 df (n-1)
b. Pengujian 1 sisi
 Jika H1 : > 0
H0 ditolak
1-α
0 tα; (n-1)
H0 diterima bila thitung < tα df (n-1) dan H0 ditolak bila thitung > tα df (n-1)
 Jika H1 : < 0
H0 ditolak
1-α
H0 H0
diterima diterima
-tα; (n-1) 0
H0 diterima bila thitung > -tα df (n-1) dan H0 ditolak bila thitung < -tα df (n-1)
Contoh:
Berdasarkan hasil sensus ekonomi yang baru saja dilakukan diperoleh informasi bahwa rata-rata
keuntungan perusahaan industri kecil di Kabupaten ABC mencapai Rp 22 juta per tahunnya.
Untuk memperoleh keyakinan yang lebih pasti, maka Bappeda setempat melakukan pula
penelitian dengan memilih sebanyak 8 sampel industri kecil pada daerah tersebut, dan diperoleh
rata-rata keuntungan Rp 19,25 juta dengan standar deviasi Rp 1,9 juta. Ujilah dengan α = 5%
46
MODUL STATISTIKA I
apakah benar bahwa taksiran rata-rata keuntungan industri tersebut lebih kecil dari Rp 22 juta
pertahun?
Jawab
I. H0 : = 22 juta H1 : < 22 juta
II. α = 5% tα df (n-1) = t0,05 df (8-1) = 1,895
III. H0 diterima bila thitung > -t0,05 df (7) atau thitung > -1,895
H0 ditolak bila thitung < -t0,05 df (7) atau thitung < -1,895
IV. Test Statistik
x  0 19,25  22
thitung =  = -4,09
s/ n 1,9 / 8
V. Keputusan
5%
95%
-4,09 -1,895 0
H0 ditolak karena thitung < -t0,05 df (7) atau -4,09 < -1,895
VI. Kesimpulan
Keuntungan rata-rata industri kecil di Kabupaten ABC sebesar Rp 22 juta ternyata terlalu
besar, karena kenyataannya lebih kecil dari Rp 22 juta per tahun.
6.2.2 Uji Hipotesis Proporsi

Dalam pengujian ini sebenarnya ingin diketahui apakah proporsi yang kita peroleh dari
suatu pengamatan sejumlah sampel tertentu memiliki perbedaan yang signifikan atau tidak
terhadap proporsi populasinya pada tingkat signifikansi tertentu.
Secara umum hipotesa yang bisa dibuat adalah:
H0 : π = π0
H1 : π ≠ π0 (uji 2 sisi)
atau
: π < π0 atau π < π0 (uji 1 sisi)
p 0
Statistik uji yang digunakan: Zhitung =
p
Dimana: p = proporsi sampel
π0 = taksiran awal nilai proporsi populasi
σp = standar deviasi proporsi populasi
 0 1   0 
σp =
n
Daerah penolakan dan penerimaan H0 untuk pengujian 2 sisi dan 1 sisi adalah
47
MODUL STATISTIKA I
1) Pengujian 2 sisi (two tailed test)

2) Pengujian 1 sisi (one tailed test)
H1 : π > π0 H0 diterima bila Zhitung < Zα
H0 ditolak bila Zhitung > Zα
H1 : π < π0 H0 diterima bila Zhitung > -Zα
H0 ditolak bila Zhitung < -Zα
Contoh:
SCTV menduga bahwa golongan pria maupun wanita memiliki probabilitas yang sama dalam
menonton film seri Minggu siang. Pada daerah tertentu diadakan survey ternyata dari 400
pirsawan yang terpilih sebagai sampel, ternyata 220 orang diantaranya adalah kaum pria. Ujilah
dengan α = 5%, apakah proporsi yang menonton film seri Minggu siang tersebut antara pria dan
wanita sama?
Jawab
Karena pihak SCTV menduga bahwa proporsi pria dan wanita sama dalam menonton film seri
Minggu siang maka π0 = 0,5.
220 0,5 x0,5
p= = 0,55 p  =0,025
400 400
Uji Hipotesis:
I. H0 : π = 0,5
H1 : π ≠ 0,5 (uji 2 sisi)
II. α = 5% Z1/2 α = Z1/2 (0,05) = 1,96
III. Daerah penerimaan H0 berada antara -1,96 ≤ Zhitung ≤ 1,96
Daerah penolakan H0 berada Zhitung > 1,96 atau Zhitung < -1,96
IV. Statistik uji
p 0 0,55  0,5
Zhitung =  =2
p 0,025
V. Keputusan
2,5% 2,5%
95%
-1,96 0 1,96 2
Tolak H0 karena Zhitung > 1,96 atau 2 > 1,96
VI. Kesimpulan
Proporsi yang menonton film Minggu siang antara pria dan wanita tidak sama.
48
MODUL STATISTIKA I
6.2.3 Uji Hipotesis Perbedaan Antara 2 Sampel Means

6.2.3.1
6.2.3.2 Uji Hipotesis Perbedaan Antara 2 Sampel Mean untuk Sampel Besar (n ≥30)
A. Uji hipotesis apabila sampel-sampel adalah sampel yang bersifat independen
Pengujian ini digunakan untuk menguji terhadap ada tidaknya perbedaan yang signifikan
antara 2 rata-rata sampel dalam arti bahwa hasil pengamatan dari sampel-sampel tersebut
mungkin sekali berasal dari populasi berbeda. Langkah-langkah pengujiannya sebagai berikut:
I. Buatlah hipotesa
H0 : 1 = 2
H1 : 1 ≠ 2
atau
: 1 > 2 atau 1 < 2 (uji 1 sisi)
II. Carilah nilai kritis pada α tertentu sesuai dengan jenis pengujian apakah 1 sisi atau 2 sisi
III. Tentukan daerah penerimaan dan penolakan H0 tersebut
a) Pengujian 2 sisi
b) Pengujian 1 sisi
H1 : 1 > 2 H0 diterima bila Zhitung < Zα
H1 : 1 < 2 H0 diterima bila Zhitung > -Zα
IV. Test Statistik
x1  x 2  12  22
Z hitung = dimana σd = 
d n1 n2
s12 s 22
Jika varian populasi tidak diketahui maka σd = 
n1 n2
V. Buatlah keputusan apakah menerima atau menolak Ho tersebut dengan membandingkan

antara nilai kritis dengan test statistiknya.
VI. Kesimpulan
Contoh:
Seorang ahli farmasi ingin mengetahui apakah rata-rata kadar vitamin A yang terkandung dalam
obat merek X dan Y sama atau tidak. Untuk mengetahui hal itu, maka beliau memilih secara
random sebanyak 35 sampel obat merek X dan 40 sampel obat merek Y. Setelah obat-obat
tersebut dianalisa menghasilkan data sebagai berikut:
Merek X Merek Y
Mean 500 mgr 480 mgr
Standar deviasi 40 mgr 30 mgr
49
MODUL STATISTIKA I
Ujilah dengan α = 8%, apakah rata-rata kadar vitamin A yang terkadung dalam obat merek X dan
Y sama?
Jawab
I. H0 : X = Y
H1 : X
≠ Y
II. α = 8% Z1/2 α = Z1/2 (0,08) = 1,

III. 75
IV. Ho diterima bila -1,75 ≤ Zhitung ≤ 1,75
Ho ditolak bila Zhitung > 1,75 atau Zhitung < -1,75
V. Test Statistik
x1  x 2 500  480  20
Z hitung = = = = -2,42
s 2
s 2
40 2
30 2 8,26
 
x y
nx n y 35 40
VI.
VII. \Keputusan
4%
4%
92%
-2,42 -1,75 0 1,75

Ho ditolak karena Zhitung < -1,75 atau -2,42 < -1,75
VIII. Kesimpulan
Rata-rata kadar vitamin A terkandung dalam obat merek X dan Y ternyata tidak sama pada α
= 8%, sehingga terdapat perbedaan yang signifikan rata-rata vitamin A yang terkandung
antara obat merek X dan obat merek Y.
B. Uji hipotesis apabila sampel-sampel bukan sampel yang bersifat independen

Pada kasus sebelumnya pengujian terhadap ada tidaknya perbedaan yang signifikan antara
1 dan 2 dianggap bahwa sampel-sampel tersebut bersifat independen sampel dalam arti bahwa
hasil pengamatan dari sampel-sampel tersebut mungkin sekali berasal dari populasi yang berbeda.
Tetapi bila sampel-sampel tersebut berasal dari populasi yang sama, maka kasus independen
sampel tidak mungkin dapat digunakan.
Sebagai contohnya adalah bagaimana kita dapat menguji ada tidaknya perbedaan yang
signifikan terhadap 30 orang karyawan mengenai hasil ujian yang mereka capai pada waktu
sebelum dan sesudah dilakukan training kepada karyawan tersebut. Untuk memudahkan
pengertian tersebut marilah kita ambil contoh kasus di bawah ini:
Contoh:
50
MODUL STATISTIKA I
Data di bawah ini menunjukkan hasil ujian mereka pada waktu sebelum dan sesudah training.
No Nilai Sebelum Nilai Sesudah

Training (X1) Training (X2)
1 68 65
2 75 76
3 80 88
4 73 79
5 69 78
6 90 94
7 75 75
8 70 72
9 73 69
10 87 89
11 84 89
12 90 92
13 72 69
14 71 73
15 74 75
16 71 78
17 69 75
18 71 76
19 82 93
20 87 79
21 82 89
22 87 95
23 69 65
24 71 82
25 86 86
26 75 86
27 72 79
28 74 80
51
MODUL STATISTIKA I
29 73 81
30 79 86
Untuk menguji apakah terdapat perbedaan yang signifikan terhadap data-data nilai sebelum dan
sesudah adanya training maka dapat dibuat langkah-langkah sebagai berikut:
I. Ho : Tidak terdapat perbedaan yang signifikan antara hasil sebelum dan sesudah adanya
training
H1 : Terdapat adanya perbedaan yang signifikan antara hasil sebelum dan sesudah adanya
training (2 sisi)
II. Tentukan nilai kritis sesuai dengan derajat kepercayaan dan model pengujian 1 sisi atau 2 sisi
III. Tentukan daerah penerimaan dan penolakan Ho
IV. Tentukan nilai test statistik
d 0
ZHitung =
sd
Dimana: d  rata-rata perbedaan hasil sebelum dan sesudah training
d
d
n
s
s d = standar deviasi dapat dicari melalui : s d 
n
 d 2 
 d   n
2 

 
s =
n 1
No X1 X2 d d2
1 68 65 -3 9
2 75 76 1 1
3 80 88 8 64
4 73 79 6 36
5 69 78 9 81
6 90 94 4 16
7 75 75 0 0
8 70 72 2 4
9 73 69 -4 16
10 87 89 2 4
11 84 89 5 25
12 90 92 2 4
13 72 69 -3 9
14 71 73 2 4
52
MODUL STATISTIKA I
15 74 75 1 1
16 71 78 7 49
17 69 75 6 36
18 71 76 5 25
19 82 93 11 121
20 87 79 -8 64
21 82 89 7 49
22 87 95 8 64
23 69 65 -4 16
24 71 82 11 121
25 86 86 0 0
26 75 86 11 121
27 72 79 7 49
28 74 80 6 36
29 73 81 8 64
30 79 86 7 49
Total 114 1.138
d
 d  114 =3,80
n 30
 d 2 
 1.138 
 d   n
2 
 1.138   
    30 
s=
n 1 30  1
s= 24,303 = 4,929
s 4,929
sd   = 0,899
n 30
 Bila model pengujian 2 sisi
I. Ho : 1 = 2 artinya yang diperoleh sebelum dan sesudah training sama saja (tidak
terdapat perbedaan yang signifikan)
H1 : 1 ≠ 2 artinya hasil yang diperoleh sebelum dan sesudah adanya training berbeda
(terdapat perbedaan yang signifikan)
II. Bila α = 5%, maka nilai kritis Z adalah Z1/2α = Z1/2(0,05) = Z0,025 = 1,96
III. Ho diterima bila -1,96 ≤ ZHitung ≤ 1,96
Ho ditolak bila ZHitung > 1,96 atau ZHitung < -1,96
IV. Test statistik
d  0 3,80  0
ZHitung =  = 4,22
sd 0,899
V. Keputusan
53
MODUL STATISTIKA I
2,5% 2,5%
95%
-1,96 0 1,96 4,22

Tolak Ho karena ZHitung > 1,96 atau 4,22 > 1,96
VI. Kesimpulan
Hal ini menunjukkan bahwa hasil sebelum dan sesudah adanya training bagi karyawan
ternyata membawa pengaruh yang sangat signifikan.
 Bila pengujian model 1 sisi
I. Ho : 1 = 2
H1 : 2 > 1 (Karena ada keyakinan bahwa dengan adanya training akan memberikan
hasil yang baik)
II. Bila α = 5%, maka nilai kritis Z adalah Zα = 1,65
III. Ho diterima bila ZHitung < 1,96
Ho ditolak bila ZHitung > 1,96
IV. Test statistik
d  0 3,80  0
ZHitung =  =4,22
sd 0,899
V. Keputusan
H0 ditolak
1-α = 95%
H0 diterima
α
0 1,96 4,22
Tolak Ho karena ZHitung > 1,96 atau 4,22 > 1,96
VI. Kesimpulan
Hasil ujian yang diperoleh karyawan sesudah adanya training memang lebih baik daripada
sebelum diadakannya training
6.2.3.3 Uji Hipotesis Perbedaan Antara 2 Sampel Mean untuk Sampel Kecil (n < 30)
Pengujian hipotesis ini digunakan jika kedua sampel (n 1 + n2) kurang dari 30. statistik uji
yang digunakan adalah sbb:
x1  x2
t hitung =
(n1  1) s12  (n2  1) s 22 1 1

n1  n2  2 n1 n2
Daerah penerimaan dan penolakan Ho untuk pengujian 2 sisi dan pengujian 1 sisi adalah sbb:
54
MODUL STATISTIKA I
1. Pengujian 2 sisi
H0 diterima bila -tα/2 df (n1 + n2 -2) ≤ thitung ≤ tα/2 df (n1 + n2 -2)
H0 ditolak bila thitung > tα/2 df (n1 + n2 -2) atau thitung < -tα/2 df (n1 + n2 -2)
2. Pengujian 1 sisi
H1 : 1 > 2 H0 diterima bila thitung < tα df (n1 + n2 -2)
H0 ditolak bila thitung > tα df (n1 + n2 -2)
H1 : 1 < 2 H0 diterima bila thitung > - tα df (n1 + n2 -2)

H0 ditolak bila thitung < -tα df (n1 + n2 -2)
Contoh:
Perusahaan President Taxi sedang mempertimbangkan untuk menggunakan ban merk manakah
yang harus digunakan untuk seluruh armada taxinya. Guna membantu memecahkan masalah ini
maka ban merek X dan merek Y dicoba sebanyak 12 taxi untuk setiap mereknya. Dari hasil
pengujian kedua merek ban di atas menghasilkan informasi sbb:
Merek X Merek Y
Rata-rata daya tempuh 23.600 mil 24.800 mil
Standar deviasi 3.200 mil 3.700 mil
Ujilah dengan α = 5% terhadap hipotesa yang menyatakan bahwa ban merek X dan merek Y
memiliki kualitas yang sama.
Jawab
I. Ho : x = y
H1 : x ≠ y
II. Bila α = 5%, maka nilai kritis adalah t α/2 df (n1 + n2 -2) = t0,05/2 df (12 + 12 -2)
= t0,0025 df (22) = 2,074
III. Ho diterima bila -2,074 ≤ thitung ≤ 2,074
Ho ditolak bila thitung > 2,074 atau thitung < -2,074
IV. Test Statistik
t hitung = x1  x 2 = 23.600  24.800 = - 0,85
(n1  1) s  (n2  1) s
2 2
1 1 (12  1)3200  (12  1)3700
2 2
1 1
1 2
 
n1  n2  2 n1 n2 12  12  2 12 12
V. Keputusan
2,5% 2,5%
95%
-2,074 -0,85 0 2,074

Terima Ho karena t hitung > - 2,074 atau -0,85 > -2,074
VI. Kesimpulan
55
MODUL STATISTIKA I
Perbedaan rata-rata daya tempuh antara ban merek X dan merek Y tidak signifikan pada α =
5%.
6.2.4 Uji Hipotesis Perbedaan 2 Macam Sampel Proporsi
Pengujian ini digunanakn bila terdapat 2 macam random sampel dimana proporsi yang
berbeda. Secara umum hipotesa yang dapat dibuat adalah :
I. Ho : π1 = π2
H1 : π1 ≠ π2 (Uji 2 sisi)
Atau
π1 > π2 atau π1 < π2 (Uji 1 sisi)
II. Tentukan α
III. Daerah penerimaan dan penolakan Ho
a) Pengujian 2 sisi
b) Pengujian 1 sisi
H1 : π1 > π2 H0 diterima bila Zhitung < Zα
H1 : π1 < π2 H0 diterima bila Zhitung > -Zα
IV. Test Statistik
p1  p 2 n1 p1  n2 p2
Zhitung = dimana  
1 1 n1  n 2
 1     
 n1 n2 
V. Keputusan apakah menerima atau menolak Ho
VI. Kesimpulan yang dapat diambil
Contoh:
Pada tanggal 2 Pebruari 1987 dari sebanyak 200 pemilih memperlihatkan bahwa 120 pemilih
tersebut menyukai calon X sebagai lurahnya, namun pada bulan berikutnya dari sebanyak 300
pemilih ternyata yang menyukai calon X sebagai lurahnya sebanyak 150 pemilih. Ujilah dengan
α = 5% apakah popularitas calon X tersebut telah berubah dalam 2 masa pemungutan suara
tersebut?
Jawab
n1 = 200 n2 = 300
120 150
p1 = = 0,6 p2 = =0,5
200 300
n1 p1  n2 p 2 (200 x0,6)  (300 x0,5)
  =0,54
n1 n 2 200  300
I. Ho : π1 = π2
H1 : π1 > π2 (Uji 1 sisi)
56
MODUL STATISTIKA I
II. α = 5% Zα = Z0,05 = 1,64

III. H0 diterima bila Zhitung < Zα
IV. Test Statistik
p1  p 2 0,6  0,5
Zhitung = = =2,298
1 1  1 1 
 1      0,541  0,54   
 n1 n2   200 300 
V. Keputusan
H0 ditolak
1-α = 95%
α
H0 diterima
0 1,64 2,298
H0 ditolak karena Zhitung > 1,64 atau 2,298 > 1,64
VI. Kesimpulan
Popularitas calon X semakin menurun dalam 2 masa pemungutan suara tersebut.
Latihan:
1. Selama tahun 2008 dan 2009 diketahui bahwa hasil penjualan suatu unit produk terjual rata-
rata 260 unit per bulan tiap distributor, dengan α= 15 unit. Lalu dilakukan pengamatan
terhadap 150 penjual pada beberapa pasar dan hasilnya diketahui rata-rata terjual 275 unit per
bulan. Jika tigkat keyakinan terhadap hasil penjualan tersebut 96%. Apakah penjualan sudah
dapat dikatakan meningkat?
2. Berdasarkan hasil data historis diketahui bahwa pengeluaran masyarakat secara rata-rata
terhadap pembersih perkakas dapur Rp. 50.000 untuk suatu merk. Maka timbul keraguan
manager apakah pengeluaran masyarakat yang menjadi pendapatan perusahaan tersebut masih
dapat dipertahankan. Lalu dilakukan survei dengan hasil wawancara terhadap 150 orang
anggota masyarakat, dan hasil survei dalam ribuan rupiah yaitu sebagai berikut (X i = titik
tengah pengeluaran; fi = jumlah anggota masyarakat).
Xi : 15 25 35 45 55 65 75 85 95
fi : 10 18 25 28 33 17 10 7 2
Untuk α= 0,05 apakah pendapatan perusahaan dari pembersih itu masih dianggap sama dengan
waktu yang lalu?
57
MODUL STATISTIKA I
BAB VII
UJI HIPOTESIS ASOSIATIF
Hipotesis asosiatif merupakan dugaan adanya hubungan antar variabel dalam sampel.
Untuk itu dalam langkah awal pembuktiannya, maka perlu dihitung terlebih dahulu koefisien
korelasi antar variabel dalam sampel, baru koefisien yang ditemukan itu diuji signifikansinya.
Jadi menguji hipotesis asosiatif adalah menguji koefisiensi korelasi yang ada pada seluruh
populasi dimana sampel diambil. Bila penelitian dilakukan pada seluruh populasi maka tidak
diperlukan pengujian signifikansi terhadap koefisien korelasi yang ditemukan. Hal ini berarti
peneliti tidak merumuskan dan menguji instrumen statistik.
Terdapat tiga macam bentuk hubungan antar variabel, yaitu hubungan simetris, hubungan
sebab akibat (kausal) dan hubungan interaktif (saling mempengaruhi). Untuk mencari hubungan
antara dua variabel atau lebih dilakukan dengan menghitung korelasi antar variabel yang akan
dicari hubungannya. Korelasi merupakan angka yang menunjukkan arah dan kuatnya hubungan
antar dua variabel atau lebih. Arah dinyatakan dalam bentuk hubungan positif atau negatif,
sedangkan kuatnya hubungan dinyatakan dalam koefisien korelasi.
Hubungan dua variabel atau lebih dinyatakan positif, bila nilai suatu variabel ditingkatkan,
maka akan meningkatkan variabel yang lain, dan sebaliknya bila satu variabel diturunkan maka
akan menurunkan variabel yang lain. Hubungan dua variabel atau lebih dinyatakan negatif, bila
nilai satu variabel dinaikkan maka akan menurunkan nilai variabel yang lain, dan juga sebaliknya
bila nilai satu variabel diturunkan, maka akan menaikkan nilai variabel yang lain
Gambar Korelasi Positif Gambar Korelasi Negatif
12
12
10
10
8 8
6 6
4 4
2 2
0
0
2 4 6 8 2 4 6 8
Kuatnya hubungan antar variabel dinyatakan dalam koefisien korelasi. Koefisien korelasi
positif sebesar =1 dan koefisien korelasi negatif terbesar adalah -1, sedangkan yang terkecil
adalah 0. Bila hubungan antara dua variabel atau lebih itu mempunyai koefisien korelasi = 1 atau
-1, maka hubungan tersebut sempurna. Dalam arti kejadian-kejadian pada variabel yang satu akan
dapat dijelaskan atau diprediksikan oleh variabel yang lain tanpa terjadi kesalahan (error).
Semakin kecil koefisien korelasi, maka akan semakin besar error untuk membuat prediksi.
Besarnya koefisien korelasi dapat diketahui berdasarkan penyebaran titik-titik pertemuan
antara dua variabel misalnya X dan Y. Bila titik-titik itu terdapat dalam satu garis, maka
koefisien korelasinya = 1 atau -1. Bila titik-titik itu membentuk lingkaran, maka koefisien
58
MODUL STATISTIKA I
korelasinya = 0. Hubungan X dan Y untuk berbagai koefisien bila digambarkan dalam diagram
pencar (scatterplot) dapat dilihat pada gambar di bawah ini.
Gambar r = 0 Gambar r = 0,5
Variabel Variabel
Y Y
Variabel X
Variabel X
Gambar r = 1
Variabel
Variabel X
Terdapat bermacam-macam teknik statistik korelasi yang dapat digunakan untuk

menguji hipotesis asosiatif. Teknik korelasi mana yang akan dipakai tergantung pada jenis data
yang akan dianalisis. Berikut ini dikemukakan berbagai teknik statistik korelasi yang digunakan
untuk menguji hipotesis asosiatif. Untuk data nominal dan ordinal digunakan statistik
nonparametris dan untuk data interval dan ratio digunakan statistik parametris.
PEDOMAN UNTUK MEMILIH TEKNIK KORELASI

DALAM PENGUJIAN HIPOTESIS
Macam/Tingkatan Data Teknik Korelasi yang Digunakan
Nominal 1. Koefisien Kontingensi
1. Spearman Rank
Ordinal
2. Kendal Tau
1. Pearson Product Moment
Interval dan Ratio 2. Korelasi Ganda
3. Korelasi Parsial
59
MODUL STATISTIKA I
7.1 Korelasi Product Moment

Teknik korelasi ini digunakan untuk mencari hubungan dan membuktikan hipotesis
hubungan dua variabel bila data kedua variabel berbentuk interval atau ratio dan sumber data dari
dua variabel atau lebih adalah sama. Koefisien korelasi untuk populasi diberi simbol rho (ρ) dan
untuk sampel diberi simbol r, sedang untuk korelasi ganda diberi simbol R. Berikut ini
dikemukakan rumus yang paling sederhana yang dapat digunakan untuk menghitung koefisien
korelasi, yaitu:
n
 xy
rxy  i 1
n n
 x2  y2
i 1 i 1
Dimana : rxy adalah korelasi antara variabel x dengan y

x =  xi  x  dan y =  yi  y 
Contoh:
Dilakukan penelitian utnuk mengetahui ada tidaknya hubungan antara pendapatan dan
pengeluaran. Untuk keperluan tersebut, maka telah dilakukan pengumpulan data terhadap 10
responden yang diambil secara random. Berdasarkan 10 responden tersebut diperoleh data
tentang pendapatan (x) dan pengeluaran (y), sebagai berikut:
X : 800 900 700 600 700 800 900 600 500 500/ bulan
Y : 300 300 200 200 200 200 300 100 100 100/ bulan
Jawab:
H0 : tidak ada hubungan antara pendapatan dan pengeluaran
H1 : terdapat hubungan antara pendapatan dan pengeluaran
Atau
H0 : ρ = 0
H1 : ρ ≠ 0
pendptn/bln dlm ratusan
No ribu
penglrn/bln dlm ratusan ribu  xi  x   yi  y  X2 Y2 xy
y
x X y
1 8 3 1 1 1 1 1
2 9 3 2 1 4 1 2
3 7 2 0 0 0 0 0
4 6 2 -1 0 1 0 0
5 7 2 0 0 0 0 0
6 8 2 1 0 1 0 0
7 9 3 2 1 4 1 2
8 6 1 -1 -1 1 1 1
9 5 1 -2 -1 4 1 2
10 5 1 -2 -1 4 1 2
Jum 70 20 0 0 20 6 10
60
MODUL STATISTIKA I
10 10
 xi
70
y i
20
x  7
i 1
y i 1
 2
10 10 10 10
10
 xy 10
rxy  i 1
  0,9129
10 10
20 x6
x y
i 1
2
i 1
2
Jadi ada korelasi positif sebesar 0,9129 antara pendapatan dan pengeluaran tiap bulan. Hal ini
berarti semakin besar pendapatan, maka akan semakin besar pula pengeluaran. Apakah koefisien
korelasi hasil perhitungan tersebut signifikan (dapat digeneralisasikan) atau tidak, maka perlu
dibandingkan dengan r tabel, dengan taraf kesalahan tertentu. Tahap-tahap pengujiannya adalah
sebagai berikut:
I. H0 : ρ = 0
H1 : ρ ≠ 0
II. α = 5% maka untuk N = 10 nilai rtabel = 0,632
III. Daerah penolakan H0 adalah jika rhitung > rtabel
IV. Statistik uji : rhitung = 0,9129
V. Keputusan : Tolak H0 karena rhitung > rtabel atau 0,9129 > 0,632
VI. Kesimpulan : Ada hubungan positif dan signifikan antara pendapatan dan pengeluaran
sebesar 0,9129.
Pengujian signifikansi koefisien korelasi, selain dapat menggunakan tabel, juga dapat
dihitung dengan uji t.
r n2
t
1 r2
Tahapan pengujian dengan uji t untuk contoh tersebut adalah sebagai berikut:
I. H0 : ρ = 0
H1 : ρ ≠ 0
II. α = 5% maka t ; df = n – 2 = t0,025 ; df = 10-2 = t0,025 ; df = 8 =2,306
2
III. Daerah penolakan H0 adalah jika thitung > 2,306 atau thitung < -2,306
r n2 0,9129 8  2
IV. Statistik uji : t =  6,33
1 r 2
1  0,9129 2
V. Keputusan : Tolak H0 karena thitung > 2,306 atau 6,33 > 2,306
VI. Kesimpulan : Hal ini berarti terdapat hubungan yang positif dan signifikan antara
pendapatan dan pengeluaran sebesar 0,9129.
Untuk dapat memberikan penafsiran terhadap koefisien korelasi yang ditemukan
tersebut besar atau kecil, maka dapat berpedoman pada ketentuan yang tertera pada tabel
berikut ini:
Interval koefisien Tingkat hubungan
61
MODUL STATISTIKA I
0,00 – 0,199 Sangat rendah

0,20 – 0,399 Rendah
0,40 – 0,599 Sedang
0,60 – 0,799 Kuat
0,80 – 1,000 Sangat kuat
Dalam analisis korelasi terdapat suatu angka yang disebut dengan koefisien
determinasi, yang besarnya adalah kuadrat dari koefisien korelasi (r 2). Koefisien ini disebut
koefisien penentu, karena varian yang terjadi pada variabel dependen dapat dijelaskan melalui
varian yang terjadi pada variabel independen. Untuk contoh di atas ditemukan r = 0,9129.
Koefisien determinasinya adalah r2 = 0,91292 = 0,83. Hal ini berarti varian yang terjadi pada
variabel pengeluaran 83% dapat dijelaskan melalui varian yang terjadi pada variabel pendapatan,
atau pengeluaran 83% ditentukan oleh besarnya pendapatan, dan 17% oleh faktor lain misalnya
terjadi musibah, sehingga pengeluaran tersebut tidak dapat diduga.
7.2 Korelasi Ganda
Korelasi Ganda (Multiple Correlation) merupakan angka yang menunjukkan arah dan
kuatnya hubungan antara dua variabel secara bersama-sama atau lebih dengan variabel yang lain.
Pemahaman tentang korelasi ganda dapat dilihat melalui gambar berikut ini. Simbol korelasi
ganda adalah R.
r1
X1
R Y
X2
r2
Gambar 1
X1 = Kepemimpinan Y = Kepuasan kerja

X2 = Tata ruang kantor R = Korelasi ganda
r1
X1
r5 R
r3
X2 Y
r4
r6
X3
r2
Gambar 2
62
MODUL STATISTIKA I
X1 = Kesejahteraan pegawai X3 = Pengawasan

X2 = Hubungan dengan pemimpin Y = Efektifitas kerja
Dari contoh di atas terlihat bahwa korelasi ganda R, bukan merupakan penjumlahan dari
korelasi sederhana yang ada pada setiap variabel (r 1 + r2 + r3). Jadi R ≠ (r1 + r2 + r3). Korelasi
ganda merupakan hubungan secara bersama-sama antara X1 dengan X2 dan Xn dengan Y. Pada
gambar 1, korelasi ganda merupakan hubungan secara bersama-sama antara variabel
kepemimpinan dan tata ruang kantor dengan kepuasan kerja pegawai.
ryx2 1  ryx2 2  2 ryx1 ryx2 rx1x2

R y , x1x2 
1  rx21x2
Dimana: Ry , x1x2 = Korelasi antara variabel X1 dengan X2 secara bersama-sama dengan
variabel Y
ryx1 = Korelasi Product Moment antara X1 dengan Y
ryx2 = Korelasi Product Moment antara X2 dengan Y
rx1x2 = Korelasi Product Moment antara X1 dengan X2
Jadi untuk dapat menghitung korelasi ganda, maka harus dihitung terlebih dahulu korelasi
sederhananya dulu melalui korelasi Product Momen dan Pearson.
Contoh:
Misalnya dari suatu penelitian yang berjudul ”Kepemimpinan dan Tata Ruang Kantor dalam
Kaitannya dengan Kepuasan Kerja Pegawai di Lembaga A”. Berdasarkan data yang terkumpul
untuk setiap variabel dan setelah dihitung korelasi sederhananya ditemukan sebagai berikut:
1. Korelasi antara Kepemimpinan dengan Kepuasan Kerja Pegawai (r1) = 0,45
2. Korelasi antara Tata Ruang Kantor dengan Kepuasan Kerja Pegawai (r 2)= 0,48
3. Korelasi antara Kepemimpinan dengan Tata Ruang Kantor (r 3) = 0,22
Jawab: r1 = 0,45
X1
Dimana: X1 = Kepemimpinan
r3 = 0,22 R = 0,5959 Y X2 = Tata Ruang
Kantor X2
Y = Kepuasan
r2 = 0,48
Kerja Pegawai
Korelasi ganda antara Kepemimpinan dan Tata Ruang Kantor secara bersama-sama dengan
Kepuasan Kerja Pegawai dapat dihitung sebagai berikut:
0,45 2  0,48 2  2 (0,45) (0,48) (0,22)

R y , x1x2   0,5959
1  0,22 2
Pengujian signifikansi terhadap koefisien korelasi ganda dapat menggunakan rumus

berikut ini, yaitu dengan uji F.
63
MODUL STATISTIKA I
R2 k
F
 
1  R 2 n  k  1
Dimana : R = Koefisien Korelasi Ganda n = jumlah anggota sampel
k = jumlah variabel independen
Berdasarkan angka yang telah ditemukan, dan bila n = 30, maka harga Fh dapat dihitung
dengan rumus:
0,5959 2 2
F
 
1  0,5959 2 30  2  1
= 7,43
Harga tersebut selanjutnya dibandingkan dengan harga Ftabel dengan derajat kebebasan
pembilang = k dan derajat kebebasan penyebut = (n-k-1). Jadi dkpembilang = 2 dan dkpenyebut = 10-2-
1 = 7. Dengan taraf kesalahan 5%, harga Ftabel ditemukan sebesar = 4,74. Ternyata harga Fhitung
lebih besar dari Ftabel (7,43 > 4,74). Karena Fhitung lebih besar dari Ftabel maka H0 ditolak dan H1
diterima. Jadi koefisien korelasi ganda yang ditemukan adalah signifikan (dapat diberlakukan
untuk populasi dimana sampel diambil).
7.3 Korelasi Parsial

Korelasi Parsial digunakan untuk menganalisis bila peneliti bermaksud mengetahui
pengaruh atau mengetahui hubungan antara variabel independent dan dependen, dimana salah
satu variabel independennya dibuat tetap/dikendalikan. Jadi korelasi parsial merupakan angka
yang menunjukkan arah dan kuatnya hubungan antara dua variabel atau lebih setelah satu
variabel yang diduga dapat mempengaruhi hubungan variabel tersebut dikendalikan untuk dibuat
keberadaannya itu tetap.
Rumus:
1. Korelasi antara X1 dengan Y, bila variabel X2 dikendalikan
ryx1  ryx2 rx1x2

R y , x1x2 
1  rx21x2  1  ryx2 2
2. Korelasi antara X2 dengan Y, bila variabel X1 dikendalikan

ryx2  ryx1 rx1 x2
Ry , x 2 x1 
1  rx21 x 2  1  ryx2 1
Pengujian signifikansi terhadap koefisien korelasi parsial dapat dihitung dengan rumus:
rp n  3
t
1  rp2
Dimana: rp = koefisien korelasi parsial n = jumlah sampel

Contoh:
1. Korelasi antara IQ dengan nilai kuliah = 0,58 ( ryx1 = 0,58)
64
MODUL STATISTIKA I
2. Korelasi antara nilai kuliah dengan waktu belajar = 0,1 ( ryx2 = 0,1)
3. Korelasi antara IQ dengan waktu belajar = -0,4 ( rx1x2 = -0,4)
Jika waktu belajar dibuat sama/dikendalikan, berapa korelasi antara IQ dengan nilai kuliah?
Jawab:
ryx1  ryx2 rx1x2

R y , x1x2 
1  rx21x2  1  ryx2 2
0,58  (0,1) (0,4)
 = 0,68
1  (0,4) 2  1  (0,1) 2
Dari perhitungan di atas diperoleh nilai koefisien korelasi parsial = 0,68, hal ini berarti bila orang
yang IQ-nya tinggi dan waktu belajarnya sama dengan yang IQ-nya rendah, maka nilai kuliahnya
akan jauh lebih tinggi.
Apakah koefisien korelasi yang ditemukan itu signifikan atau tidak maka perlu diuji, bila
jumlah sampel (n) = 25.
I. H0 : Tidak ada korelasi antara IQ dengan nilai kuliah jika waktu belajar dibuat
sama/dikendalikan(rp= 0).
H1: Ada korelasi antara IQ dengan nilai kuliah jika waktu belajar dibuat
sama/dikendalikan (rp ≠ 0).
II. α = 5% t ; df = n – 1 = t0,025 ; df = 25 -1 = t0,025 ; df =24 =2,064
2
III. Daerah penolakan H0 adalah jika thitung > 2,064 atau thitung < -2,064
IV. Statistik uji:
rp n  3 0,68 25  3
t =  4,35
1  rp2 1  0,68 2
V. Keputusan: Tolak H0 karena thitung > 2,064 atau 4,35 > 2,064
VI. Kesimpulan: Ada korelasi antara IQ dengan nilai kuliah bila waktu belajar dibuat sama (r p
≠ 0). Dengan demikian koefisien korelasi yang ditemukan tersebut adalah signifikan yaitu
dapat digeneralisasikan ke seluruh populasi dimana sampel diambil.
7.4 Koefisien Kontingensi

Koefisien kontingensi digunakan untuk menghitung hubungan antar variable bila datanya
berbentuk nominal. Koefisien kontingensi dapat dihitung dengan rumus sebagai berikut:
2
C
N  2
Dimana: C = Koefisien Kontingensi
χ2 = Chi Kuadrat
N = Jumlah data
Harga Chi Kuadrat dicari dengan rumus:
65
MODUL STATISTIKA I
r k O  Eij 
2
  
2 ij
i 1 j 1 Eij
Dimana: O = Observasi k = jumlah kategori variabel A
E = Ekspektasi / Harapan r = jumlah kategori variabel B
Untuk memudahkan perhitungan, maka data-data hasil penelitian perlu disusun ke dalam
tabel yang modelnya ditunjukkan pada tabel di bawah ini:
Variabel A
Variabel B Jumlah
A1 A2 ... Ak
B1 A1B1 A2B1 ... AkB1
B2 A1B2 A2B2 ... AkB2
... ... ... ... ...
Br A1Br A2Br ... AkBr
Jumlah
Contoh:
Dilakukan penelitian untuk mengetahui adalah hubungan antara profesi pekerjaan dengan jenis
olahraga yang sering dilakukan. Profesi dikelompokkan : Dokter, Pengacara, Dosen, Bisnis (Dr,
P, Do, Bi). Jenis olahraga dikelompokkan menjadi Golf, Tenis, Bulutangkis dan Sepak Bola (Go,
Te, Bt, Sb). Jumlah Dokter yang digunakan sebagai sampel = 58 orang, pengacara = 75 orang,
Dosen = 68 orang, Bisnis = 81. Jumlah seluruhnya 282 orang.
Jawab:
H0 : Tidak ada hubungan yang signifikan antara Jenis Profesi dengan Jenis Olahraga yang
disenangi.
H1 : Ada hubungan yang signifikan antara Jenis Profesi dengan Jenis Olahraga yang
disenangi.
Berdasarkan sampel 4 kelompok profesi yang dipilih secara random, diperoleh data
seperti ditunjukkan pada tabel di bawah ini.
Jenis Profesi
Olahraga Jumlah
Dr P Do Bi
Go 17 23 10 30 80
Te 23 14 17 26 80
Bt 12 26 18 14 70
Sb 6 12 23 11 52
Jumlah 58 75 68 81 282
66
MODUL STATISTIKA I
Untuk mengetahui f yang diharapkan (fh) pertama-tama dihitung berapa persen dari masing-
masing sampel yang menyenangi olahraga Golf, Tenis, Bulutangkis dan Sepak Bola.
Dari sini dapat dihitung prosentase:
1. ke empat sampel yang menyenangi olahraga Golf, adalah:
17  23  10  31 80
  0,284
282 282
2. ke empat sampel yang menyenangi olahraga Tenis, adalah:
23  14  17  26 80
  0,284
282 282
3. ke empat sampel yang menyenangi olahraga Bulutangkis, adalah:
12  26  18  14 70
  0,248
282 282
4. ke empat sampel yang menyenangi olahraga Sepak Bola, adalah:
6  12  23  11 52
  0,184
282 282
Selanjutnya masing-masing fh (frekuensi yang diharapkan) kelompok yang menyenangi
setiap jenis olahraga dapat dihitung:
a. Yang menyenangi Golf: b. Yang menyenangi Tenis:
1) fh Dokter = 0,284 x 58 = 16,472 1) fh Dokter = 0,284 x 58 =
16,472
2) fh Pengacara= 0,284 x 75 = 21,300 2) fh Pengacara= 0,284 x 75 =
21,300
3) fh Dosen = 0,284 x 68 = 19,312 3) fh Dosen = 0,284 x 68 =
19,312
4) fh Bisnis = 0,284 x 81 = 23,004 4) fh Bisnis = 0,284 x 81 =
23,004
Jumlah 80 Jumlah 80
c. Yang menyenangi Bulutangkis: d. Yang menyenagi Sepak Bola:
1) fh Dokter = 0,248 x 58 = 14,384 1) fh Dokter = 0,184 x 58 =0,672
2) fh Pengacara= 0,248 x 75 = 18,600 2) fh Pengacara= 0,184 x 75 =
13,800
3) fh Dosen = 0,248 x 68 = 16,864 3) fh Dosen = 0,184 x 68 =
12,512
4) fh Bisnis = 0,248 x 81 = 20,088 4) fh Bisnis = 0,184 x 81 =
14,904
Jumlah 70 Jumlah 52
Berdasarkan hasil perhitungan tersebut, selanjutnya dimasukkan dalam tabel:

Olahraga Dr P Do Bi Jumlah
67
MODUL STATISTIKA I
fo fh fo fh fo fh fo fh
Go 17 16,472 23 21,300 10 19,312 30 23,004 80
Te 23 16,472 14 21,300 17 19,312 26 23,004 80
Bt 12 14,384 26 18,600 18 16,864 14 20,088 70
Sb 6 10,672 12 13,800 23 12,512 11 14,904 52
Jumlah 58 75 68 81 282
Selanjutnya harga Chi Kuadrat dapat dihitung dengan rumus:
2
  
2 ij
i 1 j 1 Eij
Dalam hal ini O (observasi) = fo dan E (Ekspektasi) = fh.
 2

17  16,472 
2

23  21,3
2

11  14,904 
2
 29,881
16,472 21,3 14,904
2 29,881
Jadi  = 29,881 maka C 
2
2 =  0,31
N 282  29,881
Jadi besarnya koefisien kontingensi antara jenis profesi dengan kesenangan olahraga sebesar 0,31.
Untuk menguji signifikansi koefisien kontingensi (C) dapat dilakukan dengan uji Chi Kuadrat.
Langkah – langkah pengujiannya adalah sebagai berikut:
I H0 : Tidak ada hubungan yang signifikan antara jenis Profesi dengan jenis Olahraga
yang disenangi.
H1 : Ada hubungan yang signifikan antara jenis Profesi dengan jenis Olahraga yang
disenangi.
II α = 5% 2 ; df = (k-1)(r-1) =  02, 05 ; df = (4-1)(4-1) =  02, 05 ; df = 9 = 15,51
III Daerah penolakan H0 adalah jika  hitung

2
>  02, 05 ; df = 9 atau  hitung
2
> 15,51
IV Statistik uji:
2
  
2 ij
= 29,881
i 1 j 1 Eij
V Keputusan : Tolak H0 karena  hitung
2
> 15,51 atau 29,881 > 15,51
VI Kesimpulan : Jenis Profesi mempunyai hubungan yang signifikan dengan jenis olahraga
yang disenangi.
BAB VIII
68
MODUL STATISTIKA I
REGRESI LINEAR
Analisis regresi adalah analisis statistika yang bertujuan untuk memodelkan hubungan
antara variable independen dengan variable dependen. Analisis regresi digunakan bila kita ingin
mengetahui bagaimana variable dependen dapat diprediksi melalui variable independen. Dampak
dari penggunaan analisis regresi dapat digunakan untuk memutuskan apakah naik dan
menurunnya variable dependen dapat dilakukan melalui menaikkan dan menurunkan keadaan
variable independen.
8.1 Regresi Linear Sederhana
Regresi linear sederhana adalah analisis statistika yang bertujuan untuk memodelkan
hubungan antara satu variabel independent dengan satu variabel dependen. Persamaan umum
regresi linear sederhana adalah:
Yˆ = a + bX
Dimana: Y = variabel dependen a = konstanta (harga Y jika X = 0)
X = variabel independen b = koefisien regresi
Harga a dan b ini bisa dicari dengan rumus berikut:
Y  X    X  X Y 
2
a
i i i i i
n X   X  2 2
i i
n X Y   X  Y 
b
i i i i
n X   X  2 2
i i
Pengujian Terhadap Koefisien Regresi

Pengujian ini dilakukan untuk mengetahui apakah variabel independen (X) berpengaruh
terhadap variabel dependen (Y). Pengujian hipotesis terhadap koefisien regresi dilakukan melalui
langkah-langkah sebagai berikut:
1. Perumusan hipotesis
H0 : β = 0 , variable independen (X) tidak berpengaruh terhadap variable dependen
(Y)
H1 : β ≠ 0 , variable independen (X) berpengaruh terhadap variable dependen (Y)
2. Menentukan tingkat signifikansi α

3. Menentukan daerah kritis
H0 diterima apabila - tα/2 ; n-p-1 ≤ thitung ≤ tα/2 ; n-p-1
H0 ditolak apabila thitung < - tα/2 ; n-p-1 atau thitung > tα/2 ; n-p-1
4. Menentukan statistik uji thitung
thitung =
dimana:
69
MODUL STATISTIKA I
b : koefisien regresi
sb : kesalahan standard koefisien regresi yang dapat ditentukan dengan rumus:
∑ ̂
√
√∑ ∑
Keterangan: se : kesalahan baku atau standar error

X : variabel independen
Y : variabel dependen
̂ : variabel Y hasil taksiran regresi
n : jumlah data
p : jumlah variabel X
5. Membuat keputusan
Dilakukan dengan membandingkan nilai thitung dengan ttabel
6. Membuat kesimpulan
Contoh 1:
Data berikut adalah hasil pengamatan terhadap nilai kualitas layanan (X) dan nilai rata-rata
penjualan barang tertentu tiap bulan (Y).
Kualitas Layanan Penjualan
No
(X) Barang (Y)
1 54 167
2 50 155
3 53 148
4 45 146
5 48 170
6 63 173
7 46 149
8 56 166
9 52 170
10 56 174
a) Buatlah persamaan regresi linear sederhananya dan apa artinya!

b) Ujilah koefisien regresi pada α = 5%!
Jawab a:
Berikut ini adalah tabel penolong untuk menghitung persamaan regresi sederhana dan korelasi:
No X Y XY X2 Y2
1 54 167 9018 2916 27889
2 50 155 7750 2500 24025
70
MODUL STATISTIKA I
3 53 148 7844 2809 21904

4 45 146 6570 2025 21316
5 48 170 8160 2304 28900
6 63 173 10899 3969 29929
7 46 149 6854 2116 22201
8 56 166 9296 3136 27556
9 52 170 8840 2704 28900
10 56 174 9744 3136 30276
Jumlah 523 1618 84975 27615 262896
a
1618 27615   52384975  = 91,24
1027615   523 
2
1084975   523 1618 

b = 1,35
1027615   523 
2
Persamaan regresi linear sederhananya adalah sebagai berikut:

Yˆ  91,24  1,35 X
Dari persamaan regresi di atas dapat diartikan bahwa, bila nilai kualitas layanan bertambah 1,
maka nilai rata-rata penjualan barang tiap bulan akan bertambah 1,35 atau setiap nilai kualitas
layanan bertambah 10 maka nilai rata-rata penjualan tiap bulan akan bertambah sebesar 13,5.
Antara nilai kualitas layanan dengan nilai penjualan tiap bulan dapat dihitung korelasinya.
Korelasi dapat dihitung dengan rumus:
n X i Yi   X i  Yi 
r
{n X i2   X i  }{n Yi 2   Yi  }
2 2
1084975   523 1618 

r = 0,66
{1027615   523  }{10262896   1618  }
2 2
Dari nilai koefisien korelasi tersebut dapat disimpulkan bahwa terdapat hubungan yang
positif sebesar 0,66 antara nilai kualitas layanan dan rata-rata penjualan barang tiap bulan.
Koefisien determinasinya r2 = 0,662 = 0,4356. hal ini berarti nilai rata-rata penjualan barang tiap
bulan 43,56% ditentukan oleh nilai kualitas layanan yang diberikan, sisanya 56,44% ditentukan
oleh faktor lain.
Jawab b:
No Yˆ Y  Yˆ 
2
1 164.14 8.1796
2 158.74 13.9876
3 162.79 218.7441
4 151.99 35.8801
5 156.04 194.8816
6 176.29 10.8241
7 153.34 18.8356
8 166.84 0.7056
71
MODUL STATISTIKA I
9 161.44 73.2736
10 166.84 51.2656
jumlah 626.5775
Berikut ini adalah tahapan pengujian koefisien regresi linear sederhana:
1. H0 : β = 0 , kualitas layanan (X) tidak berpengaruh terhadap penjualan barang (Y)
H1 : β ≠ 0 , kualitas layanan (X) berpengaruh terhadap penjualan barang (Y)
2. α = 5% maka ttabel = t0,025 ; 10 – 1 – 1 = t0,025 ; 8 = 2,306
3. Daerah kritis :
H0 diterima apabila – 2,306 ≤ thitung ≤ 2,306
H0 ditolak apabila thitung < - 2,306 atau thitung > 2,306
Daerah penolakan H0 Daerah penolakan H0
-2,306 0 2,306
4. Statistik uji:
∑ ̂
√ =√ =√ = 8,85
= = = 0,547
√∑ ∑ √ √
thitung = = = 2,468
5. Keputusan: tolak H0 karena thitung > t0,025 ; 8 atau 2,468 > 2,306
6. Kesimpulan: Kualitas Layanan (X) berpengaruh terhadap Penjualan Barang (Y)
8.2 Regresi Linear Berganda
Analisis regresi berganda digunakan untuk memodelkan hubungan antara variabel
dependen (respon) dengan dua atau lebih variabel independent (prediktor). Jadi analisis regresi
ganda akan dilakukan bila jumlah variabel independennya minimal 2.
Persamaan regresi berganda untuk dua prediktor adalah
Yˆ = a + b1X1 + b2X2
Persamaan regresi berganda untuk n prediktor adalah
Yˆ = a + b1X1 + b2X2 +. . . + bnXn
8.2.1 Regresi Linear Berganda Dua Prediktor

Persamaan regresi berganda untuk dua prediktor adalah
Yˆ = a + b1X1 + b2X2
Konstanta (a) dan koefisien regresi linear berganda dua predictor (b1 dan b2) dapat dihitung
dengan rumus sebagai berikut:
a  Y  b1 X 1  b2 X 2
72
MODUL STATISTIKA I
b1 
 x  x y    x x  x y 
2
2 1 1 2 2
 x  x    x x 
2
1
2
2 1 2
2
 x  x y    x x  x y 
 
2
1 2 1 2 1
 x  x   x x 
b2 2 2 2
2 1 1 2
Dimana:
Y 
Y X1 
X 1
X2 
X 2
n n n
 y   Y  nY
2 2 2
 x   X  nX
2
1 1
2
1
2
 x   X  nX
2
2
2
2
2
2  x y   X Y  nX Y
1 1 1
 x y   X Y  nX Y
2 2 2  x x   X X  nX
1 2 1 2 1 X2
8.2.2 Pengujian Koefisien Regresi Linear Berganda Dua Prediktor

Pengujian hipotesis bagi koefisien regresi linear berganda dibedakan menjadi dua bentuk,
yaitu pengujian hipotesis secara serentak/simultan dan pengujian hipotesis secara individu.
A. Pengujian secara serentak/simultan
Pengujian secara serentak merupakan pengujian hipotesis koefisien regresi berganda
dengan β1 dan β2 serentak atau bersama-sama mempengaruhi Y. Langkah-langkah
pengujiannya adalah sebagai berikut:
1. Menentukan hipotesis:
H0 : β1 = β2 = 0 (X1 dan X2 tidak mempengaruhi Y)
H1 : Paling sedikit ada satu βi ≠ 0
(X1 dan X2 mempengaruhi Y atau paling sedikit ada satu X yang mempengaruhi Y)

H0 ditolak jika nilai F > F α,p,n-p-1
H0 diterima jika nilai F ≤ F α,p,n-p-1
4. Menentukan statistic uji

Tabel ANOVA
Sumber db Jumlah Kuadrat Tengah F
Variasi Kuadrat (KT)
Regresi p
 (Yˆ  Y )  (Yˆ  Y ) KT .Re gresi
2 2
/p
KT .Re sidual
73
MODUL STATISTIKA I
Residual n-p-1
(Y  Yˆ ) (Y  Yˆ )
2 2
/ (n-p-1)
 (Y  Y )
Total n-1 2
5. Keputusan
Memutuskan apakah menerima atau menolak H0 dengan membandingkan nilai Fhitung
dengan Ftabel.
6. Kesimpulan
B. Pengujian secara individu

Pengujian ini dilakukan untuk mengetahui masing-masing parameter yang signifikan
terhadap model. Langkah-langkah pengujiannya adalah sebagai berikut:
1. Perumusan hipotesis
H0 : βi = 0 , variable independen (Xi) tidak berpengaruh terhadap variable dependen
(Y)
H1 : βi ≠ 0 , variable independen (Xi) berpengaruh terhadap variable dependen (Y)
H0 diterima apabila - tα/2 ; n-p-1 ≤ thitung ≤ tα/2 ; n-p-1
H0 ditolak apabila thitung < - tα/2 ; n-p-1 atau thitung > tα/2 ; n-p-1
4. Menentukan statistik uji thitung
thitung =
dimana:
b : koefisien regresi
sb : kesalahan standard koefisien regresi
Untuk koefisien regresi b1 dan b2, kesalahan standardnya dirumuskan sebagai berikut:
√ ∑ ̅
√ ∑ ̅
Keterangan: : korelasi product momen antara X1 dengan X2 yang dirumuskan:

∑ ∑ ∑
√{ ∑ ∑ }{ ∑ ∑ }
se : kesalahan baku atau standar error yang dirumuskan:
∑ ̂
√
X : variabel independen
74
MODUL STATISTIKA I
Y : variabel dependen
̂ : variabel Y hasil taksiran regresi
n : jumlah data
p : jumlah variabel X
5. Membuat keputusan
Dilakukan dengan membandingkan nilai thitung dengan ttabel
6. Membuat kesimpulan
Contoh 2:
Sebuah penelitian untuk mengetahui pengaruh kemampuan kerja pegawai (X 1) dan
kepemimpinan direktif (X2) terhadap produktivitas kerja pegawai (Y). Berdasarkan 10 responden
yang digunakan sebagai sumber data penelitian, hasilnya sebagai berikut:
No.
X1 X2 Y
responden
1 10 7 23
2 2 3 7
3 4 2 15
4 6 4 17
5 8 6 23
6 7 5 22
7 4 3 10
8 6 3 14
9 7 4 20
10 6 3 19
a. Buatlah persamaan regresi linear berganda dan apa artinya!

b. Ujilah koefisien regresi linear berganda pada α = 5% secara simultan (serentak)
maupun secara individu!
Jawab a:
No X1 X2 Y X1Y X2Y X1X2 X12 X22 Y2
1 10 7 23 230 161 70 100 49 529
2 2 3 7 14 21 6 4 9 49
3 4 2 15 60 30 8 16 4 225
4 6 4 17 102 68 24 36 16 289
5 8 6 23 184 138 48 64 36 529
6 7 5 22 154 110 35 49 25 484
7 4 3 10 40 30 12 16 9 100
8 6 3 14 84 42 18 36 9 196
9 7 4 20 140 80 28 49 16 400
10 6 3 19 114 57 18 36 9 361
jumlah 60 40 170 1122 737 267 406 182 3162
Y = 17 X1 = 6 X2 = 4
75
MODUL STATISTIKA I
 x = 406 – 10(6)2 = 46
2
1  x = 182 – 10(4)2 = 22
2
2
 x y = 1122 – 10(6)(17) = 102

1  x y = 737 – 10(4)(17) = 57
2
 x x = 267 – 10 (6)(4) = 27
1 2  y = 3162 – 10 (17)2 = 272
2
b1 
22 102   27 57  = 2,491
46 22   27 2
b2 
46 57   27 102  = -0,466
22 46   27 2
a = 17 – (2,491)(6)- (-0,466)(4) = 3,918
Jadi persamaan regresi linear berganda untuk dua predictor (kemampuan kerja pegawai dan
kepemimpinan direktif) adalah:
Yˆ = 3,918 + 2,491 X1 – 0,466 X2
Dari persamaan tersebut berarti produktivitas kerja pegawai akan naik bila kemampuan
pegawai ditingkatkan, dan akan turun jika kepemimpinan direktif (otoritas) ditingkatkan.
Jawab b:
No Yˆ Yˆ  Y 
2
Y  Yˆ 2
Y  Y 2
1 25.566 73.376356 6.584356 36

2 7.502 90.212004 0.252004 100
3 12.95 16.4025 4.2025 4
4 17 0 0 0
5 21.05 16.4025 3.8025 36
6 19.025 4.100625 8.850625 25
7 12.484 20.394256 6.170256 49
8 17.466 0.217156 12.01316 9
9 19.491 6.205081 0.259081 9
10 17.466 0.217156 2.353156 4
jumlah 227.527634 44.48763 272
1. Uji secara simultan (serentak)

I. H0 : β1 = β2 = 0 (X1 dan X2 tidak mempengaruhi Y)
H1 : Paling sedikit ada satu satu β i ≠ 0 (X1 dan X2 mempengaruhi Y atau paling
sedikit ada satu X yang mempengaruhi Y)
II. α = 5% maka F0,05 ; 2 ; 7 = 4,74
Kurva Distribusi F
Daerah penolakan H0
Daerah penerimaan H0
4,47
76
MODUL STATISTIKA I
III. H0 ditolak jika F hitung > 4,74

IV. Statistik uji:
Tabel ANOVA
Sumber db Jumlah Kuadrat F
Variasi Kuadrat Tengah
(KT)
Regresi 2 227,53 227,53 113,77
 113,77  17,89
2 6,36
Residual 7 44,49 44,49

 6,36
7
Total 9 272
V. Keputusan: Tolak H0 karena F hitung > 4,74 atau 17,89 > 4,74
VI. Kesimpulan: X1 (kemampuan kerja pegawai) dan X2 (kepemimpinan derektif)
mempengaruhi Y (produktivitas pegawai).
2. Uji secara individu

∑ ∑ ∑
√{ ∑ ∑ }{ ∑ ∑ }
= = = 0,849
√{ }{ } √
 Uji koefisien β1
I. H0 : β1 = 0 (X1 tidak mempengaruhi Y)
H1 : β1 ≠ 0 (X1 mempengaruhi Y)
II. α = 5% maka t0,025 ; 7 = 2,365
III. H0 ditolak jika t hitung > 2,365 atau t hitung < - 2,365
IV. Statistik uji:

ˆ1 2,491
t =  3,54
SEˆ 0,703
1
V. Keputusan: Tolak Ho karena t hitung > 2,365 atau 3,54 > 2,365
VI. Kesimpulan: X1 (kemampuan kerja pegawai) mempengaruhi Y
 Uji koefisien β2
I. H0 : β2 = 0 (X2 tidak mempengaruhi Y)
H1 : β2 ≠ 0 (X2 mempengaruhi Y)
II. α = 5% maka t0,025 ; 7 = 2,365
77
MODUL STATISTIKA I
III. H0 ditolak jika t hitung > 2,365 atau t hitung < - 2,365
IV. Statistik uji:
ˆ2  0,466
t =  0,459
SEˆ 1,016
2
V. Keputusan: Terima Ho karena t hitung > - 2,365 atau -0,459 > -2,365
VI. Kesimpulan: X2 (kepemimpinan derektif) tidak mempengaruhi Y
Latihan:
1. Di bawah ini adalah hasil pengamatan mahasiswa terhadap hasil penjualan produk susu, yang
dipengaruhi oleh biaya promosi. Dan hasil pengamatan tersebut dalam bentuk jutaan rupiah,
yaitu dikemukakan per bulan selama tahun 2009 dan datanya adalah sebagai berikut:
No Bulan Promosi Penjualan No Bulan Promosi Penjualan
1. Januari 38,2 1.910,4 7. Juli 64,3 2.794,1
2. Februari 40,8 2.061,3 8. Agustus 72,5 3.021,3
3. Maret 43,3 2.176,0 9. September 76,8 3.343,0
4. April 46,9 2.345,0 10. Oktober 78,0 3.395,0
5. Mei 52,1 2.460,0 11. Nopember 79,9 3.477,7
6. Juni 53,2 2.637,1 12. Desember 80,8 3.648,0
Jika tingkat keyakinan terhadap data tersebut adalah 90%, maka yang menjadi pertanyaan
adalah:
a. Apakah ada pengaruh promosi terhadap penjualan?
b. Ujilah koefisien regresinya!
78

Modul Statistika

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Modul Statistika

Diunggah oleh

Hak Cipta:

Format Tersedia

MODUL STATISTIKA I

1.3 Kegunaan Statistika

Contoh penggunaan statistik dalam lingkup kehidupan sehari-hari antara lain:

1.4 Data Statistika

1.4.3 Macam-macam Data

Interval kelas = tepi atas – tepi bawah

Titik tengah = (batas bawah + batas atas)

Langkah-langkah membuat distribusi frekuensi adalah:

Jumlah kelas (k) = 1+3,322 log n

b) Menentukan interval kategori. Interval kategori ditentukan sebagai berikut:

b) Setiap data hanya dapat masuk ke dalam satu kelas

Perusahaan Harga Per

Perusahaan Harga Per

 Langkah kedua : membuat kategori atau kelas.

Kelas ke- Interval Keterangan

 Langkah ketiga : melakukan penturusan atau pentabulasian

3.2 Frekuensi Relatif dan Frekuensi Kumulatif

2 1805 – 3394 4 20% (4/20) x 100%

3.3 Diskripsi Data dengan Grafik

Histogram Harga Saham di BEJ

Tepi kelas interval harga saham

Grafik Poligon Harga Saham di BEJ

3.3.3 Kurva Ogif

2. Kurva Ogif Negatif

Kurva Ogif Positif Harga Saham di BEJ

Kurva Ogif Negatif Harga Saham di BEJ

Susunlah data di atas kedalam distribusi frekuensi!

Dimana : µ : rata-rata hitung populasi X : Nilai data yang berada dalam

Dimana : ̅ : rata-rata hitung sampel X: nilai data yang berada dalam

Interval Nilai Tengah Jumlah fixi

3.2.1 Median untuk Data Tidak Berkelompok

PT. H.M. Sampoerna 1.480

3.2.2 Median untuk Data Berkelompok

sebagai berikut: Median = L +

Median = L + dimana i = tepi atas kelas – tepi bawah kelas

= 447,5 + x 144 = 303,5 – 159,5 = 144

Dimana : L : tepi bawah kelas dimana modus berada

592 – 735 3 591,5

Rumus Ukuran Letak

PT. Bimantara Citra 392

Dimana: NKi = nilai kuartil ke-i dimana i = 1, 2, 3

1. Menentukan letak kuartil K1 = (1 x 20) / 4 = 5 K2 = (2 x 20) / 4 = 10

NK1 = 303,5 + x 144 = 303,5 + 86,4 = 389,9

NK2 = 447,5 + x 144 = 447,5 + 48 = 495,5

NK1 = 447,5 + x 144 = 447,5 + 128 = 575,5

Rumus Ukuran Letak

ND = NDB + [(LD – LDB) / (LDA - LDB)] X (NDA - NDB)

Nama Perusahaan Laba Bersih (Rp Miliar)

Interval Frekuensi Tepi Bawah Frek

592 – 735 3 591,5 19 D9

736 – 879 1 735,5 20

 Nilai desil (D2) untuk letak desil 4 adalah

ND2 = 303,5 + x 144 = 303,5 + 57,6 = 361,1

 Nilai desil (D5) untuk letak desil 10 adalah

ND5 = 447,5 + x 144 = 447,5 + 48= 495,5

 Nilai desil (D9) untuk letak desil 18 adalah

ND9 = 591,5 + x 144 = 591,5 + 96 = 687,5

NP75 = 250 + [(6,75 - 6)/(7-6)] X (260 - 250)

Dimana: NPi = nilai persentil ke-i dimana i = 1, 2, 3

Interval Frekuensi Tepi Bawah Frek

736 – 879 1 735,5 20

NP85 = 591,5 + X 144