Anda di halaman 1dari 14

Deskripsi

Data

Setelah mempelajari bab ini, mahasiswa diharapkan dapat:

 meringkas data kategori ke dalam suatu tabel frekwensi dan suatu tabel tabulasi
silang
 menginterpretasikan hasil dari suatu tabel frekwensi pasti dan suatu tabel
tabulasi silang
 membangun dan menginterpretasikan diagram batang
 mengklasifikasikan data ke dalam suatu distribusi frekuensi dan suatu distribusi
frekuensi kumulatif
 membangun dan menginterpretasikan suatu histogram dan suatu ogive
 membangun dan menginterpretasikan suatu ploting menyebar dari dua ukuran
numerik
 menampilkan data gugus berkala sebagai grafik garis dan kecenderungan
interpretasi
 menguraikan konsep kecondongan
 mengkalkulasi dan menginterpretasikan koefisien kecondongan
Deskripsi Data

3-1 Pendahuluan
Seringkali kita menghadapi masalah menyajikan sejumlah besar data statistik dalam bentuk
yang ringkas dan kompak. Meskipun ukuran numerik bagi lokasi dan ragam jelas merupakan
deskripsi yang kompak dan bermanfaat bagi segugus pengamatan, ukuran-ukuran tersebut
tidak dapat mengidentifikasikan semua ciri yang penting. Sejumlah informasi dapat
diperoleh kembali bila data asal yang banyak tersebut diringkaskan dan disajikan dalam
bentuk tabel, diagram, dan grafik yang layak.

3-2 Distribusi Frekuensi


Ciri-ciri penting sejumlah besar data dengan segera dapat diketahui melalui pengelompokan
data tersebut ke dalam beberapa kelas, dan kemudian dihitung banyaknya pengamatan yang
masuk ke dalam setiap kelas. Susunan demikian ini, dalam bentuk tabel, disebut distribusi
frekuensi.
Data yang disajikan dalam bentuk distribusi frekuensi dikatakan sebagai data yang telah
dikelompokkan. Kita sering kali mengelompokkan data sampel ke dalam selang-selang agar
memperoleh gambaran yang lebih baik mengenai populasi yang belum diketahui tersebut.
Tetapi dengan cara ini kita kehilangan identitas masing-masing pengamatan dalam sampel itu.

Tabel 3-1
Distribusi Frekuensi bagi Bobot 50 Potong Koper
Bobot
Banyaknya
(kilogram)
7 - 9 2
10 - 12 8
13 - 15 14
16 - 18 19
19 - 21 7

Tabel 3-1 adalah distribusi frekuensi bobot 50 potong koper, yang dicatat sampai kilogram
terdekat, milik penumpang pesawat suatu penerbangan. Untuk data tersebut diambil 5
selang kelas, 7-9, 10-12, 13-15, 16-18, dan 19-21. Nilai-nilai terkecil dan terbesar dalam
setiap selang disebut limit kelas. Untuk selang 10-12, bilangan yang lebih kecil, yaitu 10,
disebut limit bawah kelas, sedangkan bilangan yang lebih besar, yaitu 12, disebut limit
atas kelas. Data aslinya dicatat sampai kilogram yang terdekat, sehingga 8 pengamatan
dalam selang 10-12 adalah bobot semua koper yang beratnya lebih dari 9,5 kilogram tetapi
kurang dari 12,5 kilogram. Kedua bilangan 9,5 dan 12,5 tersebut disebut batas kelas bagi
selang bersangkutan. Untuk selang 10-12, bilangan yang 9,5 disebut batas bawah kelas,
sedangkan bilangan 12,5 disebut batas atas kelas. Tetapi 12,5 sekaligus juga merupakan
batas bawah kelas bagi selang 13-15. Batas kelas selalu dinyatakan satu desimal lebih
banyak daripada pengamatan asalnya. Hal ini menjamin bahwa tidak ada pengamatan yang
jatuh tepat pada batas kelas, sehingga menghindarkan keraguan pada kelas mana
pengamatan itu termasuk. Banyaknya pengamatan yang masuk dalam suatu kelas tertentu
disebut frekuensi kelas dan dilambangkan dengan huruf f .
Lebar kelas suatu kelas didefinisikan sebagai selisih antara batas atas kelas dengan batas
bawah kelas bagi kelas bersangkutan. Dalam prakteknya kita lebih menyukai bila kelas-kelas
tersebut memiliki lebar kelas yang sama. Dalam hal demikian lebar kelas tersebut akan kita
lambangkan dengan c . Untuk data dalam Tabel 3-1, kita memperoleh c  3 kilogram.
Titik tengah antara batas atas dan batas bawah kelas, yang berarti juga sama dengan antara
kedua limit kelas, disebut titik tengah kelas. Untuk Tabel 3-2, titik-titik tengah kelasnya
adalah 8, 11, 14, 17, dan 20.

30
Deskripsi Data

Tabel 3-2
Distribusi Frekuensi bagi Bobot 50 Potong Koper
Selang Batas Titiktengah Frekuensi
Kelas Kelas Kelas (x) (f)
7 - 9 2 2 2
10 - 12 8 8 8
13 - 15 14 14 14
16 - 18 19 19 19
19 - 21 7 7 7

Tabel 3-1 adalah jenis distribusi yang mungkin kita jumpai dalam laporan-laporan dan
koran-koran. Untuk kepentingan statistik biasanya lebih menguntungkan bila kita
menyajikan dalam bentuk distribusi yang lebih terinci, seperti yang diperlihatkan dalam
Tabel 3-2 bagi data yang sama. Tabel 3-2 mengandung informasi yang nanti akan kita lihat
manfaat dalam menghitung ciri-ciri deskripsi yang lain bagi data kita.
Untuk mengilustrasikan pembuatan suatu distribusi frekuensi, perhatikan data Tabel 3-3,
yang merupakan umur 40 buah aki mobil yang serupa jenisnya dan dicatat sampai
persepuluhan tahun terdekat. Aki-aki mobil tersebut dijamin mencapai umur 3 tahun.

Tabel 3-3
Umur Aki Mobil
2,2 4,1 3,5 4,5 3,2 3,7 3,0 2,6
3,4 1,6 3,1 3,3 3,8 3,1 4,7 3,7
2,5 4,3 3,4 3,6 2,9 3,3 3,9 3,1
3,3 3,1 3,7 4,4 3,2 4,1 1,9 3,4
4,7 3,8 3,2 2,6 3,9 3,0 4,2 3,5

Pertama-tama kita harus menetapkan berapa banyaknya kelas yang akan kita ambil. Ini
biasanya dilakukan secara semau dan sesuai dengan kehendak kita, meskipun kita
dibimbing oleh ukuran atau besarnya contoh kita. Tentu saja kita menginginkan banyaknya
kelas lebih sedikit daripada banyaknya pengamatan, sebab bila tidak demikian kita tidak
memperoleh apa-apa dari pengelompokan tersebut. Karena dalam pengelompokan itu kita
kehilangan identitas pengamatan individu, maka banyaknya kelas yang terlalu sedikit akan
membuang atau menghancurkan terlalu banyak informasi. Biasanya banyaknya selang kelas
diambil antara 5 dan 20. Semakin sedikit banyaknya data, semakin sedikit pula banyaknya
kelas yang diambil. Untuk data Tabel 3-3, baiklah kita ambil 7 selang kelas. Lebar kelas harus
cup besar sehingga ketujuh kelas tersebut dapat mencakup semua data. Untuk menentukan
lebar kelas kita bagi wilayah data dengan bayaknya selang. Dalam sampel kita, wilayahnya
adalah 4,7 – 1,6 = 3,1, sehingga lebar kelas tidak boleh kurang dari 3,1/7 = 0,443. Karena
lebar kelas harus memiliki angka nyata yang sama dengan pengamatannya, maka kita ambil
c=0,5.
Sekarang kita harus memutuskan dimana memulai selang yang paling bawah. Kalau kita
mulai selang kelas paling bawah pada 1,5, maka batas bawah bagi selang ini adalah 1,45.
Pada bilangan ini kita tambahkan lebar kelas 0,5, untuk memperoleh batas atas kelas
tersebut, yaitu 0,95. Oleh karena itu, limit atas kelas bagi selang yang pertama haruslah 1,9.
Perhatikan bahwa pertama-tama kita harus menentukan limit bawah kelas bagi selang yang
pertama, kemudian sebelum menentukan limit atas kelasnya, kita tetapkan dulu kedua batas
kelasnya. Dengan bekerja menurut urutan demikian bagi selang kelas yang pertama akan
tercegah kemungkinan kesalahan yang sering dibuat orang. Titik tengah kelas bagi kelas ini
adalah rata-rata limit atas dan bawahnya, (1,5 + 1,9)/2 = 1,7.

31
Deskripsi Data

Batas-batas kelas serta selang-selang lainnya sekarang dapat diperoleh dengan


menambahkan lebar kelas 0,5 pada masing-masing limit kelas dan batas kelas sampai kita
memperoleh selang yang ketujuh, yang mengandung pengamatan yang terbesar dalam
gugus data tersebut. Terakhir, kita menghitung banyaknya pengamatan yang jatuh dalam
masing-masing kelas dan menuliskan hasilnya pada kolom atau lajur frekuensi. Sebagai
pegangan, totalkan kolom frekuensi tersebut untuk melihat apakah semua pengamatan telah
diperhitungkan atau tidak. Distribusi frekuensi bagi data Tabel 3-3 diberikan dalam Tabel 3-4.

Tabel 3-4
Distribusi Frekuensi Umur Aki
Selang Titiktengah Frekuensi
Batas Kelas
Kelas Kelas (x) (f)
1,5 - 1,9 1,45 - 1,95 1,7 2
2,0 - 2,4 1,95 - 2,45 2,2 1
2,5 - 2,9 2,45 - 2,95 2,7 4
3,0 - 3,4 2,95 - 3,45 3,2 15
3,5 - 3,9 3,45 - 3,95 3,7 10
4,0 - 4,4 3,95 - 4,45 4,2 5
4,5 - 4,9 4,45 - 4,95 4,7 3

Langkah-langkah membuat
1. Tentukan banyaknya selang kelas yang diperlukan
2. Tentukan wilayah data tersebut
3. Bagilah wilayah tersebut dengan banyaknya kelas untuk menduga lebar selangnya
4. Tentukan limit bawah kelas bagi selang yang pertama dan kemudian batas bawah
kelasnya. Tambahkan lebar kelas pada batas bawah kelas untuk mendapatkan batas
atas kelasnya
5. Daftarkan semua limit kelas dan batas kelas dengan cara menambahkan lebar kelas
pada limit dan batas selang sebelumnya
6. Tentukan titik tengah kelas bagi masing-masing selang dengan merata-ratakan limit
kelas atau batas kelasnya
7. Tentukan frekuensi bagi masing-masing kelas
8. Jumlahkan kolom ferekuensi dan periksa apakah hasilnya sama dengan banyaknya
total pengamatan

Variasi bagi Tabel 3-4 dapat diperoleh dengan menentukan frekuensi relatif atau
persentase bagi masing-masing selang. Frekuensi relatif masing-masing kelas diperoleh
dengan cara membagi frekuensi kelas dengan frekuensi total. Tabel yang memuat frekuensi
relatif disebut distribusi frekuensi relatif. Bila setiap frekuensi relatif tersebut digandakan
dengan 100%, maka kita memperoleh apa yang disebut distribusi persentase. Distribusi
frekuensi relatif bagi data dalam Tabel 3-2 diberikan dalam Tabel 3-5.

Tabel 3-5
Distribusi Frekuensi Relatif bagi Bobot 50 Potong Koper
Titiktengah Frekuensi
Selang Kelas Batas Kelas
Kelas (x) (f)
7,0 - 9 6,5 - 9,5 8 0,04
10,0 - 12 9,6 - 12,5 11 0,16
13,0 - 15 12,7 - 15,5 14 0,28
16,0 - 18 15,8 - 18,5 17 0,38
19,0 - 21 18,9 - 21,5 20 0,14

32
Deskripsi Data

Dalam banyak keadaan kita lebih tertarik bukan pada banyaknya pengamatan dalam suatu
kelas tertentu, namun pada banyaknya pengamatan yang jatuh di atas atau bawah sebuah
nilai tertentu. Misalnya, dalam Tabel 3-4 banyaknya aki yang umurnya kurang dari 3 tahun
ada 7. Frekuensi total semua nilai yang lebih kecil daripada batas atas kelas suatu selang kelas
tertentu disebut frekuensi kumulatif sampai dan termasuk kelas tersebut. Suatu tabel seperti
Tabel 3-6, ang menunjukkan frekuensi kumulatif, disebut distribusi frekuensi kumulatif.

Tabel 3-6
Distribusi Frekuensi Kumulatif bagi Umur Aki
Frekuensi
Batas Kelas
Kumulatif
Kurang dari 1,45 0
Kurang dari 1,95 2
Kurang dari 2,45 3
Kurang dari 2,95 7
Kurang dari 3,45 22
Kurang dari 3,95 32
Kurang dari 4,45 37
Kurang dari 4,95 40

Ada dua alternatif lain bagi Tabel 3-6 yaitu dengan menggunakan frekuensi relatif dan persentase.
Distribusi yang demikian itu disebut distribusi frekuensi kumulatif relatif dan ditribusi
kumulatif persentase. Distribusi kumulatif persentase memungkinkan kita membaca
dengan cepat persentase pengamatan yang jatuh di bawah nilai tertentu. Misalnya, dalam
Tabel 3-7 kita melihat bahwa 80% dari semua aki tersebut umurnya kurang dari 3,95 tahun.

Tabel 3-7
Distribusi Kumulatif Persentase bagi Umur Aki
Persen
Batas Kelas
Kumulatif
Kurang dari 1,45 0,0
Kurang dari 1,95 5,0
Kurang dari 2,45 7,5
Kurang dari 2,95 17,5
Kurang dari 3,45 55,0
Kurang dari 3,95 80,0
Kurang dari 4,45 92,5
Kurang dari 4,95 100,0

Latihan yang telah kita bicarakan sejauh ini berkaitan semata-mata dengan data numerik
atau kuantitatif. Tentu saja, tabel frekuensi juga dapat dibuat untuk data kategori atau
kualitatif. Misalkan, jumlah mobil milik sebuah agen penyewaan di sebuah bandar udara.
Seperti juga sebelumnya, kita harus menentukan berapa banyak kategori atau kelas yang
digunakan. Kategori-kategori tersebut harus diambil sehingga mencakup semua data dan
tidak ada suatu pengamatanpun yang masuk ke dalam lebih satu kategori. Konsep-konsep
limit kelas, batas kelas, dan titik tengah kelas biasanya tidak menarik perhatian kita bila kita
membuat distribusi frekuensi bagi data kategori.

33
Deskripsi Data

3-3 Penyajian Grafik


Informasi yang dikandung suatu distribusi frekuensi dalam bentuk tabel biasanya menjadi
lebih mudah ditangkap bila disajikan secara grafik. Pada kebanyakan orang, gambar visual
sangat membantu dalam memahami ciri-ciri penting yang ada pada suatu distribusi
frekuensi. Sajian grafik yang sangat luas digunakan bagi data numerik adalah diagram
balok yang diperlihatkan dalam Gambar 3-1 untuk data Tabel 3-4.
Dari diagram balok itu orang dapat dengan cepat mengetahui bahwa kebanyakan aki
berumur dari 3,0 sampai 3,4 tahun, hanya sedikit yang umurnya kurang dari 2,5 tahun, tetapi
juga tidak ada aki yang mencapai umur lebih dari 4,9 tahun. Dalam diagram balok, sebagai
lebar balok diambil selang kelas distribusi frekuensinya, sedangkan frekuensi setiap kelas
ditunjukkan oleh tinggi balok.

Gambar 3-1
Diagram Balok

Meskipun diagram balok menyampaikan dengan segera informasi yang dikandung segugus
data dalam bentuk yang ringkas, biasanya kita lebih tertarik pada sajian gambar yang erat
hubungannya yang disebut histogram. Suatu histogram berbeda dari diagram balok dalam
hal sebagai lebar baloknya digunakan batas kelas dan bukan limit kelas. Digunakannya batas
kelas bagi lebar balok menghilangkan ruang yang ada antara balok-balok sehingga
memberikan bentuk yang padat (lihat Gambar 3-2)
Untuk beberapa masalah tertentu akan lebih baik bila sumbu tegaknya menyatakan
frekuensi relatif atau persentase. Grafiknya, yang disebut histogram frekuensi relatif atau
histogram persentase, memiliki bentuk yang persis sama dengan histogram frekuensi,
hanya saja skala tegaknya berbeda.
Ketika melihat ke histogram, mata kita cenderung membandingkan luas persegipanjang-
persegipanjang tersebut dan bukan tingginya. Meskipun ini dapat diterima untuk selang-
selang kelas yang lebarnya sama, tetapi dapat menyesatkan bila ada kelas-kelas yang
lebarnya berbeda. Orang-orang yang tidak bertanggung jawab, ada yang sengaja menyajikan
data secara salah dengan membuat histogram yang lebar kelasnya tidak sama. Misalkan kita
menggabungkan kedua kelas 2,5-2,9 dan 3,0-3,4 pada tabel 3-4 menjadi sebuah selang 2,5-
3,4 yang mengandung 19 pengamatan.

Gambar 3-2
Histogram Frekuensi

34
Deskripsi Data

Gambar 3-3
Histogram Frekuensi yang Tidak Benar
dengan Lebar Kelas yang Tidak Sama

Dalam Gambar 3-3, kita memperoleh kesan yang salah bahwa lebih dari separuh
pengamatan masuk dalam selang yang panjang, 2,5-3-4, padahal sebenarnya kurang dari
separuh, tepatnya satu kurangnya dari separuh. Untuk memperbaiki hal ini, kita harus
membagi dua tinggi persegi panjang baru ini agar memperoleh gambar visual yang benar
seperti diperlihatkan dalam Gambar 3-4. Sekarang tentu saja luasnya dan bukan tingginya
yang menyatakan frekuensi; kita tidak lagi memerlukan sumbu tegak dan oleh karena itu
kita buang saja.

Gambar 3-4
Distribusi Frekuensi yang Benar
dengan Lebar Kelas yang Tidak Sama

Cara kedua yang bermanfaat bagi penyajian data numerik dalam bentuk grafik adalah apa
yang disebut poligon frekuensi. Poligon frekuensi dibentuk dengan memplotkan frekuensi
kelas terhadap titik tengah kelas dan kemudian menghubungkan titik-titik yang berurutan
dengan garis lurus.
Poligon merupakan bangun bersisi banyak yang tertutup. Untuk menutup poligon frekuensi
kita memerlukan sebuah selang kelas tambahan yang ditambahkan pada kedua ujung
distribusi, masing-masing dengan frekuensi nol. Untuk latihan kita, titik tengah kedua kelas
tambahan itu adalah 1,2 dan 5,2. Kedua titik tersebut memungkinkan kita menghubungkan
kedua ujung pada sumbu datar, sehingga menghasilkan sebuah poligon. Poligon frekuensi
bagi data Tabel 3-4 ditunjukkan dalam Gambar 3-5. Kita dapat dengan cepat memperoleh
poligon frekuensi dari histogram dengan cara menghubungkan titik-titik tengah puncak
persegipanjang-persegipanjang yang berdekatan dan kemudian menambahkan kedua
selang tersebut pada masing-masing ujungnya.

35
Deskripsi Data

Gambar 3-5
Poligon Frekuensi

Bila kita ingin membandingkan dua gugus data yang ukuran contohnya tidak sama dengan
membuat dua poligon frekuensi pada satu gambar, maka kita harus menggunakan frekuensi
relatif atau persentase. Grafik yang serupa dengan Gambar 3-3 tetapi menggunakan
frekuensi relatif atau persentase disebut poligon frekuensi relatif atau poligon persentase.

Gambar 3-6
Ogive Frekuensi

Grafik garis yang lain, disebut poligon frekuensi kumulatif atau ogive, diperoleh dengan
memplotkan frekuensi kumulatif yang lebih kecil daripada batas atas kelas terhadap batas
atas kelasnya, kemudian menghubungkan semua titik yang berurutan dengan garis lurus.
Poligon frekuensi kumulatif bagi data Tabel 3-6 diperlihatkan dalam Gambar 3-6.
Seandainya yang digunakan adalah frekuensi kumulatif relatif atau persentase, maka grafik
yang dihasilkannya disebut ogive frekuensi relatif atau ogive persentase.

3-4 Kesetangkupan dan Kemenjuluran


Bentuk atau distribusi segugus pengukuran paling abik ditayangkan melalui sebuah
histogram. Sebagian dari sekian banyak kemungkinan bangun yang dapat muncul
diperlihatkan dalam Gambar 3-7 dan Gambar 3-8. Suatu distribusi dikatakan setangkup
atau simetris bila distribusi itu dapat dilipat sepanjang suatu sumbu tegak sehingga kedua
belahannya saling menutupi. Kita lihat bahwa kedua distribusi dalam Gambar 3-7 setangkup,
meskipun bentuknya sangat berbeda. Suatu distribusi yang tidak setangkup terhadap suatu
sumbu tegak dikatakan menjulur.

Gambar 3-7
Distribusi yang Setangkup

36
Deskripsi Data

Gambar 3-8
Distribusi yang Menjulur

Distribusi yang diperlihatkan dalam Gambar 3-8 (a) dikatakan menjulur ke kanan, atau
menjulur positif, sebab distribusi demikian ini memiliki ekor kanan yang panjang
dibandingkan dengan ekor kiri yang jauh lebih pendek. Dalam Gambar 3-8 (b), distribusinya
menjulur ke kiri, atau menjulur negatif.
Bagi distribusi yang setangkup, nilai tengah dan mediannya terletak pada posisi yang sama
pada sumbu datar. Tetapi, bila distribusi menjulur ke kanan, nilai-nilai yang besar di ekor
kanan tidak terlalu banyak dipengaruhi oleh nilai-nilai kecil di ekor kiri, sehingga nilai
tengahnya lebih besar daripada mediannya. Keadaan sebaliknya terjadi untuk ditribusi yang
menjulur ke kiri. Kita akan menggunakan perilaku antar nilai tengah dan median relatif
terhadap simpangan bakunya untuk mendefinisikan ukuran kemenjuluran.

DEFINISI. Koefisien Kemenjuluran Pearson. Koefisien Kemenjuluran Pearson


didefinisikan sebagai
3 x  x  3    
SK  atau SK 
s 

Untuk distribusi yang setangkup sempurna, nilai tengah dan mediannya identik dan oleh
karena itu SK bernilai nol. Bila distribusinya menjulur ke kiri, nilai tengahnya lebih kecil
daripada mediannya sehingga nilai SK negatif. Tetapi bila distribusinya menjulur ke kanan,
nilai tengahnya lebih besar daripada mediannya, sehingga nilai SK positif. Secara umum, nilai
SK terletak antara -3 dan +3.

Latihan 3-1
Hitunglah koefisien kemenjuluran Pearson bagi distribusi dalam Tabel 3-4
Jawab
Dengan mengganggap data pada Tabel 3-4 sebagai suatu sampel, kita peroleh
x  3,41 , x  3,4 , dan s  0,70 , oleh karena itu
33,41  3,4 
SK   0,04
0,70
Menunjukkan bahwa data itu hanya sedikit menjulur ke kanan. Dengan nilai SK yang
demikian kecilnya, kita dapat mengatakan bahwa distribusi dataya setangkup.

Meskipun histogram dapat mengambil bangun yang beraneka ragam, untungnya distribusi
yang kita jumpai dalam praktek biasanya dapat dihampiri dengan histogram berbentuk
genta menyerupai 3-7 (a), yang koefisien kemenjuluran Pearson-nya mendekati nol. Ini
tentu saja berlaku bagi distribusi umur aki yang diperlihatkan dalam Gambar 3-2. Dan
sesungguhnya, hampiran tersebut berlaku bagi sembarang gugus data yang frekuensi
pengamatan yang masuk dalam berbagai kelas menurun dengan laju yang kira-kira sama
bila kita semakin menjauhi ke arah kedua ekornya.
Distribusi yang berbentuk genta tersebut memainkan peranan utama dalam inferensia
statistik. Sebagian lebih bervariasi daripada yang lain, seperti dicerminkan oleh histogram

37
Deskripsi Data

yang lebih datar dan lebar. Dalam Gambar 3-9 (a) sebagian besar pengamatan dekat pada
nilai tengahnya, hanya sedikit yang masuk dalam ekor distribusinya yang jauh. Tetapi dalam
Gambar 3-9 (b), pengamatan-pengamatan itu tetap mengelompok di sekitar nilai tengah,
tetapi cukup banyak pengamatan yang berada jauh dari nilai tengah dalam kedua arah. Data
yang disajikan oleh Gambar 3-9 (b) memiliki simpangan baku yang lebih besar daripada data
dalam Gambar 3-9 (a), karena simpangan pengamatan yang lebih besar daripada nilai
tengahnya terjadi lebih sering dan simpangan yang kecil jarang.

Gambar 3-9
Keragaman Pengamatan di Sekitar Nilaitengah

Dalil Chebysev mengatakan kepada kita bahwa sekurang-kurangnya ¾ atau 8/9 dari seluruh
pengamatan dengan distribusi apapun, baik yang berbentuk genta atau tidak, akan terletak,
berturut-turut, dalam 2 atau 3 simpangan baku dari nilai tengahnya. Seandainya
distribusinya agak lebih menyerupai genta, kita dapat membuat sebuah kaidah yang
memberi hasil lebih kuat.

DEFINISI. Kaidah Empirik. Pada distribusi pengamatan yang berbentuk genta, maka kira-
kira
68% pengamatan terletak dalam 1 simpangan baku dari nilai tengahnya
95% pengamatan terletak dalam 2 simpangan baku dari nilai tengahnya
99,7% pengamatan terletak dalam 3 simpangan baku dari nilai tengahnya

Dari Latihan 3-1, kita peroleh x  3,41 dan s  0,70 bagi data dalam Tabel 3-4. Sekarang
menurut kaidah empirik berarti kurang dari 68% atau 27 diantara 40 pengamatan itu
terletak dalam selang diantara x  s  3,41  0,70 atau dari 2,71 sampai 4,11. Pencacahan
sesungguhnya menghasilkan 28 diantara 40 pengamatan itu yang jatuh dalam selang
tersebut. Begitupula, 95% atau 38 diantara 40 pengamatan itu terletak dalam selang
diantara x  2s  3,41  20,70 atau dari 2,01 sampai 4,81. Pencacahan sesungguhnya
menghasilkan tepat 38 diantara 40 pengamatan itu yang jatuh dalam selang tersebut. Selang
x  3s  3,41  30,70 atau dari 1,31 sampai 5,51 mencakup semua pengamatan. Bila
didasarkan pada dalil Chebysev, kita hanya dapat mengatakan bahwa sekurang-kurangnya
36 pengamatan akan jatuh antara 1,31 dan 5,51.

Latihan 3-2
Sebuah perusahaan menggaji 1000 pegawainya rata-rata 6,25 dengan simpangan baku
60 sen. Dengan mengasumsikan bahwa gaji-gaji itu mempunyai distribusi berbentuk
genta, gunakan kaidah empirik untuk mendeskripsikan keragaman data tersebut
Jawab
Untuk mendeskripsikan data tersebut, pertama-tama kita tentukan selang:
    6,25  0,60 atau $5,65 sampai $6,85
  2  6,25  20,60 atau $5,05 sampai $7,45
  3  6,25  30,60 atau $4,45 ampai $8,05

38
Deskripsi Data

Kita dapat menyimpulkan bahwa kurang lebih 680 pegawai menerima gaji dari $5,65
sampai $6,85 per jam, 950 menerima $5,05 sampai $7,45, dan 997 menerima $5,05
sampai $7,45. Kita juga dapat menyimpulkan bahwa dari bilangan bilangan tersebut
informasi tambahan mengenai banyaknya pegawai dalam berbagai selang yang tidak
bertumpang-tindih. Misalnya, bila ada 950 pegawai yang menerima antara $5,05 sampai
$7,45 dan 680 menerima antara $5,65 sampai $6,85, maka ada 950 – 680 = 270 pegawai
yang masuk sekaligus dalam selang $5,65 sampai $6,85 sampai $7,45 per jam. Anggapan
distribusi yang berbentuk genta memungkinkan kita untuk menyimpulkan bahwa di
antara ke-270 pegawai itu kurang lebih 135 menerima antara $5,65 sampai $6,85, dan
135 yang lain menerima antara $5,05 sampai $7,45. Penalaran serupa memungkinkan
kita menyimpulkan bahwa kurang dari 1 atau 2 pegawai yang menerima $8,05 per jam.

3-5 Persentil, Desil, dan Kuartil


Dalam bab sebelumnya kita membahas hanya ukuran lokasi pemusatan. Masih ada beberapa
ukuran lokasi lain yang menjelaskan atau menunjukkan lokasi sebagian data relatif terhadap
keseluruhan data. Ukuran-ukuran tersebut, yang sering disebut fraktil atau kuantil, adalah
nilai-nilai yang dibawahnya terdapat sejumlah pecahan atau persentase tertentu dari seluruh
pengamatan. Yang menarik dan penting dari fraktil yang disebut persentil, desil, dan kuartil.

DEFINISI. Persentil. Persentil adalah nilai-nilai yang membagi segugus pengamatan menjadi
100 bagian yang sama. Nilai-nilai ini dilambangkan dengan P1 , P2 ,..., P99 , bersifat bahwa 1%
dari seluruh data terletak di bawah P1 , 2% terletak di bawah P2 , ..., dan 99% terletak di
bawah P99 ,

Untuk menggambarkan prosedur menghitung suatu persentil, marilah kita cari P85 untuk
distribusi umur aki dalam Tabel 3-3. Pertama-tama kita harus mengurutkan data itu dari
yang terkecil sampai yang terbesar, seperti diperlihatkan dalam Tabel 3-9. Karena datanya
terdiri dari 40 pengamatan, maka kita harus mencari nilai yang dibawahnya terdapat
(85/100) x 40 = 34 pengamatan. Seperti dapat dilihat dari Tabel 3-9, P85 dapat berupa
sembarang nilai antara 4,1 tahun dan 4,2 tahun. Agar diperoleh nilai yang khas, kita akan
mendefinisikan P85 sebagai nilai tengah antara kedua pengamatan tersebut. Jadi P85 = 4,15
tahun.
Tabel 3-9
Umur Aki Mobil Diurutkan dari yang Terkecil sampai Terbesar
1,6 2,6 3,1 3,2 3,4 3,7 3,9 4,3
1,9 2,9 3,1 3,3 3,4 3,7 3,9 4,4
2,2 3,0 3,1 3,3 3,5 3,7 4,1 4,5
2,5 3,0 3,2 3,3 3,5 3,8 4,1 4,7
2,6 3,1 3,2 3,4 3,6 3,8 4,2 4,7

Meskipun kita selalu dapat menentukan persentil dari data aslinya, mungkin lebih memudahkan
dan menghemat waktu bila kita menentukan langsung dari distribusi frekuensinya. Ketika
mengelompokkan datanya, kita telah menghilangkan identitas masing-masing pengamatan.
Informasi yang tertinggal, bila kita tidak menengok ke data asalnya, adalah banyaknya
pengamatan yang jatuh dalam setiap selang kelasnya. Untuk mencari persentil dari suatu
distribusi frekuensi, kita mengasumsikan bahwa pengamatan dalam setiap selang kelas
menyebar merata antara batas bawah dan batas atas kelas. Ini berarti kita telah
menginterpretasikan suatu persentil sebagai suatu nilai yang di bawahnya terdapat sejumlah
persentase atau pecahan tertentu dari luas seluruh histogram. Untuk menggambarkan
perhitungan suatu persentil dari distribusi frekuensi, perhatikan Latihan berikut ini.

39
Deskripsi Data

Latihan 3-3
Tentukan P48 bagi distribusi umur aki dalam tabel 3-4
Jawab
Kita mencari nilai yang di bawahnya terdapat (48/100) x 40 = 19,2 pengamatan. Karena
kita mengasumsikan bahwa pengamatannya menyebar merata pada selang kelasnya,
maka kita dapat menggunakan pengamatan pecahan, seperti yang terjadi di sini. Ada 7
pengamatan yang jatuh di bawah batas kelas 2,95. Kita masih memerlukan 12,2 dari 15
pengamatan berikutnya yang jatuh dalam selang antara 2,95 dan 3,45. Oleh karena itu
kita harus melangkah sejauh (12,2/15) x 0,5 = 0,41 dari 2,95. Jadi
P48 = 2,95 + 0,41
= 3,36 tahun
Bandingkan dengan 3,4 tahun yang diperoleh dari perhitungan berdasarkan data asalnya.
Jadi kita menyimpulkan 48% dari semua aki jenis ini umurnya akan kurang dari 3,36
tahun.

DEFINISI. Desil. Desil adalah nilai-nilai yang membagi segugus pengamatan menjadi 10
bagian yang sama. Nilai-nilai ini dilambangkan dengan D1 , D2 ,..., D9 , bersifat bahwa 10%
dari seluruh data terletak di bawah D1 , 20% terletak di bawah D2 , ..., dan 90% terletak di
bawah D9 ,

Untuk menghitung desil persis sama dengan cara kita menentukan persentil.

Latihan 3-4
Tentukan D7 bagi distribusi umur aki dalam tabel 3-4
Jawab
Kita mencari nilai yang di bawahnya terdapat (70/100) x 40 = 28 pengamatan. Ada 22
pengamatan yang jatuh di bawah batas kelas 3,45. Kita masih memerlukan 6 dari 10
pengamatan berikutnya yang jatuh dalam selang antara 3,45 dan 3,95. Oleh karena itu
kita harus melangkah sejauh (6/10) x 0,5 = 0,3 dari 3,45. Jadi
D7 = 3,45 + 0,3
= 3,75 tahun

DEFINISI. Kuartil. Kuartil adalah nilai-nilai yang membagi segugus pengamatan menjadi 4
bagian yang sama. Nilai-nilai ini dilambangkan dengan Q1 , Q2 , Q3 , bersifat bahwa 25% dari
seluruh data terletak di bawah Q1 , 50% terletak di bawah Q2 , dan 75% terletak di bawah Q3

Untuk menghitung Q1 bagi distribusi umur aki, kita memerlukan nilai yang dibawahnya
terdapat (25/100) x 40 = 10 pengamatan. Karena pengamatan yang ke 10 dan 11 sama
dengan 3,1, maka rata-ratanya juga 3,1 tahun. Jadi Q1 = 3,1 tahun.

Latihan 3-5
Gunakan distribusi frekuensi Tabel 3-2 untuk menentukan Q3 bagi distribusi bobot 50 koper
Jawab
Kita mencari nilai yang di bawahnya terdapat (75/100) x 50 = 37,5 pengamatan. Ada 24
pengamatan yang jatuh di bawah batas kelas 15,5. Kita masih memerlukan 13,5 dari 19
pengamatan berikutnya yang jatuh dalam selang antara 15,5 dan 18,5. Oleh karena itu
kita harus melangkah sejauh (13,5/19) x 3 = 2,1 dari 15,5. Jadi
Q3 = 15,5 + 2,1
= 17,6 kilogram
Jadi kita menyimpulkan bahwa 75% dari 50 koper itu bobotnya kurang dari 17,6 kilogram.

40
Deskripsi Data

Persentil ke-50, desil ke-5 dan kuartil ke-dua suatu distribusi disebut median. Kuartil dan
desil juga merupakan persentil. Misalnya, desil ke-7 adalah persentil ke-70, dan kuartil
pertama adalah juga persentil ke-25. Persentil, desil, atau kuartil juga dapat diduga dari
ogive persentasenya.

3-6 SUPLEMEN
1. Bila titik-titik tengah kelas suatu distribusi frekuensi bobot suatu produk adalah 6,5; 8,5;
10,5; 12,5; dan 14,5 kilogram, tentukan
a. Lebar kelas
b. Batas-batas kelas
c. Limit-limit kelas

2. Tentukan lebar kelas bagi masing-masing distribusi yang mempunyai 10 selang ini:

Skor Terendah Skor Tertinggi


(a) 7,5 18,65
(a) 53 149
(a) 0,392 0,514
(a) - 15 0

3. Bilangan-bilangan berikut menyatakan hasil ujian akhir Metode Statistik:

23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61

Dengan menggunakan 9 selang dengan nilai terendah 10,


a. Buat distribusi frekuensinya
b. Buat distribusi frekuensi kumulatifnya
c. Buat histogram frekuensinya
d. Buat poligon frekuensinya
e. Buat ogive frekuensinya

4. Bilangan-bilangan berikut menyatakan hasil ujian akhir Metode Statistik:

2,4 0,7 3,9 2,8 1,3 1,8 2,4 1,3 2,6 1,8
1,6 2,9 2,6 3,7 2,1 2,7 0,4 2,8 3,5 1,4
3,2 3,5 1,8 3,1 0,3 1,7 3,9 1,1 5,9 2,0
4,6 0,9 3,4 2,3 2,5 5,3 6,3 0,2 2,0 1,9
0,4 2,1 2,3 1,5 4,3 1,2 2,5 2,1 1,2 1,7

Dengan menggunakan 8 selang dengan nilai terendah mulai di 0,1,


a. Buat distribusi persentasenya
b. Buat distribusi kumulatif persentasenya
c. Buat histogram persentasenya
d. Buat poligon persentasenya
e. Buat ogive persentasenya

41
Deskripsi Data

5. Bilangan-bilangan berikut menyatakan hasil ujian akhir Metode Statistik:

39,12 61,74 37,29 44,35 57,29


64,10 48,25 67,25 58,95 39,95
38,42 55,80 44,35 38,75 63,91
51,50 40,15 60,29 41,26 49,32
36,07 46,01 41,13 67,29 45,68
63,55 62,12 36,85 45,97 42,89

Dengan menggunakan 6 selang dengan nilai terendah mulai pada 36,05:


a. Buat distribusi frekuensi relatifnya
b. Buat distribusi frekuensi relatif kumulatifnya
c. Buat histogram frekuensi relatifnya
d. Buat poligon frekuensi relatifnya
e. Buat ogive frekuensi relatifnya

42

Anda mungkin juga menyukai