(Edisi I)
Maiyastri
Jurusan Matematika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Andalas
A. Pendahuluan
Statistika telah dipergunakan orang sudah sejak lama, diawali oleh pengumpulan data
tentang jumlah rakyat, jumlah hewan ternak, luas sawah dan produksi bahan pangan oleh
raja yang nantinya digunakan untuk penghitungan pajak, untuk melihat persediaan
pangan dan untuk pertahanan dan keamanan dari dari serangan musuh. Data yang didapat
kemudian disajikan dalam bentuk tabel dan gambar sehigga informasi dari data dapat
mudah difahami oleh raja dan para mentrinya. Dari sini muncullah tabel distribusi
frekeunsi, diagram, gambar dan lain-lainnya, (Walpole, 1982).
Pada zaman sekarang semakin banyak Statistika dipergunakan. Statistika bukan saja
digunakan dalam penelitian, akan tetapi juga dalam kehidupan sehari-hari kita selalu
menemukan Analisis Statistika. Surat kabar dan majalah menggunakan Statistika untuk
menyajikan data. Mereka menggunakan tabel, histogram, diagram batang, diagram
lingkaran dan banyaklagi diagram lainnya. Para peneliti selalu menggunakan teknik
statistika dalam mengumpulkan data, baik yang melakukan survei, maupun yang
merupakan percobaan. Dalam menganalisis data hasil penelitian, juga menggunakan
teknik Statistika, sehingga pada masa sekarang, orang tidak bisa dipisahkan dengan
Statistika.
B. Uraian materi
1. Konsep Dasar
Defenisi Statistika sebagai suatu ilmu dapat dituliskan sebagai berikut:
Statistika (statistics) adalah suatu ilmu yang berisi aturan-aturan mengenai
pengumpulan data, penyajian, analisa serta penafsiran data. Metode yang
terdapat dalam statistika dinamakan metode statistka. Metode statistika
dapat dibagai 2 yaitu: statistika deskriptif dan statistika inferensia.
Dengan kata lain, pada statistika inferensia, data yang dianalis hanya sebahagian
saja, yang biasanya disebut dengan sampel (atau contoh) untuk mengambil kesimpulan
tentang data induknya yaitu populasi. Jadi sampel (contoh) adalah bahagian (himpunan
bagian) dari populasi.
Karena dalam mengambil keputusan yang diambil mengenai data induk
(populasi) bersifat tidak pasti, disebabkan oleh keputusan ini hanya berdasarkan
informasi dari sebahagian dari populasi, yaitu sampel, maka kesimpulan/keputusan ini
mengandung unsur ketidak pastian. Ukuran ketidak pastian ini diukur dengan suatu nilai
yang dinamakan dengan peluang, itulah sebabnya ilmu peluang dipelajari dalam
Statistika.
Sebagaimana definisi di atas, teknik statistika digunakan dalam suatu peneltian,
baik penelitian yang berupa survei maupun yang berupa eksperimen. Suatu peneltian
sederhana, misalnya kita ingin meneliti apakah rata-rata tinggi mahasiswa S-1 UNAND
tahun ajaran Semester ganjil 2007/2008 lebih tinggi dari 158 cm atau lebih. Seluruh
mahasiswa S-1 UNAND pada tahun ajaran tersebut adalah populasi, dengan anggota
populasinya adalah setiap orang yang terdaftar sebagai mahasisiwa S-1 UNAND pada
tahun ajaran Semester ganjil 2007/2008. Karena mengumpulkan data dari semua
mahasiswa UNAND cukup sulit dan perlu waktu lama, maka kita cukup mengambil
sebahgian dari Mahasisiwa S-1 Unand saja. Dimisalkan, setelah melalui cara penarikan
sampel yang benar, terpilih mahasiswa jurusan Matematika angkatan 2006 dan
mahasisiwa Fakultas Hukum angkatan 2005. Mahasiswa yang terpilih ini dinamakan
sampel atau contoh. Cara pemilihan mahasiswa yang terpilih ini dinamakan dengan
Teknik Penarikan Sampel/ Contoh. Tinggi adalah variabel/peubah yang diukur. Dalam
penelitian ini kita ingin mengambil kesimpulan tentang rata-rata tinggi semua
mahasiswa UNAND yang dinamakan dengan parameter. Rata-rata tinggi semua
mahasiswa UNAND merupakan karakteristik dari populasi dan dilambangkan dengan
(). Nilai yang dihitung adalah rata-rata tinggi mahasiswa Jurusan Matematika angkatan
2006 dan mahasisiwa Fakultas Hukum angkatan 2005, nilai ini dinamakan dengan
statistik (ciri dari sampel dan dilambangkan dengan ( x )). Jadi kita telah mengenal
beberapa istilah dalam statistika, yaitu:
Banyaknya data pada populasi terhingga dinamakan ukuran populasi dan biasanya
dilambangkan dengan N. Sedangkan ukuran bagi bagian dari populasi yang dinamakan
dinamakan dengan contoh/sampel dilambangkan dengan: n. Sampel yang bagus adalah
sampel yang dapat mewakili populasi, artinya keadaan-keadaan/karateristik yang khusus
dalam populasi harus terdapat juga dalam populasi. Supaya sampel/contoh dapat
mewakili populasi, maka contoh diambil secara acak, maka contohnya dinamakan dengan
contoh acak. Teknik penarikan contoh ini dapat dipelajari dalam bidang stistika yang
dinamakan dengan: Metode Penarikan Contoh/ Sampel.
2. Cara Memilih Sampel Secara Acak
Sampel acak adal sampel yang dipilih secara acak. Artinya, dari seluruh anggota populasi
dipilih sampel secara acak. Pemilihan secara acak artinya setiap anggota populasi
mempunyai kemungkinan yang sama untuk terpilih menjadi sampel. Untuk pemilihan
secara kita harus mengetahui jumlah anggota populasi serta membuat membuat daftar
semua anggota populasi yang biasa disebut sebagai kerangka penarikan sampel
(sampling frame). Jumlah anggota populasi dilambangkan dengan huruf N. Sebagai
contoh bagaimana mengambil sampel/contoh secara acak diberikan ilustrasi sederhana
sebagai berikut. Misalkan suatu populasi mempunayi anggota sebanyak 500, jadi N=500.
Ingin dipilih contoh/sampel sebanyak 10, jumlah anggota sampel/contoh dilambangkan
dengan n, jadi n=10. Dari N=500, ingin dipilih n secara acak sebanyak 10, artinya kita
memilih 10 angka secara acak dari no 1 sampai dengan no 500. Angka 500 adalah tiga
digit, berarti kita memilih 3 digit angka. Angka desimal 3 digit dari 001 sampai dengan
999. Karena angka yang dipilih dari 001 sampai dengan 500, pemilihan ini bisa dilakukan
dengan 2 cara. Cara pertama: Angka yang dipakai hanya angka 001 sampai dengan 500,
jadi angka 501 sampai dengan 999, diabaikan. Pemilihan secara acak bisa dengan
memilih angka acak dengan menggunakan kalkulator atau menggunakan table acak.
Berikut ini dicontohkan pemilihan angka acak dengan table acak. Diberikan cuplikan
table acak sebagai berikut:
9698
8001
6778
2667
1385
1994
7734
7433
2068
2914
2839
1996
4178
8383
1650
3358
4474
2351
5233
8887
5420
1216
1704
8831
2325
Kalau tabelnya besar, angka awal dimulai dengan memilih baris dan kolom secara acak,
misalnya dengan undian. Tapi karena table diatas kcil kita mulai dari baris pertama dan
kolom pertama, yaitu angka 9698. Karena hanya tiga digit yang dipakai, maka angka
yang diperhatikan adalah: 698. Angka 698 lebih besar dari 500, angka ini diabaikan.
Terus ke baris ke dua, yaitu angka:8001, tiga digit artinya angka 001. Jadi sampel yang
pertama adalah no 001 dari nomor urut populasi. Angka ketiga dank e empat tidak
terpakai, karena lebih baesar dari 500, tapi angka ke lima adalah 1385, artinya no
populasi ke 385 yang terpilih menjadi sampel, begitu seterusnya. Hubungan populasi
dan sampel dapat dilihat pada Gambar 1.
Defenisi Peubah/variabel: Suatu ciri/karakteristik dari tiap unit yang diukur atau
dihitung dinamakan peubah/variabel.
Misalkan objek penelitian kita adalah manusia, dari manusia bisa diukur; tinggi, berat
badan, tingkat pendidikan; maka tinggi, berat badan, tingkat pendidikan ini adalah
peubah.
Sekali lagi, keterangan tentang parameter dan statistik. Suatu nilai yang mencirikan
populasi dari suatu peubah dinamakan parameter. Parameter ini biasa dilambngkan
dengan huruf Yunani. Misalkan populasi kita adalah mahasiswa UNAND dan peubahnya
adalah berat badan, maka rata-rata berat badan dari semua data mahasiswa UNAND
dinamakan Parameter, dan dilambangkan dengan: . Jika contoh/sample untuk
penelitian ini adalah mahasiswa Jurusan Matematika FMIPA UNAND, maka rata-rata
berat badan dari semua data mahasiswa Jurusan Matematika FMIPA UNAND dinamakan
Statistik, dan dilambangkan dengan x . Penelitian jarang menggunakan data populasi,
tapi menggunakan data sampel/contoh, karena itu parameter tidak bisa dihitung. Oleh
sebab itu yang bisa dihitung adalah: Statistik dan digunakan untuk mewakili parameter.
3.
Jenis-jenis Data
Pengetahuan tentang jenis data ini perlu dalam memilih metode anlisa yang benar dan
cocok dengan data yang dimiliki. Data dapat dibagi dengan data kategorik (yang hanya
mengelompokkan objek) dan data numerik (angka) yang dapat mengukur objek. Contoh
data kategorik adalah: jenis kelamin; (perempuan dan laki-laki), data tingkat pendidikan (
SD, SLTP, SLTA, dan Perguruan Tingi). Sedangkan data numerik/angka adalah: tinggi
badan, berat badan, jumlah pendapatan dll. Data numerik dapat dibagi dua pula data
diskrit (angkanya merupakan bilangan bulat) dan data kontinu (angkanya merupkan
bilangan riil).
4
Berdasarkan skala pengukurannya, data dapat dibagi empat, yaitu: skala nominal, ordinal,
selang dan rasio. Data jenis kelamin; laki-laki dan perempuan adalah data berskala
nominal. Jika terdapat penataan/urutan antar kategori, maka data tersebut berskala
ordinal. Skla berikutnya adalah interval dan terakhir rasio. Dua skala terakhir adalah data
numeric, kedua skla dibedakan karena data berskala rasio memiliki nilai nol yang berarti
tidak ada dan data berskala rasio jumlahnya bias dibandingkan sedangkan skala interval
tidak.
PENYAJIAN DATA
Tabel
Gambar
Angka.
4.1. Tabel
Tabel adalah cara yang paling awal untuk menyajikan data, secara umum Tabel dapat
dibagi dua (2), yaitu:
1. Tabel ikhtisar adalah untuk memerikan informasi awal data.
2. Tabel Distribusi Frekuensi untuk melihat sebaran suatu data.
Berikut ini diberikan dua contoh tabel ikhtisar. Pada tabel pertama ditampilkan data luas
pemilikan kolam ikan dan data kedua merupakan data produksi kelapa sawit.
2
5
6
8
12
18
20
2
3
6
7
13
18
25
40
90
18
12
10
5
5
12
6
14
8
7
8
4
6
6
7
18
20
12
9
5
8
8
9
10
6
8
25
30
5
8
35
25
3
4
6
6
8
18
18
12
10
8
2001
2002
Januari
530,67
998,82
Februari
569,90
1421,05
Maret
1345,10
Mei
741,90
1054,3
8
1085,7
3
Juni
994,90
1221,93
Juli
803,01
1375,67
Agustus
802,61
1489,5
5
1677,9
3
1812,7
8
1621,0
8
996,76
April
September
Oktober
November
Desember
1678,43
1547,04
1608,46
2289,68
2142,72
3238,81
2003
1005,6
8
1806,5
4
1733,3
8
1981,1
6
1609,6
1
1563,2
1
1078,9
0
1006,2
0
1809,4
6
1923,1
0
2717,5
7
3017,3
1
2004
1449,68
2293,29
2218,49
2424,86
2619,32
2185,18
1211,50
1742,69
2005
2026,6
1
2769,7
6
2550,8
0
3050,9
8
2941,1
0
2245,3
3
1876,4
6
1525,9
1
2006
2070,50
2936,16
2749,50
3227,97
3188,30
2524,48
2574,44
1462,87
Contoh selanjutnya yang disajikan pada Tabel 2 menampilkan produksi kelapa sawit di
PT Perkebunan Nusantara VI Rimsa pada tahun tanam 1997. Data produksi dimulai pada
6
bulan Januari tahun 2001 dan berakhir bulan November tahun 2006. Data ini adalah data
numerik (angka) skala data rasio, dan menurut urutan waktu yaitu data bulanan. Sangat
sukar memperoleh informasi dari data asli pada Tabel tersebut, oleh sebab itu data di atas
akan disajikan/diolah menjadi bentuk lain, sehingga informasi/pesan dari data tersebut
lebih mudah didapatkan.
Untuk memperoleh informasi yang lebih berarti dari suatu data, baik data numerik,
maupun data kategorik digunakan Tabel Distribusi Frekuensi. Untuk istilah distribusi
kadangkala digunakan juga kata Sebaran, sehingga ada juga yang menggunakan istilah
Tabel Sebaran Frekuensi. Pada materi ini digunakan istilah: Tabel Distribusi Frekuensi,
Pada bagian pertama disajikan Tabel Distribusi Frekuensi untuk data kategorik.
Pada contoh ini, datanya adalah jumlah sekolah menurut tingkat pendidikan di Kota A,
data ini termasuk data kategorik dengan skala ordinal. Data disajikan pada Tabel 3.
Tabel ini ini sebenarnya telah merupakan Tabel Distribusi Frekuensi dari data yang
bertipe kategorik. Tabel distribusi frekuensi bertujuan untuk menampilkan/melihat
sebaran/distribusi data tersebut, artinya bagaimana penyebaran nilai-nilai data tersebut.
Untuk data kategori, berarti akan dilihat apakah frekuensi untuk setiap kategori hampir
sama atau tidak, jika tidak sama, pada kategori mana terdapat frekuensi terbesar, dan pada
kategori apa frekuensi terkecil.
Tabel 3. Tabel Distribusi Frekuensi Jumlah Sekolah di Kota A
Jumlah Sekolah
Frekuensi
SD
30
SMP
25
SMA
15
Perguruan tinggi
Total
74
Tabel 3 menunjukkan bahwa SD adalah sekolah terbanyak di kota A, disusul oleh SMP.
Semakin tinggi tinggkat pendidikan semakin sedikit jumlah sekolahnya. Jumlah
perguruan tinggi paling sedikit di kota itu, yaitu hanya ada empat (4) buah.
Berikut ini akan berikan contoh Tabel Distribusi Frekuensi untuk data numerik. Data
yang digunakan adalah data pada Tabel 1, yaitu data luas pemilikan kolam ikan di Desa
Sekardangan.
Tabel Distribusi Frekuensi untuk data numerik: adalah untuk melihat distribusi/sebaran
data satu variabel/peubah yang bertipe numerik, jadi untuk data berskala interval atau
rasio. Menampilkan data dengan tabel ini dinamakan juga menampilkan data
berkelompok. Jadi data asli dikelompokkan kedalam beberapa selang, dari setiap selang
dicari nilai frekuensinya. Tabel distribusi frekuensi data numerik ini berguna untuk
melihat sebaran data numerik, jadi untuk melihat bagaimana data itu tersebar pada nilainilainya, apakah ada penumpukan, atau tersebar secara merata pada nilai-nilai yang ada.
Tabel 4 menunjukkan bahwa data terbanyak pada selang 5,0 sampai 14,9 dengan nilai
tengah 10. Frekuensi pada selang ini adalah 37, dengan frekeunsi relatif 0,63793. Nilai
ini berarti 63,793% data terlatak pada selang ini, jadi lebih dari separuh data berada pada
7
selang ini. Hal ini menunjukkan bahwa sebahagian besar petani di Desa Sekardangan
punya luas kolam ikan seluas 10 ha. Nilai lainnya terletak disekitar nilai ini, untukselang
yang lebih kecil yaitu -5,0 - 4,9 terdapat 6 data dengan frekuensi relatif 10,34%. Pada
selang ini nilai datanya berkisar 0 sampai 4, karena tidak ada data negatif pada data luas.
Jadi ada sekitar 6 data berkisar 0 sampai dengan 4. Pada selang selanjutnya yaitu selang
-5,0 14,9 ada 8, atau dengan frekuensi relatif sebesar 0,13793. Pada selang
selanjutnya (15,0 24,9) data semakin sedikit yaitu ada 4 data, dan selang (25,0 34,9)
hanya ada 2 data. Pada 4 selang berikutnya tidak terdapat data sama sekali. Data
terbesar terletak pada selang terakhir yaitu selang 85,0 94,9 dan hanya ada satu buah.
Nilai data terlalu besar dibandingkan dengan data lainnya, karena nilai ini terlalu besar
dibandingkan nilai lainnya, maka data ini dikatakan sebagai pencilan. Pencilan adalah
data yang nilainya terlalu besar atau terlalu kecil dibandingkan sebahagian besar data
lainnya. Data ini harus menjadi perhatian kita. Pertama apakah data ini memang
merupakan nilai sebenarnya, maksudnya bukan merupakan berasal dari kesalahan baik
kesalahan manusia (salah ukur, salah catat, salah ketik dan lainnya) maupun salah alat.
Jika memang data ini memang merupakan nilai yang benar dari objek yang sedang
diukur, maka pencilan ini harus menjadi perhatian kita, mengapa nilainya terlalu besar
dibandingkan dengan nilai yang lainnya. Bagaimana karakteristik objek tersebut, janganjangan karakteristik objeknya berbeda, misalnya petani yang mempunyai luas kolam ikan
yang paling luas adalah petani yang konglomerat yang bukan berasal dari Desa
Sekardangan mungkin saja berasal dari kota misalnya.
Tabel 4. Tabel Distribusi Frekuensi Data Luaas Pemilikan Kolam Ikan di Desa
Sekardangan.
Nilai
Frekuen
Kelas/ si
Frekuensi
Titik
Kumulati
Tengah
f
Selang
Kelas
-5,0 5,0 15,0 25,0 35,0 45,0 55,0 65,0 75,0 85,0 -
4,9
14,9
24,9
34,9
44,9
54,9
64,9
74,9
84,9
94,9
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
6
37
8
4
2
0
0
0
0
1
6
43
51
55
57
57
57
57
57
58
Frekuens
i
Relatif
0,10345
0,63793
0,13793
0,06897
0,03448
0,00000
0,00000
0,00000
0,00000
0,01724
Frekuensi
Relatif
(Kumulatif)
Kecil dari
0,10345
0,74138
0,87931
0,94828
0,98276
0,98276
0,98276
0,98276
0,98276
1,00000
Frekuensi
Relatif
(Kumulatif)
Besar dari
1,00000
0,89655
0,25862
0,12069
0,05172
0,01724
0,01724
0,01724
0,01724
0,01724
Pada Tabel 5 akan ditampilkan Tabel Distribusi Frekuensi untuk data kategorik yang
hampir sama dengan Tabel 3, yaitu jumlah sekolah, akan tetapi jumlah sekolah pada ddua
kecamatan yang berbeda. Jadi tabel ini bertujuan untuk membandingkan jumlah sekolah
(fasilitas pendidikan) pada masing-masing kecamatan dan sekaligus membandingkan
fasilitas tersebut untuk dua kecamatan.
Kec. A Kec. B
13
6
8
13
2
8
1
4.2. Gambar
Data tidak saja disajikan dalam bentuk Tabel, akan tetapi bisa juga dalam bentuk gambar.
Menyajikan data dalam bentuk Gambar, berguna untuk beberapa tujuan. Pertma untuk
melihat sebaran data, jadi gambar-gambar yang dibuat ini merupakan lanjutan dari Tabel
Distribusi Frekuensi, dengan kata lain, gambar yang akan dibuat ini merupakan
visualisasi Tabel Distribusi Frekuensi. Diagram Batang dan Diagram Lingkaran
(Diagram Kue) merupakan visualisasi Tabel Distribusi Frekuensi untuk data Kategorik,
sedangkan Histogram merupakan visalisasi Tabel Distribusi Frekuensi data Numerik.
Pada Gambar 3 dan akan disajikan Diagram Batang untuk data pada Tabel 3, jadi untuk
melihat secara visual jumlah sekolah menurut tingkat pendidikan di Kota A. Pada
diagram batang, frekuensi yang paling banyak ditunjukkan oleh batang yang paling
tinggi, begitu juga frekuensi yang paling sedikit, ditunjukkan oleh batang yang paling
pendek.
35
30
25
20
15
10
5
0
SD
SMP
SMA
PT
35
30
30
25
25
20
15
15
10
5
0
SD
SMP
SMA
PT
Gambar 3b. Diagram Batang Jumlah Sekolah di Kota A dengan Nilai Frekuensi.
Sebaran data kategorik juga bisa dilihat dengan Diagram Lingkaran (Diagram Kue)
bahasa ingrrisnya Pie Chart. Pada diagram ini lebih ditonjolkan adalah perbandingan
frekeunsi untuk tiap-tiap kategori, sehingga lebih bagus digunakan frekuensi relatif.
Untuk data jumlah sekolah menurut tingkat pendidikan di Kota A, gambar Diagram
Lingkarannya ditampilkan pada Gambar 4a sammpai dengan 4d.
Frekuensi Relatif
P T; 5%
SMA; 20%
SD; 41%
SMP; 34%
10
Frekuensi Relatif
P T; 5%
SMA; 20%
SD; 41%
SMP; 34%
Frekuensi Relatif
P T; 5%
SMA; 20%
SD; 41%
SMP; 34%
Gambar 4c. Diagram Lingkaran Jumlah Sekolah di Kota A (Dua Dimensi dengan
Juring Terpisah).
11
Frekuensi Relatif
P T; 5%
SMA; 20%
SD; 41%
SMP; 34%
Gambar 4d. Diagram Lingkaran Jumlah Sekolah di Kota A (Tiga Dimensi dengan
Juring Terpisah).
.
Gambar 5a sampai dengan Gambar 5c menampilkan diagram batang untuk data pada
Tabel 5, yaitu jumlah sekolah (fasilitas pendidikan) pada dua kecamatan. Diagram yang
cocok untuk melihat sebaran jumlah sekolah pada dua kecamatan adalah diagram batang.
Pada Gambar 5a, diagram batang dua kategori dua dimensi, Gambar 5b adalah diagram
batang dua kategori dan dilengkapi dengan tabel distribusi frekuensinya. Pada Gambar
5c, diagram batang dua kategori tiga dimensi. Pada diagram terlihat secara umum bahwa
jumlah sekolah di kecamatan A lebih banyak dari kecamatan B. Malahan, SLTA di
Kecamatan b tidak ada. Pada Kecamatan A, jumlah TK dan SD sama banyak, yaitu 13
buah, sedangkan jumlah SMP lebih sedikit yaitu 2 dan jumlah SLTA hanya 1. Sedangkan
pada Kecamatan B, jumlah sekolah yang paling banyak adalah SD yaitu 8 buah, diikuti
oleh TK 6 buah dan hanya ada 1 SMP, sedangkan SLTA tidak ada.
12
14
12
10
8
Kec. A
Kec. B
6
4
2
0
TK
SD
SMP
SLTA
25
20
15
Frekuensi
10
TK
SD
SMP
SLTA
Gambar 5b. Diagram batang Jumlah Sekolah di Kecamtan A dan B (dengan Tabel
Distribusi Frekuensi).
Histogram adalah penyajian visual dari table distribusi frekuensi data numerik, jadi untuk
melihat gambaran freuensi/sebaran dari data. Diagram ini memiliki tampilan yang hampir
sama dengan batang ; sama-sama berbentuk batang, namun tanpa pemisah di antara
batang. Titik yang dijadikan pembatas antar masing-masing batang adalah nilai tepi kelas,
kita ketahui bahwa tepi kelas atas suatu kelas sama dengan tepi kelas bawah untuk kelas
selanjutnya.
13
14
13
13
12
10
8
6
4
2
0
2
1
TK
SD
SMP
SLTA 0
Kec. A
Kec. B
Gambar 5c. Diagram batang Jumlah Sekolah di Kecamtan A dan B (Tiga Dimensi)
horizontal menunjukkan waktu produksi, dalam hal ini adalah bulan ke. Pada diagram
garis ini dapat dilihat pola produksi sawit perbulan untuk beberapa tahun.
15
1
0.9
0.8
0.7
0.6
0.5
ogif-positif
0.4
ogif-negatif
0.3
0.2
0.1
0
0
10
20
30
40
50
60
70
80
90
Gambar 8. Ogive dari Data Luas Pemilikan Kolam Ikan di Desa Sekardangan.
4.3. Diagram Dahan/Batang Daun.
Bagian ini khusus membahas Diagram Dahan/Batang Daun, diagram ini sekarang sangat
populer di dunia Statistika, oleh sebab itu dimasukkan kedalam bahan ini. Pada dasarnya
diagram dahan daun ini fungsinya sama dengan histogram yaitu suatu diagam yang
digunakan untuk melihat sebaran/distribusi data. Sama-sama dibentuk dengan cara
mengelompokan pengamatan-pengamatan ke dalam kelas-kelas. Hanya saja kelas-kelas
tersebut dibentuk berdasarkan digit-digit pada nilai pengamatan. Dalam pembuatan
diagram dahan daun, setiap nilai dipisahkan atas digit utama dan digit penyerta. Digit
utama sebagai dahan/batang dan digit penyerta sebagai daun, digit penyerta/daun harus
terdiri dari satu digit.
Diagram dahan daun disusun baris-perbaris secara vertikal dan ini cukup efektif untk
menggambarkan pola sebaran dari data yang berukuran kecil. Misalkan kita memilki
kumpulan sebagai berikut :
32
87
95
41
11
10
94
95
36
99
91
75
62
57
74
75
14
63
58
16
Tahap 0
Penyususnan
Lajur Dahan/Batang
Dahan
Daun
0
1
2
3
4
5
6
7
8
9
2. Tambahkan daunnya (digit penyerta)
Tahap 1
Pengisian
Angka 32
Dahan Daun
0
1
2
2
3
4
5
6
7
8
9
3. Tambahkan data selajutnya:
Tahap 2
Pengisian
Angka 95
Dahan Daun
0
1
2
3
2
4
5
6
7
8
9
5
Tahap 3
Pengisian
Angka 11. . .
Dahan
Daun
0
1
140
2
3
26
4
1
5
87
6
223
7
455
8
7
9
54159
17
4. Urutkan daunnya:
Tahap 4
Pengisian
Angka 11. . .
Dahan
Daun
0
1
014
2
3
26
4
1
5
78
6
223
7
455
8
7
9
14559
5. Angka 10 adalah bernilai 10, sehingga unit untuk diagram dahan daun ini adalah
1.
6.
Diagram Dahan Daun
Unit=1
Dahan
Daun
0
1
2
3
4
5
6
7
8
9
014
26
1
78
223
455
7
14559
Contoh 1.
Buatlah diagram dahan daun dari data di bawah ini :
16,8
13,1
14,6
22,6
24,4
25,7
15,8
16,9
12,9
16,6
21,4
21,7
14,9
14,1
20,5
22,7
26,2
26,7
25,8
19,7
28,1
18,7
20,2
17,9
17,3
17,5
20,2
21,6
17,7
18,0
14,4
24,6
15,1
18,6
13,7
20,9
24,2
6,9
20,3
17,3
Yang menjadi daun adalah angka desimalnya 16,8, angka 16 menjadi dahan angka 8
menjadi daunnya, maka kita ingin memperbesar intervalnya maka untuk menjadi daun
adalah jarak (lebar) intervalnya 2, yaitu 00-1.0 ditulis dengan * , 2.0-3.0 ditulis t
(two,three), 4. 0-5.0 ditulis f (four, five), 6. 0-7.0 ditulis s (six, seven), 8. 0-9.0 ditulis .
(titik). Penulisan angkanya dibulatkan ke bawah sehingga 25,7 menjadi 25 dan
seterusnya. Diagram dahan daun untuk data di atas menjadi seperti terlihat pada gambar 1
18
Dahan
0
Daun
*
t
s
.
*
t
f
s
.
*
t
f
s
.
9
233
444455
66677777
8889
00000111
22
44455
66
8
5,62
4,52
5,51
4,12
4,26
4,82
5,29
4,26
4,63
4,64
4,40
4,29
4,31
5,78
4,60
4,30
4,73
4,39
4,56
4,45
5,08
5,67
4,41
Untuk data, kita bisa mengambil dua digit pertama sebagai dahan dan digit terakhir
sebagian daun. Jika data menunjukkan 4,12, maka kita harus menuliskan daun 2 pada
dahan 41. Didaptkan hasil sebagai berikut.
Unit = 0.01
Dahan
Daun
41
22
42
669
43
1099
44
501
45
729
46
430
47
3
48
2
49
50
8
51
52
9
53
54
55
1
56
27
57
8
19
Biasanya diagram dahan daun ini dilengkapi dengan informasi mengenai unit yang
ditempatkan bagi digit penyerta. Jika unit = 0,01, berarti bahwa digit penyerta berada
pada posisi 2 angka di belakang koma. Jika unit = 1 berarti bahwa digit penyerta berada
posisi satuan. Jika angka desimal terakhir diabaikan maka diagramnya akan menjadi:
Unit = 0,1
4 51633343522475418626
5 626705
Diagram dia atas terlihat terlalu padat, oleh sebab itu, dahan/batangya bis dibagi menjadi
dua, sehingga gambarnya menjadi:
Unit = 0.1
4 * 11222333444
. 55566678
5 * 02
. 6667
Keterangan: * = 0,1,2,3,4
. = 5,6,7,8,9
Kalau dirasakan masih terlalu padat, maka daun dapat dibagi lima dan diagramnya
menjadi:
Dahan
4
Keterangan:
Unit = 0,1
Daun
11
t 3333222
f 545454
s 6766
. 8
0
t 2
f 5
s 667
* = 0,1
t = 2,3
f=4,5
s=5,7
. =8,9.
20
xi / N
i 1
x xi / n
i2
Rumus data tunggal digunakan jika tersedia data tunggal, sedangkan rumus data yang
dikelompokkan digunakan jika datanya tersedia telah berkelompok, jadi data tunggalnya
tidak ada.
1.2. Data yang dikelompokkan
x
fiMi ; Mi Titik
fi
tengah
Contoh 1.
Nilai lima kali quiz mata kuliah Statistika seorang mahasiswa adalah: 56, 89, 74, 99, dan
66. Berapakah rata-rata hitung populasi tersebut?
2. Median
Median sekelompok data yang telah diurutkan baik dari terkecil sampai terbesar maupun
dari terbesar sampai terkecil adalah pengamatan yang tepat di tengah-tengah kalau
jumlah pengamatan ganjil atau rata-rata kedua pengamatan yang ditengah kalau
pengamatan itu genap.
Data yang tidak dikelompokkan, data diurutkan/disusun sebagai berikut:
X(1), X(2),..., X(n) ; X(1) = data terkecil
X(n) = data terbesar
21
fm
Median = Lo + C
3. Modus
Modus sekelompok data adalah nilai yang paling sering muncul atau yang mempunyai
frekuensi tertinggi.
Contoh 2:
Suatu data sampel/contoh mempunyai nilai-nilai sebagai berikut: 21 3 4 29 11 7 8
13 ,
n
x xi / n
i2
= 96/8 = 12.
Median adalah suatu nilai yang posisinya di tengah-tengah, jika datanya diurutkan dari
kecil sampai ke besar. Secara perhitungn median dihitung sebagai berikut:
Jika jumlah datanya genap maka median adalah rata-rata dua data yang terletak ditengahtengah.
Modus adalah data yang paling sering muncul atau yang mempunyai frekuensi terbesar.
22
Seandainya data pada contoh di atas data 29 diganti dengan 2888 (misalkan data ini
adalah data pencilan yang berasal dari kesalahan pengetikan, maka
n
Rata-rata=
x xi / n
i2
Jadi dapat dilihat bahwa rata-rata mempunyai kelemahan dibandingkan dengan median,
yaitu rata-rata sangat sensitif dengan nilai pencilan sedangkan median tidak. Untuk
sebaran/distrubusi yang tidak simetrik, penggunaan median lebih baik dibandingkan
dengan rata-rata, karena sifat kesensitifan rata-rata ini.
Sedangkan modus untuk data di atas tidak ada, karena semua data mempunyai frekuensi
yang sama yaitu satu.
Frekuensi
9
35
20
10
4
2
Kelas
0
5
10
15
20
25
4
9
14
19
24
29
fi*mi
18
245
240
170
88
54
815
23
Rata-rata =
Rata-rata =
fiMi ; Mi Titik
fi
tengah
10.1875
Kelas
0
5
10
15
20
25
4
9
14
19
24
29
Tepi Kelas
-0.5-4.5
4.5-9.5
9.5-14.5
14.5-19.5
19.5-24.5
24.5-29.5
Jumlah
n
0
2 ( fi )
fm
Median = Lo + C
Contoh3 : Data: 21 3 4 29 11 7 8 13
Data yang telah diurutkan: 3 4 7 8 11 13 21 29
Selanjutnya akan dilakukan penghitungan median jika diketahui histogram untuk
frekuensi kumulatif dan poligonnya.
24
2. Ukuran Penyebaran
Ukuran Variasi (Ukuran Penyebaran) ialah besaran yang menggambarkan penyebaran
atau variasi suatu kelompok data apakah data tersebut mengumpul di sekitar rata (median
atau ukuran pemusatan lainnya) atau tersebar telalu jauh dan rata-ratanya.
Contoh ukuran variasi: Range (Jarak), Rata-rata simpangan, Ragam (Variance).
Simpangan baku (Standar deviasi).
25
1. Range (Jarak) = R
R = Xn X1; Xn = Data terbesar
X1 = Data terkecil
Sifat-sifat, Jarak:
1.Jarak semakin besar kalau data semakin memencar
2.Besarnya ditentukan oieh nilai ekstrim dan tidak peduli dengan penyebaran data di
tengahnya.
2. Jarak Antar Quartil = IQ
IQ = Q3 Q1
3. Ragam (Variansi) dan Simpangan Baku (Standar Deviasi)
Ragam populasi (parameter) dilambangkan dengan
Ragam contoh (statistik) dilambangkan dengan s2
Simpangan Baku populasi (parameter) dilambangkan dengan
Simpangan Baku populasi (statistik) dilambangkan dengan s
2
1
N
( xi )
1
(xi x ) 2
(
n
1
)
2
s =
2
s= s
Contoh 5.
Dari data Tabel 4 hitunglah ragam dan simpangan baku (dengan rumus untuk populasi)
dan dari data Tabel 6 hitunglah ragam dan simpangan baku (dengan rumus untuk contoh).
2. Untuk Data yang Dikelompokkan
1
N
fi( Mi )
26
fid
N
fidi
fiM
( fiMi ) 2
N
Contoh: Data Indeks Prestasi (IP)pada Perguruan tinggi datanya berkisar 0 sampai 4,00.
Sedangkan data nilai berkisar 0 sampaii 100. Jika kita ingin membandingkan
keragaman/variasi data IP dan data nilai maka KV lebih bagus digunakan, karena
simpangan baku data cenderung lebih besar dari simpangan baku IP.
x100%
KV =
(untuk populasi)
S
x100%
KV = X
(untuk contoh/sampel)
Jika dari dua kelompok data masing-masing koefisien variasinya adalah KV 1 dan KV2,
ternyata KV1 > KV2 maka dapat dikatakan bahwa data kelompok pertama lebih
bervariasi dari kelompok data kedua.
C. Kesimpulan
a) Jenis data ada dua data kategorik(Kualittif) dan data Numerik (Kuantitatif)
b) Penyajian data berguna untuk memperoleh informasi semaksimal mungkin
dari data tersebut, Penyajian data bisa dilakukan dengan membuat tabel dan
membuat gambar. Tabel terdiri dari Tabel Ikhtisar dan Tabel Distribusi
Frekuensi. Penyajian data dengan gambar bisa dengan membuat: diagram
27
batang dan diagram lingkaran untuk data kategorik, serta histogram, diagram
garis, ogive, dan diagram dahan daun untuk data numerik.
c) Pengambilan kesimpulan dari suatu data bisa dengan menghitung ukuran
pemusatan dan ukuran penyebaran data tersebut. Ukuran pemusatan seperti
rata-rata, median atau modus, berguna untuk mengukur di mana data itu
terpusat, sehingga nilai tersebut dapat mewakili kelompok datanya. Ukuran
penyebaran mengukur variasi data, apakah data bervariasi atau datanya
seragam atau homogen
D. Rujukan
1.
2.
3.
28