Statistik Deskriptif
Dosen Pengampu
Oleh
14610002
JURUSAN MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI MAULANA MALIK IBRAHIM MALANG
2015
I. Contoh Soal
Data tinggi 100 pohon milik Kelompok Usaha Pertanian Blaises` Christmas Tree
Farm.
56 61 52 62 63 34 47 35 44 59
70 61 65 51 65 72 55 71 57 75
53 48 55 67 60 60 73 74 43 74
71 53 78 59 56 62 48 65 68 51
73 62 80 53 64 44 67 45 58 48
50 57 72 55 56 62 72 57 49 62
46 61 52 46 72 56 46 48 57 52
54 73 71 70 66 67 58 71 75 50
44 59 56 54 63 43 68 69 55 63
48 49 70 60 67 47 49 69 66 73
Penyelesaian
Untuk menyelesaikan permasalahan tersebut, dibuat tabel distribusi frekuensi
kelompok.
Dibulatkan menjadi 6
Misalnya digunakan alternatif pertama, jadi tabel frekuensi dari data tinggi
100 pohon milik Kelompok Usaha Pertanian Blaises` Christmas Tree Farm adalah
sebagai berikut;
Batas Kelas Tinggi Pohon Frekuensi Frekuensi Kumulatif
33-38 2 2
39-44 5 7
45-50 16 23
51-56 19 42
57-62 20 62
63-68 15 77
69-74 19 96
75-80 4 100
∑
II. Kajian Pustaka
1. Pengertian Statistika
Statistika merupakan sekumpulan konsep dan metode yang digunakan
untuk mengumpulkan dan menginterpretasi data tentang bidang kegiatan
tertentu dan mengambil kesimpulan dalam situasi dimana ada ketidak pastian
dan variasi. Statistika berarti sekumpulan data yang terdiri dari angka-angka,
sehingga kita mengenal statistika pertanian, statistika kependudukan, statistika
perekonomian, dan sebagainya. (Turmudi dan Sri Harini, 2008)
Menurut sumber lain, statistika merupakan ilmu pengetahuan yang
berhubungan dengan motode-metode ilmiah untuk pengumpulan,
pengorganisasian, perangkuman, pemaparan dan penganalisisan data
disamping terkait pula dengan metode-metode untuk menarik kesimpulan
yang valid serta pengambilan keputusan yang berdasarkan alasan-alasan yang
ilmiah dan kuat yang diperoleh dari hasil analisis tadi. Dalam makna yang
lebih sempit, istilah statistika digunakan untuk menunjukkan data-data itu
sendiri atau angka-angka yang diturunkan dari data tersebut, misalnya rata-
rata. (Murray R. Spiegel dan Larry J. Stephen, 2004)
Selain itu, statistika juga berarti suatu disiplin ilmu. Ruang lingkup
statistika sebagai disiplin ilmu mencakup berbagai teknik pengumpulan dan
penyajian data, baik untuk keperluan analisis data maupun dalam dalam proses
pengambilan keputusan. Salah satu kegunaan utama dari ilmu statistika adalah
untuk menyediakan suatu set prosedur yang memungkinkan kita melakukan
inferensi, pendugaan dan menentukan keputusan tentang karakteristik suatu
populasi berdasarkan atas informasi sampel yang diambil dari sebagian
populasi tersebut.(Turmudi dan Sri Harini, 2008)
Istilah Statistika (statistics) dan statistic (Statistic) sebenarnya berbeda.
Kalau statistika adalah ilmunya maka statistik adalah data atau hasil penerapan
statistika pada suatu data. Statistik adalah data, fakta, informasi, atau hasil
penerapan algoritma statistika pada suatu data. Sebagai contoh, misalkan
ketika kita membaca berita surat kabar di pagi hari dengan waktu yang
terbatas karena akan berangkat kerja, padahal kita ingin mengetahui berbagai
macam berita secara lengkap. Maka yang dapat kita lakukan adalah membaca
sepintas dengan cepat berita yang disajikan, seperti tentang tingkat kejahatan,
tingkat pertumbuhan, rata-rata pendapatan, dan sebagainya. Dengan demikian
secara sederhana statistik memuat fakta dan gambaran dari fakta itu
sendiri.(Turmudi dan Sri Harini, 2008)
2. Ukuran Pemusatan dan Penyebaran
2.1 Ukuran Pemusatan
Ada beberapa jenis ukuran pemusatan yang biasa digunakan dalam
mendeskripsikan data. Yaitu :
1. Ukuran gejala pusat, meliputi :
Rata-rata hitung (mean)
Rata-rata atau mean atau average adalah nilai yang
mewakili sehimpunan atau sekelompok data (a set of data).
Nilai rata-rata pada umumnya mempunyai kecenderungan
terletak di tengah-tengah dalam suatu kelompok data yang
disusun menurut besar kecilnya nilai. Dengan perkataan lain
bahwa ia mempunyai kecenderungan memusat. Oleh karena itu
nilai rata-rata sering disebut ukuran kecenderungan memusat.
(Supranto, 1977)
Mean memiliki kecenderungan untuk berada diposisi
tengah atau sentral dari suatu kumpulan data yang disusun
berdasarkan besarnya maka rata-rata sering pula disebut ukuran
tendensi sentral atau ukuran pemusatan.
Mean aritmetik atau singkatnya mean, dari suatu
himpunan N bilangan , , …, dapat dinyatakan
dengan ̅ . Serta didefinisikan sebagai ;(Supranto, 1977)
∑ ∑
̅= =
∑
̅
∑
Dimana :
= Nilai tengah kelas
= frekuensi kelas
Modus
Modus (mode) dari suatu himpunan bilangan
merupakan nilai yang muncul dengan frekuensi terbanyak.
Suatu himpunan bilangan tidak selalu memiliki modus, dengan
kata lain modus dari suatu himpunan bilangan tidak selalu
muncul. Jikalaupun terdapat modus dari suatu himpunan
bilangan, modus ini selalu bersifat unik.
Untuk mencari nilai modus pada data tunggal, cukup
dicari nilai yang memiliki frekuensi terbanyak, atau nilai yang
paling sering muncul. Untuk kasus data kelompok dimana
suatu kurva frekuensi sudah dibuat untuk mengeplot data-data
yang ada, modusnya akan sama dengan nila (atau nila-nilai) X
yang berkorespondensi dengan titik maksimum (atau titik-titik
maksimum) kurva. Nilai X seringkali disimbolkan sebagai ̂ .
Dari sebuah distribusi frekuensi atau histogram, modus
dapat dicari dengan menggunakan rumus sebagai berikut :
Di mana :
= Batas bawah kelas modus
= Kelebihan dari frekuensi modus terhadap frekuensi
dari kelas yang lebih rendah berikutnya
= Kelebihan dari frekuensi modus terhadap frekuensi
dari kelas yang lebih tinggi berikutnya
= Ukuran dari interval kelas modus
2. Ukuran letak, meliputi :
Median
Median adalah nilai pengamatan yang terletak di
tengah-tengah data yang kita punyai dan telah diurutkan dari
kecil ke besar atau sebaliknya. Median merupakan skor yang
membagi dua distribusi data tepat sama, yaitu setengahnya
adalah skor yang kurang sama dengan median dan setengah
yang lain adalah nilai yang lebih besar dari median.
Untuk menentukan median suatu data maka data
pengamatan tergantung pada n, apakah n tersebut ganjil atau
genap. Jika banyaknya pengamatan (n) genap maka
pengamatan yang dimaksud adalah data antara yang ke ⁄
∑ ( ̅ ∑ ̅ ∑
√ √ √ √̅̅̅̅̅̅̅̅̅̅̅̅
̅
√̅̅̅̅̅̅̅̅̅̅̅̅
̅
3. Statistika Deskriptif
Ilmu statistika dapat dibedakan menjadi dua bagian, yaitu statistika
deskriptif dan statistika inferensial. Dalam hal ini, hanya akan dibahas
statistika deskriptif. Statistika deskriptif berkenaan dengan deskripsi data,
misalnya dari menghitung rata-rata dan variansi dari data mentah;
mendeskripsikan menggunakan tabel-tabel atau grafik sehingga data mentah
lebih mudah “dibaca” dan lebih bermakna. Cabang ilmu statisika deskriptif
berkaitan dengan berbagai teknik pengumpulan, pengorganisasian,
penyederhanaan, dan penyajian data ke dalam bentuk ysng lebih mudah
dipahami, misalnya dalam bentuk tabel atau grafik. Teknik penyederhanaan
data biasanya disertai dengan penjelasan tentang karakteristik-karateristik
tertentu dari data, seperti ukuran pemusatan, ukuran penyebaran dari data
tersebut.
3.1 Distribusi Frekuensi
Penyajian data ke dalam bentuk distribusi frekuensi merupakan salah
satu langkah awal yang biasanya dilakukan dalam menganalisis suatu data.
Penginterpretasian data biasanya dapat lebih mudah jika data tersebut ditata
(disusun) dan disederhanakan lebih dulu ke dalam tabel. Salah satunya adalah
tabel frekuensi. Distribusi frekuensi merupakan suatu tabel, di mana data
dikelompokkan ke dalam beberapa interval numeric yang disebut interval
kelas (selang kelas). Bentuk tabel ini sangat sederhana karena hanya
menyajikan jumlah pengamatan atau frekuensi dalam setiap interval kelas.
(Turmudi dan Sri Harini, 2008)
Tabel
Ada beberapa tahapan yang dapat digunakan sebagai petunjuk untuk
menyusun tabel distribusi kelompok. Aturan ini memuat pedoman, tetapi
bukan aturan kaku, yang dapat membantu kita menyusun tabel yang baik dan
mudah dipahami. Tahapan yang diperlukan dalam penyusunan disribusi
frekuensi dengan kelas yang merupakan selang interval dilakukan urutan
sebagai berikut; (Turmudi dan Sri Harini, 2008)
a. Penentuan banyaknya selang/interval kelas
Digunakan rumusan sebagai berikut:
Atau
̅
̅ = Rata-rata
= Modus
= Median
= Simpangan Baku
b. Kurtosis
Kurtosis adalah ukuran keruncingan kurva. Kurva suatu distribusi
frekuensi dilihat dari tingkat keruncingan dibagi menjadi 3, yaitu leptokurtis,
platykurtis, dan mesokurtis. (Supranto, 1977)
Nilai kurtosis merupakan nilai relative terhadap distribusi normal.
Sebuah distribusi yang mempunyai puncak yang relative tinggi, disebut
leptokurtic, sementara kurva yang memiliki puncak rata/datar, disebut
platikurtik. Distribusi normal dengan puncak yang tidak terlalu runcing
ataupun terlalu datar disebut mesokurtik. (Murray R. Spiegel dan Larry J.
Stephen, 2004)
Untuk menghitung tingkat keruncingan suatu kurva distribusi
digunakan , yaitu moment coefficient of kurtosis yang rumusnya sebagai
berikut:
∑ ̅
∑ ̅
(atas untuk data tak berkelompok dan bawah untuk data berkelompok.)
= Ukuran keruncingan kurva
= Simpangan baku
= Banyaknya kelas
= Frekuensi kelas ke-i
= Ukuran momen
̅ = Rata-rata
III. Langkah-langkah
Langkah-langkah untuk mengetahui statistik deskriptif menggunakan minitab
adalah sebagai berikut:
1) Dibuka aplikasi “Minitab” pada menu start,
Grafik
Histogram
Individual Value Plot
Boxplot
2. Interpretasi
Data Nilai
∑
∑
[ ] 56.5+
[ ] [ ]
∑ [ ̅] =
√ √
̅
∑[ ̅ ]
∑
4.2 Pembahasan
1) Mean
Mean atau rata-rata adalah hasil perhitungan yang diperoleh
dengan jalan menjumlahkan seluruh skor didalam distribusi frekuensi
dan membaginya dengan banyaknya skor. Hasil mean dari Minitab
adalah 59.22, sedangkan berdasarkan perhitungan secara manual
adalah 58.96. Dari kedua hasil tersebut dapat dilihat bahwa hasil
perhitungan minitab dan perhitungan secara manual.
2) SE of Mean
SE of Mean merupakan nilai eror yang menunjukkan besarnya
kemungkinan kesalahan yang terjadi pada data tersebut. Semakin kecil
nilai SE Mean maka semakin kecil pula kemungkinan kesalahan yang
terjadi dan sebaliknya semakin besar nilai SE Mean maka semakin
besar pula kemungkinan kesalahan yang terjadi. Hasil SE of Mean dari
data tersebut 1.01.
3) Standar Deviation dan Variansi
Standar Deviasi dan variansi merupakan sebuah ukuran
penyebaran yang menunjukkan standar penyimpangan atau deviasi
data terhadap nilai rata-ratanya. Nilai varians dan nilai standar deviasi
saling berhubungan karena nilai kuadrat dari standar deviasi
merupakan nilai dari variansi. Hasil perhitungan minitab standar
deviasi adalah 10.11 sedangkan hasil perhitungan manual adalah
sebesar 24.56. Hasil perhitungan standar deviasi atau simpangan baku
antara minitab dan manual tidak sama.
Hasil perhitungan minitab variansi adalah 102.23 sedangkan
hasil manual adalah 602.88. Dapat dilihat juga bahwa hasil minitab dan
manual variansi tidak sama.
4) Median
Median adalah nilai pengamatan yang terletak di tengah-tengah
data yang kita punyai dan telah diurutkan dari kecil ke besar atau
sebaliknya. Median merupakan skor yang membagi dua distribusi data
tepat sama, yaitu setengahnya adalah skor yang kurang dari atau sama
dengan median dan setengah yang lain adalah skor yang lebih besar
dari median. Hasil median dari minitab adalah 59.00 sedangkan dari
perhitungan secara manual 56.9. Hasil perhitungan minitab dan
perhitungan secara manual dari nilai median juga tidak sama.
5) Sum
Sum adalah jumlah nilai dari semua data yang ada. Jumlah
perhitungan minitab dari seluruh data diatas adalah 5922, sama dengan
perhitungan manual.
6) Minimum
Minimum merupakan nilai yang paling kecil dari semua data.
Hasil nilai minimum dari minitab adalah 34, sama dengan hasil
manual.
7) Maximum
Maximum merupakan nilai yang paling besar dari semua data.
Hasil nilai maximum dari minitab adalah 80, sama dengan hasil
manual.
8) Range
Range adalah selisih antara nilai maksimum dan nilai minimum. Hasil
perhitungan nilai range dari minitab adalah 64, sama dengan hasil
manual.
9) Skewness
Skewness atau ukuran kecondongan adalah derajat kesimetrian
dari suatu distribusi, diperoleh skewness -0,13, sedangkan nilai
skewness hasil perhitungan manual adalah 0.093. Arti skewness hasil
perhitungan minitab adalah kemencengan kurva adalah negatif, berarti
menuju ke arah kanan, sehingga bagian kanan berisi lebih banyak data
daripada bagian kiri. Jika nilai kemencengan positif maka akan menuju
ke arah kiri, sehingga bagian kiri akan lebih banyak dari pada bagian
kanan, dimana menunjukkan hasil perhitungan skewness secara
manual. Dari sini dapat disimpulkan bahwa skewness dari hasil
perhitungan minitab dan manual tidak sama.
10) MSSD
Hasil perhitungan MSSD dari minitab adalah 101.66
11) Kurtosis
Kurtosis atau ukuran keruncingan ada yang menyebut
kepuncakan atau ketinggian kurva. Untuk mengukur keruncingan pada
suatu kurva dapat dilakukan melalui perbandingan dengan kurva
normal (simetris). Kurva normal yaitu mempunyai distribusi yang
tidak mendatar dan tidak meruncing. Kurva demikian disebut dengan
mesokurtic. Kurva dengan distribusi puncak yang mendatar disebut
dengan platykurtic, sedang kurva distribusi puncak yang tinggi disebut
dengan leptokurtic. Distribusi yang normal memiliki nilai kurtosis = 0.
Hasil perhitungan kurtosis dari minitab data di atas adalah -0,70,
sedangkan hasil perhitungan manual 6.41. Hasil perhitungan nilai kur
Kurtosis bernilai negatif menunjukkan distribusinya memiliki puncak
yang lebih landai dibandingkan dengan distribusi normal. Jika nilainya
positif maka distribusi puncaknya akan lebih tinggi dari pada distibusi
normalnya.
Grafik
1) Histogram (with normal curve)
Histogram digunakan untuk menyajikan data yang telah
tersusun dalam bentuk tabel distribusi frekuensi ke dalam bentuk
grafik. Kegunaan utama histogram adalah untuk menunjukkan bentuk
umum dari distribusi data dan untuk memberikan kesan visual tentang
konsentrasi dari sebagian besar pengamatan.
Batang yang tertinggi dari histogram tersebut mewakili
frekuensi yang terbanyak yaitu grafik yang memiliki frekuensi 19 yaitu
antara 51-56. Sedangkan grafik terendah ditunjukkan oleh grafik yang
memiliki frekuensi 2 pada grafik ke 1 yaitu yang memiliki nilai dari
33-38. Dari grafik diatas data lebih banyak memusat ditengah.
2) Individual value plot
Individual value plot menggambarkan frekuensi masing-masing
nilai. Dari data di atas diketahui bahwa frekuensi pohon yang memiliki
tinggi 34 meter adalah 1, frekuensi 35 meter adalah 1, frekuensi 43
meter adalah 2, frekuensi 44 adalah 3, dan seterusnya. Individual value
plot juga menggambarkan ada atau tidaknya pencilan yang dapat
mengganggu keseimbangan data tersebut. Yang dimaksud dengan
pencilan adalah data yang cukup kecil atau cukup besar dibanding
dengan data yang lainnya. Dari hasil grafik minitab data di atas, tidak
terdapat data yang menjadi pencilan. Tidak ada data yang nilainya
terlalu kecil atau terlalu besar dibandingkan dengan data lainnya. Jadi
dapat disimpulkan bahwa data tersebut cukup bagus.
3) Boxplot
Dari hasil boxplot minitab, dapat diketahui bahwa nilai
adalah 51.2, Median adalah 59, adalah 67.75, IQRange adalah 16.5,
Whiskers to (nilai minimum dan nilai maksimum) adalah 34 dan 80,
dan yang terakhir N (banyaknya data) adalah 100. Dari hasil boxplot,
dapat disimpulkan bahwa median membagi daerah grafik menjadi
setengahnya ditunjukkan dengan garis horizontal yang membagi box
menjadi 2 bagian yang sama. Titik tengah distribusi data mempunyai
arti bahwa daerah didalam grafik dibagi menjadi dua bagian yang
sama, tetapi bukan berarti membagi dua rentangan skor.
V. Kesimpulan
Dari pembahasan diatas, dapat disimpulkan bahwa hasil perhitungan
dari minitab dan perhitungan manual mayoritas tidak sama. Hasil perhitungan
yang sama hanya range, minimum, maksimum, dan sum. Hal ini memang
dimungkinkan karena adanya kesalahan/eror dan dari perhitungan mean.
Pertitungan mean terjadi kesalahan karena terdapat SE of mean yang
menghitung kemungkinan tingkat kesalahan perhitungan mean. Sedangkan
kesalahan perhitungan lainnya karena ada kesalahan terhadap perhitungan
mean itu sendiri. Karena mayoritas perhitungan ukuran pusat maupun ukuran
penyebaran melibatkan nilai mean.
Daftar Pustaka
Spiegel, Murray R; Stephens, Larry J. 2004. Statistik. Jakarta:Erlangga
Supranto, J. 1977. Statistik, Teori dan Aplikasi. Jakarta:Erlangga
Turmudi; Harini, Sri. 2008. Metode Statistika, Pendekatan teoritis dan Aplikatif.
Malang:UIN Malang Press