Anda di halaman 1dari 36

TUGAS MANDIRI

Judul : Membuat Makalah Tentang Statistik


Subject : Statistik Deskriptif



Name : Fither
NPM : 121210099
Code Class : 131-MA111-M12
Lecturer : Yuliadi, S.Si
UNIVERSITAS PUTERA BATAM
2014

Kata Pengantar
Saya berterima kasih dan berdoa untuk semua kebaikan dan kasih karunia
dari Allah yang diberikanNya. Saya seorang komposer untuk
menyelesaikan tugas ini tepat waktu, sesuai dengan materi yang diajarkan
dalam semester ini.
Tulisan ini memberikan informasi tentang " Membuat makalah tentang
statistik " yang terdiri dari penjelasan tentang bagaimana menbuat dan
menghitung dalam metode statistik. Banyak kendala yang terjadi ketika saya
mengkompilasi tulisan ini, baik dari dalam maupun dari luar. Namun dengan
ketekunan dan kesabaran telah konstituen, maka ini dapat diatur dan
diselesaikan kertas
Saya seorang komposer mengucapkan terima kasih kepada semua orang
yang terlibat, didalamnya khususnya teman-teman kuliah yang membantu
memberikan referensi serta Mr. Yuliadi, S.Si yang telah memberikan
bantuan dan bimbingan. Tulisan ini masih jauh dari sempurna, jika ada
kesalahan dan kekurangan sehingga dapat dimengerti, dan mungkin berguna
sehingga dapat menjadi referensi bagi pembaca.

BATAM, 2 Desember 2013
Penulis

(FITHER)

i
Daftar isi
Kata Pengantar i
Daftar isi . ii
Definisi Statistik .. 1
Sejarah statistic .... 2
Konsep Dasar ... 3
Analisis Regresi dan Korelasi .. 4
Analisis varians (analysis of variance, ANOVA) 5
Metode Statistik ... 7
Tipe Pengukuran .. 7
Distribusi Frekuensi ... 9
Ukuran Statistika .. 22
Referensi .... 31




ii
Definisi Statistik
Statistik adalah ilmu yang mempelajari bagaimana merencanakan,
mengumpulkan, menganalisis, menginterpretasi, dan mempresentasikan data.
Singkatnya, statistik adalah ilmu yang berkenaan dengan data. Istilah 'statistika'
bahasa Inggris: statistics berbeda dengan 'statistik' (statistic). Statistik merupakan
ilmu yang berkenaan dengan data, sedang statistik adalah data, informasi, atau hasil
penerapan algoritma statistik pada suatu data. Dari kumpulan data, statistik dapat
digunakan untuk menyimpulkan atau mendeskripsikan data; ini dinamakan statistik
deskriptif. Sebagian besar konsep dasar statistika mengasumsikan teori probabilitas.
Beberapa istilah statistika antara lain: populasi, sampel, unit sampel, dan probabilitas.
Statistik adalah kata yang digunakan untuk menyatakan sekumpulan fakta,
umumnya berbentuk angka-angka yang disusun dalam tabel atau diagram yang
melukiskan atau menggambarkan suatu kumpulan data yang mempunyai arti. Untuk
memudahkan.
Berikut ini disampaikan beberapa contoh :
"Ada 60 % dari penduduk yang memerlukan air bersih, kata 60 % adalah
statistik.
Statistik vital pragawati tersebut adalah 38 - 33 - 35, rangkaian angka-angka
ini disebut juga "statistik" karena mempunyai arti.
Sedangkan statistika menunjukkan suatu pengetahuan yang berhubungan dengan
cara- cara pengumpulan fakta, pengolahan, penganalisisan, dan penarikan kesimpulan
serta pembuatan keputusan yang cukup beralasan berdasarkan fakta yang ada.
Statistik banyak diterapkan dalam berbagai disiplin ilmu, baik ilmu-ilmu alam
misalnya astronomi dan biologi maupun ilmu-ilmu sosial termasuk sosiologi dan
psikologi, maupun di bidang bisnis, ekonomi, dan industri. Statistika juga digunakan
1
dalam pemerintahan untuk berbagai macam tujuan; sensus penduduk merupakan
salah satu prosedur yang paling dikenal. Aplikasi statistika lainnya yang sekarang
popular adalah prosedur jajak pendapat atau polling misalnya dilakukan sebelum
pemilihan umum, serta hitung cepat (perhitungan cepat hasil pemilu) atau quick
count. Di bidang komputasi, statistik dapat pula diterapkan dalam pengenalan pola
maupun kecerdasan buatan.
Sejarah statistik
Penggunaan istilah statistika berakar dari istilah istilah dalam bahasa latin
modern statisticum collegium ("dewan negara") dan bahasa Italia statista
("negarawan" atau "politikus"). Gottfried Achenwall (1749) menggunakan Statistik
dalam bahasa Jerman untuk pertama kalinya sebagai nama bagi kegiatan analisis data
kenegaraan, dengan mengartikannya sebagai "ilmu tentang negara (state)". Pada awal
abad ke-19 telah terjadi pergeseran arti menjadi "ilmu mengenai pengumpulan dan
klasifikasi data". Sir John Sinclair memperkenalkan nama (Statistics) dan pengertian
ini ke dalam bahasa Inggris. Jadi, statistika secara prinsip mula-mula hanya mengurus
data yang dipakai lembaga-lembaga administratif dan pemerintahan. Pengumpulan
data terus berlanjut, khususnya melalui sensus yang dilakukan secara teratur untuk
memberi informasi kependudukan yang berubah setiap saat.
Pada abad ke-19 dan awal abad ke-20 statistika mulai banyak menggunakan
bidang-bidang dalam matematika, terutama peluang. Cabang statistika yang pada saat
ini sangat luas digunakan untuk mendukung metode ilmiah, statistika inferensi,
dikembangkan pada paruh kedua abad ke-19 dan awal abad ke-20 oleh Ronald Fisher
(peletak dasar statistika inferensi), Karl Pearson (metode regresi linear), dan William
Sealey Gosset (meneliti problem sampel berukuran kecil). Penggunaan statistika pada
masa sekarang dapat dikatakan telah menyentuh semua bidang ilmu pengetahuan,
mulai dari astronomi hingga linguistika. Bidang-bidang ekonomi, biologi dan cabang-
cabang terapannya, serta psikologi banyak dipengaruhi oleh statistika dalam
2
metodologinya. Akibatnya lahirlah ilmu-ilmu gabungan seperti ekonometrika,
biometrika (atau biostatistika), dan psikometrika.
Meskipun ada pihak yang menganggap statistika sebagai cabang dari
matematika, tetapi sebagian pihak lainnya menganggap statistika sebagai bidang yang
banyak terkait dengan matematika melihat dari sejarah dan aplikasinya. Di Indonesia,
kajian statistika sebagian besar masuk dalam fakultas matematika dan ilmu
pengetahuan alam, baik di dalam departemen tersendiri maupun tergabung dengan
matematika.
Konsep Dasar
Dalam mengaplikasikan statistika terhadap permasalahan sains, industri, atau
sosial, pertama-tama dimulai dari mempelajari populasi. Makna populasi dalam
statistika dapat berarti populasi benda hidup, benda mati, ataupun benda abstrak.
Populasi juga dapat berupa pengukuran sebuah proses dalam waktu yang berbeda-
beda, yakni dikenal dengan istilah deret waktu.
Melakukan pendataan (pengumpulan data) seluruh populasi dinamakan
sensus. Sebuah sensus tentu memerlukan waktu dan biaya yang tinggi. Untuk itu,
dalam statistika seringkali dilakukan pengambilan sampel (sampling), yakni sebagian
kecil dari populasi, yang dapat mewakili seluruh populasi. Analisis data dari sampel
nantinya digunakan untuk menggeneralisasi seluruh populasi.
Jika sampel yang diambil cukup representatif, inferensial (pengambilan
keputusan) dan simpulan yang dibuat dari sampel dapat digunakan untuk
menggambarkan populasi secara keseluruhan. Metode statistika tentang bagaimana
cara mengambil sampel yang tepat dinamakan teknik sampling.
Analisis statistik banyak menggunakan probabilitas sebagai konsep dasarnya
hal terlihat banyak digunakannya uji statistik yang mengambil dasar pada sebaran
peluang. Sedangkan matematika statistika merupakan cabang dari matematika terapan
3
yang menggunakan teori probabilitas dan analisis matematika untuk mendapatkan
dasar-dasar teori statistika. Ada dua macam statistik:
A. Statistika deskriptif
Statistika deskriptif berkenaan dengan deskripsi data, misalnya dari
menghitung rata-rata dan varians dari data mentah; mendeksripsikan menggunakan
tabel-tabel atau grafik sehingga data mentah lebih mudah dibaca dan lebih
bermakna dan statistik yang berkenaan dengan bagaimana data dapat digambarkan
dideskripsikan atau disimpulkan, baik secara numeric misalnya menghitung rata-rata
dan deviasi standar atau secara grafis dalam bentuk tabel atau grafik, untuk
mendapatkan gambaran sekilas mengenai data tersebut, sehingga lebih mudah dibaca
dan bermakna.
B. Statistika inferensial
Statistik inferensial lebih dari itu, misalnya melakukan pengujian hipotesis,
melakukan prediksi observasi masa depan, atau membuat model regresi dan statistik
yang berkenaan dengan permodelan data dan melakukan pengambilan keputusan
berdasarkan analisis data, misalnya melakukan pengujian hipotesis, melakukan
estimasi pengamatan masa mendatang estimasi atau prediksi, membuat permodelan
hubungan korelasi regresi, ANOVA, deret waktu, dan sebagainya.


Analisis Regresi dan Korelasi
Analisis regresi dalam statistika adalah salah satu metode untuk menentukan
hubungan sebab-akibat antara satu variabel dengan variable yang lain. Variabel
"penyebab" disebut dengan bermacam-macam istilah: variabel penjelas, variabel
eksplanatorik, variable independen, atau secara bebas, variabel X (karena seringkali
digambarkan dalam grafik sebagai absis, atau sumbu X). Variabel terkena akibat
dikenal sebagai variabel yang dipengaruhi, variabel dependen, variabel terikat, atau
variabel Y. Kedua variabel ini dapat merupakan variabel acak (random), namun
variabel yang dipengaruhi harus selalu variabel acak.
4
Analisis regresi adalah salah satu analisis yang paling populer dan luas
pemakaiannya. Analisis regresi dipakai secara luas untuk melakukan prediksi dan
ramalan, dengan penggunaan yang saling melengkapi dengan bidang pembelajaran
mesin. Analisis ini juga digunakan untuk memahami variabel bebas mana saja yang
berhubungan dengan variabel terikat, dan untuk mengetahui bentuk-bentuk hubungan
tersebut.
Analisis varians (analysis of variance, ANOVA)
Suatu metode analisis statistika yang termasuk ke dalam cabang statistika
inferensi. Dalam literatur Indonesia metode ini dikenal dengan berbagai nama lain,
seperti analisis ragam, sidik ragam, dan analisis variansi. Ia merupakan
pengembangan dari masalah Behrens-Fisher, sehingga uji-F juga dipakai dalam
pengambilan keputusan. Analisis varians pertama kali diperkenalkan oleh Sir Ronald
Fisher, bapak statistika modern. Dalam praktik, analisis varians dapat merupakan uji
hipotesis lebih sering dipakai maupun pendugaan estimation, khususnya di bidang
genetika terapan.
Secara umum, analisis varians menguji dua varians (atau ragam)
berdasarkan hipotesis nol bahwa kedua varians itu sama. Varians pertama adalah
varians antar contoh dan varians kedua adalah varians di dalam masing-masing
contoh. Dengan ide semacam ini, analisis varians dengan dua contoh akan
memberikan hasil yang sama dengan uji-t untuk dua perata.Supaya sahih dalam
menafsirkan hasilnya, analisis varians menggantungkan diri pada empat asumsi yang
harus dipenuhi dalam perancangan percobaan:
Data berdistribusi normal, karena pengujiannya menggunakan uji F-Snedecor
Varians atau ragamnya homogen, dikenal sebagai homoskedastisitas, karena
hanya digunakan satu penduga (estimate) untuk varians dalam contoh
Masing-masing contoh saling bebas, yang harus dapat diatur dengan
perancangan percobaan yang tepat.
5
Komponen-komponen dalam modelnya bersifat aditif (saling menjumlah).
Analisis varians relatif mudah dimodifikasi dan dapat dikembangkan untuk
berbagai bentuk percobaan yang lebih rumit. Selain itu, analisis ini juga masih
memiliki keterkaitan dengan analisis regresi. Akibatnya, penggunaannya sangat luas
di berbagai bidang, mulai dari eksperimen laboratorium hingga eksperimen
periklanan, psikologi, dan kemasyarakatan.
Deret Waktu
Dalam statistika dan pemrosesan sinyal, deret waktu adalah rangkaian data
yang berupa nilai pengamatan (pengamatan) yang diukur selama kurun waktu
tertentu, berdasarkan waktu dengan interval yang uniform sama. Beberapa Contoh
data deret waktu adalah produksi total tahunan produk pertanian indonesia, harga
penutupan harisan sebuah saham di pasar modal untuk kurun waktu satu bulan, suhu
udara per jam, dan penjualan total bulanan sebuah pasar swalayan dalam waktu satu
tahun. Analisis deret waktu (Bahasa Inggris: time series analysis) merupakan metode
yang mepelajari deret waktu, baik dari segi teori yang menaunginya maupun untuk
membuat peramalan (prediksi). Prediksi / Peramalan deret waktu adalah penggunaan
model untuk memprediksi nilai di waktu mendatang berdasar peristiwa yang telah
terjadi. Di dunia bisnis, data deret waktu digunakan sebagai bahan acuan pembuatan
keputusan sekarang, untuk proyeksi, maupun untuk perencanaan pada masa depan.
Contoh penggunaannya adalah pada harga pembukaan harga saham di bursa efek
berdasar performa sebelumnya.

Metode Statistik

Terdapat dua jenis utama penelitian: eksperimen dan survei. Keduanya
sama-sama mendalami pengaruh perubahan pada perubah penjelas, perilaku, dan
6
respon akibat perubahan itu. Perbedaan keduanya terletak pada bagaimana kajian
dilakukan.
Metode Eksperimen
Suatu eksperimen melibatkan pengukuran terhadap sistem yang dikaji,
memberi perlakuan terhadap sistem, dan kemudian melakukan pengukuran lagi
dengan cara yang sama terhadap sistem yang telah diperlakukan untuk mengetahui
apakah perlakuan mengubah nilai pengukuran. Bisa juga perlakuan diberikan secara
simultan dan pengaruhnya diukur dalam waktu yang bersamaan pula. Metode statistik
yang berkaitan dengan pelaksanaan suatu eksperimen dipelajari dalam rancangan
percobaan.
Metode Survei
Dalam survey, di sisi lain, tidak dilakukan manipulasi terhadap sistem yang
dikaji. Data dikumpulkan dan hubungan korelasi antara berbagai peubah diselidiki
untuk memberi gambaran terhadap objek penelitian.

Tipe Pengukuran

Ada empat tipe skala pengukuran yang digunakan di dalam statistika, yaitu
nominal, ordinal, interval, dan rasio. Keempat skala pengukuran tersebut memiliki
tingkat penggunaan yang berbeda dalam pengolahan statistik
1. Skala nominal
Skala nominal merupakan skala yang merupakan kategori atau kelompok dari
suatub subyek. Misal, variabel jenis kelamin responden dikelompokkan menjadi dua,
L/P, masing-masing diberi kode 1 dan 2. Angka ini hanya berfungsi sebagai label
kategori, tanpa memiliki nilai instrinsik dan tidak memiliki arti apa pun. Lambang-
lambang tersebut tidak memiliki sifat sebagaimana bilangan pada umumnya,
sehingga pada variabel dengan skala nominal tidak dapat diterapkan operasi
matematika standar: pengurangan, penjumlahan, perkalian, dll. Uji statistik yang
7
sesuai dengan skala nominal adalah uji yang mendasarkan pada jumlah seperti modus
dan distribusi frekuensi, dan hanya bisa juga membedakan sesuatu yang bersifat
kualitatif atau kategoris, misalnya jenis kelamin, agama, dan warna kulit.
2. Skala ordinal
Skala ordinal, lambang-lambang bilangan hasil pengukuran menunjukkan
urutan atau tingkatan obyek yang diukur menurut karakteristik yang dipelajari. Misal,
kita ingin mengetahui preferensi responden terhadap merek indomie goreng: merek
Sarimi, Indomie, Mie Sedap, Gaga Mie kemudian responden diminta untuk
melakukan ranking terhadap merek mie goreng dengan memberi angka 1 untuk
merek yang paling disukai, angka 2 untuk rangking kedua, dst. Rangkuman hasil sbb:

Merek mie goreng Rangking
Indomie 1
Mie Sedap 2
Sarimi 3
Gaga Mie 4

Tabel ini menunjukkan bahwa merek Indomie lebih disukai daripada Mie
Sedap, merek Mie Sedap lebih disukai daripada Sarimi, dsb. Walaupun perbedaan
angka antara preferensi satu dengan lainnya sama, namun kita tidak dapat
menentukan besarnya nilai preferensi dari suatu merek terhadap merek lainnya. Uji
statistik yang sesuai adalah modus, median, distribusi frekuensi dan statistik non-
parametrik seperti rank order correlation. Membedakan sesuatu dengan menunjukkan
tingkatan, misalnya pendidikan dan tingkat kepuasan pengguna.

3. Skala interval
Skala pengukuran mempunyai sifat seperti skala ordinal (memiliki urutan
tertentu), ditambah satu sifat khas, yaitu adanya satuan skala (scale unit). artinya,
perbedaan karakteristik antara obyek yang berpasangan dengan lambang bilangan
satu dengan lambang bilangan berikutnya selalu tetap.
8
Jika dalam pengukuran preferensi responden terhadap merek indomie goreng
tersebut diasumsikan bahwa urutan kategori menunjukkan preferensi yang sama,
maka kita dapat mengatakan bahwa perbedaan indomie goreng merek urutan ke 1
dengan 2 adalah sama dengan perbedaan merek 2 dengan lainnya. Namun demikian,
kita tidak bisa mengatakan bahwa merek yang mendapat ranking 5 nilainya lima kali
preferensi daripada merek 1. Uji statistik yang sesuai adalah semua uji statistik
kecuali uji yang mendasarkan pada rasio seperti koefisien variasi. Berupa angka
kuantitatif namun tidak memiliki nilai nol mutlak sehingga titik nol dapat digeser
sesuka orang yang mengukur, misalnya tahun dan suhu dalam Celcius.
4. Skala rasio
Skala rasio adalah skala yang menghasilkan data dengan mutu yang paling
tinggi. Perbedaan skala rasio dengan skala interval terletak pada keberadaan nilai nol
(based value). Pada skala rasio, nilai nol bersifat mutlak, tidak seperti pada skala
interval. Data yang dihasilkan oleh skala rasio adalah data rasio. Tidak ada
pembatasan terhadap alat uji statistik yag sesuai Berupa angka kuantitatif yang
memiliki nilai nol mutlak dan tidak dapat digeser sesukanya, misalnya adalah suhu
dalam Kelvin, panjang, dan massa.

Distribusi Frekuensi
A. Penyajian Grafik Distribusi frekuensi dapat juga disajikan dalam bentuk
grafik. Penyajian grafik yang sangat luas digunakan bagi data numerik
adalah diagram balok seperti gambar dibawah ini.

9

Diagram Balok umur Aki

Penyajian data lainnya adalah berbentuk Histogram. Histogram berbeda
dengan Diagram Balok dala hal sebagai lebar baloknya digunakan batas kelas bukan
limit kelas. Untuk beberapa masalah tertentu akan lebih baik bila sumbu tegaknya
menyatakan frekuensi relatif atau persentase. Grafiknya disebut Histogram Frekuensi
Relatif atau Histogram Persentase, bentuknya persis dengan histogram frekuensi,
hanya skala tegaknya berbeda.
10

Histogram Frekuensi
Biasanya ada kecenderungan bahwa yang menjadi patokan adalah luas dari
persegi panjang tersebut bukan tingginya. Tetapi untuk lebar kelas yang berbeda,
tinggi persegi panjang itu harus dibagi dengan perbandingan lebar yang lebih besar
dengan gaya yang lebih kecil. Hal ini dapat dilihat dalam gambar dibawah ini, karena
lebar kelas yang dipakai ada dua lebar kelas, maka lebar kelas dari 2.5-3.4, lebar
kelasnya harus kita bagi dengan lebar kelas lainnya, yaitu didapat ternyata lebar
selang 2.5-3.4 dua kali lebih panjang dari lebar kelas lainnya. Sehingga tinggi dari
kelas 2.5-3.4, harus dibagi 2.

11
Histogram Frekuensi yang tidak benar dengan lebar kelas yang tidak sama

Histogram Frekuensi yang benar dengan lebar kelas yang tidak sama

Cara lainnya lagi adalah dalam bentuk poligon frekuensi. Poligon frekuensi
dibentuk dengan memplotkan frekuensi kelas terhadap titik tengah kelas dan
kemudian menghubungkan titik-titik yang berurutan dengan garis lurus. Dengan kata
lain poligon merupakan bangun bersisi banyak yang tertutup. Jika frekuensi yang ada
dalam bentuk frekuensi relatif, maka disebut poligon frekuensi relatif atau poligon
persentase.

12
Poligon Frekuensi


Ogif atau Poligon Frekuensi Kumulatif

Grafik garis lainnya disebut Poligon Frekuensi Kumulatif atau Ogif, didapat dengan
memplotkan frekuensi kumulatif yang lebih kecil daripada batas atas kelas terhadap
batas atas kelasnya.
B. Distribusi Frekuensi Kumulatif
13
Dalam suatu keadaan yang menjadi titik perhatian mungkin bukan pada
banyaknya pengamatan pada kelas tertentu, tetapi pada banyaknya pengamatan yang
jatuh di atas atau di bawah sebuah nilai tertentu. Distribusi Frekuensi semacan ini
dikenal dengan sebagai Distribusi Frekuensi Kumulatif.
Distribusi Frekuensi Kumulatif terdiri dari dua macam, yaitu distribusi
kumulatif kurang dari dan distribusi kumulatif lebih dari. Distribusi Frekuensi
Kumulatif kurang dari menunjukkan berapa banyaknya frekuensi pengamatan yang
menunjukkkan nilai lebih kecil dari sebuah nilai atau nilai-nilai tertentu. Sedangkan
Distribusi Frekuensi Kumulatif lebih dari menunjukkan berapa banyaknya frekuensi
pengamatan yang menunjukkan nilai yang lebih besar dari sebuah nilai atau nilai-nilai
tertentu
Tabel Distribusi Frekuensi Kumulatif Kurang Dari

Dari tabel distribusi frekuensi kumulatif diatas, ada 7 pengamatan yang
mempunyai nilai kurang dari 3 .

Tabel Distribusi Frekuensi Kumulatif Lebih Dari
14


Dari tabel distribusi frekuensi kumulatif diatas ada 18 pengamatan yang
mempunyai nilai lebih dari 3.
C. Distribusi Frekuensi Relatif

Distribusi Frekuensi dapat juga berbentuk Distribusi Frekuensi Relatif, yaitu
dengan membagi setiap frekuensi kelas dengan total banyaknya data. atau dalam
bentuk rumus adalah:



15
Tabel Distribusi Frekuensi Relatif Umur Aki


D. Membentuk Distribusi Frekuensi

Langkah-langkah membuat distribusi frekuensi bagi segugus data kwantitatif adalah:
Tentukan banyaknya kelas yang diperlukan
Tentukan wilayah data tersebut (Range)
Bagilah wilayah tersebut dengan banyaknya kelas untuk menduga lebar
selangnya.
Tentukan limit bawah kelas bagi selang yang pertama dan kemudian batas
bawah kelasnya. Tambahkan lebar kelas pada batas bawah kelas untuk
mendapatkan batas atas kelasnya.
Daftarkan semua limit kelas dan batas kelas dengan cara menambahkan lebar
kelas pada limit dan batas selang sebelumnya.
Tentukan titik tengah kelas bagi masing-masing selang dengan merata-ratakan
limit kelas atau batas kelasnya.
16
Tentukan frekuensi bagi masing-masing kelas.
Jumlahkan kolom frekuensi dan periksa apakah hasilnya sama dengan
banyaknya total pengamatan
Dalam menentukan berapa buah kelas yang harus dibentuk, hal ini tergantung
pada keadaan dan banyaknya data, dimana harus dihindarkan terlalu banyak atau pun
terlalu sedikit terbentuknya kelas. Semakin sedikit banyaknya data semakin sedikit
pula banyaknya kelas yang diambil. Biasanya banyaknya kelas diambil antara 5
sampai dengan 20. Disamping kebiasaan di atas, ada aturan lain mengenai
pembentukan banyaknya kelas, yaitu dengan menggunakan aturan Sturges, yaitu:
k = 1 + 3.3 log n (1)
dimana :
k = banyaknya kelas
n = banyaknya pengamatan
Wilayah kelas atau range dari data yang dihadapi adalah selisih antara nilai data yang
terbesar dengan nilai data yang terkecil. Untuk mengerti apa yang dimaksud dengan
limit kelas dan batas kelas dapat dilihat dari keterangan di bawah ini.

Tabel 1. Distribusi frekuensi bilangan


Tabel 1. adalah distribusi frekuensi bobot 50 koper, yang dicatat sampai
kilogram terdekat, milik penumpang pesawat pada penerbangan Jakarta ke Padang.
17
Untuk data tersebut diambil 5 selang kelas, 7-9, 10- 12, 13-15, 16-18, dan 19-21.
Nilai-nilai terkecil terbesar dalam setiap selang disebut limit kelas. Untuk selang 10-
12, bilangan yang lebih kecil dan yaitu 10, adalah limit bawah kelas sedangkan
bilangan yang lebih besar yaitu 12, adalah limit atas kelas. Data aslinya dicatat
sampai kilogram terdekat sehingga 7 pengamatan pada selang 10-12 adalah bobot
semua koper yang beratnya sama dengan atau lebih dan 9.5 tetapi kurang dari 12.5.
Kedua bilangan itu yaitu 9.5 dan 12.5 adalah batas kelas untuk selang kelas 10-12,
dimana bilangan 9.5 adalah batas bawah kelas sedangkan bilangan 12.5 adalah batas
atas kelas. Tetapi bilangan 12.5 merupakan batas bawah kelas bagi selang kelas 13-
15.
Lebar kelas suatu kelas didefinisikan sebagai selisih antara batas atas kelas
dengan batas bawah kelas bagi kelas bersangkutan. Dalam prakteknya lebih disukai
bila kelas-kelas tersebut memiliki lebar kelas yang sama. Dalam hal demikian lebar
kelas tersebut dilambangkan dengan c. Untuk data dalam tabel 1, diperoleh c = 3.

Titik tengah antara batas atas dan batas bawah kelas, yang berarti juga sama dengan
antara kedua limit kelas, disebut titikk tengah kelas. Atau dalam bentuk rumus titik
tengah kelas didapat dari
Ttk=(bak+bbk):2 (2)

dimana :
Ttk = Titik tengah kelas
bak = batas atas kelas
bbk = batas bawah kelas
Untuk data pada Label 1. maka titik tengah kelas untuk kelas 10-12 adalah 11.
Untuk lengkapnya data dan tabel 1. dapat dilihat pada Label 3. Untuk
mengilustrasikan pembuatan suatu distribusi frekuensi, perhatikan data Tabel 4, yang
18
merupakan umur 40 buah aki yang serupa jenisnya dan dicatat sampai persepuluhan
terdekat. Aki-aki mobil tersebut dijamin mencapai umur 3 tahun.

Tabel 3. Distribusi Frekuensi bagi bobot 50 potong koper

Tabel 4. Umur Aki Mobil

Langkah pertama adalah ditentukan terlebih dahulu banyaknya kelas yang
akan diambil. Untuk menentukan banyaknya kelas dapat digunakan kebiasaan yang
ada yaitu banyaknya kelas antara 5 sarnpai dengan 20. Dalam hal ini diambil 7 selang
kelas saja. Wilayah kelas atau range dari data di atas adalah 4.7 - 1.6 = 3.1, sehingga
lebar kelas tidak boleh kurang dari (3.1)/7 = 0.443. Karena lebar kelas harus memiliki
angka nyata yang sama dengan pengamatannya, maka kita ambil c = 0.5. Kemudian
ditentukan pada angka berapa dimulai selang dan kelas pertama. Jika diambil angka
1.5 sebagai limit bawah kelas pcrtama, maka batas bawah kelas pertama ini adalah
1.45, sedangkan batas alas kelas pertama adalah dengan menambahkan batas bawah
kelas ini dengan lebar kelas, dengan demikian batas atas kelasnya adalah 1.95,
dengan limit atas untuk kelas ini adalah 1.9 Titik tengah kelas ini adalah rata-rata
batas bawah kelas dan batas atas kelas, (1.45 + 1.95)12 = 1.7.
Batas-batas kelas serta selang lainnya dapat diperoleh dengan menambahkan
19
lebar kelas 0.5 pada masing-masing limit kelas dan batas kelas sampai diperoleh
selang yang ketujuh. Langkah terakhir adalah memasukkan frekwensi pengamatan
yang masuk pada selang-selang tersebut. Distribusi frekuensi bagi data pada tabel 3,
disajikan pada label 5.

Tabel 5. Distribusi Frekuensi umur aki

Cara lain dalam menentukan banyaknya kelas adalah dengan menggunakan
aturan Sturgess. k = 1 + 3.3 log 40= 6.287, atau dibulatkan 6, sedangkan langkah
selanjutnya adalah sama seperti di atas.
E. Distribusi Frekuensi

Dalam suatu penelitian biasanya dilakukan suatu kegiatan pengumpulan data.
Data-data ini digunakan untuk mendukung penelitian, dimana hasil dari penelitian ini
bergantung dari banyak dan ketepatan data-data yang berhasil dikumpulkan. Untuk
memudahkan penggunaan data-data itu dalam penelitian, data-data itu dapat
diringkaskan atau disusun.
Salah satu cara untuk mengatur atau menyusun data adalah dengan
mengelompokkan data-data berdasarkan ciri-ciri penting dari sejumlah besar data, ke
dalam beberapa kelas dan kemudian dihitung banyaknya pengamatan yang masuk ke
dalam setiap kelas. Susunan demikian ini dalam bentuk label, disebut Distribusi
20
frekuensi. Selain itu dapat pula disajikan dalam bentuk diagram dan grafik.
Berdasarkan jenis data yang digolongkan didalamnya distribusi frekuensi
dibagi menjadi dua yaltu, distribusi frekuensi bilangan (numerical frequency
distribution) dan distribusi frekuensi kategoris (categorical frequency distribution).

Tabel 1. Distribusi Frekuensi Bilangan

Distribusi frekuensi bilangan adalah distribusi frekuensi yang berisikan data
berupa angka-angka, dimana data itu dibagi atas golongan-golongan yang dinamakan
kelas-kelas, menurut besarnya bilangan.

Tabel 2. Distribusi Frekuensi Kategoris


Distribusi frekuensi kategoris adalah distribusi frekuensi yang berisikan data
bukan angka, dimana data itu dibagi atas golongan-golongan yang dinamakan kelas-
kelas, berdasarkan sifat lain.

21
1) Ukuran Statistika
Ukuran Keragaman
Ukuran pemusatan data yang dibahas pada bagian ukuran pemusatan, belum
memberikan gambaran yang mencukupi bagi pendefinisian segugus data. Masih
diperlukan lagi suatu ukuran untuk mengetahui seberapa jauh pengamatan-
pengamatan itu menyebar rata-ratanya. Sangat mungkin dapat dimiliki dua kumpulan
pengamatan yang mempunyai nilai tengah atau median yang sama, tetapi sangat
berbeda keragamannya. Ukuran statistik yang paling penting untuk mengukur
keragaman data adalah range (wilayah) dan ragam.
Persentile
nilai-nilai yang membagi segugus pengamatan menjadi seratus bagian yang sama.
Nilai-nilai itu, dilambangkan dengan P1, P2,...P99, mempunyai sifat bahwa 1% data
jatuh dibawah P1, 2% data jatuh di bawah P2..., dan 99% data jatuh di bawah P99.
Sedangkan untuk menghitung persentile dari data yang telah tersusun dalam bentuk
distribusi frekuensi (grouped data), digunakan rumus berikut.


Persentile ke-50, desil ke-5 dan quartil ke-2 suatu distribusi disebut median.
Kuartil dan desil juga merupakan persentil. Misalnya, desil ke-7 adalah
persentil ke-70, dan kuartil ke-2 adalah juga persentil ke-50.
Desile
nilai-nilai yang membagi segugus pengamatan menjadi sepuluh bagian
yang sama. Nilai-nilai itu, dilambangkan dengan D1, D2, .....D9, mempunyai
sifat bahwa 10% data jatuh dibawah D1, 20% data jatuh dibawah D2, ..., dan
90% data jatuh dibawah D9.
22
Contoh :
Hitung Desile yang ke-7 D7 untuk data-data yang terdapat
pada tabel berikut ini

Jawab : Cara menghitung desile sama persis dengan cara menentukan quartile.
Untuk menentukan D7 bagi distribusi umur aki, harus ditemukan nilai yang
dibawahnya terdapat (70/100) X 40 = 28 pengamtan. Oleh karena nilai ini
dapat berup sembarang nilai antara 3.7 tahun dan 3.8 tahun maka, yang
diambil adalah rata-ratanya sehingga D7= 3.75 tahun. Jadi dapat disimpulkan
bahwa 70% dari semua aki jenis ini umurnya akan kurang dari 3.75 tahun.
Sedangkan untuk menghitung desile dari data yang telah tersusun dalam
bentuk distribusi frekuensi (grouped data) digunakan rumus berikut.

Quintile
nilai-nilai yang membagi segugus pengamatan menjadi lima bagian
sama besar. Nilai-nilai itu, yang dilambangkn dengan Q1, Q2, Q3, dan Q4
mempunyai sifat bahwa 20% data jatuh dibawah Q1, 40% data jatuh dibawah
Q2, 60% data jatuh dibawah Q3 dan 80% data jatuh dibawah Q4.
Sedangkan untuk menghitung Quintile dari data yang telah tersusun
dalam bentuk distribusi frekuensi (grouped data), digunakan rumus berikut:

23

Modus
segugus pengamatan adalah nilai yang terjadi paling sering atau yang
mempunyai frekuensi paling tinggi. Modus tidak selalu ada, hal ini bila semua
pengamatan mempunyai frekuensi terjadi yang sama. Untuk data tertentu,
mungkin saja terdapat beberapa dengan frekuensi tinggi, dan dalam hal
demikian kita mempunyai lebih dari satu modus.
contoh :
Sumbangan dari warga Bogor pada hari Palang Merah Nasional
tercatat sebagai berikut: Rp 9.000, Rp 10.000, Rp 5.000, Rp 9.000, Rp 9.000,
Rp 7.000, Rp 8.000, Rp 6.000, Rp 10.000, Rp 11.000. Maka modusnya, yaitu
nilai yang terjadi dengan frekuensi paling tinggi, adalah Rp 9.000.

Dari dua belas pelajar sekolah lanjutan tingkat atas yang diambil secara acak
dicatat berapa kali mereka menonton film selama sebulan lalu. Data yang
diperoleh adalah 2, 0, 3, 1, 2, 4, 2, 5, 4, 0, 1 dan 4. Dalam kasus ini terdapat
dua modu, yaitu 2 dan 4, karena 2 dan 4 terdapat dengan frekuensi tertinggi.
Distribusi demikian dikatakan bimodus.
Sedangkan untuk mencari modus dari data yang telah disusun dalam
bentuk distribusi frekuensi terlebih dahulu ditentukan kelas yang menjadi
kelas modus. Kelas Modus adalah kelas yang mempunyai frekuensi paling
tinggi, lalu nilai modus ditentukan menggunkan rumus berikut ini :
24



B1 = Batas bawah kelas modus.
d1 = Selisih antara frekuensi kelas modus dengan frekuensi kelas yang
mendahuluinya.
d1 = Selisih antara frekuensi kelas modus dengan frekuensi kelas berikutnya.
c = Lebar kelas modus.

Median
salah satu ukuran pemusatan yang sering digunakan. Median dari segugus data
yang telah diurutkan dari yang terkecil sampai yang terbesar atau dari terbesar
sampai terkecil adalah pengamatan yang tepat di tengah-tengah bila banyaknya
pengamatan itu ganjil, atau rata-rata kedua pengamatan yang di tengah bila
banyaknya pengamatan genap.
contoh :
Dari lima kali kuiz statistika, seorang mahasiswa memperoleh nilai 82,
93, 86, 92, dan 79. Tentukan median populasi ini.
jawab: Setelah data disusun dari yang terkecil sampai terbesar, diperoleh
79 82 86 92 93
Oleh karena itu medianya adalah 86

Kada nikotin yang berasal dari sebuah contoh acak enam batang rokok cap
tertentu adalah 2.3, 2.7, 2.5, 2.9, 3.1, dan 1.9 miligram. Tentukan mediannya.
jawab: Bila kadar nikotin itu diurutkan dari yang terkecil sampai terbesar,
maka diperoleh
25
1.9 2.3 2.5 2.7 2.9 3.1
Maka mediannya adalah rata-rata dari 2.5 dan 2.7, yaitu


Selain itu juga dapat dicari median dari data yang telah tersusun dalam bentuk
distribusi frekuensi. Rumus yang digunakan ada dua, yaitu



Dimana :
Bbk = batas kelas bawah median
c = lebar kelas
s = Selisih antara nomor frekuensi median dengan frekuensi kumulatif dari
kelas-kelas di muka kelas median
fM = frekuensi kelas median


Dimana :
Bak = batas kelas atas median
26
c = lebar kelas
s' = selisih antara nomor frekuensi median dengan frekuensi kumulatif sampai
kelas median
fM = frekuensi kelas median
Sebelum menggunakan kedua rumus di atas, terlebih dahulu harus ditentukan
kelas yang menjadi kelas median. Kelas median adalah kelas yang memuat nomor
frekuensi median, dan nomor frekuensi median ini ditentukan dengan membagi
keseluruhan data dengan dua.
Perhatikan tabel di bawah ini, kita akan cari median dengan kedua cara diatas


Dengan menggunakan kedua rumus di atas didapat:


27
Ukuran Pemusatan Rata-rata Hitung

Didalam bagian ini dibicarakan mengenai harga rata-rata hitung (arithmetic
mean), dimana harga rata-rata ini dapat digunakan untuk data yang tak tersusun
(ungrouped data), yaitu data yang belum tersusun distribusi frekuensinya, ataupun
data yang telah tersusun dalam bentuk distribusi frekuensi (grouped data). Rata-rata
hitung dikenal juga sebagai nilai tengah. Selain itu, rata-rata hitung dapat juga dibagi
menjadi dua yaitu, rata-rata hitung untuk segugus data yang membentuk populasi,
dan data yang merupakan contoh. Bila segugus data X1, X2, ....Xn tidak harus
semuanya berbeda, menyusun sebuah populasi terhingga berukuran N, maka nilai
rata-rata hitung populasinya adalah:


Banyaknya pegawai di lima apotik adalah 3,4,5,6 dan 6. Dengan memandang
data itu adalah sebagai populasi, hitunglah nilai rata-rata hitung banyaknya pegawai
bagi lima apotik itu.
jawab :
Karena datanya merupakan sebuah populasi terhingga, maka

28

Misalkan X1,X2 ,...Xn tidak harus semuanya berbeda, merupakan sebuah
contoh terhingga berukuran n, maka nilai rata-rata hitung contohnya adalah :


Seorang petugas memeriksa suatu contoh acak tujuh kaleng ikan tuna merk
tertentu untuk diperiksa persentase ketidak murniannya. Data yang diperoleh adalah
1.8, 2.1, 1.7, 1.6, 0.9, 2.7, dan 1.8. Tentukanlah rata-rata hitung contohnya.
jawab : Karena data ini merupakan contoh, kita peroleh


Selain rumus diatas dapat juga dengan terlebih dahulu menentukan rata-rata
hitung dugaan. Jika M merupakan suatu nilai yang diterka dari harga rata-rata hitung
yang dipilih secara sembarang dan jika di=xi - M, maka :

29

Ukuran Statistika
Teknologi dan notasi yang digunakan statistikawan dalam mengolah
data statistik sepenuhnya bergantung pada apakah data tersebut merupakan
populasi atau suatu contoh yang diambil dalam dari suatu populasi. Parameter
adalah sembarang nilai yang menjelaskan ciri populasi. Statistik adalah
sembarang nilai yang menjelaskan ciri suatu contoh. Kemudian untuk
menyelidiki segugus data kwantitatif akan sangat membantu bila ukuran-
ukuran numerik yang menjelaskan ciri-ciri data yang penting didefinisikan.
Salah satu cara yang dapat ditempuh adalah penggunaan rata-rata, baik
terhadap contoh maupun populasi. Pemakaian harga rata-rata banyak sekali
dilakukan, bukan saja di dalam pelajaran statistik, akan tetapi dalam
perhitungan sehari-hari. Seorang dapat berkata, misalnya : "Rata-rata
kelahiran di suatu negara adalah 2.3 persen per tahun". Contoh ini dapat
diperbanyak dengan mudah dan dapat diambil dari segala aspek kehidupan.
Harga rata-rata adalah harga yang dapat dipakai untuk mewakili sekumpulan
data, suatu harga yang representatif. Dapat ditambahkan disini, selain disebut
sebagai measure of central tendency (ukuran tendensi pertengahan),
dinamakan juga measures of central values (ukuran nilai-nilai pertengahan),
atau measures of centarl position (ukuran tempat pertengahan), ketiga nama
ini menekankan perkataan central yang berarti pusat atau pertengahan.
Sehingga kesemuanya itu dapat disebut sebagai ukuran pemusatan.




30
Referensi
Lindley, D. Making Decisions. John Wiley. Second Edition 1985. ISBN 0-
471-90808-8
William H. Kruskal and Judith M. Tanur, ed. (1978), "Linear Hypotheses,"
International Encyclopedia of Statistics. Free Press, v. 1,
Evan J. Williams, "I. Regression," pp. 52341.
Julian C. Stanley, "II. Analysis of Variance," pp. 541554.
Lindley, D.V. (1987). "Regression and correlation analysis," New Palgrave: A
Dictionary of Economics, v. 4, pp. 12023.
Birkes, David and Yadolah Dodge, Alternative Methods of Regression. ISBN
0-471-56881-3
Chatfield, C. (1993) "Calculating Interval Forecasts," Journal of Business and
Economic Statistics, 11. pp. 121135.
Corder, G.W. and Foreman, D.I. (2009).Nonparametric Statistics for Non-
Statisticians: A Step-by-Step Approach Wiley, ISBN 978-0-470-45461-9
Draper, N.R. and Smith, H. (1998).Applied Regression Analysis Wiley Series
in Probability and Statistics
Fox, J. (1997). Applied Regression Analysis, Linear Models and Related
Methods. Sage
Hardle, W., Applied Nonparametric Regression (1990), ISBN 0-521-42950-1
Meade, N. and T. Islam (1995) "Prediction Intervals for Growth Curve
Forecasts," Journal of Forecasting, 14, pp. 413430.
N. Cressie (1996) Change of Support and the Modiable Areal Unit Problem.
Geographical Systems 3:159180.
A.S. Fotheringham, C. Brunsdon, and M. Charlton and Sandt Damanik
Witwicky. (2002) Geographically weighted regression: the analysis of
spatially varying relationships. Wiley.
31

Anda mungkin juga menyukai