Statistika banyak diterapkan dalam berbagai disiplin ilmu, baik ilmu-ilmu alam
(misalnya astronomi dan biologi maupun ilmu-ilmu sosial (termasuk sosiologi dan psikologi),
maupun di bidang bisnis, ekonomi, dan industri. Statistika juga digunakan
dalam pemerintahan untuk berbagai macam tujuan; sensus penduduk merupakan salah satu
prosedur yang paling dikenal. Aplikasi statistika lainnya yang sekarang popular adalah
prosedur jajak pendapat atau polling (misalnya dilakukan sebelum pemilihan umum),
serta hitung cepat (perhitungan cepat hasil pemilu) atau quick count. Di bidang komputasi,
statistika dapat pula diterapkan dalam pengenalan pola maupun kecerdasan buatan.
Sejarah
Penggunaan istilah statistika berakar dari istilah istilah dalam bahasa Latin modern statisticum
collegium ("dewan negara") dan bahasa Italia statista ("negarawan" atau "politikus").
Gottfried Achenwall (1749) menggunakan Statistik dalam bahasa Jerman untuk pertama
kalinya sebagai nama bagi kegiatan analisis data kenegaraan, dengan mengartikannya sebagai
"ilmu tentang negara (state)". Pada awal abad ke-19 telah terjadi pergeseran arti menjadi "ilmu
mengenai pengumpulan dan klasifikasi data". Sir John Sinclair memperkenalkan nama
(Statistics) dan pengertian ini ke dalam bahasa Inggris. Jadi, statistika secara prinsip mula-mula
hanya mengurus data yang dipakai lembaga-lembaga administratif dan pemerintahan.
Pengumpulan data terus berlanjut, khususnya melalui sensus yang dilakukan secara teratur
untuk memberi informasi kependudukan yang berubah setiap saat.
Pada abad ke-19 dan awal abad ke-20 statistika mulai banyak menggunakan bidang-bidang
dalam matematika, terutama peluang. Cabang statistika yang pada saat ini sangat luas
digunakan untuk mendukung metode ilmiah, statistika inferensi, dikembangkan pada paruh
kedua abad ke-19 dan awal abad ke-20 oleh [Ronald Fisher] (peletak dasar statistika
inferensi), Karl Pearson (metode regresi linear), dan William Sealey Gosset (meneliti problem
sampel berukuran kecil). Penggunaan statistika pada masa sekarang dapat dikatakan telah
menyentuh semua bidang ilmu pengetahuan, mulai dari astronomi hingga linguistika. Bidang-
bidang ekonomi, biologi dan cabang-cabang terapannya, serta psikologi banyak dipengaruhi
oleh statistika dalam metodologinya. Akibatnya lahirlah ilmu-ilmu gabungan
seperti ekonometrika, biometrika (atau biostatistika), dan psikometrika.
Meskipun ada pihak yang menganggap statistika sebagai cabang dari matematika, tetapi
sebagian pihak lainnya menganggap statistika sebagai bidang yang banyak terkait dengan
matematika melihat dari sejarah dan aplikasinya. Di Indonesia, kajian statistika sebagian besar
masuk dalam fakultas matematika dan ilmu pengetahuan alam, baik di dalam departemen
tersendiri maupun tergabung dengan matematika.
Metode statistika
Terdapat dua jenis utama penelitian, yakni eksperimen dan survei. Keduanya sama-
sama mendalami pengaruh perubahan pada peubah penjelas dan perilaku peubah respon akibat
perubahan itu. Beda keduanya terletak pada bagaimana kajiannya dilakukan.
Suatu eksperimen melibatkan pengukuran terhadap sistem yang dikaji, memberi perlakuan
terhadap sistem, dan kemudian melakukan pengukuran (lagi) dengan cara yang sama terhadap
sistem yang telah diperlakukan untuk mengetahui apakah perlakuan mengubah nilai
pengukuran. Bisa juga perlakuan diberikan secara simultan dan pengaruhnya diukur dalam
waktu yang bersamaan pula. Metode statistika yang berkaitan dengan pelaksanaan suatu
eksperimen dipelajari dalam rancangan percobaan (desain eksperimen).
Dalam survei, di sisi lain, tidak dilakukan manipulasi terhadap sistem yang dikaji. Data
dikumpulkan dan hubungan (korelasi) antara berbagai peubah diselidiki untuk memberi
gambaran terhadap objek penelitian. Teknik-teknik survai dipelajari dalam metode survei.
Penelitian tipe eksperimen banyak dilakukan pada ilmu-ilmu rekayasa, misalnya teknik, ilmu
pangan, agronomi, farmasi, pemasaran (marketing), dan psikologi eksperimen.
Penelitian tipe observasi paling sering dilakukan di bidang ilmu-ilmu sosial atau berkaitan
dengan perilaku sehari-hari, misalnya ekonomi, psikologi dan pedagogi, kedokteran
masyarakat, dan industri
1. Secara Etimologis
Kata statistic berasal dari kata statas yang berasal dari bahasa latin yang mempunyai
persamaan arti dengan kata stats yang berasal dari bahasa Inggris atau kata staat dari bahasa
Belanda. Pada mulanya kata “statistic” diartika sebagai kumpulan bahan keterangan (data),
baik yang berwujud angka (data kuantitatif) maupun yang tidak berwujud angka (data penting
dan kegunaannya yang besar bagi suatu Negara). Namun, pada perkembangan selajutnya hanya
dibatasi pada kumpulan bahan keterangan yang berwujud angka saja. Dalam kamus bahasa
Inggris terdapat kata statistics artinya “ilmu statistik”, sedangkan kata statistik diartikan
sebagai ukuran yang diperoleh atau yang berasal dari sampel.
3. Penggolongan Statistik
a. Statistik deskriptif
Adalah statistik yang tikat pekerjaannya mencakup cara-cara menghimpu, menyusun atau
mengatur, mengolah, menyajikan dan menganalisis data angka agar dapat memberikan
gambaran yang teratur, ringkas dan jelas mengenai suatu gejala atau peristiwa tertentu.
b. Statistik Inferensial
Adalah statistik yang menyediakan aturan atau cara yang dapat dipergunakan sebagai alat
dalam rangka mencoba menarik kesimpulan yang bersifat umum dari sekumpulan data yang
telah disusun dan diolah.
b. Kegunaan Statistik
1) memperoleh gambaran baik gambaran secara khusus maupun gambaran secara umum
tentang suatu gejala, keadaan atau peristiwa.
2) Mengikuti perkembangan atau pasang surut mengenai gejala, keadaan atau peristiwa tersebut
dari waktu ke waktu.
3) Melakukan pengujian, apakah gejala yang satu berbeda dengan gejala yang lain ataukah
tidak, jika terdapat perbedaan itu merupakan perbedaan yang berarti atau perbedaan itu terjadi
hanya secara kebetulan saja.
4) Mengetahui apakah yang satu ada hubungannya dengan gejala lain.
5) Menyusun laporan yang berupa data kuantitatif dengan teratur, ringkas dan jelas.
6) Menarik kesimpulan secara logis, mengambil keputusan secara tepat dan mantap.
5. Data Statistik
a. Pengertian Data Statistik
Data statistik adalah data yang berwujud angka atau bilangan tapi tidak semua angka data
statistik karena untuk dapat disebut data-data statistik angka itu harus memenuhi persyaratan
tertentu yaitu bahwa angka tadi haruslah menunjukkan suatu ciri dari suatu penelitian yang
bersifat agregatif serta mencerminkan suatu kegiatan dalam bilangan atau lapangan tertentu.
Ukuran pemusatan yang paling banyak digunakan adalah median, mean, dan modus. Masing-
masing dari ukuran pemusatan data tersebut memiliki kekurangan. Nilai tengah akan sangat
dipengaruh nilai pencilan. Median terlalu bervariasi untuk dijadikan parameter populasi.
Sedangkan modus hanya dapat diterapkan dalam data dengan ukuran yang besar.
Salah satu ukuran pemusatan data adalah mean atau rata-rata. Mean suatu data adalah jumlah
seluruh datum dibagi oleh banyaknya datum.
Dalam 12 kali ulangan Bahasa Indonesia, Ucok memperoleh tujuh kali nilai 8. Artinya, nilai
yang paling sering diperoleh Ucok adalah 8. Dalam statistika, nilai yang paling sering muncul
di dalam suatu data disebut modus.
Median adalah nilai tengah suatu data yang telah diurutkan. Dengan demikian, median
membagi data menjadi dua bagian sama banyak.
Ukuran Lokasi
Menurut Andi (2007: 69), Ukuran lokasi (ukuran letak) dimaksudkan sebagai besaran atau
ukuran untuk mendapatkan gambaran yang lebih jelas berdasarkan letak data dari sekumpulan
data yang dipunyai. Ukuran ini sangat berarti dalam rangka melakukan analisis data.
Berdasarkan penjelasan di atas, maka dapat diartikan bahwa ukuran lokasi (ukuran letak)
merupakan ukuran untuk melihat dimana letak salah satu data dari sekumpulan banyak data
yang ada. Andi juga di dalam bukunya (2007: 69) menjelaskan bahwa, yang termasuk ukuran
lokasi (ukuran letak) antara lain adalah kuartil, desil dan persentil.
Terdapat 3 jenis ukuran lokasi yang sering digunakan dalam statistika yaitu kuartil, desil, dan
persentil.
A. Kuartil
Kuartil adalah ukuran lokasi yang membagi data berurutan menjadi empat bagian sama besar.
Untuk himpunan data yang jumlah observasinya (n) lebih dari atau sama dengan 4, terdapat
tiga nilai kuartil yaitu kuartil pertama (Q1), kuartil kedua (Q2), dan kuartil ketiga (Q3). Data
dibagi sedemikian rupa sehingga 25% data sama atau lebih kecil dari Q1, 50% data sama atau
lebih kecil dari Q2, dan 75% data sama atau lebih kecil dari Q3. Nilai dari Q2 tersebut tidak
lain adalah nilai median (Q2=Med). Gambar berikut ini menjelaskan posisi dari Q1, Q2, dan
Q3 untuk himpunan data yang telah diurutkan.
Jika suatu himpunan data telah diurutkan dari terkecil sampai yang terbesar, maka untuk
menghitung Q1, Q2, dan Q3 dapat digunakan rumus berikut:
Untuk data berkelompok, yaitu data yang sudah dibuat tabel frekuensinya, maka rumus
kuartilnya adalah sebagai berikut:
B. Desil
Untuk himpunan data dimana jumlah observasinya lebih besar atau sama dengan 10, dapat
ditentukan 9 nilai yang membagi himpunan data tersebut menjadi 10 bagian yang sama besar.
Nilai-nilai tersebut disebut sebagai desil, mulai dari desil pertama (D1) sampai dengan desil
sembilan (D9). Artinya, setiap bagian memiliki jumlah observasi yang sama sedemikian rupa
sehingga 10% observasi sama atau lebih kecil dari D1, 20% observasi sama atau lebih kecil
dari D2, dst. Jika nilai himpunan data tersebut sudah diurutkan dari terkecil ke yang terbesar
maka rumus desil adalah sebagai berikut:
Untuk data berkelompok, yaitu data yang sudah dibuat tabel frekuensinya, maka rumus
desilnya adalah sebagai berikut:
C. Persentil
Untuk himpunan data dimana jumlah observasinya lebih besar atau sama dengan 100, dapat
ditentukan 99 nilai yang membagi himpunan data tersebut menjadi 100 bagian yang sama
besar. Nilai-nilai tersebut disebut sebagai persentil, mulai dari persentil pertama (P1) sampai
dengan persentil sembilan puluh sembilan (P99). Artinya, setiap bagian memiliki jumlah
observasi yang sama sedemikian rupa sehingga 1% observasi sama atau lebih kecil dari P1, 2%
observasi sama atau lebih kecil dari P2, dst. Jika nilai himpunan data tersebut sudah diurutkan
dari terkecil ke yang terbesar maka rumus persentil adalah sebagai berikut:
Untuk data berkelompok, yaitu data yang sudah dibuat tabel frekuensinya, maka rumus
persentilnya adalah sebagai berikut:
Ukuran dispersi
Dispersi adalah data yang menggambarkan bagaimana suatu kelompok data menyebar terhadap
pusatnya data atau ukuran penyebaran suatu kelompok data terhadap pusat data. Rata-rata dari
serangkaian nilai observasi tidak dapat diinterpretasikan secara terpisah dari hasil dispersi nilai-
nilai tersebut sekitar rataratanya. Makin besar variasi nilai xi , makin kurang representatif rata-
rata distribusinya. Ukuran penyebaran suatu kelompok data terhadap pusat data disebut dispersi
atau variasi atau keragaman data. Dispersi data digunakan untuk membandingkan penyebaran
dua distribusi data atau lebih.
2. Dispersi Relatif’
Dispersi relatif digunakan untuk membandingkan tingkat variabilitas nilai-nilai
observasi suatu data dengan tingkat variabilitas nilai-nilai observasi data lainnya. Ukuran
dispersi relatif ini terdiri dari :
a. Coefficient of Variance (CV) adalah menyatakan persentase deviasi standar dari rata-
ratanya. Guna dari koefisien variasi ini adalah untuk mengukur keseragaman suatu hal.
Semakin kecil koefisien variasi semakin besar berarti suatu data itu semakin tidak seragam.
Untuk mencari koefisien variasi ini dapat dilakukan dengan rumus sbb:
b. Coefficient of Quartile Variation (CQV) adalah suatu bilangan yang diperoleh dari
perbandingan antara selisih Q3 dengan Q1 terhadap jumlah nilai Q3 dan Q1.
c. Standard Score (Z) adalah merupakan suatu bilangan yang diperoleh dari hasil
perbandingan selisih suatu nilai dengan rata-ratanya terhadap rata-rata nilai tersebut.