Anda di halaman 1dari 13

Statistika

Statistika adalah ilmu yang mempelajari bagaimana merencanakan, mengumpulkan,


menganalisis, menginterpretasi, dan mempresentasikan data. Singkatnya, statistika adalah ilmu
yang berkenaan dengan data. Istilah 'statistika' (bahasa Inggris: statistics) berbeda dengan
'statistik' (statistic). Statistika merupakan ilmu yang berkenaan dengan data, sedang statistik
adalah data, informasi, atau hasil penerapan algoritme statistika pada suatu data. Dari kumpulan
data, statistika dapat digunakan untuk menyimpulkan atau mendeskripsikan data; ini
dinamakan statistika deskriptif. Sebagian besar konsep dasar statistika mengasumsikan teori
probabilitas. Beberapa istilah statistika antara lain: populasi, sampel, unit sampel,
dan probabilitas.

Statistika banyak diterapkan dalam berbagai disiplin ilmu, baik ilmu-ilmu alam
(misalnya astronomi dan biologi maupun ilmu-ilmu sosial (termasuk sosiologi dan psikologi),
maupun di bidang bisnis, ekonomi, dan industri. Statistika juga digunakan
dalam pemerintahan untuk berbagai macam tujuan; sensus penduduk merupakan salah satu
prosedur yang paling dikenal. Aplikasi statistika lainnya yang sekarang popular adalah
prosedur jajak pendapat atau polling (misalnya dilakukan sebelum pemilihan umum),
serta hitung cepat (perhitungan cepat hasil pemilu) atau quick count. Di bidang komputasi,
statistika dapat pula diterapkan dalam pengenalan pola maupun kecerdasan buatan.

Sejarah
Penggunaan istilah statistika berakar dari istilah istilah dalam bahasa Latin modern statisticum
collegium ("dewan negara") dan bahasa Italia statista ("negarawan" atau "politikus").

Gottfried Achenwall (1749) menggunakan Statistik dalam bahasa Jerman untuk pertama
kalinya sebagai nama bagi kegiatan analisis data kenegaraan, dengan mengartikannya sebagai
"ilmu tentang negara (state)". Pada awal abad ke-19 telah terjadi pergeseran arti menjadi "ilmu
mengenai pengumpulan dan klasifikasi data". Sir John Sinclair memperkenalkan nama
(Statistics) dan pengertian ini ke dalam bahasa Inggris. Jadi, statistika secara prinsip mula-mula
hanya mengurus data yang dipakai lembaga-lembaga administratif dan pemerintahan.
Pengumpulan data terus berlanjut, khususnya melalui sensus yang dilakukan secara teratur
untuk memberi informasi kependudukan yang berubah setiap saat.
Pada abad ke-19 dan awal abad ke-20 statistika mulai banyak menggunakan bidang-bidang
dalam matematika, terutama peluang. Cabang statistika yang pada saat ini sangat luas
digunakan untuk mendukung metode ilmiah, statistika inferensi, dikembangkan pada paruh
kedua abad ke-19 dan awal abad ke-20 oleh [Ronald Fisher] (peletak dasar statistika
inferensi), Karl Pearson (metode regresi linear), dan William Sealey Gosset (meneliti problem
sampel berukuran kecil). Penggunaan statistika pada masa sekarang dapat dikatakan telah
menyentuh semua bidang ilmu pengetahuan, mulai dari astronomi hingga linguistika. Bidang-
bidang ekonomi, biologi dan cabang-cabang terapannya, serta psikologi banyak dipengaruhi
oleh statistika dalam metodologinya. Akibatnya lahirlah ilmu-ilmu gabungan
seperti ekonometrika, biometrika (atau biostatistika), dan psikometrika.

Meskipun ada pihak yang menganggap statistika sebagai cabang dari matematika, tetapi
sebagian pihak lainnya menganggap statistika sebagai bidang yang banyak terkait dengan
matematika melihat dari sejarah dan aplikasinya. Di Indonesia, kajian statistika sebagian besar
masuk dalam fakultas matematika dan ilmu pengetahuan alam, baik di dalam departemen
tersendiri maupun tergabung dengan matematika.

Metode statistika
Terdapat dua jenis utama penelitian, yakni eksperimen dan survei. Keduanya sama-
sama mendalami pengaruh perubahan pada peubah penjelas dan perilaku peubah respon akibat
perubahan itu. Beda keduanya terletak pada bagaimana kajiannya dilakukan.

Suatu eksperimen melibatkan pengukuran terhadap sistem yang dikaji, memberi perlakuan
terhadap sistem, dan kemudian melakukan pengukuran (lagi) dengan cara yang sama terhadap
sistem yang telah diperlakukan untuk mengetahui apakah perlakuan mengubah nilai
pengukuran. Bisa juga perlakuan diberikan secara simultan dan pengaruhnya diukur dalam
waktu yang bersamaan pula. Metode statistika yang berkaitan dengan pelaksanaan suatu
eksperimen dipelajari dalam rancangan percobaan (desain eksperimen).

Dalam survei, di sisi lain, tidak dilakukan manipulasi terhadap sistem yang dikaji. Data
dikumpulkan dan hubungan (korelasi) antara berbagai peubah diselidiki untuk memberi
gambaran terhadap objek penelitian. Teknik-teknik survai dipelajari dalam metode survei.

Penelitian tipe eksperimen banyak dilakukan pada ilmu-ilmu rekayasa, misalnya teknik, ilmu
pangan, agronomi, farmasi, pemasaran (marketing), dan psikologi eksperimen.
Penelitian tipe observasi paling sering dilakukan di bidang ilmu-ilmu sosial atau berkaitan
dengan perilaku sehari-hari, misalnya ekonomi, psikologi dan pedagogi, kedokteran
masyarakat, dan industri

Konsep dasar statistika


Pengertian Statistik

1. Secara Etimologis
Kata statistic berasal dari kata statas yang berasal dari bahasa latin yang mempunyai
persamaan arti dengan kata stats yang berasal dari bahasa Inggris atau kata staat dari bahasa
Belanda. Pada mulanya kata “statistic” diartika sebagai kumpulan bahan keterangan (data),
baik yang berwujud angka (data kuantitatif) maupun yang tidak berwujud angka (data penting
dan kegunaannya yang besar bagi suatu Negara). Namun, pada perkembangan selajutnya hanya
dibatasi pada kumpulan bahan keterangan yang berwujud angka saja. Dalam kamus bahasa
Inggris terdapat kata statistics artinya “ilmu statistik”, sedangkan kata statistik diartikan
sebagai ukuran yang diperoleh atau yang berasal dari sampel.

2. Dari segi tertimologi


a. Statistik kadang diberi pengertian sebagai “data statistik” yaitu kumpulan bahan keterangan
yang berupa angka atu bilangan dengan istilah lain, statistik adalah deretan atau kumpulan
angka yang menunjukkan keterangan mengenai cabang kegiatan hidup tertentu.
Misalnya : statistik penduduk, statistik pertanian dan statistik pendidikan.
Dengan demikian istilah statistik dengan pengertia sebagai data kuantitatif adalah data angka
yang dapat memberikan gambaran mengenai keadaan peristiwa atau gejala tertentu.
b. Istilah statistik juga sering diartikan sebagai kegiatan statistik atau penstatikan.
c. Istilah statistik kadang-kadang juga dimaksudkan atau dikandung pengertian sebagai metode
statistik yaitu cara-cara tertentu yang perlu ditempuh dalam rangka mengumpulkan, menyusun
atau mengatur, menyajikan, menganalisis dan memberikan interpretasi terhadap sekumpulan
bahan keterangan yang berupa angka sedemikian rupa sehingga kumpulan bahan keterangan
yang berupa angka itu “dapat berbicara” atau dapat memberikan pengertian dan makna tertentu.
d. Istilah statistik, dewasa ini juga dapat diberi pengetian sebagai ilmu statistik. Ilmu statistik
adalah ilmu pengetahuan yang mempelajari dan mengembangkan secara ilmiah tahap-tahap
yang ada dalam kegiatan statistik.

3. Penggolongan Statistik
a. Statistik deskriptif
Adalah statistik yang tikat pekerjaannya mencakup cara-cara menghimpu, menyusun atau
mengatur, mengolah, menyajikan dan menganalisis data angka agar dapat memberikan
gambaran yang teratur, ringkas dan jelas mengenai suatu gejala atau peristiwa tertentu.

b. Statistik Inferensial
Adalah statistik yang menyediakan aturan atau cara yang dapat dipergunakan sebagai alat
dalam rangka mencoba menarik kesimpulan yang bersifat umum dari sekumpulan data yang
telah disusun dan diolah.

4. Fungsi dan Kegunaan Statistik


a. Fungsi Statistik
Fungsi statistik adalah sebagai alat bantu untuk mengolah, menganalisis dan menyimpulakan
hasil yang telah dicapai dalam kegiatan penilaian tersebut. Statistik sebagai ilmu pengetahuan
dapat dibedakan menjadi dua golongan yaitu statistik deskriptif dan inferensial. Berdasarkan
penggolongan statistik tersebut, maka fungsi statistik adalah :
1) Fungsi statistik deskriptif adalah untuk dapat memahami, medeskripsikan, menerangkan data
atau peristiwa yang dikumpulkan dalam suatu penelitian dan tidak sampai pada generalisasi
atau pengambilan kesimpulan mengenai keseluruhan populasi yang diselidiki.
2) Fungsi statistik inferensial adalah untuk meramalkan dan mengontrol. Statistik inferensial
ini mempelajari tata cara penarikan kesimpulan mengenai keseluruhan atau populasi
berdasarkan data atau gejala dan peristiwa yang ada dalam suatu penelitian.

b. Kegunaan Statistik
1) memperoleh gambaran baik gambaran secara khusus maupun gambaran secara umum
tentang suatu gejala, keadaan atau peristiwa.
2) Mengikuti perkembangan atau pasang surut mengenai gejala, keadaan atau peristiwa tersebut
dari waktu ke waktu.
3) Melakukan pengujian, apakah gejala yang satu berbeda dengan gejala yang lain ataukah
tidak, jika terdapat perbedaan itu merupakan perbedaan yang berarti atau perbedaan itu terjadi
hanya secara kebetulan saja.
4) Mengetahui apakah yang satu ada hubungannya dengan gejala lain.
5) Menyusun laporan yang berupa data kuantitatif dengan teratur, ringkas dan jelas.
6) Menarik kesimpulan secara logis, mengambil keputusan secara tepat dan mantap.

5. Data Statistik
a. Pengertian Data Statistik
Data statistik adalah data yang berwujud angka atau bilangan tapi tidak semua angka data
statistik karena untuk dapat disebut data-data statistik angka itu harus memenuhi persyaratan
tertentu yaitu bahwa angka tadi haruslah menunjukkan suatu ciri dari suatu penelitian yang
bersifat agregatif serta mencerminkan suatu kegiatan dalam bilangan atau lapangan tertentu.

b. Penggolongan Data Statistik


1) Penggolongan data statistic berdasarkan sifatnya.
Ditijuan dari segi sifat angkanya, data statistic dapat dibedakan menjadi dua golongan yaitu
data kontiniyu yaitu data statistic yang angka-angkanya merupakan deretan angka yang
sambung menyambung dan data diskrit yaitu statistic yang tidak mungkin berbentuk pecahan.

2) Penggolongan data statistic berdasarkan cara menyusun angkanya


a. Data nominal adalah data statistic yang menyusun angkanya didasarkan atas penggolongan
atau klasifikasi tertentu. Data nominal juga sering disebut data hitungan, dikatakan demikian
karena data itu diperoleh dengan cara menghitung.
b. Data ordinal juga sering disebut data urutan yaitu data statistic yang cara menyusun angkanya
didasarkan atas urutan kedudukan atau ranking.
c. Data interval adalah data statistic dimana terdapat jarak yang sama diantara hal-hal yang
sedang diselediki atau dipersoalkan.

3) Penggolongan data statistic berdasarkan bentuk angkanya


a. Data tunggal adalah data statistic yang masing-masing angkanya merupakan satu unit (satu
kesatuan) dengan kata lain data tunggal ialah data statistic yang angka-angkanya tidak
dikelompok-kelokpokkan.
b. Data kelompok adalah data statistic yang tiap-tiap unitnya terdiri dari sekelompok angka.
4) Penggolongan data statistic berdasarkan sumbernya
a. Data primer adalah data statistic yang diperoleh atau bersumber dari tangan pertama.
b. Data skunder adalah data statistic yang diperoleh atau bersumber dari tangan kedua.

5) Penggolongan berdasarkan waktu pengumpulannya.


a. Data seketika adalah data statistic yang mencerminkan keadaan pada satu waktu saja.
b. Data urutan waktu adalah data statistic yang mencerminkan keadaan atau perkembangan
mengenai sesuatu hal dari satu waktu ke waktu yang lain secara berurutan. Data ini juga dikenal
dengan istilah historical data.
c. Sifat Data Statistik
1) Data statistic memiliki nilai relatif atau nilai semu. Nilai relatif dari suatu angka atau bilangan
adalah nilai yang ditunjukkan oleh angka atau bilangan itu sendiri.
2) Data statistic memiliki nilai nyata dari suatu angka atau nilai sebenarnya. Nilai nyata dari
suatu angka adalah daerah tertentu dalam suatu deretan angka yang diwakili oleh nilai relatif.
3) Data statistik memiliki batas bawah relatif, batas atas relatif, batas bawah nyata dan batas
atas nyata.
4) Data statistic yang berbentuk data kelompok memiliki nilai tengah. Yang dimaksud dengan
nilai tengah adalah bilangan yang terletak di tengah-tengah deretan bilangan tersebut.
5) Data statistic sebagai data angka dalam proses penghitungannya tidak menggunakan sistem
pecahan melainkan menggunakan sistem desimal.
6) Data statistik sebagai data angka. Dalam proses penghitunganya tidak menggunakan sistem
pembulatan angka tertentu. Dalam hubungan ini perlu dikemukakan bahwa walaupun dalam
pembulatan angka yang terletak dibelakang tanda decimal tidak selalu sama, namun pada
dasarnya pembulatan tersebut dilakukan sampai dengan tiga buah angka dibelakang angka
decimal dengan catatan :
a. Jika setelah tiga angka di belakang tanda desimal terdapat bilangan yang besarnya 50
atau kurang dari 50 maka dianggap 0.
b. Jika setelah angka di belakang tanda desimal terdapat bilangan yang besarnya 51 atau
lebih, maka bilangan 51 atau bilangannya lebih besar dari 51 itu dianggap sama dengan satu
dan bilangan 1 ditambahkan pada bilangan nomor 3 yang terletak di belakang tanda desimal.
Ukuran Pemusatan Data
Ukuran pemusatan data adalah sembarang ukuran yang menunjukkan pusat segugus data, yang
telah diurutkan dari yang terkecil sampai yang terbesar atau sebaliknya dari yang terbesar
sampai yang terkecil. Salah satu kegunaan dari ukuran pemusatan data adalah untuk
membandingkan dua (populasi) atau contoh, karena sangat sulit untuk membandingkan
masing-masing anggota dari masing-masing anggota populasi atau masing-masing anggota
data contoh. Nilai ukuran pemusatan ini dibuat sedemikian sehingga cukup mewakili seluruh
nilai pada data yang bersangkutan.

Ukuran pemusatan yang paling banyak digunakan adalah median, mean, dan modus. Masing-
masing dari ukuran pemusatan data tersebut memiliki kekurangan. Nilai tengah akan sangat
dipengaruh nilai pencilan. Median terlalu bervariasi untuk dijadikan parameter populasi.

Sedangkan modus hanya dapat diterapkan dalam data dengan ukuran yang besar.

Jenis-jenis ukuran pemusatan data

1. Mean (Nilai Rata-rata)

Salah satu ukuran pemusatan data adalah mean atau rata-rata. Mean suatu data adalah jumlah
seluruh datum dibagi oleh banyaknya datum.

2. Modus (Nilai yang Paling Sering Muncul)

Dalam 12 kali ulangan Bahasa Indonesia, Ucok memperoleh tujuh kali nilai 8. Artinya, nilai
yang paling sering diperoleh Ucok adalah 8. Dalam statistika, nilai yang paling sering muncul
di dalam suatu data disebut modus.

3. Median (Nilai Tengah)

Median adalah nilai tengah suatu data yang telah diurutkan. Dengan demikian, median
membagi data menjadi dua bagian sama banyak.
Ukuran Lokasi

Menurut Andi (2007: 69), Ukuran lokasi (ukuran letak) dimaksudkan sebagai besaran atau
ukuran untuk mendapatkan gambaran yang lebih jelas berdasarkan letak data dari sekumpulan
data yang dipunyai. Ukuran ini sangat berarti dalam rangka melakukan analisis data.

Berdasarkan penjelasan di atas, maka dapat diartikan bahwa ukuran lokasi (ukuran letak)
merupakan ukuran untuk melihat dimana letak salah satu data dari sekumpulan banyak data
yang ada. Andi juga di dalam bukunya (2007: 69) menjelaskan bahwa, yang termasuk ukuran
lokasi (ukuran letak) antara lain adalah kuartil, desil dan persentil.

Terdapat 3 jenis ukuran lokasi yang sering digunakan dalam statistika yaitu kuartil, desil, dan
persentil.

A. Kuartil

Kuartil adalah ukuran lokasi yang membagi data berurutan menjadi empat bagian sama besar.
Untuk himpunan data yang jumlah observasinya (n) lebih dari atau sama dengan 4, terdapat
tiga nilai kuartil yaitu kuartil pertama (Q1), kuartil kedua (Q2), dan kuartil ketiga (Q3). Data
dibagi sedemikian rupa sehingga 25% data sama atau lebih kecil dari Q1, 50% data sama atau
lebih kecil dari Q2, dan 75% data sama atau lebih kecil dari Q3. Nilai dari Q2 tersebut tidak
lain adalah nilai median (Q2=Med). Gambar berikut ini menjelaskan posisi dari Q1, Q2, dan
Q3 untuk himpunan data yang telah diurutkan.

Jika suatu himpunan data telah diurutkan dari terkecil sampai yang terbesar, maka untuk
menghitung Q1, Q2, dan Q3 dapat digunakan rumus berikut:

Untuk data berkelompok, yaitu data yang sudah dibuat tabel frekuensinya, maka rumus
kuartilnya adalah sebagai berikut:
B. Desil

Untuk himpunan data dimana jumlah observasinya lebih besar atau sama dengan 10, dapat
ditentukan 9 nilai yang membagi himpunan data tersebut menjadi 10 bagian yang sama besar.
Nilai-nilai tersebut disebut sebagai desil, mulai dari desil pertama (D1) sampai dengan desil
sembilan (D9). Artinya, setiap bagian memiliki jumlah observasi yang sama sedemikian rupa
sehingga 10% observasi sama atau lebih kecil dari D1, 20% observasi sama atau lebih kecil
dari D2, dst. Jika nilai himpunan data tersebut sudah diurutkan dari terkecil ke yang terbesar
maka rumus desil adalah sebagai berikut:

Untuk data berkelompok, yaitu data yang sudah dibuat tabel frekuensinya, maka rumus
desilnya adalah sebagai berikut:
C. Persentil

Untuk himpunan data dimana jumlah observasinya lebih besar atau sama dengan 100, dapat
ditentukan 99 nilai yang membagi himpunan data tersebut menjadi 100 bagian yang sama
besar. Nilai-nilai tersebut disebut sebagai persentil, mulai dari persentil pertama (P1) sampai
dengan persentil sembilan puluh sembilan (P99). Artinya, setiap bagian memiliki jumlah
observasi yang sama sedemikian rupa sehingga 1% observasi sama atau lebih kecil dari P1, 2%
observasi sama atau lebih kecil dari P2, dst. Jika nilai himpunan data tersebut sudah diurutkan
dari terkecil ke yang terbesar maka rumus persentil adalah sebagai berikut:

Untuk data berkelompok, yaitu data yang sudah dibuat tabel frekuensinya, maka rumus
persentilnya adalah sebagai berikut:
Ukuran dispersi
Dispersi adalah data yang menggambarkan bagaimana suatu kelompok data menyebar terhadap
pusatnya data atau ukuran penyebaran suatu kelompok data terhadap pusat data. Rata-rata dari
serangkaian nilai observasi tidak dapat diinterpretasikan secara terpisah dari hasil dispersi nilai-
nilai tersebut sekitar rataratanya. Makin besar variasi nilai xi , makin kurang representatif rata-
rata distribusinya. Ukuran penyebaran suatu kelompok data terhadap pusat data disebut dispersi
atau variasi atau keragaman data. Dispersi data digunakan untuk membandingkan penyebaran
dua distribusi data atau lebih.

Klasifikasi Ukuran Dispersi


1. Dispersi Mutlak/Absolut
Dispersi mutlak/Absolut digunakan untuk mengetahui tingkat variabilitas nilai-nilai
observasi pada suatu data.Dispersi ini terdiri dari :
a) Range (R) atau sebaran atau jangkauan adalah selisih antara nilai maksimum dengan nilai
minimum dalam suatu kelompok/ susunan data.
b) Inter Quartile Range (IQR) atau sebaran antar quartile adalah selisih nilai quartile ke-3
dengan nilai quartile ke-1.
c) Quartile Deviation (QD) adalah merupakan ½ bagian selisih antara Q3 dengan Q1.
d) Average Deviation (AD) sering disebut juga mean deviation/deviasi rata-rata merupakan
rata-rata penyimpangan suatu nilai terhadap rata-ratanya.
e) Standard Deviation (SD atau ) adalah suatu nilai yang menujukkan rata-rata penyimpangan
suatu nilai terhadap rata-ratanya.

2. Dispersi Relatif’
Dispersi relatif digunakan untuk membandingkan tingkat variabilitas nilai-nilai
observasi suatu data dengan tingkat variabilitas nilai-nilai observasi data lainnya. Ukuran
dispersi relatif ini terdiri dari :
a. Coefficient of Variance (CV) adalah menyatakan persentase deviasi standar dari rata-
ratanya. Guna dari koefisien variasi ini adalah untuk mengukur keseragaman suatu hal.
Semakin kecil koefisien variasi semakin besar berarti suatu data itu semakin tidak seragam.
Untuk mencari koefisien variasi ini dapat dilakukan dengan rumus sbb:
b. Coefficient of Quartile Variation (CQV) adalah suatu bilangan yang diperoleh dari
perbandingan antara selisih Q3 dengan Q1 terhadap jumlah nilai Q3 dan Q1.
c. Standard Score (Z) adalah merupakan suatu bilangan yang diperoleh dari hasil
perbandingan selisih suatu nilai dengan rata-ratanya terhadap rata-rata nilai tersebut.

Anda mungkin juga menyukai