Anda di halaman 1dari 13

1.

DATA dan JENIS DATA


Data adalah fakta atau keterangan mengenai sesuatu persoalan yang bisa
berbentuk bilangan atau juga berbentuk kategori, misalnya rusak, baik, senang,
puas, berhasil, gagal, dan sebagainya.
Data dalam bentuk bilangan disebut data kuantitatif, harganya berubah-ubah
atau bersifat variabel. Data dalam bentuk kategori yang menurut lukisan objek
yang dipelajari disebut data kualitatif.
Data kuantitatif dilihat dari nilainya, dikenal dua golongan, yaitu:

A. Data Diskrit
Data diskrit disebut juga data variabel diskrit. Hasil perhitungan atau
membilang merupakan data diskrit. Data ini mempunyai sejumlah nilai yang
terbatas, misalnya; a. Banyak siswa 25 orang
b. Banyak kendaraan 50 buah
c. Banyak ternak 100 ekor
d. dan lain-lain.
Data diskrit juga disebut nilai pengamatan, misalnya: nilai pengamatan terhadap
banyaknya pegawai dalam suatu perusahaan merupakan data diskrit karena nilai
pengamatannya hanya mempunyai jumlah terbatas, yakni bukan merupakan
bilangan pecahan.
Variabel ini juga disebut sebagai variabel kategorial. Jika hanya dua disebut
dikhotom. Contoh: jenis kelamin terdiri dari laki-laki dan perempuan. Jika lebih
dari dua kategori maka disebut variabel politom.
B. Data Kontinyu
Data kontinyu disebut juga data variabel kontinyu, yaitu merupakan data hasil
pengukuran. Data ini disebut juga nilai pengamatan kuantitatif kontinyu,
yakni data yang secara teoritis dapat menjalani nilai setiap hari, misalnya;
a. Panjang 7,58m
b. Isi 20,25cm3
c. Berat 26, 65kg
d. Waktu 13/4 jam
e. Dan lain-lain
Secara teoritis nilai-nilai pengamatannya tidak terbatas, tetapi dalam praktiknya
harus dilakukan pengukuran yang setepat-tepatnya, dan ini tergantung pada
ketelitian atau kemampuan dari alat pengukutan yang digunakan.

C. Klasifikasi Data berdasarkan sumbernya;


1. Data Intern
Data yang dikumpulkan oleh suatu badan itu sendiri dan hasil
pengumpulan data itu digunakan oelh badan itu sendiri; misalnnya
pengusaha perusahaan sabun merk B memecat segala aktivitas
perusahaannya sendiri, seperti pegawai, pengeluaraan, seperti keadaan
pegawai, pengeluaran, keadaan barang di gudang, hasil jualan, keadaan
produksi pabriknya, dan lain-lain aktivitas yang terjadi di dalam
perusahaan itu. Data yang diperoleh demikian merupakaan data intern.
2. Data Ekstern
Data yang tidak terdapat dalam aktivitas intern suatu badan. Data ini dapat
diperoleh dari sumber-sumber di luar suatu badan. Klasifikasi ini hanya
penting apabila didasarkan pada aktivitas suatu badan, karena mungkin
sekali bahwa data lain untuk suatu badan digolongkan sebagai data
ekstern. Data ekstern dibagi menjadi data ekstern primer dan data ekstern
sekunder.
a. Data ekstern primer
Data yang dikumpulkan oleh badan yang sama disebut data ekstern
primer. Mmisalnya, Biro Pusat Statistik (BPS) mengumpulkan data
tentang penduduk, kemudian menerbitkannya.
b. Data ekstern sekunder
Data yang dilaporkan suatu badan sedangkan badan itu tidak langsung
mengumpulkan sendiri, melainkan diperoleh dari pihak lain yang tidak
mengumpulkan terlebih dahulu dan menerbitkannya.
Data juga ditinjau dari perlakuannya, data yang belum dikenai perlakuan
atau belum pernah menjalani pengolahan apapun maka data tersebut
dinamakan data mentah.
D. Klasifikasi data berdasarkan sifatnya
1. Data kualitatif adalah yang diperoleh dari hasil pengukuran atau sifat,
seperti kecerdasan, kenakalan remaja, kepemimpinan, agama, dan
sebagainya.
2. Data kuantitatif adalah data yang diperoleh dari hasil pengukuran atau
penghitungan, misal; data berat badan, tinggi badan, luas sawah, dan
sebagainya.
E. Klasifikasi data berdasarkan skala
Data yang diperoleh dengan alat ukur maupun dengan cara pengamatan perlu
dinyatakan dalam ukuran skala. Dalam statistik ada empat macam skala data,
yaitu data diskrit yang juga disebut data skala nominal, dan data kontinyu yang
mencakup skala ordinal, skala interval, dan skala ratio.
a. Skala nominal
Ciri-ciri skala nominal adalah;
1. Terdiri dari beberapa kategori. Jika hanya terdiri dari dua kategori,
maka kategori tersebut merupakan dua kutub yang berlawanan, yakni
‘ya’ dan ‘tidak’, ‘wanita’, dan ‘pria’,‘hadir’ dan ‘tidak hadir.
2. Antara kategori yang satu dengan yang lainnya dapat dibedakan.
3. Antara tiap kategori tidak ada atau tidak dapat diketahui tingkatannya.
Contoh; a) Jenis kelamin : laki-laki dan perempuan
b) Agama : Islam, Kristen, Budha, Hindu

b. Skala Ordinal
Ciri-ciri skala ordinal adalah:
1. Terdiri dari beberapa kategori
2. Antara kategori yang satu dengan yang lainnya dapat dibedakan.
3. Antara tiap kategori diektahui tingkatannya.
4. Antara tiap kategori tidak diketahui besar perbedaannya. Contoh;
a) Tingkat pendidikan : SD, SMP, SMA, D3, S1, S2, S3
b) Ani terpandai, Anne pandai, dan Anno tidak pandai
Kedua contoh diatas masing-masing ada beberapa kategori. Misalnya
SD, SMP, SMA, D3, S1, S2, dan S3. Tiap kategori dapat dibedakan
dan dapat diketahui tingkatannya, tetapi tidak diketahui secara pasit
berapa besar perbedaan antara masing-masing kategori.
c. Skala interval
Ciri-ciri skala interval adalah:
1. Terdiri dari beberapa kategori
2. Antara kategori yang satu dengan lainnya dapat dibedakan
3. Dapat diketahui tingkatan dan besar perbedaan masing-masing
kategori.
4. Perbedaan antara kategori bukan berdasarkan kelipatannya, contoh:
Jarak Jakarta-Bogor 70km, Jakarta-Bandung 240 km, maka jarak
Bogor-Bandung 170km, yaitu selisih 240-70=170.
d. Skala Ratio
Ciri-ciri skala ratio adalah:
1. Terdiri dari beberapa kategori.
2. Antara masing-masing kategori dapat dibedakan.
3. Dapat diketahui tingkatan dan besar perbedaan masing-masing
kategori.
4. Perbedaan antara kategori berdasarkan kelipatannya atau
perbandingannya. Contoh: Berat induk ayam 3kg, sedang anaknya
1kg, maka berat induk ayam 3 kali anaknya, atau berat anak ayam 1/3
induknya.

2. Distrubusi Frekuensi
A. Pembulatan Angka
Data statistik yang sifatnya kuantitatif pada dasarnya merupakan data diskrit
dan data kontinu. Data diskrit adalah data yang dihasilkan dengan
menghitung, sehingga merupakan bilangan bulat, sedangkan data kontinu
adalah data yang dihasilkan dengan mengukur, sehingga dapat
merupakan bilangan pecahan.
Berikut adalah aturan-aturan pembulatan angka tersebut sebagai berikut.
1. Jika angka dibulatkan lebih besar daripada setengah satuan maka dibulatkan
ke atas satu satuan.
Contoh: 7,564 dibulatkan menjadi dua angka 7,6
8,4501 dibulatkan menjadi 8,5
2. Jika angka yang dibulatkan lebih kecil daripada setengah satuan maka
dibulatkanke bawah atau dihilangkan.
Contoh: 7,548 dibulatkan menjadi dua angka 7,5
8,4401 dibulatkan menjadi dua angka 8,4
3. Jika angka yang dibulatkan sama dengan atau tepat setengah satuan maka
ada dua kasus yang disebut prinsip pembulatan genap”
a. Jika angka sebelumnya angka ganjil maka dibulatkan ke atas satu
satuan,
Contoh: 7,350 menjadi 7,4
8,550 menjadi 8,6
b. Jila angka sebelumnya genap maka dibulatkan ke bawah atau
dihilangkan.
Contoh: 7,250 menjadi 7,2
8,450 menjadi 8,4
B. Notasi Sigma
Dasar matematika yang paling dasar sekali untuk dipergunakan dalam statistik
adalah penggunaan notasi ∑ (baca: sigma) yang artinya penjumlahan. Dalam
statistika penjumlahan ini dinotasikan sebagai berikut:
5

∑ X 𝑖 = 𝑋1 + 𝑋2 + 𝑋3 + 𝑋4 + 𝑋5
𝑖=1

Untuk mempermudah perhitungan dan pernotasian, biasanya


5

∑ 𝑋𝑖
𝑖=1

hanya dituliskan ∑X saja, sehingga menjadi ∑X = X1 + X2 + X3 + X4 + X5.

C. Tabel Dsitribusi Frekuensi


Distrubusi Frekuensi adalah suatu yang menjelaskan frekuensi anggota populasi
didistribusikan menurut nilai variabel yang diambilnya. Untuk data pengamatan
biasanya dituliskan dalam bentuk tabel dengan mengelompokkan ke dalam
selang-selang bagi data variabel kontinyu. Distribusi frekuensi digunakan
apabila diperoleh sekelompok data penelitian yang tidak memungkinkan
disusun dalam distribusi tunggal. Dalam distribusi frekuensi, data dikelompok-
kelompokkan sedemikian rupa sehingga di dalam setiap kelompok
menunjukkan frekuensi subyek yang memiliki data tersebut.
Data yang diperoleh dari hasil penelitian umumnya masih merupakan data raw.
Agar lebih rapi, data tersebut perlu disusun berdasarkan menurut utrutan dari
nilai angka terkecil hingga angka terbesar atau sebaliknya. Susunan data
tersebut disebut array.
Contoh: Seorang mahasiswa meneliti tentang pengeluaran uang pembelian
buku para mahasiswa STIAMI Depok setiap bulan. Dari 50 responden dicatat
pengeluaran (dalam ribuan rupiah) sebagai berikut data mentah:

61 53 57 35 30 55 46 39 41 63 48 63 41
55 68 55 54 50 42 55 43 51 45 69 44 78
56 51 55 59 52 58 50 45 75 67 50 52 53
57 66 57 64 61 65 53 54 64 54 46

Dari data mentah tersebut maka dapat disusun secara array dari nilai teredah
hingga tertinggi:
30 35 39 41 41 42 43 44 45 45 46 46 48
50 50 50 51 51 52 52 53 53 53 54 54 54
55 55 55 55 55 56 57 57 57 58 59 61 61
63 63 64 64 65 66 67 68 69 75 78
Dari data yang sudah berbentuk array tersebut juga dapat kita ketahui range-nya
yaitu selisih nilai tertinggi dan selisih nilai terendah. Nilai terbesar 78 dan
terendah 30 maka 78.000-30.000=48.000.
Data diatas telah tersusun namun masih belum menyajikan informasi yang
memuaskan karena belum dapat segera melihat mengenai jumlah mahasiswa
yang pengeluarannya, misalnya antara 40 – 50 ribu rupiah. Juga bila datanya
banyak, penyusunan array memerlukan banyak waktu dan tenaga. Untuk itu
data perlu dikelompokan berdasarkan kelas-kelas dan data dalam setiap kelas
dihitung banyaknya atau frekuensinya.
Susunan data yang tiap kelasnya disertai dengan frekuensi disebut tabel
distribusi frekuensi. Berikut contoh:
Tabel 1
Pengeluaran Untuk Pembelian Buku
Mahasiswa STIAMI per Bulan (Ribuan Rupiah)
Pengeluaran (Xi) Frekuensi (fi)
30-39,99 3
40-49,99 10
50-59,99 24
60-69,99 11
70-79,99 2
Jumlah 50
Tabel tersebut disebut tabel distribusi frekuensi sederhana.

Ada beberapa ketentuan atau istilah sehubungan dengan tabel distribusi:

a. Jumlah kelas
Jumlah kelas adalah banyaknya kelompok dalam tabel distribusi frekuensi.
Berapa jumlah kelas yang diperlukan dalam suatu rabel, sangat tergantung dari
kebutuhan si pembuat tabel itu sendiri. Storgers membuat patokan untuk
menentukan jumlah kelas berdasarkan jumlah sampel yang diteliti denga rumus
sebagai berikut:
M = 1 + 3,32 log n
Keterangan: m = jumlah kelas yang akan disusun
n = jumlah sampel
Misalnya umlah sampel yang diambil sebanyak 400, maka jumlah kelas yang
diutuhkan sebanyak 1 + 3,3 log 400 = 1 + 3,32 x 2,6 = 9,6. Maka jumlah kelas
yang dibutuhkan 10 kelas.
Persyaratan penentuan jumlah kelas adalah:
a. Praktis
b. Batas kelas mudah diinga
c. Jumlahnya antara 5 sampai 20 kelas
b. Batas kelas (Class Boundary)
Batas kelas adalah angka atau nilai yang membatasi seiap kelas. Pada setiap kelas
ada dua batas kelas, yaitu nilai yang di bawah disebut batas bawah kelas (lower
class) dan nilai yang diatas disebut batas atas kelas (upper class).

c. Interval Kelas
Interval kelas adalah selisih antara batas bawah dengn batas bawah sebelumnya
dari kelas yang berurutan atau selisih antara batas dengan batas atas sebelumnya
dari kelas yang berurutan. Urutan kelas interval disusun mulai dari data terkecil
terus ke bawah sampai nilai data terbesar. Berturut-turut, mulai dari atas, diberik
nama kelas interval pertama (30-39), kelas interval kedua (40-49), kelas interval
ketiga (50-59),...., kelas interval terakhir (90-99).
Untuk menentukan intervalah kelas dapat digunakan rumus:
Range
𝐶𝐼 =
Jumlah kelas
Keterangan:
CI : Interval kelas
Contoh:
Range: 99 – 30 = 69 dibulatkan menjadi 70
Jumlah kelas : 7
70
Interval kelas : = 10, maka interval kelas tersebut 10
7

Catatan: Bila interval kelas merupakan bilangan pecahan maka harus dbibulatkan
ke atas, sehingga nilai pengamatan terbesar dapat terliput dalam interval kelasnya.

d. Nilai Tengah Kelas


Nilai tengah kelas adalah suatu nilai yang berada di tengah-tengah suatu kelas.
Untuk data kontinu, nilai tengah dihitung dengan menjumlahkan batas bahwa
dengan batas bawah kelas berikutnya, kemudian dibagi 2.
Contoh: Data dalam tabel 1 diatas, bawah kelas I = 30 dan batas bawah kelas II =
30+40 40+50
40 maka nilai tengah kelas I = = 35 ; dan nilai tengah kelas II = = 45
2 2
Untuk data diskrit (bilangan bulat), nilai tengah dihitung dengan menjumlahkan
batas bawah dengan batas atas kelas yang bersangkutan, kemudian dibagi 2.
Berdasarkan uraian diata maka dapat dibuat langkah-langkah penyusunan tabel
distribusi frekuensi, sebagai berikut:
1. Dari data mentah (raw data) tentukan nilai terkecil dan nilai terbesar lalu
hitung range-nya.
2. Jika jumlah sampel tidak banyak, susun data secara array.
3. Jika jumlah sampel banyak, kelompokan data dalam kelas-kelas.
4. Tentukan jumlah kelas dengan cara:
a. Jika besar interval telah ditentukan maka jumlah kelas dhitung dengan
rumus:
𝑅𝐴𝑁𝐺𝐸
CI = Jumlah Kelas

Contoh: Data diatas, interval ditentukan sebesar 10, range = 78-30=48,


maka jumlah kelas 48 : 10= 4,8 dibulatkan menjadi 5.

b. Jika besar interval tidak ditentukan maka jumlah kelas ditentukan antara
5-20 buah, tergantung kebutuhan atau dihitung dengan menggunakan
rumus Stuges : m = 1 + 3,32 log n
Keterangan: m = jumlah kelas yang akan disusun
n = jumlah sample
5. Hitung frekuensi untuk masing-masing kelas.

D. Distribusi Frekuensi Sederhana


Distribusi frekuensi sederhana berbentuk tabel yang berisi karakteristik dari
suatu variabel yang diteliti, serta jumlah observasi sebagai frekuensi. Contoh di
tabel 1.
E. Distribusi Frekuensi Relatif
Dalam bentuk tabel ini, frekuensi tiap-tiap kelas dinyatakan dalam presentase.
Distribusi frekuensi relatif berasal dari bentuk distribysi frekuensi sederhana
kemudian frekuensinya dinyatakan dalam bentuk presentase. Berikut contoh:
Tabel 2.
Pengeluaran Untuk Pembelian Buku
Mahasiswa STIAMI per bulan (Ribuan Rupiah)
Pengeluaran (Xi) Frekuensi (fi) Frekuensi Relatif
30 – 39,99 3 6%
40 – 49,99 10 20%
50 – 59,99 24 48%
60 – 69,99 11 22%
70 – 79,99 2 4%
Jumlah 50 100%

F. Distribusi Frekuensi Kumulatif


Dsitribyusi Frekuensi Kumulatif digunakan untuk mendapatkan informasi
mengenai berapa di antaranya variabel yang mempunyai nilai lebih besar atau
lebih kecil daripada suatu nilai tertentu. Pembuatan distribusi ini berdasarkan
distribusi frekuensi sederhana.
1. Distribusi Frekuensi Kumulatif Kurang Dari
Tiap kelas merupakan penjumlahan dari kelas-kelas di bawahnya. Disebut
distribusi frekuensi kumulatif positif karena makin lama jumlah
frekuensinya semakin naik. Oleh karena itu, frekuensi pada kelas terakhir
harus sama dengan sampel. Berikut contoh:
Tabel 3
Distribusi Kumulatif Pengeluaran untuk Pembelian Buku
Mahasiswa STIAMI per bulan (Ribuah Rupiah)
Pengeluaran (Xi) Frekuensi (fi) Frekuensi Kumulatif Less Than

Kurang dari 30 0 0
Kurang dari 40 33 3
Kurang dari 50 10 13
Kurang dari 60 24 37
Kurang dari 70 11 48
Kurang dari 80 2 50
Jumlah 50
Berdasarkan tabel 3 diatas, terlihat frekuensi kumulatif kelas pertama (kurang
dari 30) = 0, karena berdasarkan data tidak ada mahasiswa yang pengeluarannya
kurang dari Rp. 30.000. Lalu, pengeluaran yang kurang dari 40, frekuensinya =
3, yaitu frekuensi dari kelas pertama pada distribusi frekuensi sederhana dan
juga frekuensi dari frekuensi kumulatif kelas kedua. Selanjutnya, frekuensi
kumulatif dari kelas ke-3 atau pengeluaran kurang dari 50 adalah
penjumlahandari frekuensi kumulatif sebelumnya atau frekuensi kumulatif
kelas ke-2 dengan frekuensi sederhana kelas ke-3 yaitu 3+10=13; frekuensi
kumulatif kelas ke-4 =13 + 24 =37; kelas ke-5 = 37 + 11 = 48 dst. Kelas terakhir
sama dengan ∑ fi atau jumalh sampel (n).

2. Distribusi Frekuensi Kumulatif Lebih dari


Dalam distribusi ini, frekuensinya semakin lama semakin menurun. Oleh
karena itt, distribusi ini disebut distribusi frekuensi negatif. Contoh:
Tabel 4
Distribusi Kumulatif Pengeluaran Untuk Pembelian Buku
Mahasiswa STIAMI Per Bulan (Ribuan Rupiah)
Pengeluaran Frekuensi (fi) Frekuensi Kumulatif
(Xi) More Than
Lebih dari 30 3 50
Lebih dari 40 10 47
Lebih dari 50 24 37
Lebih dari 60 11 13
Lebih dari 70 2 2
Lebih dari 80 0 0
Jumlah 50
Berdasarkan tabel diatas, terlihat frekuensi kumulatif kelas pertama (lebih
dari 30) = 50 sama dengan ∑ fi atau jumlah sampel (n). Berikutnya,
frekuensi kumulatif kelas ke-2 sebesar 47 dari hasil selisih frekuensi
kumulatif kelas pertama dengan frekuensi sederhana kelas pertama, yaitu
50-3=47, dst dan berdasarkan data tidak ada yang pengeluaran pembelian
buku lebih dari Rp. 80.000 per bulan.
G. Penyajian Grafik
1. Grafik Garis
Contoh: seorang mahasiswa meneliti setiap bulan tentang jumlah kasus
kecelakaan sepeda motor di suatu kota besar, mulai dari Janusair hingga
Desember 2018.
Bulan 1 2 3 4 5 6 7 8 9 10 11 12
Jumlah
61 53 57 35 30 55 46 39 41 63 48 63
Kasus
Bentuk grafik garis tunggal dari data diatas adalah sebagai berikut:

2. Grafik Batang
Berikut adalah contoh dari diagram batang atau balok dengan data mengenai
pengeluaran uang pembelian buku para mahasiswa STIAMI Depok setiap
bulan.

3. Ogif (Ogive)
Poligon frekuensi kumulatif disebut Ogif dimana penggambaran Ogif ini
hanya menggambarkan distribusi frekuensi kumulatif lebih dari dan kurang
dari. Berikut adalah contoh bentuk grafik Ogive yang mencakup distribusi
frekuens kumulatif kurang dari dan lebih dari dengan data sebelumnya yaitu
mengenai pengeluaran uang untuk pembelian buku mahasiswa STIAMI
Depok perbulan.

4. Hostogram
Yaitu penggambaran secara grafik suatu distribusi frekuensi dari suatu
variabel dimana penggamabaran tersebut menurut dua sumbu yaitu sumbu
datas (axis) dan sumbu tegak (ordinat). Axis menunjukan kelas atau sifat
yang diteliti dari suatu variabel, sedangkan ordinat menunjukan
frekuensinya. Pada hostogram yang dilihat adalah luasnya. Luas ini
menunjukan proporsi atau presentase dari frekuensi taip tiap kels sedangkan
luas seluruh hostogram menunjukan seluruh pengamatn dalam presentase
(100%).
Berikut contoh:
Berdasarkan gambar hostogram diatas, terlihat daerah berupa batang/balok
balok yang dibatasi oleh kelas 30-40 dengan frekuensi sebanyak 3, kelas 40-
50 dengan frekuensi 10, kelas 50-60 dengan frekuensi 24, kelas 60-70
dengan frekuensi 11, dan kelas 70-80 dengan frekensi 2.

5. Grafik Lingkaran (Pie Graph)


Adalah data disajikan dalam bentuk presetase yang dihimpun dalam suatu
lingkaran, berikut contoh:

6. Poligon
Bila dihubungkan masing-masing titik puncak batang hostogram, akan
terbentuk grafik garis tunggal patah-patah yang melengkung dan membatasi
suatu area. Luas area tersebut dinamakan poligon. Berikut contoh:
Dalam contoh gambar diatas poligon adalah daerah yang dibatasi oleh garis-
garis yang menghubungkan titik-titik tengah masing-masing puncak batang
hostogram dengan sumbu horizontal. Bila jumlah sampel diperbanyak dan
interval kelas diperkecil maka garis patah-patah tersebut akan menjadi
halus. Bila jumlah sampel diperbanyak lagi serta interval semakin kecil lagi
maka garis patah-patah halus berbentuk lengkung tersebut disebut kurva
distribusi normal.

Sumber:
1. Yusri. 2009. Statistika Sosial. Graha Ilmu. Yogyakarta.
2. Silaen, Sofar dan Yayak Heriyanto. 2013. Pengantar Statistika Sosial.
Jakarta: In. Media.

Anda mungkin juga menyukai