STATISTIKA DESKRIPTIF
1.1 PENDAHULUAN
1.1.1 Latar Belakang
Statistika merupakan salah satu cabang pengetahuan yang banyak
dipelajari oleh ilmuan dari hampir semua bidang ilmu pengetahuan seperti
ilmu kedokteran, teknik, manajemen, sosial, dan semua bidang yang
mencakup pengetahuan manusia. Statistika adalah metode atau ilmu yang
mempelajari suatu proses dalam merencanakan, mengumpulkan,
menganalisis, dan mempresentasikan data. Statistika dikelompokkan
menjadi dua macam, yaitu deskriptif dan statistika inferensia. Statistika
deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan
penyajian suatu gugus data sehingga memberikan informasi yang berguna,
sedangkan statistika inferensia mencakup semua metode yang berhubungan
dengan analisis sebagian data untuk kemudian sampai pada peramalan atau
penarikan kesimpulan mengenai keseluruhan gugus data populasinya.
Di Indonesia penggunaan statistika telah dicantumkan dalam
kurikulum sains sejak tahu 1975. Hal ini disebabkan karena sekitar
lingkungan kita berada selalu berkaitan dengan statistik. Di dalam
kehidupan sehari-hari sering kita jumpai banyak hal yang dapat kita
deskripsikan dalam sebuah data. Informasi data yang diperolehtentuya
harus diolah terlebih dahulu menjadi sebuah data yang akan dibaca dan
dianalisa. Akan tetapi bagaimana penyajian data yang kita dapat tentunya
berbeda-beda, sesuai dengan kebutuhan dan keinginan penyaji data.
Pada dasarnya aplikasi ilmu statistika dapat di bagi menjadi dua
bagian, yaitu Statistika Deskriptif dan Statistika Induktif. Statistika
Deskriptif berusaha menjelaskan atau menggambarkan berbagai
1
karekteristik data, seperti berapa rata-ratanya (mean), seberapa jauh data-
data yang bervariasi dan sebagainya. Statistika inferensia salah satunya
meliputi pendugaan parameter. Untuk mengetahui ukuran populasi atau
disebut dengan parameter biasanya mengukkurnya tidak secara langsung
melainkan dengan cara mengambil sebagian kecil dari populasi (sampel)
kemudia mengukurnya.
2
d. Setiap 1 menit, tulislah data jumlah motor yang lewat pada tabel yang
telah ada dan hal tersebut dilakukan sampai 120 menit.
e. Terakhir, Lakukan pengolahan data.
3
a. Statistik Deskriptif (Deduktif) atau sederhana, yaitu statistik yang
tingkat pengerjaannya mencakup cara-cara menghitung, menyusun
atau mengatur, mengolah, menyajikan, dan menganalisa data atau
dapat memberikan gambaran yang ringkas mengenai suatu keadaan.
b. Statistik Inferensial, yaitu yang menyediakan aturan-aturan atau cara
yang digunakan suatu alat dalam rangka menarik kesimpulan yang
bersifat umum dari suatu data yang telah disusun dan diolah.
4
c. Wawancara
Wawancara merupakan teknik pengumpulan data yang digunakan
melalui tatap muka dan tanya jawab langsung antara pengumpul data
maupun peneliti terhdapa narasumber atau sumber data. Wawancara
pada penelitian sampel besar biasanya hanya dilakukan sebagai studi
pendahuluan karena tidak mungkin menggunakan wawancara pada
1000 responden, seangkan pada sampel kecil teknik wawancara dapat
diterapkan sebagai teknik pengumpulan data (umumnya penelitian
kualitatif).
5
b. Menurut Cara Memperolehnya
1) Data Primer
Data primer merupakan data yang langsung diperoleh dari lapangan
melalui percobaan, survey, dan data observasi. Misalnya seorang
peneliti ingin mengetahui antara besarnya biaya yang dikeluarkan
untuk promosi dan volume penjualan komoditas tertentu.
2) Data Sekunder
Data sekunder diperoleh dari data primer, biasanya dalam publikasi
berupa tabel-tabel, sperti data harga, data impor – ekspor, dan data
produksi. Data yang dipublikasikan oleh Biro Pusat Statistik selalu
berupa data sekunder.
c. Menurut Waktu
1) Data Silang
Data silang merupakan data yang dikumpulkan dalam waktu yang
sifatnya kontemporer. Misalnya data hasil penelitian pemasaran
pakaian jadi di Medan pada tahun 2012.
2) Data Berkala
Data berkala merupakan data yang dikumpulkan setiap periode
tertentu. Misalnya jumlah impor mobil mewah menurut tahun, dari
tahun 2011 s/d 2012.
d. Menurut Sumbernya
1) Data Internal
Data Internal merupakan data yang dikumpulkan oleh unit kerja
tertentu dalam lingkungannya untuk keperluan sendiri. Misalnya
data mahasiswa, dosen, pegawai, dan peralatan FISIP USU.
2) Data Eksternal
Data eksternal merupakan data yang diambil dari unit lain.
Misalnya data FISIP USU, kemudian digunakan oleh BPS, maka
data tersebut merupakan data eksternal bagi BPS.
6
1.2.6 Data Statistik
Data statistik merupakan keterangan atau ilustrasi mengenai suatu hal
yang bisa berbentuk kategori (misal: rusak, baik, cerah, berhasil, ataupun
bilangan). Ciri-ciri data :
a. Berbentuk angka atau simbol angka, tidak bebrbentuk kalimat,
b. Tersusun teratur
c. Agregat
jenis data dalam statistik, terbagi menjadi 4 tipe data dari tingkat terendah
sampai tertinggi. Berikut beberapa jenisnya :
a. Nominal digunakan untuk mengklasifikasikan informasi ataupun data,
contohnya data jenis kelamin.
b. Ordinal digunakan untuk mengklasifikasikan tingkatan.
c. Interval ciri dari data ini adalah memiliki kemampuan mengklasifikasi
dan membentuk tingkatan juga ada titik nol mutlak.
d. Rasio, dimana tipe ini memiliki kemampuan dari ketiga tipe diatas dan
angka nol dianggap mutlak.
∑ 𝑘 = 1 + 3,3 log 𝑁
b. Range (R)
R = Nilai data Max – Nilai data Min
7
c. Class Interval
𝑅
𝐶𝑖 =
∑𝐾
8
b. Modus (Mo)
Modus adalah nilai yang mempunyai frekuensi paling banyak. Modus
tidak harus tunggal, artinya nilainya bisa lebih dari satu. Adapun cara
mencari modus untuk data tunggal tinggal dilihat frekuensinya. Untuk
data dalam daftar distribusi frekuensi, modus ditentukan dengan rumus
𝑏1
𝑀𝑜 = 𝑏 + 𝑝 ( )
𝑏1 + 𝑏2
Dengan :
b = batas bawah kelas modus yaitu kelas interval dengan frekuensi
terbanyak
p = panjang interval kelas modus
b1= frekuensi kelas modus dikurangi frekuensi kelas sebelum kelas
modus
b2= frekuensi kelas modus dikurangi frekuensi kelas sesudah kelas
modus
c. Median (Me)
Median adalah suatu nilai yang membagi distribusi data menjadi dua
bagian yang sama besar atau suatu nilai yang membagi 50% frekuensi
bagian atas dan 50% frekuensi bagian bawah, sehingga frekuensi yang
terdapat diatas sama dengan frekuensi yang terdapat dibawah. Oleh
karena itu median dari sejumlah data tergantung pada frekuensinya
bukan variasi nilai-nilainya. Adapun cara mencari median, antara lain :
1) Data Tunggal
Sebelum dihitung mediannya, data diurutkan terlebih dahulu
dari data yang terkeci ke yang terbesar. Rumusan median untuk data
tunggal dibedakan jadi dua, yaitu :
untuk jumlah data ganjil
𝑥𝑛 + 1
𝑀𝑒 =
2
9
untuk jumlah data genap
𝑥𝑛
2 + 𝑥(𝑛2)+1
𝑀𝑒 =
2
2) Data Kelompok ( dalam distribusi frekuensi)
untuk data yang disusun dalam daftar distribusi frekuensi,
median dihitung dengan rumus :
𝑛
− 𝐹
𝑀𝑒 = 𝑏 + 𝑝 (2 )
𝑓
dengan
b = batas bawah kelas median
p = panjang kelas median
n = jumlah data
F = jumlah frekuensi kumulatif sebelum kelas median
f = frekuensi kelas median
10
1) Range untuk data yang tidak berkelompok
Range untuk data yang tidak berkelompok adalah data yang belum
dikelompokkan. Rumus untuk data tidak berkelompok sebagai
berikut :
Jarak (range) = Nilai terbesar – Nilai terkecil
2) Range untuk data yang berkelompok
Range untuk data berkelompok adalah data yang sudah
dikelompokkan. Adapun rumus untuk data yang berkelompok
adalah sebagai berikut :
Range = batas atas kelas tertinggi – batas bawa kelas terendah
b. Deviasi
Deviasi rata-rata adalah rata-rata penyimpangan data-data dari
rata-rata (mean)-nya. Di dalam menghitung deviasi rata-rata harus
kita cari rata-rata dari harga mutlak selisih antara tiap-tiap data dengan
meannya. Harga mutlak adalah nilai dengan tidak memandang positif
atau negatif, semuanya dianggap positif.
1) Deviasi untuk data yang tidak berkelompok
Rumus deviasi untuk data tidak berkelompok adalah sebagai
berikut :
𝛴|𝑥− 𝑥̅ |
MD =
𝑁
Keterangan :
MD : Deviasi rata – rata
X : nilai setiap data pengamatan
𝑥̅ : Nilai rata – rata hitung dari seluruh nilai pengamatan
𝑁 : Jumlah data atau pengamatan dalam sampel/populasi
|| : Lambang nilai mutlak
𝛴 : Lambang Penjumlahan
11
2) Deviasi untuk data berkelompok
Rumus deviasi untuk data berkelompok adalah sebagai berikut :
𝛴𝑓|𝑥− 𝑥̅ |
MD =
𝑁
Keterangan :
MD : Deviasi rata – rata
F : Jumlah frekuensi tiap kelas
X : nilai setiap data pengamatan
𝑥̅ :Nilai rata – rata hitung dari seluruh nilai pengamatan
𝑁 : Jumlah data atau pengamatan dalam sampel/populasi
|| : Lambang nilai mutlak
𝛴 : Lambang Penjumlahan
c. Varians dan standar deviasi
Varians dan standar deviasi adalah sebuah ukuran penyebaran
yang menunjukkan standar penyimpangan atau deviasi data terhadpat
penyimpangan rata-ratanya. Varians adalah rata-rata hitung deviasi
kuadrat setiap data terhadap rata-rata hitungnya. Standar deviasi
adalah akar kuadrat dari varians dan menunjukka standar
penyimpangan data terdapat nilai rata-ratanya.
1) Varians Dan Standar Deviasi untuk Data Tidak Berkelompok
Rumus :
𝛴(𝑥 − 𝜇)2
𝜎=√
𝑁
Keterangan :
𝜎 2 : Varians Populasi
X : Nilai setiap data/pengamatan dalam populasi
𝜇 : Nilai rata – rata hitung setiap populasi
N : Jumlah total data
𝛴 : Simbol operasi penjumlahan
12
2) Varians Dan Standar Deviasi Untuk Data Berkelompok
Rumus :
𝛴𝑓(𝑥 − 𝑥̅ )2
𝑠=√
𝑛−1
Keterangan :
S : Varians sampel
f : Jumlah frekuensi tiap kelas
X : Nilai setiap data/pengamatan dalam populasi
𝑥̅ : Nilai rata – rata hitung dalam sampel
N : Jumlah total data
𝛴 : Simbol operasi penjumlahan
13
Ukuran keruncingan (kurtosis) merupakan derajat atau ukuran tinggi
rendahnya puncak suatu distribusi data terhadap distribusi normalnya data.
Jika bentuk kurva runcing berarti nilai data terkonsetrasi terhadap nilai
rata-rata atau nilai penyebarannya kecil, sebaliknya jika bentuk kurvanya
tumpul berarti nilai data tersebar terhadp nilai rata-rata atau nilai
penyebaran besar. Derajat keruncingan suatu distribusi frekuensi dapat
dibedakan menjadi 3, yaitu :
a. Leptokurtis
Distribusi data yang puncaknya relatif tinggi atau bentuk distribusi
yang ujungnya sangat runcing
b. Mesokurtisd
Distribusi data yang puncaknya tidak terlalu runcing atau tidak terlalu
tumpul
c. Platikurtis
Distribusi data yang puncaknya terlalu rendah atau terlalu mendatar.
14
1.3 HASIL PENGOLAHAN DATA
Berdasarkan hasil pengumpulan data yang dilakukan dengan menghitung
jumlah sepeda motor yang lewat setiap menitnya di depan SMP 4 Makassar
jln.pongtiku.selama dua jam dan diperoleh data sebanyak 120 data yang dapat
dilihat pada lampiran 1, maka diperoleh hasil pengolahan data sebagai berikut:
1.3.1 Distribusi Frekuensi
A. Jumlah Kelas
𝑘 = 1 + 3,3 log 𝑛
= 1+ 3,3 log 120
= 1 + 3,3 (2,079)
= 1 + 6,8607
= 7, 86 ≈ 8
Jadi, jumlah kelas dari 120 data adalah 8 kelas
B. Range
𝑅 = 𝑁𝑖𝑙𝑎𝑖 𝑇𝑒𝑟𝑡𝑖𝑛𝑔𝑔𝑖 − 𝑁𝑖𝑙𝑎𝑖 𝑇𝑒𝑟𝑒𝑛𝑑𝑎ℎ
= 54 – 18
= 36
Jadi, range dari data yang diperoleh adalah 36
C. Interval Kelas
𝑅
𝐼=
𝑘
36
=
8
= 4,5 ≈ 5
Jadi, interval kelas dari data yang diperoleh adalah 5
15
Tabel 1.1 Distribusi Frekuensi
= 27,5 + 4,1
= 31,61
Jadi, median dari data yang diperoleh adalah 31,61.
16
C. Modus
𝑑1
𝑀𝑜 = 𝐵 + ×𝐼
𝑑1 + 𝑑2
13
= 27,5 + 13+(−3) × 5
13
= 27,5 + 10 × 5
= 27,5 + 6,5 = 34
Jadi, modus dari data yang diperoleh adalah 34.
= 22,5 + 0,72× 5
= 22,5 + 3,6 = 26,1
Jadi, quartil satu dari data yang diperoleh adalah 26,1.
2. Quartil 2
𝑛
− 𝑓𝑘𝑠
𝑄2 = 𝐵 + 2 ×𝐼
𝑓𝑖
120
− 37
2
= 27,5 + ×5
28
60 − 37
= 27,5 + ×5
28
= 27,5 + 0,82 × 5
= 27,5 + 4,11 = 31,61
Jadi, quartil dua dari data yang diperoleh adalah 31,61
17
3. Quartil 3
3𝑛
− 𝑓𝑘𝑠
𝑄3 = 𝐵 + 4 ×𝐼
𝑓𝑖
3(120)
−87
4
= 37,5 + ×5
15
90 − 87
= 37,5 + ×5
15
= 37,5 + 0,2 × 5
= 37,5 + 1= 38,5
Jadi, quartil 3 dari data yang diperoleh adalah 38,5.
B. Desil
(𝑖 × 𝑛)
− 𝑓𝑘𝑠
𝐷𝑖 = 𝐵 + 10 ×𝐼
𝑓𝑖
(8×120)
−87
10
𝐷8= 37,5 + ×5
15
96 −87
= 37,5 + ×5
15
9
=37,5 + 15 × 5
=37,5 + 0,6 × 5
= 37,5 + 3 = 40,5
Jadi, desil dari data yang diperoleh adalah 40,5.
C. Persentil
(𝑖 × 𝑛)
− 𝑓𝑘𝑠
𝑃𝑖 = 𝐵 + 100 ×𝐼
𝑓𝑖
(44×120)
− 37
100
𝑃44 = 27,5 + ×5
18
53 − 37
= 27,5 + ×5
18
= 27,5 + 0,88 × 5
= 27,5 + 2,9 =30,4
Jadi, persentil dari data yang diperoleh adalah 30,4.
18
1.3.4 Ukuran Dispersion
A. Variansi
1
𝑆2 = . {𝑓𝑖. (𝑚𝑖 − 𝑥̅ )2 }
𝑛−1
1
= 120−1 . {7.599,79}
1
= 119 . {7.599,79}
= 63,87
Jadi, variansi dari data yang diperoleh adalah 63,87.
B. Standar Deviasi
𝑆 = √𝑆 2
= √63,87
= 7,99
Jadi, standar deviasi dari data yang diperoleh adalah 7,99.
1.3.5 Histogram
30
25
20
frekuensi
15
10
5
0
18-22 23-27 28-32 33-37 38-42 43-47 48-52 53-57
kelas
19
1.4 PEMBAHASAN
1.4.1 Distribusi frekuensi
Dalam menganalisis data untuk distribusi frekuensi, hasil
pengukuran yang diperoleh yang disebut dengan data mentah, harus diolah
terlebih dahulu untuk mempermudah dalam melakukan analisis. Dari hasil
analisis distribusi frekuensi, diperoleh jumlah kelas sebanyak 8, jangkauan
atau range yang merupakan hasil pengurangan dari data tertinggi yaitu 57
dan data terendah yaitu 18, maka nilai jangkauan yang diperoleh adalah 36.
Untuk panjang interval kelas atau luas kelas, diperoleh hasil 5 yang
menunjukkan jarak antara tepi atas dan tepi bawah kelas.
20
1.4.4 Ukuran Dispersion
Varian dan standar deviasi adalah sebuah ukuran penyebaran yang
menunjukkan standar penyimpangan atau deviasi data terhadap
penyimpangan rata rata. Dari hasil 120 data yang telah diolah, diperoleh
varians sebesar 63,87 dan standar deviasi sebesar 7,99.
1.4.5 Histogram
Berdasarkan histogram diatas dari data yang diperoleh, dapat
diketahui bahwa kelas pertama 18-22 dengan frekuensi 12. Kelas kedua 23-
27 frekuensinya adalah 25. Kelas ketiga 28-32 dengan frekuensi 28. Kelas
keempat 33-37 dengan frekuensi sebanyak 22. Kelas kelima 38-42 dengan
frekuensi sebanyak 15. Kelas keenam 43-47 dengan frekuensi sebanyak 17.
Kelas ketujuh 48-52 dengan frekuensi sebanyak 0 dan kelas kedelapan 53-
57 dengan frekuensi sebanyak 1.
21