Anda di halaman 1dari 8

BAB 2

STATISTIKA DESKRIPTIF
Dalam penelitian kuantitatif, langkah pertama analisis statistika setelah mengumpulkan data
adalah menggambarkan karakteristik respons, seperti rata-rata satu variabel (misalnya, usia) atau
hubungan antara dua variabel (misalnya, usia dan kreativitas). Dataset adalah sekelompok
respons atau pengamatan dari sampel atau seluruh populasi. Statistika deskriptif mengumpulkan
dan mengatur informasi tentang dataset.
2.1. Jenis-jenis Statistika Deskriptif
Ada 4 jenis utama statistika deskriptif:
 Ukuran frekuensi, yaitu menyangkut frekuensi setiap nilai. Dapat berupa pencacahan,
persentase, table frekuensi Ukuran ini menunjukkan seberapa sering sesuatu terjadi
Ukruan ini digunakan untuk menunjukkan seberapa sering respons diberikan
 Tendensi sentral , ukurannya adalah rata-rata, median, dan modus. Ukuran ini
menemukan distribusi dengan berbagai titik. Ukruan ini digunakan untuk menunjukkan
bagaimana respons rata-rata atau paling sering ditunjukkan
 Variabilitas atau dispersi menyangkut seberapa tersebar nilai-nilai itu. Ukurannya adalah
range atau rentang, varians, Standar Deviasi, Ukuran ini mengidentifikasi penyebaran
skor dengan menyatakan interval. Ukruan ini digunakan untuk seberapa "menyebar" data
tersebut. Sangat membantu untuk mengetahui kapan data Anda tersebar sedemikian rupa
sehingga memengaruhi rata-rata
 Ukuran Letak. Ukurannya adalah Desil, Persentil, Kuartil.Ukuran ini menjelaskan
bagaimana skor jatuh dalam kaitannya satu sama lain. Bergantung pada skor standar.
Ukruan ini digunakan untuk membandingkan skor dengan skor yang dinormalisasi (mis.,
norma nasional)
Contoh Contoh penelitian
Seorang mahasiswa ingin mempelajari popularitas berbagai kegiatan rekreasi berdasarkan
jenis kelamin. Mahaiswa tersebut mendistribusikan survei dan bertanya kepada peserta
berapa kali mereka melakukan masing-masing hal berikut dalam satu tahun terakhir:
 Pergi ke perpustakaan
 Menonton film di bioskop
 Kunjungi taman nasional
Dataset yang terkumpul adalah kumpulan tanggapan terhadap survei. Mahasiswa tersebut
dapat menggunakan statistika deskriptif untuk mengetahui frekuensi keseluruhan dari setiap
aktivitas (distribusi), rata-rata untuk setiap aktivitas (kecenderungan sentral), dan penyebaran
tanggapan untuk setiap aktivitas (variabilitas).
2.2. Distribusi Frekuensi
Table distribusi frekuensi dapat digunakan untuk data kuantitatif dan kualitatif. Distribusi
frekuensi menggambarkan frekuensi atau jumlah hasil yang berbeda dalam kumpulan data atau
sampel. Distribusi frekuensi biasanya disajikan dalam tabel atau grafik. Setiap entri dalam tabel
atau grafik disertai dengan hitungan atau frekuensi kemunculan nilai dalam interval, rentang,
atau grup tertentu.
Distribusi frekuensi pada dasarnya adalah penyajian atau ringkasan data yang dikelompokkan
berdasarkan kelas yang saling eksklusif dan jumlah kemunculan di masing-masing kelas. Ini
memungkinkan cara yang lebih terstruktur dan terorganisir untuk menyajikan data mentah.
Bagan dan grafik umum yang digunakan dalam presentasi dan visualisasi distribusi frekuensi
meliputi diagram batang, histogram, diagram lingkaran, dan diagram garis.

2.3. Ukuran Tendensi Sentral


Gagasan ukuran tendensi sentral mengacu pada kumpulan data tipikal (Lokasi sentral atau
ukuran lokasi sentral). Setiap bagian data tidak mengungkapkan apa yang khas tentangnya,
melainkan memberikan gambaran tentang keseluruhan dataset. Tendensi sentral menggambarkan
dataset tipikal dengan menggunakan tiga metode utama: mean, modus, dan median.
Mean adalah rata-rata dari sekumpulan angka tertentu. Mean dihitung dalam dua langkah
sederhana:
 Mean dihitung dengan menjumlahkan semua data dan
 kemudian membaginya dengan jumlah total data.
Keuntungan terbesar dari mean adalah dapat digunakan untuk menilai data numerik kontinu
dan diskrit. Tentu saja, mean atau rata-rata memiliki keterbatasan. Data harus numerik untuk
menghitung mean.
Contoh : Dataset pengunjung perpustakaan : 13, 5, 13, 0, 23, 3. Untuk mendapatkan mean
(rata-ratanya) jumlahkan semua nilai : 13 + 5 + 13 + 0 + 23 + 3 = 57. Banyak respons (N) = 6.
57
Maka nilai rata-ratanya adalah : μ= =9 ,5 .
6

Modus suatu himpunan data adalah bilangan dalam himpunan yang paling sering muncul.
Suatu dataset bisa saja tidak memiliki modus, hanya memiliki satu modus, atau lebih dari satu
modus.
Untuk menentukan modus, urutkan dataset dari terendah ke tertinggi dan temukan respons
yang paling sering terjadi atau data dengan frekuensi terbesar.
Contoh : Dataset pengunjung perpustakaan : 13, 5, 13, 0, 23, 3. Data diurutkan terlebih
dahulu dari yang terkecil : 0,3, 5, 13, 13, 23. Terlihat bahwa modus untuk data ini adalah 13.
Modus memiliki satu keunggulan yang sangat penting dibandingkan median dan mean.
Modus dapat dihitung untuk data numerik dan kategorikal. Namun kelemahan modus adalah
dalam beberapa dataset, modus mungkin tidak mencerminkan pusat dataset.

Untuk mencari median, urutkan setiap nilai respon dari yang terkecil sampai yang terbesar.
Kemudian, median adalah angka di tengah. Jika ada dua angka di tengah, cari rata-ratanya.
Contoh : Dataset pengunjung perpustakaan : 13, 5, 13, 0, 23, 3. Data diurutkan terlebih
dahulu dari yang terkecil : 0,3, 5, 13, 13, 23. Terlihat bahwa median untuk data ini adalah
5+13
=9.
2
Kesulitan mengingat perbedaan antara modus, mean, dan median? Berikut beberapa
petunjuknya:

2.4. Ukuran Variabilitas


Kecenderungan ukuran tendensi sentral memberi tahu informasi penting tetapi tidak
menunjukkan semua yang ingin diketahui tentang nilai rata-rata. Tendensi sentral gagal
mengungkapkan sejauh mana nilai-nilai item individual berbeda dalam dataset.
Ukuran dispersi atau variabilitas atau penyebaran memungkinkan untuk menafsirkan dataset
dengan lebih baik.
Dispersi dalam statistika menggambarkan penyebaran nilai data dalam dataset tertentu.
Dengan kata lain, ukuran dispersi menunjukkan bagaimana data “tersebar” di sekitar mean (nilai
pusat).

Contoh 6: Misalkan akan dibandingkan kinerja 2 kelompok mahasiswa pada ujian akhir
matematika. Diketahui bahwa hasil tes matematika rata-rata identik untuk kedua kelompok.
Apakah itu berarti mahasiswa dalam dua kelompok berkinerja sama? TIDAK!
Mari kita lihat alasannya.
Kelompok mahasiswa A: 56, 58, 60, 62, 64
Kelompok mahasiswa B: 40, 50, 60, 70, 80
Kedua kelompok ini memiliki nilai rata-rata 60. Namun, dalam kelompok A skor individu
terkonsentrasi di sekitar pusat , yaitu 60. Semua mahasiswa di A memiliki kinerja yang sangat
mirip. Ada konsistensi. Di sisi lain, di grup B rata-rata juga 60 tetapi skor individu bahkan tidak
dekat dengan pusat. Satu skor cukup kecil, yaitu 40 dan satu skor sangat besar, yaitu 80. Kita
dapat menyimpulkan bahwa ada dispersi yang lebih besar di grup B.
Catatan:
Studi tentang dispersi memiliki peran kunci dalam data statistika. Jika di suatu negara ada
orang yang sangat miskin dan orang yang sangat kaya, dikatakan ada kesenjangan ekonomi yang
serius. Dispersi juga sangat berguna ketika ingin mencari hubungan antar dataset.
Ada dua ukuran dispersi yang populer: jangkauan atau range , simpangan baku atau standar
deviasi, dan ragam atau varians.
Jangkauan
Rentang ini memberikan gambaran tentang seberapa jauh selisih skor respons paling ekstrem.
Untuk menemukan rentang, cukup kurangi nilai terendah dari nilai tertinggi.
Contoh : Dataset pengunjung perpustakaan : 13, 5, 13, 0, 23, 3. Range dataset ini adalah
23−0=0.
Simpangan Baku atau Standar deviasi
Standar deviasi (s) adalah jumlah rata-rata variabilitas dalam dataset. Simpangan baku
memberitahu, rata-rata, seberapa jauh setiap skor terletak dari rata-rata. Semakin besar standar
deviasi, semakin banyak variabel dataset.
Ada enam langkah untuk menemukan standar deviasi:
1) Buat daftar setiap skor dan hitung meannya.
2) Kurangi mean dari setiap skor untuk mendapatkan deviasi dari mean.
3) Kuadratkan setiap penyimpangan ini.
4) Jumlahkan semua simpangan kuadrat.
5) Bagilah jumlah simpangan kuadrat dengan N – 1.
6) Hitung akar kuadrat dari angka yang didapat.
Contoh : Dataset pengunjung perpustakaan : 13, 5, 13, 0, 23, 3. Pada table berikut adalah
langkah 1 sampai 4
Data mentah Penyimpangan dari rata-rata Kuadrat dari simpangan
13 13 – 9,5 = 3,5 12,25
5 5 – 9,5 = -4,5 20,25
13 13 – 9,5 = 3,5 12,25
0 0 – 9,5 = -9,5 90,25
23 23 – 9,5 = 13,5 182,25
3 3 – 9,5 = -6,5 42,25
μ=9 ,5 Jumlah kuadrar = 359,50
359 ,50
Langkah 5 : =71 , 9.
5
Langkah 6 : √ 71 ,9=8,479
Dari contoh terlihat bahwa s = 8,479, dapat dikatakan bahwa rata-rata, setiap skor
menyimpang dari rata-rata sebesar 8,479 poin.
Ragam atau Varians
Varians adalah rata-rata deviasi kuadrat dari mean. Varians mencerminkan tingkat
penyebaran dalam dataset. Semakin menyebar data, semakin besar varians dalam kaitannya
dengan mean.
Untuk mencari varians, cukup kuadratkan simpangan bakunya. Simbol varians adalah s2.
Contoh : Dataset pengunjung perpustakaan : 13, 5, 13, 0, 23, 3. Dari sebelumnya didapat s =
8,479. Maka s2=71 , 9.

2.5. Statistika Deskriptif Univariat


Statistika deskriptif univariat hanya berfokus pada satu variabel pada satu waktu. Penting
untuk memeriksa data dari setiap variabel secara terpisah menggunakan beberapa ukuran
distribusi, tendensi sentral, dan penyebaran. Program seperti SPSS dan Excel dapat digunakan
untuk menghitungnya dengan mudah.
Contoh : Dataset pengunjung perpustakaan : 13, 5, 13, 0, 23, 3.
N 6

Mean 9.5

Median 9

Modus 13

Standard deviasi 8,479

Varians 71,9

Range 23
Jika hanya mempertimbangkan mean sebagai ukuran tendensi sentral, kesan tentang "tengah"
dari dataset dapat dimiringkan oleh outlier, tidak seperti median atau mode. Demikian juga,
sementara rentang sensitif terhadap nilai ekstrem, juga harus dipertimbangkan standar deviasi
dan varians untuk mendapatkan ukuran penyebaran yang dapat dibandingkan dengan mudah.

2.6. Statistik Deskriptif Bivariat


Jika data telah dikumpulkan pada lebih dari satu variabel, maka dapat digunakan statistika
deskriptif bivariat atau multivariat untuk mengeksplorasi apakah ada hubungan di antara variabel
tersebut.
Dalam analisis bivariat, secara bersamaan dipelajari frekuensi dan variabilitas dua variabel untuk
melihat apakah keduanya bervariasi. Juga dapat dibandingkan tendensi sentral dari kedua
variabel sebelum melakukan uji statistik lebih lanjut.
Analisis multivariat sama dengan analisis bivariat tetapi dengan lebih dari dua variabel.
Tabel kontingensi
Dalam tabel kontingensi, setiap sel mewakili perpotongan dua variabel. Biasanya, variabel
independen (misalnya, jenis kelamin) muncul di sepanjang sumbu vertikal dan variabel dependen
muncul di sepanjang sumbu horizontal (misalnya, aktivitas). Dibaca "di seberang" tabel untuk
melihat bagaimana variabel independen dan dependen berhubungan satu sama lain.

Contoh : Dataset pengunjung perpustakaan :


Kelompok 0–4 5–8 9–12 13–16 17+

Anak-anak 32 68 37 23 22

Dewasa 36 48 43 83 25

Menafsirkan tabel kontingensi lebih mudah ketika data mentah dikonversi ke persentase.
Persentase membuat setiap baris sebanding dengan yang lain dengan membuatnya seolah-olah
setiap kelompok hanya memiliki 100 pengamatan atau peserta. Saat membuat tabel kontingensi
berbasis persentase, Anda menambahkan N untuk setiap variabel independen di bagian akhir.

Contoh : Dataset pengunjung perpustakaan (persentase)

Kelompok 0–4 5–8 9–12 13–16 17+ N


Anak-anak 18% 37% 20% 13% 12% 182

Dewasa 15% 20% 18% 35% 11% 235

Dari tabel ini, lebih jelas bahwa proporsi yang sama dari anak-anak dan orang dewasa pergi
ke perpustakaan lebih dari 17 kali setahun. Selain itu, anak-anak paling sering pergi ke
perpustakaan antara 5 dan 8 kali, sedangkan untuk orang dewasa, jumlah ini antara 13 dan 16.
Diagram pencar atau scatterplot

Diagram pencar adalah bagan yang menunjukkan hubungan antara dua atau tiga
variabel. Bagan ini adalah representasi visual dari kekuatan suatu hubungan. Dalam diagram
pencar, Anda memplot satu variabel di sepanjang sumbu x dan variabel lainnya di sepanjang
sumbu y. Setiap titik data diwakili oleh sebuah titik dalam grafik.
Misalnya, Anda dapat menggunakan plot sebar untuk menunjukkan hubungan antara suhu
rata-rata harian dan jumlah orang yang mengunjungi situs web Anda pada hari tertentu. Anda
memplot suhu rata-rata harian pada sumbu x dan jumlah orang pada sumbu y. Semakin banyak
orang mengunjungi situs web Anda pada hari tertentu, semakin tinggi jumlahnya. Semakin
banyak orang mengunjungi situs web Anda, semakin tinggi suhu rata-rata hariannya.
Anda dapat memplot satu variabel kategori pada sumbu x dan satu variabel numerik pada
sumbu y untuk memvisualisasikan bagaimana nilai satu variabel berubah saat Anda mengubah
nilai variabel lain.
Diagram pencar dapat sangat berguna untuk memvisualisasikan korelasi antara variabel
kategorikal dan numerik. Anda juga dapat menggunakan diagram pencar untuk menunjukkan
bagaimana satu variabel kategori berubah saat variabel kategori lainnya berubah.
Anda juga dapat menampilkan data tambahan dalam bentuk garis tren atau kurva. Garis tren
adalah kurva yang paling cocok yang menunjukkan hubungan keseluruhan antara dua variabel
atau lebih. Kurva dapat membantu dalam menunjukkan hubungan antara satu variabel dan
variabel lainnya, seperti bagaimana perubahan suhu dari waktu ke waktu mempengaruhi
penjualan.
Contoh Diagram Pencar: Kunjungan perpustakaan dan kunjungan bioskop
Anda menyelidiki apakah orang yang mengunjungi perpustakaan lebih cenderung menonton film
di bioskop lebih sedikit. Anda memplot berapa kali peserta menonton film di bioskop di
sepanjang sumbu x dan kunjungan ke perpustakaan di sepanjang sumbu y.
Dari diagram pencar Anda, Anda melihat bahwa ketika jumlah film yang ditonton di bioskop
meningkat, jumlah kunjungan ke perpustakaan berkurang. Berdasarkan penilaian visual Anda
tentang kemungkinan hubungan linier, Anda melakukan tes korelasi dan regresi lebih lanjut.

Anda mungkin juga menyukai