Anda di halaman 1dari 51

Accounting

Research Tools
03 Statistik Deskriptif
Penelitian merupakan kegiatan utama dari penyelidikan ilmiah yang
bertujuan mengembangkan pengatahuan dan pemahaman
mengenai topik-topik penting

Temuan penelitian secara berkala dilaporkan kepada


kelompok-kelompok profesional maupun umum melalui
laporan penelitian seperti hasil tugas akhir atau
dipublikasikan dalam jurnal ilmiah, makalah konferensi ilmiah
atau buku dan lainnya
Hasil penelitian harus dilaporkan
dengan cara yang memungkinkan para
pembacanya untuk memahami dan
menggunakan informasinya

Agar dapat mengembangkan pengetahuan


secara efektif kepada mereka yang akan
mendapatkan keuntungan dari
pengetahuan baru dri penelitian
Jika data tidk diterjemahkan Agar hasil penelitian dapat dipahami oleh kelompok
menjadi pesan-pesan yang pengguna yang beragam: Data mentah penelitian
mudah diterjemakan, orang harus diubah agar mudah dipahami dengan
awam akan sulit memahami menampilkan deskripsi menggunakan angka, narasi,
hasil penelitian dan visual
• Menjadi titik awal analisis data dimana
seorang peneliti dapat mengatur,
menyederhanakan, dan meringkas data 
Statistik deskriptif data berjumlah nbesar dapat diringkas
memungkinkan menjadi sekelompok statistik yang
memberikan informasi yang berguna
peneliti mengenai populasi yang dipelajari
mengkuantifikasi • Menentukan uji statistik lanjutan yang sesuai
dan menggambarkan • Tidak memungkinkan peneliti untuk
membuat kesimpulan atas dugaan awal
karakteristik data mengenai populasi yang diteliti (akan menjadi
bagian dari statistik inferensi)
Informasi yang disediakan oleh statistik
deskriptif

Distribusi data Ukuran tendensi Ukuran penyebaran


•Menentukan analisis sentral data
statistik yang dipakai
•Menjadi pertimbangan saat
menentukan ukuran-ukuran
apa yang paling cocok untuk
suatu kelompok data
Distribusi Data
• Cara yang berguna untuk mendeskripsikan kelompok data
• Mengacu pada seberapa tersebarnya satu titik data dari titik data lainnya dan
melihat kesimetrisan atau bentuk data keseluruhan
• Hal penting karena distribusi data menentukan uji statistik lanjutan yang cocok
digunakan
• Distribusi mengidentifikasi data pencilan atau observasi ekstrim dalam data yang
dapat mempengaruhi pengukuran tendensi entral
• Hubungan antar besaran tendensi sentral (mean, median, modus) didefinisika oeh
distribusi
Distribusi data
• Distribusi data seringkali didiskusikan dalam hal simetrinya terhadap pusat data
jika ditampilkan secara grafis
• Bila data cenderung simetri dan hanya memiliki satu mode, data cenderung
terdistribusi normal.
• Jika data tidak simetris, maka data akan memiliki kemencengan dimana akan
terdapat “ekor” yang lebih panjang ke arah kanan ataupun ke arah kiri.
• Data dengan “ekor” yang lebih panjang ke kanan disebut memiliki kemencengan positif atau
menceng kanan, memiliki kecenderungan berkumpul di sebelah kiri dan akan memiliki titik-
titik data yang “bergerak” ke arah positif dari titik pusat.
• Data dengan “ekor” yang lebih panjang ke kiri disebut memiliki kemencengan negatif atau
menceng kiri, memiliki kecenderungan berkumpul disebelah kanan dan memiliki titik-titik
data yang “bergerak” ke arah negatif dari titik pusat.
Statistik deskriptif – gambaran umum
Statistik deskriptif – gambaran umum

−3 𝜎 −2𝜎 −1𝜎 Mean +1𝜎 +2𝜎 +3𝜎

99.7%

95.4%

68.2%
Data pencilan

Data pencilan (outliers) adalah nilai yang tidak biasa dalam data
Penyebab adanya data pencilan
• Kesalahan saat data entry
• Observasi yang terjadi di bawah kondisi abnormal
• Observasi yang secara akurat menunjukkan adanya variabilitas dalam studi
Masalah dengan adanya data pencilan

• Data pencilan mungkin tidak mewakili populasi atai pertanyaan penelitian yang
sedang dipelajari
• Nilai ekstrimnya akan menyebabkan penyimpangan dari ahsil analisis
• Mungkin disebabkan oleh kesalahan dalam memasukkan data
Identifikasi data pencilan
• Box plot
• Histogram
Identifikasi data pencilan - Boxplot
• Metode untuk secara grafik menggambarkan kelompok data numerik melalui nilai
kuartilnya.
• Mungkin memiliki garis yang diperpanjang dari kotaknya (box) yang
mengingikasikan variabilitas diluar kuartil atas dan bawah
Identifikasi data pencilan – Boxplot
• Kuartil: nilai yang membagi data menjadi 4 bagian
• Data dibagi berdasarkan jumlah kelompok datanya, bukan berdasar nilai data
Contoh data: 2, 5, 6, 7, 10, 22, 13, 14, 16, 65, 45, 12

Data diurutkan: 2, 5, 6, 7, 10, 12 13, 14, 16, 22, 45, 65

Nilai kuartil (dihitung menggunakan MS Excel)


Kuartil 1 (Q1): 6.75
Kuartil 2 (Q2): 12.5
Kuartil 3 (Q3): 17.5

Interquartile range (IQR): Q3 – Q1 = 17.5 – 6.75 = 10.75


Boxplot dan data pencilan

Berdasar boxplot terdapat 2 data pencilan


Identifikasi data pencilan - Histogram
• Membuat histogram untuk dapat menunjukkan data pencilan
Ukuran tendensi sentral

Data dalam jumlah besar sulit untuk


dipelajari
• Meihat data satu per satu tidak memberikan
informasi ayng berguna mengenai
keseluruhan data
• Melihat data individual membosankan
Ukuran tendensi sentral

Ukuran tendensi sentral memungkinkan


peneliti untuk mempelajari data dengan
menggunakan satu ukuran yang merupakan
perwakilan dari seluruh kelompok data
Ukuran tendensi sentral

• Tendensi sentral adalah suatu ukuran spesifik yang ditujukan


pada menemukan satu besaran yang berada pada pusat
suatu distribusi
• Tiga ukuran tendensi sentral:
• Rata-rata
• Median
• Mode
• Tidak ada satu ukuran yang ideal untuk semua situasi
Mean

• Salah satu ukuran statistik yang digunakan untuk menggambarkan


suatu populasi sampel,
• seringkali disebut sebagai rata-rata
Mean

Rumus: • Mean = hasil penjumlahan seluruh data yang ada


dibagi dengan jumlah data
𝑛

∑ 𝑋𝑖
• Mean memberikan informasi yang berhubungan
𝑖=1
𝑋=
𝑁

𝑋 1 + 𝑋 2 +…+ 𝑋 𝑛 dengan nilai rata-rata dari se;uruh data  satu nilai


𝑋= yang merupakan pusat dari suatu distribusi
𝑁
• Jika data didapat dari suatu proses yang sama selama
observasi ke i
beberapa periode maka mean dari berbagai periode
N: jumlah data
dapat diperbandingkan untuk menunjukkan suatu
trend
• Menentukan mengapa nilai mean berubah dari waktu
ke waktu berada di luar kemampuan statistik
deskriptif
Mean
• Mean memperhitungkan seluruh observasi dalam kelompok data
• Memperhitungkan seluruh data memberikan ukuran keterwakilan namun akan
memiliki potensi distorsi. Secara spesifik, adanya pencilan (titik-titik data yang
berada jauh dari “kecenderungan pusat”) akan mempengaruhi mean,
menyebabkannya menjadi kurang representatif untuk nilai tengah. Dampak
pencilan akan lebih signifikan dalam data yang berjumlah sedikit karena hanya
akan ada sedikit observasi yang dapat mengatasi dampak dari nilai ekstrim

Contoh dampak data pencilan, misal: dalam suatu ujian terdapat beberapa
mahasiswa yang mendapatkan nilai 0. Dampaknya adalah nilai 0 yang terjadi akan
“menarik” mean menjauh dari titik tengah ke arah data pencilan tersebut (ke arah
nilai kecil). Sebaliknya, beberapa nilai 100 akan menarik mean ke arah nilai besar
Mean
Beberapa hal yang harus dipertimbangkan jika peneliti menggunakan mean dalam
penelitiannya

• Karena mean menggunakan seluruh pengamatan dalam kelompok data,


mengubah satu data akan mengubah mean
• Besar perubahan mean akan tergantung pada apakah nilai yang diubah berada
jauh atau dekat dari mean
• Jika suatu konstanta tertentu dikurangi atau ditambahkan pada setiap nilai data,
besaran konstanta yang sama akan dikurangi atau ditambahkan pada mean. Hal
yang sama akan terjadi pada mean jika nilai data dibagi atau dikalikan dengan
suatu konstanta tertentu
Median
• Pengukuran lain untuk tendensi sentral
• Data diurutkan dari nilai terkecil sampai terbesar
• Median adalah nilai yang tepat ada di tengah
• Jika pengamatan berjumlah ganjil, nilai median direpresentasikan dengan satu
nilai data
• Jika pengamatan berjumlah genap, median adalah rata-rata dari dua
pengamatan yang berada di tengah
• Median = (n + 1)/2
• Tidak seperti mean, median tidak dipengaruhi
Perbedaan oleh data pencilan  median dapat dipandang
sebagai besaran yang memiliki daya tahan

Mean dan karena tidak terganggu oleh data pencilan


• Mean tergantung pada jarak untuk

Median menemukan pusat dari distribusi, median


menggunakan pengamatan pada data untuk
menemukan pusat distribusi
Mode
• Median dan mean mungkin tidak secara akurat menggambarkan kelompok data
• Diperlukan ukuran tendensi sentral yang ke 3: Mode
• Mode mengukur frekuensi: mengidentifikasi data yang paling sering keluar
• Ada data yang tidak memiliki mode (setiap data hanya keluar satu kali) ada data
yang memiliki lebih dari satu mode (lebih dari satu nilai terjadi dengan frekuensi
yang banyak)
Mode
• Beberapa hal penting mengenai Mode
• Walaupun mode dipandang sebagai ukurn”pusat,” mode mungkin tidak berada di
pusat
• Seperti median, mode tidak terpengaruh oleh nilai-nilai ekstrim sehingga mode
merupakan ukuran yang memiliki daya tahan
• Mode merupakan satu-satunya ukuran tendensi sentral yang dapat digunakan
untuk menampilkan skala nominal (contoh: klasifikasi kualitatif)
Menggunakan tendensi sentral
Pertimbangan Ukuran tendensi sentral yang sesuai
Data pencilan Jika terdapat data pencilan, mean akan terganggu dan menjadi tidak
baik untuk digunakan sebagai ukuran tendensi sentral  median
mungkin lebih tepat digunakan untuk menjadi ukuran tendensi sentral
Jika tidak terdapat data pencilan mean dan median akan memberikan
hasil yang sama
Distribusi data • Mean dapat digunakan sebagai ukuran tendensi sentral jika data
simetris mean karena
• Dapat mengukur rata-rata dari data dan dapat direplikasi pada studi lainnya
• Dapat memberikan informasi mengenai bagaimana suatu pengamatan
dibandingkan dengan sampel secara keseluruhan (contoh, diatas atau dibawah
rata-rata)
• Median dapat digunakan sebagai ukuran tendensi sentral jika data
memiliki kemencengan
• Mode dapat digunakan jika ingin menggambarkan bentuk distribusi
Menggunakan tendensi sentral
Pertimbangan Ukuran tendensi sentral yang sesuai
Skala data Mean, median dan mode dapat digunakan jika skala data adalah
yang interval atau rasio
digunakan Median dan mode dapat digunakan jika skala data adalah ordinal
walaupun median akan lebih tepat digunakan karena memanfaatkan
skor, bukan jarak dalam pengukuran tendensi sentral
Mode
• Digunakan sebagai ukuran tendensi sentral jika skala data adalah
nominal
• Digunakan sebagai pilihan tendensi sentral jika data memiliiki lebih
dari satu mode
Interpretasi hasil statistik deskriptif

Variabel N N* Mean SE Mean StDev Minimum Q1 Median Q3 Maximum


X1 68 0 21.2647 0.7788 6.4220 10.0000 16.0000 20.0000 24.7500 37.0000

N* = jumlah data yang hilang


Interpretasi hasil statistik deskriptif

Variabel N N* Mean SE Mean StDev Minimum Q1 Median Q3 Maximum


X1 68 0 21.2647 0.7788 6.4220 10.0000 16.0000 20.0000 24.7500 37.0000

Jumlah data: N = 68

Pusat data: Mean (21.2647) > Median (20.0000)  data menceng kanan
Distribusi data dan tendensi sentral
Kondisi distribusi Tampilan grafis Kondisi tendensi sentral
Simetris, unimodal Mean = Median = Mode

Bimodal Mean mungkin = Median, namun ada


dua mode (mungkin lebih 
multimodal)

Menceng kiri (menceng Mean < Median < Mode


negatif)

Menceng kanan (menceng Mean > Median > Mode


positif)
Distribusi data dan tendensi sentral

• Mean, median, mode, dan distribusi


memberikan peneliti informasi
mengenai “pusat” dari data, namun
tidak member informasi mengenai
bagaimana “penyebaran” atau
bervariasinya data dari pusatnya
• Dua kelompok data mungkin dapat
memiliki mean yang dapat
diperbandingkan, namun tersebarnya
data atau variasi dari observasi bisa
sangat berbeda
Distribusi data dan ukuran variasi

• Distribusi data dapat memberikan informasi


umum mengenai bentuk data dan potensi
pengaruh pencilan
• Untuk lebih memahami seberapa
“tersebarnya” pengamatan dalam kelompok
data, diperlukan ukuran variasi
Ukuran Variansi
• Ukuran varians menunjukkan apakah data menyebar atau tidak menyebar
• Ukuran variabilitas menggambarkan 2 hal utama:
• Karakteristik data (apakah data berkumpul atau menyebar)
• Mengukur sampai seberapa jauh suatu nilai dapat menjadi representasi dari seluruh distribusi:
jika sekelompok data memiliki variabilitas yang kecil, hal tersebut dipandang sebagai
representasi yang baik dari populasi, sementara jika variabilitas besar, sampel yang dignakan
mungkin bukan merupakan representasi yang baik dari populasi
Mengapa penting mengukur penyebaran
data?
• Ukuran penyebaran data memberikan gambaran seberapa baikny mean menjadi
perwakilan data
• Jika nilai penyebaran data besar, mean tidak menjadi perwakilan data sebaik jika
penyebaran datanya kecil  penyebaran data yang besar menjadi indikasi adanya
perbedaan nilai yang besar antara nilai-niai individu
Ukuran Variansi
• Tiga ukuran dasar variasi:
• Rentang
• Varians
• Deviasi standar
Rentang
• Pengukuran variansi yang sederhana
• Perbedaan antara nilai terbesar dengan nilai terkecil
• Keterbatasan rentang sebagai ukuran variansi
• Hanya menggunakan 2 observasi dari data: nilai tertinggi dan nilai terendah,  hanya dapat
memberikan informasi terbatas mengenai penyebaran data (rentang yang besar mungkin
disebabkan oeh data pencilan sementara penyebaran data sebenarnyanya kecil
• Rentang tidak mempertimbangkan ukuran tendensi sentral (seperti mean): peneliti tidak
memilii informasi mengenai bagaimana setiap observasi bervariasi dari pusatnya  rentang
hanya memberikan sedikit informasi mengenai varians sebenarnya dari populasi, namun
berguna untuk pengukuran penyebaran data dengan cepat
Rentang

𝑅𝑒𝑛𝑡𝑎𝑛𝑔= 𝑁𝑖𝑙𝑎𝑖 − 𝑁𝑖𝑙𝑎𝑖


𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑠𝑖𝑡𝑒𝑟𝑏𝑒𝑠𝑎𝑟 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑠𝑖𝑡𝑒𝑟𝑘𝑒𝑐𝑖𝑙
Varians

Varians (s2) mengukur seberapa jauh jarak setiap observasi dalam kelompok data
dari mean.

Rumus varians:
S: tanda penjumlahan
2
𝑠 =
∑ ( 𝑥 𝑖 − 𝑥 )2
kuadrat jarak antara pengamatan ke i dengan mean
( 𝑛 −1 ) n: total observasi dalam sampel
n – 1: penyesuaian untuk mengakomodasi bias sampel
Interpretasi varians
Varians diinterpretasi berdasar besarannya
• Jika varians = 0, tidak ada variabilitas
terjadi pada sampel, semua observasi
pada data adalah sama dengan mean
• Varians yang kecil memberikan indikasi
bahwa observasi yang ada secara relatif
berkumpul dekat dengan mean
• Varians yang besar memberikan indikasi
bahwa observasi lebih tersebar dan lebih
jauh dari mean
Interpretasi varians
Untuk menjelaskan variasi dalam suatu kelompok data, peneliti menggunakan
mean dan deviasi

Deviasi standar merupakan akar dari varians:


Interpretasi varians
• Karena deviasi standar diturunkan dri varians, statistik ini juga mengukur seberapa
jauh masing-masing observasi dari rata-rata.
Interpretasi varians
Aturan empiris deviasi standar, mayoritas dari varians dalam suatu populasi relatif
terhadap mean: Dengan asumsi distribusi normal:
• 68.2% dari data yang diobservasi berjarak satu deviasi standar dari mean
• 95.4% dari data yang diobservasi berjarak dua deviasi standar dari mean
• 99.7% dari data yang diobservasi berjarak 3 deviasi standar dari mean
Interpretasi variansi

• Secara kolektif, rentang, varians, dan deviasi standar memberikan informasi


variabilitas atau penyebaran data
• Variabilitas adalah penting, karena mendefinisikan tingkat dispersi data dari
pusatnya
• Ukuran variansi menggambarkan hubungan antara observasi di kelompok data
dalam hubungannya dengan mean
Kesimpulan
• Statistik deskriptif berlaku sebagai titik awal dari analisi data, memungkinkan bagi
para peneliti untuk menggambarkan , mengorganisasikan, dan meringkas data
secara berarti
• Pengukuran tendensi sentral, termasuk mean, median, dan mode, memberikan
kepada peneliti informasi mengenai pusat dari kelompok data
• Pengukuran sebaran, terutama varians dan deviasi standar, memungkinkan
peneliti untuk menggambarkan penyebaran atau variabilitas dari data dan
hubungan antara observasi
• Bersama-sama, statistic deskriptif memberikan kepada peneliti informasi yang
berguna untuk melakukan analisis statistic terhadap data
Interpretasi hasil statistik deskriptif

Variabel N N* Mean SE Mean StDev Minimum Q1 Median Q3 Maximum


X1 68 0 21.2647 0.7788 6.4220 10.0000 16.0000 20.0000 24.7500 37.0000

Penyebaran data: StDev: 6.4220

• 68.2% (46.376) data yang diobservasi tersebar pada rentang 14.8427 s/d 27.6867
• 95.4% (64.872) data yang diobservasi tersebar pada rentang 8.4207 s/d 34.1087
• 99.7% (67.796) data yang diobservasi tersebar pada rentang 1.9987 s/d 40.5307
Latihan
  DER ROA CR FAR SIZE SALES
Mean 0.88 0.06 2,378.00 0.27 29,021.00 0.19
Median 0.66 0.05 1,715.00 0.25 29,276.00 0.07
Maximum 4,447.00 0.46 14,829.00 0.67 32,253.00 8,921.00
Minimum 0.08 (0.66) 0.17 - 23,045.00 (0.87)
Standar Deviasi 0.80 0.15 2,344.00 0.15 1,713.00 1,004.00
Observasi 120 120 120 120 120 120

  ROA VACA VAHU STVA VAIC


Mean 0.20 1.52 21.99 0.92 24.43
Maximum 0.93 20.02 63.90 1.29 66.22
Minimum (0.16) (0.40) (4.89) 0.28 (3.41)
Standar Deviasi 0.30 3.06 18.41 14 18.53
Observasi 40 40 40 40 40

Anda mungkin juga menyukai