Kegiatan untuk : mengumpulkan data menyajikan data menganalisis data dengan metode tertentu menginterpretasikan hasil analisis
Melalui fase
KEGUNAAN
STATISTIKA DESKRIPTIF : Berkenaan dengan pengumpulan, pengolahan, dan penyajian sebagian atau seluruh data (pengamatan) tanpa pengambilan kesimpulan
dan fase
STATISTIKA INFERENSI : Setelah data dikumpulkan, maka dilakukan berbagai metode statistik untuk menganalisis data, dan kemudian dilakukan interpretasi serta diambil kesimpulan. Statistika inferensi akan menghasilkan generalisasi (jika sampel representatif)
PERAN STATISTIKA
2. DATA KUANTITATIF : Data yang dinyatakan dalam bentuk angka Contoh : lama bekerja, jumlah gaji, usia, hasil ulangan
4. Data
DATA NOMINAL : Data berskala nominal adalah data yang diperoleh dengan cara kategorisasi atau klasifikasi. CIRI : posisi data setara tidak bisa dilakukan operasi matematika (+, -, x, :) CONTOH : jenis kelamin, jenis pekerjaan DATA ORDINAL : Data berskala ordinal adalah data yang dipeoleh dengan cara kategorisasi atau klasifikasi, tetapi di antara data tersebut terdapat hubungan CIRI : posisi data tidak setara tidak bisa dilakukan operasi matematika (+, -, x, :) CONTOH : kepuasan kerja, motivasi
DATA INTERVAL : Data berskala interval adalah data yang diperoleh dengan cara pengukuran, di mana jarak antara dua titik skala sudah diketahui. CIRI : Tidak ada kategorisasi bisa dilakukan operasi matematika CONTOH : temperatur yang diukur berdasarkan 0C dan 0F, sistem kalender
DATA RASIO : Data berskala rasio adalah data yang diperoleh dengan cara pengukuran, di mana jarak antara dua titik skala sudah diketahui dan mempunyai titik 0 absolut. CIRI : tidak ada kategorisasi bisa dilakukan operasi matematika CONTOH : gaji, skor ujian, jumlah buku
5. Pengolahan Data
PROSEDUR PENGOLAHAN DATA : A. PARAMETER : Berdasarkan parameter yang ada statistik dibagi menjadi Statistik PARAMETRIK : berhubungan dengan inferensi statistik yang membahas parameter-parameter populasi; jenis data interval atau rasio; disyaratkan adanya distribusi data normal atau mendekati normal. Statistik NONPARAMETRIK : inferensi statistik tidak membahas parameter-parameter populasi; jenis data nominal atau ordinal; tidak disyaratkan adanya distribusi data normal
B.
JUMLAH VARIABEL : berdasarkan jumlah variabel dibagi menjadi Analisis UNIVARIAT : hanya ada 1 pengukuran (variabel) untuk n sampel atau beberapa variabel tetapi masing-masing variabel dianalisis sendiri-sendiri. Contoh : korelasi motivasi dengan pencapaian akademik. Analisis MULTIVARIAT : dua atau lebih pengukuran (variabel) untuk n sampel di mana analisis antar variabel dilakukan bersamaan. Contoh : pengaruh motivasi terhadap pencapaian akademik yang dipengaruhi oleh faktor latar belakang pendidikan orang tua, faktor sosial ekonomi, faktor sekolah.
6. Pengolahan Data
MULAI
Tidak normal
Statistik Non Parametrik Jenis Data ?
Analisis Univariat
SATU
Jumlah Variabel ?
DUA / LEBIH
Analisis Multivariat
7. Penyajian Data
TABEL
Tabel 1.1 Bidang Pekerj aan berdasarkan Latar Belakang Pendidikan Count pendidikan SMU Akademi 1 8 1 4 3 2 14 3 4 10 30 Sarjana 6 7 5 11 6 35 Jumlah 15 8 12 27 13 75
bidang pekerjaan
Jumlah
GRAFIK
bidang pe kerjaa n
administrasi personalia produksi marketing keuangan Pies show counts
8. Membuat Tabel
TABEL : memberikan informasi secara rinci. Terdiri atas kolom dan baris Kolom pertama : LABEL KOLOM Kolom kedua . n : Frekuensi atau label Berisikan data berdasarkan kolom
TABEL
BARIS Tabel Tabulasi Silang
Prestasi Kerja Bidang pekerjaan Sangat jelek Jelek Cukup baik Baik Sangat baik Jumlah
Administrasi
Personalia Produksi Marketing Keuangan Jumlah
9. Membuat Grafik
GRAFIK : memberikan informasi dengan benar dan cepat, tetapi tidak rinci. Syarat : 1. Pemilihan sumbu (sumbu tegak dan sumbu datar), kecuali grafik lingkaran 2. Penetapan skala (skala biasa, skala logaritma, skala lain) 3. Ukuran grafik (tidak terlalu besar, tinggi, pendek) Jenis Grafik :
4
Sumbu tegak
3 2 1 0 Titik pangkal
20
20
10
10
Count
Jumlah
bidang pekerjaan
bidang pekerjaan
700000
600000
personalia
500000
Jenis kelamin
400000 laki-laki 300000 sangat jelek jelek cukup baik baik sangat baik w anita
marketing produksi
prestasi kerja
11. Frekuensi
FREKUENSI : banyaknya data untuk satu kelompok/klasifikasi
KELOMPOK Kelompok ke-1 Kelompok ke-2 Kelompok ke-3 Kelompok ke-i Kelompok ke-k FREKUENSI f1 f2 f3 fi fk k n = fi i=1 PEKERJAAN Administrasi Personalia Produksi Marketing Keuangan FREKUENSI 18 8 19 27 13 85
k n = fi = f1 + f2 + f3 +.. + fi + + fk i=1
30
31 33 35
15
3 5 1
28 29
30 31 32 - 33 34 - 35
7
18 5 1
X + X2 + X3 + + Xn X= 1 n
n Xi
i =1
n
Bila terdapat sekumpulan bilangan di mana masing-masing bilangannya memiliki frekuensi, maka rata-rata hitung menjadi : k Xifi X f + X2 f2 + X3 f3 + + Xkfk X= 1 1 i =1
f 1 + f2 + f 3 + + f k
Cara menghitung :
Bilangan (Xi) 70 63 85 Jumlah Frekuensi (fi) 3 5 2 10 Xi fi 210 315 170 695
k fi
i =1
Maka :
X = 695 = 69.5
10
14. Median
MEDIAN : nilai tengah dari sekumpulan data setelah diurutkan yang fungsinya membantu memperjelas kedudukan suatu data. Contoh : diketahui rata-rata hitung nilai ulangan dari sejumlah siswa adalah 6.55. Pertanyaannya adalah apakah siswa yang memperoleh nilai 7 termasuk istimewa, baik, atau biasa-biasa saja ? Jika nilai ulangan tersebut adalah : 10 10 8 7 7 6 5 5 5 5 4, maka rata-rata hitung = 6.55, median = 6 Kesimpulan : nilai 7 termasuk kategori baik sebab berada di atas rata-rata hitung dan median (kelompok 50% atas) Jika nilai ulangan tersebut adalah : 8 8 8 8 8 8 7 5 5 4 3, maka rata-rata hitung = 6.55, median = 8 Kesimpulan : nilai 7 termasuk kategori kurang sebab berada di bawah median (kelompok 50% bawah) Jika sekumpulan data banyak bilangannya genap (tidak mempunyai bilangan tengah) Maka mediannya adalah rerata dari dua bilangan yang ditengahnya. Contoh : 1 2 3 4 5 6 7 8 8 9 maka median (5+6) : 2 = 5.5
15. Modus
MODUS : bilangan yang paling banyak muncul dari sekumpulan bilangan, yang fungsinya untuk melihat kecenderungan dari sekumpulan bilangan tersebut. Contoh : nilai ulangan 10 10 8 7 7 6 5 5 5 5 4 Maka : s = 6 ; k = 3 ; p =2 rata-rata hitung = 6.55 ; median = 6 modus = 5 ; kelas modus = 5 - 7
Nilai Frekuensi Nilai 8 10 57 24 Jumlah Frekuensi 3 7 1 11
10
8 7 6 5 4 Jumlah
2
1 2 1 4 1 11
Mo Me
Kurva positif apabila rata-rata hitung > modus / median Kurva negatif apabila rata-rata hitung < modus / median
Rata-rata
Deviasi Rata-rata : penyebaran Berdasarkan harga mutlak simpangan bilangan-bilangan terhadap rataratanya.
Kelompok B Nilai X X - X |X X|
100 100 100 90 45 45 45 35 45 45 45 35
60
5
-5 -15 -25 -35 -45 0
5
5 15 25 35 45 250
80
30 20 10 10 10 Jumlah
25
-25 -35 -45 -45 -45 0
25
25 35 45 45 45 390
Rata-rata
50 40 30 20 10 Jumlah
RS = 250 = 25 10
Rata-rata
Deviasi Standar : penyebaran berdasarkan akar dari varians ; menunjukkan keragaman kelompok data n 2 (Xi X) i=1 n-1
10
Jumlah
-45
2025
8250
10
Jumlah
-45
2025
15850
s=
s=
8250 9 = 30.28
s=
15850 9 = 41.97
Kesimpulan : Kelompok A : rata-rata = 55 ; RS = 25 ; s = 30.28 Kelompok B : rata-rata = 55 ; RS = 39 ; s = 41.97 Maka data kelompok B lebih tersebar daripada kelompok A
-3s
-2s
-s
+s +2s +3s
Lakukan uji normalitas Rasio Skewness & Kurtosis berada 2 sampai +2 nilai Rasio = Standard error
Jika tidak berdistribusi normal, lakukan uji melalui non parametrik (Wilcoxon, Mann-White, Tau Kendall)
TERARAH(SATU EKOR) Siswa yang belajar bahasa lebih serius daripada siswa yang belajar IPS Siswa yang belajar bahasa tidak menunjukkan kelebihan keseriusan daripada yang belajar IPS Ho : b < i Ha : b > i
TIDAK TERARAH(DUA EKOR) Ada perbedaan keseriusan siswa antara yang belajar bahasa dengan yang belajar IPS Tidak terdapat perbedaan keseriusan belajar siswa antara bahasa dan IPS Ho : b = i Ha : b I
Pengujian signifikansi dua arah (hipotesis tidak terarah): Tidak terdapat perbedaan keseriusan belajar siswa antara bahasa dan IPS Ho : b = i Jika Ho ditolak, maka Ha diterima ; daerah penolakan bisa berada di sebelah kiri atau kanan
22. Uji t
Uji t : menguji apakah rata-rata suatu populasi sama dengan suatu harga tertentu atau apakah rata-rata dua populasi sama/berbeda secara signifikan. 1. Uji t satu sampel Menguji apakah satu sampel sama/berbeda dengan ( - ) rata-rata populasinya t = hitung rata-rata dan std. dev (s) s / n df = n 1 tingkat signifikansi ( = 0.05) pengujian apakah menggunakan 1 ekor atau 2 ekor diperoleh t hitung ; lalu bandingkan dengan t tabel : jika t hitung > t tabel Ho ditolak Contoh : Peneliti ingin mengetahui apakah korban yang mengalami kerugian paling besar memang berbeda dibandingkan dengan korban lainnya. Ho : k1 = k2 Diperoleh = 2.865.625 ; std. Dev = 1.789.112,5 ; df = 79 ; t hitung = -22.169 Berdasarkan tabel df=79 dan = 0.05 diperoleh t tabel = 1.6644 Kesimpulan : t hitung > t tabel sehingga Ho ditolak korban yang mengalami kerugian paling besar secara signifikan berbeda dengan korban lainnya
23. Uji t
2. Uji t dua sampel bebas Menguji apakah rata-rata dua kelompok yang tidak berhubungan sama/berbeda
(X Y) Sx-y
t=
Di mana
Sx-y =
Contoh : Peneliti ingin mengetahi apakah ada perbedaan penghasilan setelah bencana antara korban ringan dengan korban berat Ho : Pr = Pb Diperoleh : = 1547368 ; y = 1537500 ; t hitung = .066 Uji t independent sample Berdasarkan tabel df=53 dan = 0.05 diperoleh t tabel = 1.6741 Kesimpulan : t hitung < t tabel sehingga Ho diterima tidak ada perbedaan yang signifikan penghasilan setelah bencana antara korban ringan dengan korban berat
24. Uji t
3. Uji t dua sampel berpasangan Menguji apakah rata-rata dua sampel yang berpasangan sama/berbeda D t= s D Di mana D = rata-rata selisih skor pasangan
sD =
d2 N(N-1)
d2
D2 (D)2 N
Contoh : Seorang guru ingin mengetahui perbaikan terhadap pengembangan model pembelajaran debat. Setelah selesai pembelajaran pertama, ia memberikan tes dan setelah selesai pembelajaran kedua kembali ia memberikan tes. Kedua hasil tes tersebut dibandingkan dengan harapan adanya perbedaan rata-rata tes pertama dengan kedua. Ho : t1 = t2 Diperoleh t1 = 51.36 ; t2 = 52.55 ; korelasi 0.873 Korelasi sangat erat dan benar-benar berhubungan dengan nyata
Berdasarkan tabel df=21 dan = 0.05 diperoleh t tabel = 1.7207 Kesimpulan : t hitung < t tabel sehingga Ho diterima Tidak ada perbedaan yang signifikan antara hasil tes pertama dengan hasil tes kedua, sehingga ia menyimpulkan model masih belum diimplementasikan dengan baik
POSITIF makin besar nilai variabel 1 menyebabkan makin besar pula nilai variabel 2 Contoh : makin banyak waktu belajar, makin tinggi skor ulangan korelasi positif antara waktu belajar dengan nilai ulangan
NEGATIF makin besar nilai variabel 1 menyebabkan makin kecil nilai variabel 2 contoh : makin banyak waktu bermain, makin kecil skor ulangan korelasi negatif antara waktu bermain dengan nilai ulangan
NOL tidak ada atau tidak menentunya hubungan dua variabel contoh : pandai matematika dan jago olah raga ; pandai matematika dan tidak bisa olah raga ; tidak pandai matematika dan tidak bisa olah raga korelasi nol antara matematika dengan olah raga
r=
Di mana : XY X2 Y2 N=
= jumlah perkalian X dan Y = jumlah kuadrat X = jumlah kuadrat Y banyak pasangan nilai
Contoh : 10 orang siswa yang memiliki waktu belajar berbeda dites dengan tes IPS Siswa : A B C D E F G H I J Waktu (X) : 2 2 1 3 4 3 4 1 1 2 Tes (Y) : 6 6 4 8 8 7 9 5 4 6 Apakah ada korelasi antara waktu belajar dengan hasil tes ?
Siswa
A B 2 2
X
4 4
X2
6 6
Y
36 36
Y2
12 12
XY
X2
Y2
XY
rp = 1 -
6d2 N(N2 1)
Di mana :
Contoh : 10 orang siswa yang memiliki perilaku (sangat baik, baik, cukup, kurang) dibandingkan dengan tingkat kerajinannya (sangat rajin, rajin, biasa, malas) Siswa : A B C D E F G H I J Perilaku : 2 4 1 3 4 2 3 1 3 2 Kerajinan : 2 4 1 4 4 3 2 1 2 3 Apakah ada korelasi antara perilaku siswa dengan kerajinannya ?
Siswa Perilaku Kerajinan d A B C D
d2
d2
X2 =
(O E)2 E
Di mana
Contoh : Terdapat 20 siswa perempuan dan 10 siswa laki-laki yang fasih berbahasa Inggris, serta 10 siswa perempuan dan 30 siswa laki-laki yang tidak fasih berbahasa Inggris. Apakah ada hubungan antara jenis kelamin dengan kefasihan berbahasa Inggris ? Ho = tidak ada hubungan antara baris dengan kolom H1 = ada hubungan antara baris dengan kolom L P O E (O-E) (O-E)2 (O-E)2/E Fasih Tidak fasih a c b d
a b c d 20 10 10 30 (a+b)(a+c)/N (a+b)(b+d)/N (c+d)(a+c)/N (c+d)(b+d)/N
df = (kolom 1)(baris 1) Jika X2 hitung < X2 tabel, maka Ho diterima Jika X2 hitung > X2 tabel, maka Ho ditolak
Chi-Square Tests Value 30.605 29.160 3.412 80 df 9 9 1 Asymp. Sig. (2-sided) .000 .001 .065
pendidikan terakhir
Total
Contingency Coefficient
Hasil : tingkat signifikansi = 5% ; df = 9 ; X2 tabel = 16.919 ; X2 hitung = 30.605 ; asymp. sig = 0.000 ; contingency coeff. = 0.526 Karena : X2 hitung > X2 tabel maka Ho ditolak asymp. Sig < 0.05 maka Ho ditolak Artinya ada perbedaan tingkat pendidikan berdasarkan status maritalnya dan hal ini diperkuat dengan kuatnya hubungan yang 52.6%
Membuat tabel X2
Pada file baru, buat variabel dengan nama df Isi variabel tersebut dengan angka berurutan Buka menu transform > compute
Pada target variabel ketik chi_5 (untuk 95%) Numeric expr gunakan fungsi IDF.CHISQ (0.95,df) Tekan OK
Jki =
nj
X2
j=1 i=1
ij
J2j nj
j=1
Di mana : J = jumlah seluruh data N = banyak data k = banyak kelompok nj = banyak anggota kelompok j Jj = jumlah data dalam kelompok j
Contoh : Apakah terdapat perbedaan pandangan terhadap IPS siswa SD, SLTP, SMU ? Ho : 1 = 2 = 3 (tidak terdapat perbedaan sikap)
X1 3 4 5 4 5 X2 1 1 2 1 2 7 1.4 X3 2 2 3 3 5 15 3
Jka =
Jki =
RJKa = RJKi =
Jka
k-1 Jki N-k
= 19.73/2 = 9.865
21 4.2
= 10/15-3 = 0.833
11.838
F hitung > F tabel , maka Ho ditolak Terdapat perbedaan pandangan siswa SD, SLTP, SMU terhadap IPS
CONTOH : Apakah ada perbedaan rata-rata penghasilan sesudah bencana jika dilihat dari sumbangan yang diterima ? Ho = rata-rata penghasilan tidak berbeda dilihat dari sumbangan yang diterima
Langkah-langkah : 1. Analysis > compare mean > one way anova 2. Dependent list penghasilan (kuantitatif) ; factor sumbangan yg diterima (kualitatif) 3. Option > descriptive & homogeneity of variance diberi tanda check 4. Post hoc > bonferroni & tukey diberi tanda check 5. Ok
Pemaknaan interpretasi :
Descriptiv es penghasilan sesudah bencana Std. Deviation 528148.55 501918.73 528790.17 537006.69 95% Confidence Interval for Mean Std. Error Lw Bound Up Bound 98074.72 1140482.3 1542276 91637.40 1297580.5 1672420 115391 1511678.6 1993083 60039.17 1383620.0 1622630
N 29 30 21 80
Penghasilan sesudah bencana rata-rata paling besar diterima oleh kelompok yang mendapat sumbangan banyak Kemudian lakukan interpretasi terhadap homogenitas varians, sebagai syarat untuk pengujian asumsi uji anova
Test of Homogeneity of Variances penghasilan sesudah bencana Levene Statistic .100 df1 2 df2 77 Sig. .905
Karena probabilitas > 0.05 (lihat sig. 0.905) maka keputusan Ho diterima, artinya varians homogen sehingga pengujian anova dapat dilanjutkan
ANOVA penghasilan sesudah bencana Between Groups Within Groups Total Sum of Squares 2073242970032.8 20708475779967 22781718750000 df 2 77 79 Mean Square 1036621485016 268941243895.7 F 3.854 Sig. .025
Pengambilan keputusan berdasarkan probabilitas : Karena p (sig.) < 0.05 maka Ho ditolak, artinya penghasilan yang diterima setelah bencana berbeda berdasarkan sumbangan yang diterima
Pengambilan keputusan berdasarkan nilai F : Berdasarkan df1 = 2 (klasifikasi jumlah sumbangan yang diterima 1); dan df2 = 77 (jumlah N klasifikasi jumlah sumbangan yang diterima), maka F tabel adalah (0.05, 2, 77) = 3.13 sehingga F hitung > F tabel maka Ho ditolak penghasilan berbeda berdasarkan sumbangan yg diterima
Cara melihat F tabel : 1. Sisi horisontal : df pembilang (numerator) ; sisi vertikal : df penyebut (denominator) 2. Skor bagian atas untuk 0.05 dan skor bagian bawah untuk 0.01
Multiple Comparisons Dependent Variable: penghasilan sesudah bencana Mean Difference (J) sumbangan diterima (I-J) sedang -143620.69 banyak -411001.64* sedikit 143620.690 banyak -267380.95 sedikit 411001.642* sedang 267380.952 sedang -143620.69 banyak -411001.64* sedikit 143620.690 banyak -267380.95 sedikit 411001.642* sedang 267380.952
Tukey HSD
Bonferroni
Std. Error 135050.2 148595.3 135050.2 147551.5 148595.3 147551.5 135050.2 148595.3 135050.2 147551.5 148595.3 147551.5
Sig. .540 .019 .540 .172 .019 .172 .873 .021 .873 .222 .021 .222
95% Confidence Interval Lower Bound Upper Bound -466371.94 179130.56 -766123.91 -55879.37 -179130.56 466371.94 -620008.61 85246.70 55879.37 766123.91 -85246.70 620008.61 -474143.15 186901.77 -774674.55 -47328.73 -186901.77 474143.15 -628499.18 93737.27 47328.73 774674.55 -93737.27 628499.18
Analisis lanjutan (tukey dan bonferroni) : 1. Kolom Mean difference memperlihatkan perbedaan rata-rata (I-J) dan tanda * memperlihatkan perbedaan yang signifikan, artinya yang menerima sumbangan sedikit berbeda signifikan dengan yang menerima sumbangan banyak dalam hal penghasilannya sesudah bencana 2. Antara sumbangan yang diterima sedang tidak berbeda signifikan dengan sumbangan yang diterima sedikit atau banyak
Langkah-langkah : 1. Analysis > general linear model > multivariat 2. Dependent variables usia & penghasilan sebelum bencana (kuantitatif) ; fix factor status marital (kualitatif) 3. Option > descriptive statistic & homogeneity test diberi tanda check 4. Ok
Uji varians dilakukan 2 tahap : Tahap 1 : Pengujian terhadap varians tiap-tiap variabel dependen Ho = varians populasi identik (sama) alat analisis : Lavene Test ; keputusan : probabilitas > 0.05 maka Ho diterima
df1 3 3
df2 76 76
Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a. Design: Intercept+STATUS
Tahap 2 : Pengujian terhadap varians populasi secara keseluruhan Ho = matriks varians sama (varians populasi sama yakni keseluruhan variabel dependen) alat analisis : Boxs M ; keputusan : probabilitas > 0.05 maka Ho diterima probabilitas < 0.05 maka Ho ditolak
a Box's Test of Equality of Cov ariance Matrices
Tests the null hypothesis that the observed covariance matrices of the dependent variables are equal across groups. a. Design: Intercept+STATUS
Uji Multivariat : Ho = rata-rata vektor sampel identik (sama) alat analisis : Pillai Trace, Wilk Lambda, Hotelling Trace, Roys keputusan : probabilitas > 0.05 maka Ho diterima
c Multiv ariate Tests
Effect Intercept
STATUS
Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root
F Hypothesis df 644.853 a 2.000 a 644.853 2.000 a 644.853 2.000 a 644.853 2.000 20.517 6.000 a 22.004 6.000 23.512 6.000 b 37.552 3.000
Ho ditolak : rata-rata vektor sampel tidak identik Kesimpulan : Status marital mempunyai pengaruh terhadap penghasilan dan usia
a. Exact statistic b. The statistic is an upper bound on F that yields a lower bound on the significance level. c. Design: Intercept+STATUS
Artinya : Perubahan status marital menyebabkan terjadinya perubahan penghasilan dan penambahan usia