Anda di halaman 1dari 11

Budi Purnomo

08562926388

KULIAH 3 KAMIS 2 MARET 2017

Pengertian Statistika
Rata-rata lama mahasiswa s2 belajar di perpustakaan, di Indonesia, Juli 2017

Asumsikan ada 2juta mahasiswa s2 di Indonesia. Dalam sehari bisa menemui 20 maka penelitian
tersebut selesai dalam waktu 273.973 tahun :D

Maka perlu adanya sampling missal sampling 190 orang. Jika sehari dapat diteliti 20 orang, maka
dalam 5 hari pengambilan data dapat selesai.

Maka Statistika ialah alat menganalisis data dan menguji hipotesis dengan secara lebih murah.

- Do able
- Cheaply

Hipotesis: pernyataan tentang karakteristik populasi yang akan dibuktikan

UJI HIPOTESIS
Menguji hipotesis. Apa yang dilakukan? Menilai sampel dan menggenalisir kesimpulan dari sampel
untuk populasi. Tujuannya jelas: melakukan INDUKSI.

Menguji hipotesis: proses menarik kesimpulan umum dari data sampel; membuat kesimpulan RASA
SELURUH SUP dengan dasar data sampel.

Apa beda hasil uji hipotesis dimana sampel Anda random vs sampel yang tidak random? Sampel yang
random memberikan kesimpulan yang lebih luas wilayahnya. Missal sampel adala perusahaan di Pulau
Jawa, jika sampel diambil random, kesimpulan dapat digeneralisir seluruh wilayah Indonesia. Namun jika
sampel tidak random, hanya terbatas pulau Jawa.

Uji Beda Dua Rata-rata


Teori high yield high risk. Data yang diperlukan: laba industri risiko tinggi dan laba industry risiko rendah.

Risiko tinggi: produk minuman

Risiko rendah: seng

Langkah:
1. Setelah memahami pokok masalah, peneliti harus menyusun dua hipotesis yakni Hipotesis nol
(Ho) dan Hipotesis alternative (Ha atau H1). Hipotesis nol: netral (bahasa hokum: asas praduga
tak bersalah). Kita mulai meneliti dengan tidak menyalahkan.
Ho: laba di industri risiko tinggi=laba di industri risiko rendah
Ho:
H1:
2. Menetapkan berapa persen risiko kesalahan yang bersedia ditanggung yakni alpha
3. Membakukan data sampel ke dalam satuan Distribusi Normal baku.

=
2 2
+ _

4. Hitung p-value berdasar nilai z. (catatan: saat menulis Ho, sebenarnya kita sudah
menggambarkan distribusi jika Ho benar berupa distibusi berbentuk lonceng; p-value
merupakan luas di bawah kurva ekor- yang terarsir)1
a. Ambil table z
b. Pvalue = 0.5- P(0<z<4.03) = 0.0-0.5=0
5. Dengan alpha 1%2; maka pvalue<1% sehingga Ho ditolak
6. Uji normalitas!!

Bagaimana jika data tidak normal?


Ubah ke dalam normal baku

Analyze- desc-desc. Laba, save standardized vale as variable dicheck list. Kemudian singkirkan data
ekstrim yakni yang Z<-2 dan Z>2.

Data ekonomi sangat heterogen, maka perlu di logaritmakan untuk mengurangi heterogenitas. Misal
ada perusahaan dengan asset 1juta, 100juta, 1M. log 1juta=6, log 100juta=8, log 1M=12 jaraknya
menjadi lebih terpusat.

1
P-value: ukuran kekuatan dari bukti yang kita punyai melawan/menolak Ho
2
5% (1/20) berarti setiap 20 penelitian yang sama, satu di antaranya salah
KULIAH 4 JUMAT 3 MARET 2017

UJI NON PARAMETRIK


Salah satu alternatif jika data tidak berdistribusi normal ialah dengan uji non parametric.

Dalam konteks uji niliai tengah, uji non parametric yang berpadanan ialah MEDIAN BASED TEST.

Uji non parametric pada dasarnya ialah uji bagi data kualitatf. Data kualitatif:

- Tidak memiliki satuan


- Tidak memiliki angka nol alamiah

Mengapa data kualitatif harus menggunakan uji non parametric? Karena tidak bias di+/di-/di kali/ di bagi
sehingga MEAN haram dihitung sebagai ganti dari mean adalah median.

ANOVA analysis of variance


Dinamakan analisis ragam karena data sampel yang kita miliki dihitung variance-nya dua kali:

1. data sampel diperlakukan berasal dari populasi yang sama dihitung variance between groups
2. data sampel diperlakukan berasal dari populasi yang berbeda dihitung variance within
groups

pada awalnya, alat analisis ini hanya bias dipakai untuk data hasil eksperimen; namun sekarang juga
digunakan untuk data selain hasil eksperimen.

TUJUAN menguji perbedaan tiga atau lebih rata-rata

0 : 1 = 2 = 3

1 :

Mengenai hipotesis alterntif, Fisher, sang penemu ANOVA tidak memberikan kesimpulan i dan j itu
kelompok berapa (maka perlu dilakukan uji lanjut).

Langkah-langkah ANOVA

1. tetapkan hipotesis
2. tetapkan alpha
3. bakukan data sampel ke dalam satuan F (stand for Fisher)

=

DATA
Honda Yamaha Suzuki
23 32 15
30 34 29
40 39 43
46 43 18
54 40 43

Variance between groups


1. hitung rata-rata
2. hitung standar deviasi dari 3 rata-rata tsb (gunakan rumus stdev sampel)
3. kuadratkan stdev di no 2
4. = 2 dimana ni adalah banyaknya n dalam kelompok
yakni 5

Rata-rata 38.6 37.6 29.6


std of mean 4.932883
(std of mean)^2 24.33333
var between group 121.6667

Variance within groups

1. Hitung stdev tiap kelompok


2. Kuadratkan stdev tiap kelompok
2
3. =

std 12.36123 4.505552 13.29662


(std)^2 152.8 20.3 176.8
variance within
group 116.6333

121.6667
= = = 1.043
116.6333

SPSS : Analyze compare mean one way anova\


One way anova = anova satu factor -> yang mempengaruhi hanya 1 faktor yaitu merk motor.

ANOVA
jarak

Sum of Squares df Mean Square F Sig.

Between Groups 243.333 2 121.667 1.043 .382


Within Groups 1399.600 12 116.633
Total 1642.933 14

Kesimpulan: tidak menolak Ho tidak ada perbedaan jarak yang signifikan dari ketiga merk
motor
MANOVA multiple anova
Manova digunakan jika variable dependen lebih dari satu. Contoh: ingin diteliti apakah nilai
TOEFL dan skor TPA dipengaruhi oleh gender (female/male). Nilai TOEFL dan TPA
merupakan variabel dependen, dengan independen gender.
TOEFL TPA GENDER
1 500 650 Pria
2 513 660 Pria
3 520 630 Pria
4 540 617 Pria
5 550 667 Pria
6 510 650 Pria
7 500 623 Pria
8 493 600 Pria
9 520 590 Pria
10 535 620 Pria
11 600 590 Wanita
12 580 600 Wanita
13 550 612 Wanita
14 490 585 Wanita
15 525 623 Wanita
16 530 610 Wanita
17 550 590 Wanita
18 560 610 Wanita
19 570 600 Wanita
20 563 550 Wanita

SPSS Analyze General Linear Model Multivariate


Output

Multivariate Testsa

Effect Value F Hypothesis df Error df Sig.

Pillai's Trace .999 10809.925b 2.000 17.000 .000

Wilks' Lambda .001 10809.925b 2.000 17.000 .000


Intercept
Hotelling's Trace 1271.756 10809.925b 2.000 17.000 .000

Roy's Largest Root 1271.756 10809.925b 2.000 17.000 .000


Pillai's Trace .517 9.099b 2.000 17.000 .002
Wilks' Lambda .483 9.099b 2.000 17.000 .002
gender
Hotelling's Trace 1.070 9.099b 2.000 17.000 .002

Roy's Largest Root 1.070 9.099b 2.000 17.000 .002

a. Design: Intercept + gender


b. Exact statistic
KULIAH 5 JUMAT 10 MARET 2017

The central limit theorem


Jaminan bahwa apapun distribusi awal, jika sampel diambil >= 30 akan mengikuti
distribusi normal (bell shaped)

Distribusi t (t-student)
sampel kurang dari 30, berdistribusi t yang juga bell-shaped

Analisis regresi linear


Hubungan antar variable harus linear (garis lurus)
Ilustrasinya, jika analisis regresi adl rautan pensil untuk pensil yang lurus, maka data
harus pensil yang berbentuk lurus.
Lalu bagaimana jika hubungan data tidak berbentuk linear?
o Transformasi! Jika plot berpola eksponensial, transformasi log.
Intercept dalam model regresi merupakan rata-rata nilai Y in the long run
Yang kita dapatkan dari data sampel adalah SRF sample regression function
SRF lalu diuji terhadap PRF population regression function dengan uji hipotesis (uji t
untuk koefisien regresi). Jika Ho ditolak, maka sampel yang kita ambil bukan berasal dari
populasi yang Beta=0.

Analisis Regresi Sample Regression Function


Pengaruh pupuk terhadap panen padi

Excel

SPSS: analyze regression linear

Hasil:
Coefficientsa

Model Unstandardized Coefficients Standardized t Sig.


Coefficients

B Std. Error Beta

(Constant) 32.857 1.383 23.754 .000


1
pupuk .339 .031 .980 10.970 .000

a. Dependent Variable: panen

Berdasarkan uji t di atas, p-value 0.000 < 0.05 (alpha) maka pupuk significan terhadap panen.
Koefisien Beta1=0.339.

Wonacott & Wonacott : regresi sederhana (hanya satu variable) menghasilkan regresi yang
BIAS: pengaruh variable penjelas tsb seakan terlalu besar (terlihat dalam koefisien regresi).
Kenapa? Karena pasti ada variable lain yang mempengaruhi hasil panen. Walau hanya ingin
melihat pengaruh pupuk terhadap panen, harus memasukkan variable lain (disebut variable
control).

Coba kita tambahkan variable IRIGASI dan bandingkan koefisien regresi dengan regresi
sebelumnya.

Coefficientsa

Model Unstandardized Coefficients Standardized t Sig.


Coefficients

B Std. Error Beta

(Constant) 28.020 5.796 4.834 .008

1 pupuk .285 .071 .823 4.038 .016

irigasi .434 .504 .175 .861 .438

a. Dependent Variable: panen

Setelah kita tambahkan variable irigasi, Beta1 berkurang menjadi 0.285.


Analisis Regresi Population Regression Function
Dengan variable pupuk dan hasil panen, anggap setiap nilai X (pupuk) diulang berkali-kali: jika pupuk=10
apakah selalu hasil panen=35 ??? TIDAK: bisa 35, lebih dari 35, atau kurang dari 35.

Jika X yang sama diulang berkali-kali, akan didapatkan sederet nilai Y.


Maka untuk setiap nilai X, dalam scatter plot terlihat deretan Y secara vertical untuk setiap X.
Dalam setiap X, Y yang berbeda-beda itu saling INDEPENDEN no autocorrelation
Dalam setiap X, Y punya nilai rata-rata. Nah PRF adalah titik rata-rata Y untuk setiap X yang
dihubungkan menjadi satu garis lurus linearity
Nilai Y dalam setiap X, memiliki lebar yang sama (varian sama) atau homoskedastis

Anda mungkin juga menyukai