Statistics Note
Statistics Note
1. Jenis data
2. Distribusi data
3. Hipotesis
4. Berpasangan tidak berpasangan
5. Jumlah sample
DATA
BERPASANGAN (dihasilkan dari pengukuran objek yang sama dengan dua kondisi yang berbeda, kondisi tejo sebelum tidur
dan sesudah tidur) TIDAK BERPASANGAN (hasil dari pengukuran beberapa objek yang berbeda, biasanya satu variable yang
sama, apakah tinggi badan laki-laki dan perempuan berbeda?)
HIPOTESIS
Uji Z Uji T
N sampel HARUS N sample bisa <30 tapi harus
>30 distribusi normal
Bisa dipake N>30
- One way anova : dari satu variable (contoh petak 5,6,7,8 vs jumlah burung)
- Repeated way anova : lebih dari satu variable (petak 5,6,7,8 vs kelembaban,
jumlah burung, kelerengan dll)
Regresi logistic R 0 dan 1; contoh kehadiran kalua nilainya 0,8 ada 0.8 peluang dia
ditemukan di vegetasi seperti itu
Chi Square (seleksi habitat) Ho-nya, kalau jumlah sumberdayanya sama, luas wilayahnya
sama, harusnya persebaran satwanya juga sama (sebaran datanya sama), atau ketika ada
luas yang berbeda harusnya satwa kumpul di tempat yang luas (prediksi); seleksi ketika apa
yang diprediksi tidak sama dengan apa yang teramati (satwa terkumpul di wilayah yang
tidak terlalu besar)
Uji lanjut setelah KRUSKAL WAILIS PAIRWISE WILCOXON (sama yang atas,
untuk melihat variable yana yang signif berbeda)
Garis atas
kotak (Q3-
quartil atas)
Garis bawah
kotak (Q1-
quartil
bawah)
Garis tengah
kotak
median (Q2)
Garis bawah
minimum
Garis atas
maksimum
There is no
established
association/relationship between p-value and R-square. This all depends on the data (i.e.;
contextual).
R-square value tells you how much variation is explained by your model. So 0.1 R-square means
that your model explains 10% of variation within the data. The greater R-square the better the
model. Whereas p-value tells you about the F statistic hypothesis testing of the "fit of the
intercept-only model and your model are equal". So if the p-value is less than the significance
level (usually 0.05) then your model fits the data well.
Thus you have four scenarios:
1) low R-square and low p-value (p-value <= 0.05)
2) low R-square and high p-value (p-value > 0.05)
3) high R-square and low p-value
4) high R-square and high p-value
Interpretation:
1) means that your model doesn't explain much of variation of the data but it is significant (better
than not having a model)
2) means that your model doesn't explain much of variation of the data and it is not significant
(worst scenario)
3) means your model explains a lot of variation within the data and is significant (best scenario)
4) means that your model explains a lot of variation within the data but is not significant (model is
worthless)