Nemparaméteres módszerek
R - rangsorolásos eljárások
•
R - rangsorolásos eljárások
A kérdések a már megszokott kategóriákba sorolhatók
▪ Megváltozás
▪ Különbség
▪ Kapcsolat
Minden kérdésre fogunk módszert/módszereket tanulni
● ● x x x x x
x x x x x ● ●
● x x x ● x x
R - rangsorolásos eljárások – két független minta
•
R - rangsorolásos eljárások – két független minta
• 1 2 3 4 5 6 7 rangszámok
● x x x ● x x a
x ● ● x x x x b
● x x ● x x x c
R
1 ● ● x x x x x 3 17 x x x ● x ● x 10
2 ● x ● x x x x 4 18 x x x ● x x ● 11
3 ● x x ● x x x 5 19 x x x x ● ● x 11
4 ● x x x ● x x 6 20 x x x x ● x ● 12
5 ● x x x x ● x 7 21 x x x x x ● ● 13
6 ● x x x x x ● 8
7 x ● ● x x x x 5 Ebből látható, hogy bár a nullhipotézis, ha
8 x ● x ● x x x 6 igaz, minden eset egyformán valószínű, de
9 x ● x x ● x x 7 nem minden elrendezés jelent más fokú
10 x ● x x x ● x 8 keveredést.
11 x ● x x x x ● 9
12 x x ● ● x x x 7
13 x x ● x ● x x 8
14 x x ● x x ● x 9
15 x x ● x x x ● 10
16 x x x ● ● x x 9
R - rangsorolásos eljárások – két független minta
Ez az eloszlás ábrázolva a következő:
Így már vizsgálható, hogy
egy konkrét esethez
mekkora valószínűség
tartozik, azaz szélsőséges-e
3. nem különbözik
4. 0,05
5.
6.
7. x●xx●xx
8. R = 7
R - rangsorolásos eljárások
Ilyen módon minden feladathoz felírható a nullhipotézis eloszlása,
meghatározható a valószínűség, lehet dönteni.
Nem csak két ftl minta esetén, hanem bármilyen kérdésnél ez a gondolatmenet
végigvihető
Persze ez nagyobb elemszámú minták esetén meglehetősen macerás, táblázatok
segítenek, mert a minták elemszámainak ismeretében általános képletek
segítségével a valószínűségek meghatározhatók.
Ez következik, hogy milyen tulajdonságai vannak a rangszámoknak.
•
Rangszámok tulajdonságai
•
Rangszámok tulajdonságai
•
Két független minta összehasonlítása – Mann Whitney próba
I. Különbség jellegű kérdés
II. Független minták
Folytonos eloszlás – sorrendbe állítható adatok
III. Végrehajtási utasítás:
• A
1 20 23
B
4
2 21 24 5
3 22 27 8
6 25 28 9
7 26 29 10
1130 32 13
1231 34 15
1433 35 16
36 17
37 18
38 19
39 20
A A A B B A ... B B B
Táblázat használata
p = 0,10 (62-106)
Táblázat használata
p= 0,10 (62-106)
p=0,05 (58-110)
9. Döntés
p < 0,05
A tesztek különböznek
A táblázat kétoldali
Kétoldali kérdésnél OK
Egyoldali kérdésnél felezni kell a valószínűséget
Mann Whitney próba az ismert példára
t-próbák adatai - rangszámok
Rlányok=88,5 Rfiúk=101,5
Rlányok=88,5 kívül esik az intervallumon, tehát p < 0,05
Mann Whitney próba nagy elemszámok esetén
•
Normális közelítés, standardizálás
•
Kruskal Wallis próba
● x x o o o ● ....
Kruskal Wallis próba
•
Kruskal Wallis próba
•
példa
•
Kapcsolt rangok Kruskal Wallis próba esetén
•
Két minta is több minta
•
Friedman próba
•
Friedman próba
•
Friedman próba
•
Kapcsolt rangok Friedman próba esetén
•
Példa Friedman próbára
α β γ δ ε ζ η •
7 5 11 3 –2 0 –4
I 6 5 7 4 2 3 1
4 0 5 –2 0 3 1
II 6 2,5 7 1 2,5 5 4
12 15 19 12 12 7 10
III 4 6 7 4 4 1 2
16 20 14 13 15 10 16
IV 5,5 7 3 2 4 1 5,5
22 21 27 10 16 11 0
V 6 5 7 2 4 3 1
17 11 20 6 –3 8 11
VI 6 4,5 7 2 1 3 4,5
h=2
Így már fel tudjuk írni a kérdésünkhöz tartozó nullhipotézis eloszlását. (nincs
változás)
Az eloszlás szimmetrikus (Uannyi növ és csökk)
A két széle a levágott rész. Egyoldali/kétoldali
Van táblázat, a nullhipotézisbe tartozás
intervallumát látjuk.
Példa - Wilcoxon próba
lányok lányok különbség
• erősítés
előtt
erősítés
után
Valószínűségek
13 n
53 0,20 0,10 0,05 0,02
0,01
VII: A Wilcoxon-próba
táblázata 4 0 – 10 — — — —
5 2 – 13 0 – 15 — — —
6 3 – 18 2 – 19 0 – 21 — —
7 5 – 23 3 – 25 2 – 26 0 – 28 —
8 8 – 28 5 – 31 3 – 33 1 – 35 0
– 36
9 10 – 35 8 – 37 5 – 40 3 – 42 1
– 44
10 14 – 41 10 – 45 8 – 47 5 – 50 3
– 52
11 17 – 49 13 – 53 10 – 56 7 – 59 5
– 61
12 21 – 57 17 – 61 13 – 65 9 – 69 7
•
z
0
Példa nagy elemszám esetén a közelítésre
•
Példa nagy elemszám esetén a közelítésre
• Normális közelítés
63,5
Kapcsolt rangok kérdése két összefüggő minta esetén
•
Kapcsolat jellegű kérdés megválaszolása rangsorolásos módszerrel
•
Spearman féle rangkorrelációs együttható
•
r súly (x) szívritm
q (y)
4 59 58 2
8 68 65 6
9 69 66 7
1 52 60 3
5 60 63 5
2 53 61 4
10 70 73 11
3 56 54 1
11 75 72 10
6 61 70 9
7 64 68 8
Példa - Spearman féle rangkorrelációs együttható
•
Példa - Spearman féle rangkorrelációs együttható
•
r súly (x) szívritm
q (y)
4 59 58 2
8 68 65 6
9 69 66 7
1 52 60 3
5 60 63 5
2 53 61 4
10 70 73 11
3 56 54 1
11 75 72 10
6 61 70 9
7 64 68 8
Összefoglalva a Spearman-féle rangkorreláció tudnivalóit
•
Kendall-féle t Nincsenek kapcsolt rangok
súly (x) r szívritm (y) q
59 4 58 2
68 8 65 6
69 9 66 7
52 1 60 3
60 5 63 5
53 2 61 4
70 10 73 11
56 3 54 1
75 11 72 10
61 6 70 9
64 7 68 8
Kendall-féle t Nincsenek kapcsolt rangok
r q
4 2
8 6
9 7
1 3
5 5
2 4
10 11
3 1
11 10
6 9
7 8
Kendall-féle t Nincsenek kapcsolt rangok
• E = 8+7+ 8+ 7+ 6+ 2+ 2+ 3+ 2
E=45
F = 2+ 2+ 3+ 2+ 1
F = 10 r q
4 2
8 6
9 7
1 3
5 5
2 4
10 11
3 1
11 10
6 9
7 8
Kendall-féle t Nincsenek kapcsolt rangok
•
Kendall-féle t Nincsenek kapcsolt rangok
r q
F értékének grafikus
4 2
összeszámolása
8 6
9 7
1 3
F = 10 5 5
2 4
10 11
3 1
11 10
6 9
7 8
Kendall-féle t szignifikanciájának meghatározása, nincsenek kapcsolt rangok
•
Kendall-féle t szignifikanciájának meghatározása, ha az elemszám 12-nél
nagyobb
•
Példa, Kendall-féle t
xi yi
104 104
98 101
130 127
76 85
109 119
110 111
68 63
149 145
100 105
103 100
96 96
85 86
121 118
118 115
86 84
Példa, Kendall-féle t
Nem a rangszámokból számolunk, csak az adatok sorrendjét vesszük figyelembe,
mégis könnyebb a rangszámokkal
1 1
F = 1+1+1+2+3=8
Ezek az előző 2 3
feladat 3 4
rangszámai, 4 2
Kérdés, van a 5 5
változók között 6 7
kapcsolat 7 9
8 6
Kendall-féle t-
9 8
t
10 13
használom
11 10
12 11
13 12
14 14
15 15
Példa, Kendall-féle t
•
Kendall-féle t, ha vannak kapcsolt rangok
Először a múlt órai példán nézzük meg, hogy mit fogunk csinálni (itt még nincsenek kapcsolt rangok)
(testsúly – szívritmus)
súly (x) szívritm (y)
54 58 60 61 63 65 66 68 70 71 73
59 58
52
68 65
53
69 66
56 52 60
59 60 63
60 53 61
61 70 73
64 56 54
68 75 72
69 61 70
70 64 68
75
Kendall-féle t, ha vannak kapcsolt rangok
Először a múlt órai példán nézzük meg, hogy mit fogunk csinálni (itt még nincsenek kapcsolt rangok)
(testsúly – szívritmus)
súly (x) szívritm (y)
54 58 60 61 63 65 66 68 70 72 73
59 58
52 1 68 65
53 1 69 66
56 1 52 60
59 1 60 63
60 1 53 61
61 1 70 73
64 1
56 54
68
75 72
1
61 70
69 1
64 68
70 1
75 1 Ebből már a kontingencia
táblázatoknál megismert módon
E=8+7+8+7+6+2+2+3+2=45 lehet E-t és F-et számolni
F=2+2+3+2+1=10
Kendall-féle t, ha vannak kapcsolt rangok
Az előző eljárás természetes módon akkor is alkalmazható, ha vannak kapcsolt
rangok, azaz egyforma mintaelemek.
A B A B 13 14 15 16 17
5 13
2 I
6 14
5 14 3 I I
3 15 4 I I
4 13 5 I III
5 14
6 I
3 16
2 17 Nem tudjuk a
5 14 szignifikanciát
megállapítani
4 13 (nem ismerjük
az elméleti
eloszlást)
A paraméteres és a rangsorolásos próbák összehasonlítása
Melyik próba erősebb?
α elsőfajta hiba
β második fajta hiba
1-β a próba ereje
Minden próbához kiszámolható, hogy legalább mekkora elemszám kell ahhoz,
hogy a hatást kimutathassuk.
A relatív erő jelenti két próba esetén ezen elemszámok hányadosát (százalékban)
Úgy adjuk meg, hogy az erősebbhez viszonyítjuk a gyengébbet.
párosított t 63,7%
ftl mintás t
2/π