Anda di halaman 1dari 67

Rangsorolásos eljárások

Nemparaméteres módszerek
R - rangsorolásos eljárások

R - rangsorolásos eljárások
A kérdések a már megszokott kategóriákba sorolhatók
▪ Megváltozás
▪ Különbség
▪ Kapcsolat
Minden kérdésre fogunk módszert/módszereket tanulni

Az elmélet megértéséhez a két független minta összehasonlítását nézzük meg, a


többi ehhez hasonlóan megérthető, de nem fogjuk olyan részletesen nézni
R - rangsorolásos eljárások – két független minta

● ● x x x x x

x x x x x ● ●

● x x x ● x x
R - rangsorolásos eljárások – két független minta

R - rangsorolásos eljárások – két független minta
• 1 2 3 4 5 6 7 rangszámok
● x x x ● x x a

x ● ● x x x x b

● x x ● x x x c
R
1 ● ● x x x x x 3 17 x x x ● x ● x 10
2 ● x ● x x x x 4 18 x x x ● x x ● 11
3 ● x x ● x x x 5 19 x x x x ● ● x 11
4 ● x x x ● x x 6 20 x x x x ● x ● 12
5 ● x x x x ● x 7 21 x x x x x ● ● 13
6 ● x x x x x ● 8
7 x ● ● x x x x 5 Ebből látható, hogy bár a nullhipotézis, ha
8 x ● x ● x x x 6 igaz, minden eset egyformán valószínű, de
9 x ● x x ● x x 7 nem minden elrendezés jelent más fokú
10 x ● x x x ● x 8 keveredést.
11 x ● x x x x ● 9
12 x x ● ● x x x 7
13 x x ● x ● x x 8
14 x x ● x x ● x 9
15 x x ● x x x ● 10
16 x x x ● ● x x 9
R - rangsorolásos eljárások – két független minta
Ez az eloszlás ábrázolva a következő:
Így már vizsgálható, hogy
egy konkrét esethez
mekkora valószínűség
tartozik, azaz szélsőséges-e

1. Különbözik-e a két csoport?

2. val, eloszlás alapján

3. nem különbözik

4. 0,05

5.

6.

7. x●xx●xx

8. R = 7
R - rangsorolásos eljárások
Ilyen módon minden feladathoz felírható a nullhipotézis eloszlása,
meghatározható a valószínűség, lehet dönteni.
Nem csak két ftl minta esetén, hanem bármilyen kérdésnél ez a gondolatmenet
végigvihető
Persze ez nagyobb elemszámú minták esetén meglehetősen macerás, táblázatok
segítenek, mert a minták elemszámainak ismeretében általános képletek
segítségével a valószínűségek meghatározhatók.
Ez következik, hogy milyen tulajdonságai vannak a rangszámoknak.

Előtte a rangszámok kiosztásánál felmerülő kérdések


Rangszámozás
A rangszámozás azt jelenti, hogy nagyság szerinti sorrendben beszámozzuk az
adatokat.
A legkisebbtől kezdve
Pl
1,2 3,4 4,8 5,6 6,1 9,6
1 2 3 4 5 6

Ha nincsenek sorba rendezve, kicsit jobban kell figyelni, de...


A folytonossági feltétel elvben azt jelenti, hogy nincsenek egyforma adatok, de a
gyakorlatban ez nem így van.
2 43 5 86 9
1,2 3,4 3,4 5,6 5,6 5,6 7,8 8,2 8,2 9,6
1 2,5 52,5 5 7 8,5
5 10
8,5
Rangszámok tulajdonságai


Rangszámok tulajdonságai


Rangszámok tulajdonságai

• Mi változik ezekből, ha a rangszámok


között kapcsolt rangok is vannak?

A szórás csökken, mert Q értéke


csökken

A rangszámok összege nem változik /


nem változhat, de a négyzeteinek
összege igen.
Korrekció kapcsolt rangok miatt


Két független minta összehasonlítása – Mann Whitney próba
I. Különbség jellegű kérdés
II. Független minták
Folytonos eloszlás – sorrendbe állítható adatok
III. Végrehajtási utasítás:

A két mintát egyben rangszámozni


A rangszámösszegek mutatják, hogy a minta hogyan helyezkedik el.
Táblázat segítségével valószínűséget keresünk
Pl

• A
1 20 23
B
4
2 21 24 5
3 22 27 8
6 25 28 9
7 26 29 10
1130 32 13
1231 34 15
1433 35 16
36 17
37 18
38 19
39 20

A A A B B A ... B B B
Táblázat használata
p = 0,10 (62-106)
Táblázat használata
p= 0,10 (62-106)
p=0,05 (58-110)

9. Döntés
p < 0,05
A tesztek különböznek

A táblázat kétoldali
Kétoldali kérdésnél OK
Egyoldali kérdésnél felezni kell a valószínűséget
Mann Whitney próba az ismert példára
t-próbák adatai - rangszámok

lányok erősítés előtt lányok erősítés után különbség fiúk

5,4 – 5 5,7 0,3 6,1 – 15


5,5 – 7,5 6,1 0,6 7 – 17,5
5,5 – 7,5 5,7 0,2 5,2 – 2,5
5,1 – 1 5 -0,1 6,7 – 16
5,3 – 4 6 0,7 7 – 17,5
5,8 – 13 6,3 0,5 6 – 14
5,5 – 7,5 5,9 0,4 7,5 – 19
5,7 – 12 5,4 -0,3
5,2 – 2,5 5,2 0
5,6 – 10,5 6,2 0,6
5,5 – 7,5 6 0,5
5,6 – 10,5 5,5 -0,1

Rlányok=88,5 Rfiúk=101,5
Rlányok=88,5 kívül esik az intervallumon, tehát p < 0,05
Mann Whitney próba nagy elemszámok esetén

Normális közelítés, standardizálás

p = 0,01539˙×2, mert kétoldali volt a kérdés


A feladat spss eredményei
Kapcsolt rangok MW próba esetén


Kruskal Wallis próba

● x x o o o ● ....
Kruskal Wallis próba


Kruskal Wallis próba


példa


Kapcsolt rangok Kruskal Wallis próba esetén


Két minta is több minta


Friedman próba


Friedman próba

Ha az így kapott érték nagy, azt jelenti, hogy a tényleges


érték nagyon eltér az elméletitől, (ami a nullhip), tehát
szignifikáns, a csoportok között különbséget találunk.
Friedman próba


Friedman próba


Kapcsolt rangok Friedman próba esetén


Példa Friedman próbára

α β γ δ ε ζ η •
7 5 11 3 –2 0 –4
I 6 5 7 4 2 3 1
4 0 5 –2 0 3 1
II 6 2,5 7 1 2,5 5 4
12 15 19 12 12 7 10
III 4 6 7 4 4 1 2
16 20 14 13 15 10 16
IV 5,5 7 3 2 4 1 5,5
22 21 27 10 16 11 0
V 6 5 7 2 4 3 1
17 11 20 6 –3 8 11
VI 6 4,5 7 2 1 3 4,5
h=2

Ebben az esetben a Friedman próba előjelpróbába megy át

Mi hát a két összefüggő mintára vonatkozó rangsorolásos próba?


Két összefüggő minta – Wilcoxon próba – „megváltozás” jellegű kérdés
Két összefüggő minta, tehát azok eltérését fogjuk vizsgálni. Mivel rangsorolásos
próbáról van szó, természetesen az eltérések nagyságának sorrendjét vizsgáljuk.
A végrehajtási utasítás lépései
1. Képezzük a minták különbségét – itt még az eredeti adataink vannak
2. Ahol nincs eltérés a pár értékei között, azokat kihagyjuk – változást nézünk,
ha nincs eltérés, nincs változás. Az új elemszám tehát a 0 változásokkal
csökkentett elemszám lesz
3. Most jön a rangsorolás. A változások nagysága szerint. Itt most csak azt
nézzük, hogy volt-e változás, és mekkora. Az irányával (még) nem törődünk.
Ez azt jelenti, hogy az előjel nélküli értékeket rangszámozzuk.
4. Ekkor nézzük meg, hogy mi volt „több”, emelkedés vagy csökkenés. Azaz a
rangszámösszegeket aszerint képezzük, hogy milyen irányú változást
jelentettek. Azaz a „-” előjelű változásokhoz tartozó rangszámokat adjuk
össze (R-). És a „+” előjelű változásokhoz tartozó rangszámokat. (R+)
Wilcoxon próba

Így már fel tudjuk írni a kérdésünkhöz tartozó nullhipotézis eloszlását. (nincs
változás)
Az eloszlás szimmetrikus (Uannyi növ és csökk)
A két széle a levágott rész. Egyoldali/kétoldali
Van táblázat, a nullhipotézisbe tartozás
intervallumát látjuk.
Példa - Wilcoxon próba
lányok lányok különbség
• erősítés
előtt
erősítés
után

5,4 5,7 4,5 0,3


5,5 6,1 9,5 0,6
5,5 5,7 3 0,2
5,1 5 1,5 - 0,1
5,3 6 11 0,7
5,8 6,3 7,5 0,5
5,5 5,9 6 0,4
5,7 5,4 4,5 - 0,3
5,2 5,2 0
5,6 6,2 9,5 0,6
5,5 6 7,5 0,5
5,6 5,5 1,5 - 0,1
Példa - Wilcoxon próba

Valószínűségek
13 n
53 0,20 0,10 0,05 0,02
0,01
VII: A Wilcoxon-próba
táblázata 4 0 – 10 — — — —
5 2 – 13 0 – 15 — — —
6 3 – 18 2 – 19 0 – 21 — —
7 5 – 23 3 – 25 2 – 26 0 – 28 —
8 8 – 28 5 – 31 3 – 33 1 – 35 0
– 36
9 10 – 35 8 – 37 5 – 40 3 – 42 1
– 44
10 14 – 41 10 – 45 8 – 47 5 – 50 3
– 52
11 17 – 49 13 – 53 10 – 56 7 – 59 5
– 61
12 21 – 57 17 – 61 13 – 65 9 – 69 7

z
0
Példa nagy elemszám esetén a közelítésre


Példa nagy elemszám esetén a közelítésre

• Normális közelítés

63,5
Kapcsolt rangok kérdése két összefüggő minta esetén


Kapcsolat jellegű kérdés megválaszolása rangsorolásos módszerrel


Spearman féle rangkorrelációs együttható

Persze, ha mindezt nem


tudjuk,
Q értékei a szokott módon
kiszámolhatóak
Példa - Spearman féle rangkorrelációs együttható


r súly (x) szívritm
q (y)
4 59 58 2
8 68 65 6
9 69 66 7
1 52 60 3
5 60 63 5
2 53 61 4
10 70 73 11
3 56 54 1
11 75 72 10
6 61 70 9
7 64 68 8
Példa - Spearman féle rangkorrelációs együttható


Példa - Spearman féle rangkorrelációs együttható


r súly (x) szívritm
q (y)
4 59 58 2
8 68 65 6
9 69 66 7
1 52 60 3
5 60 63 5
2 53 61 4
10 70 73 11
3 56 54 1
11 75 72 10
6 61 70 9
7 64 68 8
Összefoglalva a Spearman-féle rangkorreláció tudnivalóit

Kendall-féle t Nincsenek kapcsolt rangok
súly (x) r szívritm (y) q
59 4 58 2
68 8 65 6
69 9 66 7
52 1 60 3
60 5 63 5
53 2 61 4
70 10 73 11
56 3 54 1
75 11 72 10
61 6 70 9
64 7 68 8
Kendall-féle t Nincsenek kapcsolt rangok

r q
4 2
8 6
9 7
1 3
5 5
2 4
10 11
3 1
11 10
6 9
7 8
Kendall-féle t Nincsenek kapcsolt rangok

• E = 8+7+ 8+ 7+ 6+ 2+ 2+ 3+ 2
E=45
F = 2+ 2+ 3+ 2+ 1
F = 10 r q
4 2
8 6
9 7
1 3
5 5
2 4
10 11
3 1
11 10
6 9
7 8
Kendall-féle t Nincsenek kapcsolt rangok


Kendall-féle t Nincsenek kapcsolt rangok

r q
F értékének grafikus
4 2
összeszámolása
8 6
9 7
1 3
F = 10 5 5
2 4
10 11
3 1
11 10
6 9
7 8
Kendall-féle t szignifikanciájának meghatározása, nincsenek kapcsolt rangok


Kendall-féle t szignifikanciájának meghatározása, ha az elemszám 12-nél
nagyobb


Példa, Kendall-féle t
xi yi

104 104
98 101
130 127
76 85
109 119
110 111
68 63
149 145
100 105
103 100
96 96
85 86
121 118
118 115
86 84
Példa, Kendall-féle t
Nem a rangszámokból számolunk, csak az adatok sorrendjét vesszük figyelembe,
mégis könnyebb a rangszámokkal
1 1
F = 1+1+1+2+3=8
Ezek az előző 2 3
feladat 3 4
rangszámai, 4 2
Kérdés, van a 5 5
változók között 6 7
kapcsolat 7 9
8 6
Kendall-féle t-
9 8
t
10 13
használom
11 10
12 11
13 12
14 14
15 15
Példa, Kendall-féle t


Kendall-féle t, ha vannak kapcsolt rangok
Először a múlt órai példán nézzük meg, hogy mit fogunk csinálni (itt még nincsenek kapcsolt rangok)
(testsúly – szívritmus)
súly (x) szívritm (y)
54 58 60 61 63 65 66 68 70 71 73
59 58
52
68 65
53
69 66
56 52 60
59 60 63
60 53 61
61 70 73
64 56 54
68 75 72
69 61 70
70 64 68
75
Kendall-féle t, ha vannak kapcsolt rangok
Először a múlt órai példán nézzük meg, hogy mit fogunk csinálni (itt még nincsenek kapcsolt rangok)
(testsúly – szívritmus)
súly (x) szívritm (y)
54 58 60 61 63 65 66 68 70 72 73
59 58
52 1 68 65
53 1 69 66
56 1 52 60
59 1 60 63
60 1 53 61
61 1 70 73
64 1
56 54
68
75 72
1
61 70
69 1
64 68
70 1
75 1 Ebből már a kontingencia
táblázatoknál megismert módon
E=8+7+8+7+6+2+2+3+2=45 lehet E-t és F-et számolni
F=2+2+3+2+1=10
Kendall-féle t, ha vannak kapcsolt rangok
Az előző eljárás természetes módon akkor is alkalmazható, ha vannak kapcsolt
rangok, azaz egyforma mintaelemek.
A B A B 13 14 15 16 17
5 13
2 I
6 14
5 14 3 I I
3 15 4 I I
4 13 5 I III
5 14
6 I
3 16
2 17 Nem tudjuk a
5 14 szignifikanciát
megállapítani
4 13 (nem ismerjük
az elméleti
eloszlást)
A paraméteres és a rangsorolásos próbák összehasonlítása
Melyik próba erősebb?
α elsőfajta hiba
β második fajta hiba
1-β a próba ereje
Minden próbához kiszámolható, hogy legalább mekkora elemszám kell ahhoz,
hogy a hatást kimutathassuk.
A relatív erő jelenti két próba esetén ezen elemszámok hányadosát (százalékban)
Úgy adjuk meg, hogy az erősebbhez viszonyítjuk a gyengébbet.

kétmintás t 95,5% M-W rand. blokk 91% Friedman


egyszempontos va K-W korr t rangkorr
párosított t 3/π Wilcoxon

párosított t 63,7%
ftl mintás t
2/π

Anda mungkin juga menyukai