Anda di halaman 1dari 8

Statystyka

Analiza wspzalenoci

Znajc warto tej statystyki, moemy obliczy wartoci miar sucych ocenie zalenoci pomidzy cechami jakociowymi. Wspczynnik Yulea:

2
n

Wspczynnik jest rwny zeru, gdy badane cechy s niezalene. W przypadku, gdy przynajmniej jedna z badanych cech ma tylko dwa warianty, maksymalna warto wspczynnika to 1 i oznacza ona pen zaleno cech zmiennych. W oglnym przypadku warto wspczynnika moe przekroczy 1. Wspczynnik kontyngencji C Pearsona:

2 C= . n+ 2
Wspczynnik jest rwny zeru, gdy badane cechy s niezalene. Maksymalna warto wspczynnika zaley od liczby wariantw badanych cech zmiennych i dy do 1. Przy kwadratowej tablicy liczebnoci (k=r) warto maksymalna wspczynnika to:

C max =
Wspczynnik zbienoci T Czuprowa:

k . k +1

T=

2
n (r 1)(k 1)

W przypadku tablic kwadratowych (k=r) wspczynnik ten przyjmuje wartoci < 0,1 > . Wysza warto wspczynnika wskazuje na wiksz zaleno pomidzy badanymi cechami zmiennymi. Przykad 39. W oparciu o ponisze dane zbadaj, czy istnieje zwizek pomidzy miejscem staego zamieszkania a struktur ludnoci kraju wedug pci. W tym celu oblicz wspczynnik Yulea oraz wspczynnik kontyngencji C Pearsona.
Tabela 10. Ludno wedug pci i miejsca staego zamieszkania w Polsce. Stan na 30 VI 2009 r. Miejsce Pe ni. zamieszkania Mczyni Kobiety Miasto 11 032,5 12 261,4 Wie 7 390,8 7 468,7 n.j rdo: Sytuacja demograficzna Polski. Raport 2008-2009, Rzdowa Rada Ludnociowa, Warszawa 2009.

Statystyka 2 :

- 32 -

Statystyka Wspczynnik Yulea: Interpretacja:

Analiza wspzalenoci

Wspczynnik kontyngencji C Pearsona: Interpretacja:

Przykad 40. Na podstawie wynikw badania zachowa konsumenckich Polakw oce, czy wyksztacenie ma wpyw na motywy decyzji konsumenckich dotyczcych zakupu artykuw codziennego uytku. Zastosuj wspczynnik zbienoci T Czuprowa.
Tabela 11. Motywy decyzji konsumenckich a wyksztacenie Polakw. Wyksztacenie Cena 80 78 77 66 Wskazane motywy decyzji Jako Przyzwyczajenie Marka 40 35 20 53 30 29 62 36 46 61 50 49 ni.

Podstawowe Zasadnicze zawodowe rednie Wysze n.j rdo: Mania kupowania [...], Komunikat z bada CBOS, Warszawa 2011.

Statystyka 2 :

Wspczynnik zbienoci T Czuprowa: Interpretacja:


- 33 -

Statystyka

Analiza wspzalenoci jakociowymi

Specyficzn sytuacj jest ocena zalenoci pomidzy dwiema cechami dychotomicznymi. Wwczas otrzymujemy dwudzieln tablic liczebnoci empirycznych: Zmienna X 1 2 n.j Zmienna Y 1 2 a b c d a+c b+d ni. a+b c+d n

rdo: Opracowanie wasne.

W takiej sytuacji wspczynnik Yulea moemy obliczy rwnie wedug wzoru:

ad bc (a + b)(a + c)(b + d )(c + d ) ad bc . ad + bc

Moemy te posuy si wspczynnikiem Q Kendalla:


Q=

Wspczynnik ten przyjmuje wartoci < 0,1 > . Wysza warto wspczynnika wskazuje na wiksz zaleno pomidzy badanymi cechami zmiennymi. Przykad 41. W oparciu o ponisze dane zbadaj, czy istnieje zwizek pomidzy miejscem staego zamieszkania a struktur ludnoci kraju wedug pci. W tym celu oblicz wspczynnik Yulea.
Tabela 10. Ludno wedug pci i miejsca staego zamieszkania w Polsce. Stan na 30 VI 2009 r. Miejsce zamieszkania Miasto Wie Mczyni 11 032,5 7 390,8 Pe Kobiety 12 261,4 7 468,7 ni.

n.j rdo: Sytuacja demograficzna Polski. Raport 2008-2009, Rzdowa Rada Ludnociowa, Warszawa 2009.

Wspczynnik Yulea: Interpretacja:

Przykad 42. W oparciu o ponisze dane zbadaj, czy istniej rnice stosunku wobec palenia w miejscach publicznych pomidzy niepalcymi i byymi palaczami. Zastosuj wspczynnik Q Kendalla.
Tabela 12. Stosunek do zakazu palenia wrd byych palaczy i osb palcych. Stosunek do papierosw Stosunek do zakazu palenia w miejscach publicznych Popiera Nie popiera % 76 22 50 48

ni.

Byy palacz Pali regularnie n.j rdo: Postawy wobec palenia papierosw, Komunikat z bada CBOS, Warszawa 2010.

- 34 -

Statystyka Wspczynnik Q Kendalla: Interpretacja:

Analiza wspzalenoci

Badajc zwizki pomidzy wiksz ni dwie liczb cech posugujemy si tzw. korelacj i regresj wielorak. Si zwizku korelacyjnego pomidzy zmienn zalen Y a zbiorem zmiennych niezalenych X mierzy si przy pomocy wspczynnika regresji wielorakiej, ktry w przypadku dwch zmiennych niezalenych X1 oraz X2 przyjmuje posta:
Ry x1 x 2 =
2 2 ryx1 + ryx2 2ryx1 ryx2 rx1 x 2

1 rx2 x 2 1

i opiera si na wartociach wspczynnika korelacji liniowej Pearsona pomidzy odpowiednimi parami cech. Wspczynnik ten przyjmuje wartoci z przedziau < 0,1 > i informuje o sile zwizku pomidzy cech objanian Y i zbiorem cech objaniajcych X. Im wysza warto wspczynnika, tym zwizek korelacyjny pomidzy zmiennymi jest silniejszy. Przykad 43. Przeprowadzono badanie pomidzy cen (w tys. PLN) samochodw uywanych pewnej marki a ich wiekiem (w latach) oraz przebiegiem (w tys. km). Oce zaleno korelacyjn pomidzy cen a wyrnionymi cechami dotyczcymi eksploatacji samochodu.
Tabela 13. Cena a wiek i przebieg samochodw uywanych marki X. Cena Wiek Przebieg (w tys. PLN) (w latach) (w tys. km) 12 22 15 35 21 25 28 33 36 43 10 6 8 4 8 7 5 6 3 1 180 65 120 50 150 70 100 70 50 15 rdo: Dane umowne.

Wspczynniki korelacji liniowej Pearsona:

- 35 -

Statystyka

Analiza wspzalenoci

Wspczynnik korelacji wielorakiej:

Interpretacja:

Gdy na pewn cech zalen Y oddziauje wicej ni jedna cecha niezalena X, a interesuje nas jedynie zwizek korelacyjny pomidzy cech Y i jedn cech X przy wyczeniu wpywu pozostaych cech niezalenych, wwczas posugujemy si tzw. wspczynnikami korelacji czstkowej. Przyjmijmy, e mamy jedn zmienn zalen Y oraz dwie zmienne niezalene X1 oraz X2. Wspczynniki korelacji liniowej mierzce zaleno pomidzy dwiema z nich moemy zapisa jako:
ryx1 x2 ryx2 x1 rx1x2 y

Wspczynniki te liczymy wedug nastpujcych wzorw:


ryx1 x2 = ryx2 x1 = rx1x2 y = ryx1 ryx2 rx1x2
2 (1 ryx2 )(1 rx2x2 ) 1 ryx2 ryx1 rx1x2 2 (1 ryx1 )(1 rx2x2 ) 1 rx1x2 ryx1 ryx2 2 2 (1 ryx1 )(1 ryx2 )

Wspczynniki liniowej korelacji czstkowej interpretujemy analogicznie jak wspczynniki korelacji cakowitej Pearsona. W odniesieniu do tej samej pary zmiennych wspczynniki korelacji czstkowej i cakowitej mog si rni zarwno wartoci, jak i znakiem. Wspczynnik korelacji cakowitej, w przeciwiestwie do wspczynnika korelacji czstkowej, wyraa zwizek danej pary cech bez wzgldu na ewentualny zwizek z innymi cechami. Przykad 44. Na podstawie danych z przykadu 43. oblicz i zinterpretuj wspczynniki korelacji czstkowej pomidzy wyrnionymi w badaniu cechami zmiennymi.
- 36 -

Statystyka Wspczynnik korelacji czstkowej pomidzy.

Analiza wspzalenoci

Interpretacja

Wspczynnik korelacji czstkowej pomidzy

Interpretacja

Analiz korelacji wielorakiej moemy uzupeni o wielorak analiz regresji. W przypadku dwch zmiennych objaniajcych szacujemy model regresji postaci:
yi = a y + b1 x1i + b2 x2i ,

a stosujc zapis macierzowy otrzymujemy:


) Y = Xb ,

gdzie: X to macierz wartoci zmiennych objaniajcych rozszerzona o kolumn jedynek, a b to wektor parametrw rwnania regresji. Parametry funkcji regresji szacujemy metod najmniejszych kwadratw
X T Xb = X T Y .

( ( y y )
i i

min .

W wyniku zastosowania tej metody otrzymujemy ukad rwna, ktry moemy zapisa jako:

Rozwizaniem tego ukadu jest wektor b parametrw rwnania regresji:


b = ( X T X ) 1 X T Y .

Dokonujc analizy regresji, gdy mamy dwie zmienne objaniajce, moemy te zastosowa nastpujce wzory na parametry funkcji:
ryx1 ryx 2 rx1 x 2 y x1 1 rx2 x 2 1 ryx 2 ryx1 rx1 x 2 y b2 = . 1 rx2 x 2 x2 1 a y = y b1 x1 b2 x2 b1 =

Przykad 45. Na podstawie danych z przykadu 43. wyznacz funkcj regresji zalenoci ceny samochodu od jego wieku i przebiegu.

- 37 -

Statystyka Funkcja regresji:

Analiza wspzalenoci

Interpretacja:

Wyznaczanie parametrw funkcji regresji przy pomocy dziaa na macierzach:

Ocena dopasowania funkcji regresji do danych empirycznych:


Tabela 13. Cena a wiek i przebieg samochodw uywanych marki X. Cena Wiek Przebieg (w tys. PLN) (w latach) (w tys. km) 12 22 15 35 21 25 28 33 36 43 270 10 6 8 4 8 7 5 6 3 1 58 180 65 120 50 150 70 100 70 50 15 870 rdo: Dane umowne.

- 38 -

Statystyka Wspczynnik determinacji:


R2 =

Analiza wspzalenoci

Interpretacja:

Wspczynnik indeterminacji:

2 =
Interpretacja:

redni bd szacunku:
Sy =

Interpretacja:

Wspczynnik zmiennoci przypadkowej:


Wy =

Interpretacja:

Przykad 46. Na podstawie danych z przykadu 43. i oszacowanej funkcji regresji okrel teoretyczny poziom ceny samochodu czteroletniego z przebiegiem 50 tys. km.

Interpretacja:

- 39 -

Anda mungkin juga menyukai