Analiza wspzalenoci
Znajc warto tej statystyki, moemy obliczy wartoci miar sucych ocenie zalenoci pomidzy cechami jakociowymi. Wspczynnik Yulea:
2
n
Wspczynnik jest rwny zeru, gdy badane cechy s niezalene. W przypadku, gdy przynajmniej jedna z badanych cech ma tylko dwa warianty, maksymalna warto wspczynnika to 1 i oznacza ona pen zaleno cech zmiennych. W oglnym przypadku warto wspczynnika moe przekroczy 1. Wspczynnik kontyngencji C Pearsona:
2 C= . n+ 2
Wspczynnik jest rwny zeru, gdy badane cechy s niezalene. Maksymalna warto wspczynnika zaley od liczby wariantw badanych cech zmiennych i dy do 1. Przy kwadratowej tablicy liczebnoci (k=r) warto maksymalna wspczynnika to:
C max =
Wspczynnik zbienoci T Czuprowa:
k . k +1
T=
2
n (r 1)(k 1)
W przypadku tablic kwadratowych (k=r) wspczynnik ten przyjmuje wartoci < 0,1 > . Wysza warto wspczynnika wskazuje na wiksz zaleno pomidzy badanymi cechami zmiennymi. Przykad 39. W oparciu o ponisze dane zbadaj, czy istnieje zwizek pomidzy miejscem staego zamieszkania a struktur ludnoci kraju wedug pci. W tym celu oblicz wspczynnik Yulea oraz wspczynnik kontyngencji C Pearsona.
Tabela 10. Ludno wedug pci i miejsca staego zamieszkania w Polsce. Stan na 30 VI 2009 r. Miejsce Pe ni. zamieszkania Mczyni Kobiety Miasto 11 032,5 12 261,4 Wie 7 390,8 7 468,7 n.j rdo: Sytuacja demograficzna Polski. Raport 2008-2009, Rzdowa Rada Ludnociowa, Warszawa 2009.
Statystyka 2 :
- 32 -
Analiza wspzalenoci
Przykad 40. Na podstawie wynikw badania zachowa konsumenckich Polakw oce, czy wyksztacenie ma wpyw na motywy decyzji konsumenckich dotyczcych zakupu artykuw codziennego uytku. Zastosuj wspczynnik zbienoci T Czuprowa.
Tabela 11. Motywy decyzji konsumenckich a wyksztacenie Polakw. Wyksztacenie Cena 80 78 77 66 Wskazane motywy decyzji Jako Przyzwyczajenie Marka 40 35 20 53 30 29 62 36 46 61 50 49 ni.
Podstawowe Zasadnicze zawodowe rednie Wysze n.j rdo: Mania kupowania [...], Komunikat z bada CBOS, Warszawa 2011.
Statystyka 2 :
Statystyka
Specyficzn sytuacj jest ocena zalenoci pomidzy dwiema cechami dychotomicznymi. Wwczas otrzymujemy dwudzieln tablic liczebnoci empirycznych: Zmienna X 1 2 n.j Zmienna Y 1 2 a b c d a+c b+d ni. a+b c+d n
Wspczynnik ten przyjmuje wartoci < 0,1 > . Wysza warto wspczynnika wskazuje na wiksz zaleno pomidzy badanymi cechami zmiennymi. Przykad 41. W oparciu o ponisze dane zbadaj, czy istnieje zwizek pomidzy miejscem staego zamieszkania a struktur ludnoci kraju wedug pci. W tym celu oblicz wspczynnik Yulea.
Tabela 10. Ludno wedug pci i miejsca staego zamieszkania w Polsce. Stan na 30 VI 2009 r. Miejsce zamieszkania Miasto Wie Mczyni 11 032,5 7 390,8 Pe Kobiety 12 261,4 7 468,7 ni.
n.j rdo: Sytuacja demograficzna Polski. Raport 2008-2009, Rzdowa Rada Ludnociowa, Warszawa 2009.
Przykad 42. W oparciu o ponisze dane zbadaj, czy istniej rnice stosunku wobec palenia w miejscach publicznych pomidzy niepalcymi i byymi palaczami. Zastosuj wspczynnik Q Kendalla.
Tabela 12. Stosunek do zakazu palenia wrd byych palaczy i osb palcych. Stosunek do papierosw Stosunek do zakazu palenia w miejscach publicznych Popiera Nie popiera % 76 22 50 48
ni.
Byy palacz Pali regularnie n.j rdo: Postawy wobec palenia papierosw, Komunikat z bada CBOS, Warszawa 2010.
- 34 -
Analiza wspzalenoci
Badajc zwizki pomidzy wiksz ni dwie liczb cech posugujemy si tzw. korelacj i regresj wielorak. Si zwizku korelacyjnego pomidzy zmienn zalen Y a zbiorem zmiennych niezalenych X mierzy si przy pomocy wspczynnika regresji wielorakiej, ktry w przypadku dwch zmiennych niezalenych X1 oraz X2 przyjmuje posta:
Ry x1 x 2 =
2 2 ryx1 + ryx2 2ryx1 ryx2 rx1 x 2
1 rx2 x 2 1
i opiera si na wartociach wspczynnika korelacji liniowej Pearsona pomidzy odpowiednimi parami cech. Wspczynnik ten przyjmuje wartoci z przedziau < 0,1 > i informuje o sile zwizku pomidzy cech objanian Y i zbiorem cech objaniajcych X. Im wysza warto wspczynnika, tym zwizek korelacyjny pomidzy zmiennymi jest silniejszy. Przykad 43. Przeprowadzono badanie pomidzy cen (w tys. PLN) samochodw uywanych pewnej marki a ich wiekiem (w latach) oraz przebiegiem (w tys. km). Oce zaleno korelacyjn pomidzy cen a wyrnionymi cechami dotyczcymi eksploatacji samochodu.
Tabela 13. Cena a wiek i przebieg samochodw uywanych marki X. Cena Wiek Przebieg (w tys. PLN) (w latach) (w tys. km) 12 22 15 35 21 25 28 33 36 43 10 6 8 4 8 7 5 6 3 1 180 65 120 50 150 70 100 70 50 15 rdo: Dane umowne.
- 35 -
Statystyka
Analiza wspzalenoci
Interpretacja:
Gdy na pewn cech zalen Y oddziauje wicej ni jedna cecha niezalena X, a interesuje nas jedynie zwizek korelacyjny pomidzy cech Y i jedn cech X przy wyczeniu wpywu pozostaych cech niezalenych, wwczas posugujemy si tzw. wspczynnikami korelacji czstkowej. Przyjmijmy, e mamy jedn zmienn zalen Y oraz dwie zmienne niezalene X1 oraz X2. Wspczynniki korelacji liniowej mierzce zaleno pomidzy dwiema z nich moemy zapisa jako:
ryx1 x2 ryx2 x1 rx1x2 y
Wspczynniki liniowej korelacji czstkowej interpretujemy analogicznie jak wspczynniki korelacji cakowitej Pearsona. W odniesieniu do tej samej pary zmiennych wspczynniki korelacji czstkowej i cakowitej mog si rni zarwno wartoci, jak i znakiem. Wspczynnik korelacji cakowitej, w przeciwiestwie do wspczynnika korelacji czstkowej, wyraa zwizek danej pary cech bez wzgldu na ewentualny zwizek z innymi cechami. Przykad 44. Na podstawie danych z przykadu 43. oblicz i zinterpretuj wspczynniki korelacji czstkowej pomidzy wyrnionymi w badaniu cechami zmiennymi.
- 36 -
Analiza wspzalenoci
Interpretacja
Interpretacja
Analiz korelacji wielorakiej moemy uzupeni o wielorak analiz regresji. W przypadku dwch zmiennych objaniajcych szacujemy model regresji postaci:
yi = a y + b1 x1i + b2 x2i ,
gdzie: X to macierz wartoci zmiennych objaniajcych rozszerzona o kolumn jedynek, a b to wektor parametrw rwnania regresji. Parametry funkcji regresji szacujemy metod najmniejszych kwadratw
X T Xb = X T Y .
( ( y y )
i i
min .
W wyniku zastosowania tej metody otrzymujemy ukad rwna, ktry moemy zapisa jako:
Dokonujc analizy regresji, gdy mamy dwie zmienne objaniajce, moemy te zastosowa nastpujce wzory na parametry funkcji:
ryx1 ryx 2 rx1 x 2 y x1 1 rx2 x 2 1 ryx 2 ryx1 rx1 x 2 y b2 = . 1 rx2 x 2 x2 1 a y = y b1 x1 b2 x2 b1 =
Przykad 45. Na podstawie danych z przykadu 43. wyznacz funkcj regresji zalenoci ceny samochodu od jego wieku i przebiegu.
- 37 -
Analiza wspzalenoci
Interpretacja:
- 38 -
Analiza wspzalenoci
Interpretacja:
Wspczynnik indeterminacji:
2 =
Interpretacja:
redni bd szacunku:
Sy =
Interpretacja:
Interpretacja:
Przykad 46. Na podstawie danych z przykadu 43. i oszacowanej funkcji regresji okrel teoretyczny poziom ceny samochodu czteroletniego z przebiegiem 50 tys. km.
Interpretacja:
- 39 -