Anda di halaman 1dari 40

STATISTIKA – Obrazci in postopki

Avtor: dr. Žiga Andoljšek

Recenzent: Izr.prof.dr. Srečko Devjak

Založnik: Fakulteta za upravo Univerze v Ljubljani


Tehnično urejanje in prelom: dr. Žiga Andoljšek

September 2004

CIP - Kataložni zapis o publikaciji


Narodna in univerzitetna knjižnica, Ljubljana

311.2

ANDOLJŠEK, Žiga
Statistika : obrazci in postopki / Žiga Andoljšek. - V Ljubljani :
Fakulteta za upravo, 2004

ISBN 961-6139-55-X

216151296
Kazalo

Kazalo ............................................................................................................................... i
Predgovor ......................................................................................................................... 1
1. Temeljni pojmi.............................................................................................................. 2
1.1. Osnovni statistični pojmi...................................................................................... 2
1.2. Prikazovanje statističnih podatkov ....................................................................... 3
2. Relativna števila ......................................................................................................... 5
2.1. Strukture .............................................................................................................. 5
2.1.1. Dvorazsežna struktura vsote vrednosti .............................................................. 6
2.1.2. Pogojne vrstične strukture vsot vrednosti .......................................................... 6
2.1.3. Pogojne stolpične strukture vsot vrednosti......................................................... 7
2.1.4. Pogojne strukture vsot vrednosti ....................................................................... 7
2.2. Koeficienti ........................................................................................................... 8
2.3. Indeksi ................................................................................................................. 8
2.4. Razlika in relativna razlika med relativnimi števili ..............................................10
3. Frekvenčne porazdelitve ............................................................................................11
4. Kvantili .....................................................................................................................12
5. Srednje vrednosti .......................................................................................................16
5.1. Aritmetična sredina .............................................................................................16
5.2. Harmonična sredina ............................................................................................19
5.3. Geometrijska sredina...........................................................................................19
5.4. Mediana ..............................................................................................................20
5.5. Modus.................................................................................................................22
6. Mere veriabilnosti, asimetrije in sploščenosti.............................................................23
6.1. Mere variabilnosti ...............................................................................................23
6.1.1. Odkloni od posamezne vrednosti ..................................................................23
6.1.2. Odkloni od povprečja....................................................................................23
6.1.3. Varianca in standardni odklon.......................................................................24
6.1.4. Relatno izraženi odkloni ...............................................................................24
6.2. Mere asimetrije ...................................................................................................25
6.3. Mere sploščenosti................................................................................................25
6.4. Odnosi med mediano, modusom in aritmetično sredino.......................................25
7. Analiza časovnih vrst.................................................................................................26
7.1. Enostavni kazalci dinamike .................................................................................26
7.2. Metoda vrste drsečih sredin.................................................................................27
7.2.1. Drseča sredina iz lihega števila vrednosti ......................................................27
7.2.2. Drseča sredina iz sodega števila vrednosti.....................................................27
7.3. Metoda najmanjše vsote kvadratov......................................................................27
7.3.1. Tehnični čas.....................................................................................................28
7.3.2. Linearni trend ..................................................................................................28
7.3.3. Ocenjevanje kakovosti trenda...........................................................................28
7.3.4. Napovedovanje ................................................................................................29
8. Analiza odvisnosti med množičnimi pojavi................................................................30
8.1. Korelacija ranga ..................................................................................................30
8.2. Linearna regresija................................................................................................30
8.3. Linearna korelacija..............................................................................................32
9. Dodatek.....................................................................................................................34
9.1. Slovar simbolov ..................................................................................................34
9.2. Pregled matematičnih in logičnih operacij ...........................................................37
Litaratura .........................................................................................................................38

i
Predgovor
Priročnik Obrazci in postopki sem pripravil z namenom, da olajšam delo študentom pri
predmetih Statistika in Kvantitativne metode. Oba obvezna metodološka predmeta se
izvajata na Fakulteti za upravo v Ljubljani. Priročnik sledi obvezni literaturi za omenjena
predmeta.

Priročnik sestoji iz treh delov. Ker se slušatelji pri Statistiki prvič srečajo z vedo so v
prvem delu pojasnjeni temeljni pojmi statističnega proučevanja. Sledi osrednji del v
katerem je zbir obrazcev, postopkov in tabel za statistično obdelavo podatkov. Tretji del v
obliki dodatka pa obsega slovar simbolov in pregled matematičnih in logičnih operacij.

Osrednji del je logično razdeljen po poglavjih in sledi učbeniku Statistika v javni upravi.
Prva poglavja obsegajo spoznanje z relativnimi števili. Sledi obdelava grupiranih
podatkov, oziroma frekvenčne porazdelitve. Nadalje priročnik omogoča seznanitev z
izračunom osnovnih statističnih parametrov, kot so srednje vrednosti ter mere variabilnosti,
asimetrije in sploščenosti. Zadnji del je namenjen bivariatni analizi. Slušatelj spozna
analizo časovnih vrst in regresijsko analizo. Če prva poglavja predstavljajo osnovo za
statistično analizo, sta sedmo in osmo poglavje tista, ki slušateljem omogočata spoznanje
instumentarija za samostojno analizo množičnih pojavov.

Pri pripravi priročnika sem si prizadeval, da bi študent pridobil, kar se da sistematičen


prikaz obrazcev in postopkov, ki jih vključujeta predmeta Statistika in Kvantitativne
metode. Izbrane metode bodo slušateljem omogočale samostojno analizo podatkov, ki jim
bodo koristile pri prirpavi diplomskih del in v praksi pri delu v javni upravi. S priročnikom
bo priprava na izpit lahko bolj vsebinska.

Zahvaljujem se recenzentu prof.dr. Srečku Devjaku, ki mi je z nasveti pomagal pri


oblikovanju končnega besedila obrazcev.

Dr. Žiga Andoljšek

1
1. Temeljni pojmi
1.1. Osnovni statistični pojmi

Statistična enota je vsak pojav, ki v času in prostoru tvori množico in je predmet


statističnega proučevanja. Statistične enote delimo na več načinov:
 realne enote, so enote, ki v realnem času in prostoru obstajajo (npr.: človek, žival,
občina, država,...);
 dogodki. so enote, ki se zgodijo v trenutku (npr.: rojstvo, smrt, poroka, nesreča,...);
 dogajanja, so enote, ki ponazarjajo aktivnost v času na nekem kraju (npr.: gradnja,
uvoz, izvoz, ustvarjanje storitev,...)

Statistična populacija, je množica istovrstnih statističnih enot.

Vsota vrednosti (agregat ali total) za številsko spremenljivko y pri negrupiranih in


grupiranih podatkih:

n
Y   yi
i 1

n
Y   f j * yj
j 1

Statistična spremenljivka je značilnost - lastnost enote, ki jo proučujemo. Ločimo več


vrst spremenljivk. Po vsebini ločimo tri vrste:
1. krajevne opisujejo kraj, ki je povezan z enoto proučevanja,
2. časovne so povezane s časom v katerem se je zgodil nek dogodek, ki je povezan s
spremenljivko,
3. stvarne ali vsebinske so vse ostale, zato jih delimo glede na to, kako lahko izražamo
njihovo vrednost:
a. opisne so spremenljivke, ki jih izrazimo opisno, besedno.
b. številske so izražene v številkah,
 zvezne dobijo v določenem razmiku vse vrednosti,
 nezvezne imajo lahko le cele vrednosti.

Statistični parameter je lastnost statistične množice (populacije).

2
1.2. Prikazovanje statističnih podatkov

Statistične podatke obdelujemo matematično z uporabo statističnih metod. Rezultat ali


parameter je točna vrednost proučevanega pojava. Za lažje proučevanje in razumevanje
proučevanega pojava si v statistiki velikokrat pomagamo z grafično metodo. Grafikone
lahko uporabljamo pred izračunom parametrov, da dobimo predstavo o proučevanem
pojavi ali pa v diagram vrišemo izračunane parametre. Poznamo sledeče oblike grafikonov
glede na parametre, ki jih želimo prikazati:

 stolpični diagram ali histogram,


 črtni diagram ali poligon,
 strukturni krog,...

Stolpični diagram – histogram

Pridelek pšenice v mio ton od leta 1996 do 2002

14
12
Pridelek pšenice

10
8
Pridelek pšenice
6
4
2
0
1996 1997 1998 1999 2000 2001 2002
Leto

3
Črtni diagram – poligon

Pridelek pšenice v mio ton od leta 1996 do 2002

14
Pridelek pšenice (mio t)

12

10

8
Pridelek pšenice
6

0
1996 1997 1998 1999 2000 2001 2002
Leto

Strukturni krog

Število zaposlenih glede na doseženo izobrazbo

Visoka

Poklicna

Visoka
Srednja
Poklicna

Srednja

4
2. Relativna števila

Primerjava absolutnih podatkov ima majhno sporočilno moč. Absolutna števila nam ne
omogočajo primerjave, poleg tega pa nam tudi ne povedo razmerja med delom in celoto.
To nam povedo relativna števila. Relativno število je logičen izraz merjenja, ko se
določena količina meri s pomočjo druge. Relativna števila nam tako omogočajo številčno
izraziti odnose med pojavi in olajšajo nam primerjanje.

Razdelimo jih na:


 strukturna števila,
 statistične koeficiente,
 indekse.

2.1. Strukture

Strukturna števila ali strukture nam dajo informacijo o sestavi določenega pojava.
Frekvenca Delež
a1 Y1 Y1 
a2 Y2 Y2 
… … …
ak Yi Yi 
… … …
Skupaj Y 100

a: j = 1,2,…,k

Yj
Strukturni delež: Y j 
Y
Y jo strukturni delež pojava za opazovano spremenljivko
Yj vrednost pojava za opazovano spremenljivko
Y total
Yj
Strukturni odstotek: Y j %  100 *
Y
Kotne stopinje: Y jst  3,6 * Y j %

Yv
Polmer strukturnega kroga: rv  rm *
Ym

5
2.1.1. Dvorazsežna struktura vsote vrednosti

Shema podatkov:

b1 b2 ... b g Skupaj
a1 Y11 Y12 ... Y1j ... Y1
a2 Y21 Y22 ... Y2j ... Y2
... ... ... ... ... ...
ak Yi1 Yi2 ... Yij ... Yi 
... ... ... ... ... ... ...
Skupaj Y 1 Y 2 ... Y j ... Y = N

a: i = 1,2,...,k
b: j = 1,2,...,g

2.1.2. Pogojne vrstične strukture vsot vrednosti

Struktura po spremenljivki v glavi tabele:

b1 b2 ... b g Skupaj
a1 Y11 Y12 ... Y1j ... 100
a2 Y21 Y22 ... Y2j ... 100
... ... ... ... ... ...
ak Yi1 Yi2 ... Yij ... 100
... ... ... ... ... ... ...
Skupaj Y 1 Y 2  ... Y j ... 100

Yij
Vrstična struktura kot delež: Yij 
Yi 

Yijo vrstična struktura kot delež


Yij vrednost pojava po spremenljivkah a in b
Yi  vrstična vsota

Yij
Vrstična struktura kot odstotek: Yij %  100  100Yij
Yi 

6
2.1.3. Pogojne stolpične strukture vsot vrednosti

Struktura po spremenljivki v glavi tabele:

b1 b2 ... b g Skupaj
a1 Y11 Y12 ... Y1j ... Y1  
a2 Y21 Y22 ... Y2j ... Y2  
... ... ... ... ... ...
ak Yi1 Yi2 ... Yij ... Yi  
... ... ... ... ... ... ...
Skupaj 100 100 ... 100 ... 100

Yij
Stolpična struktura kot delež: Yij 
Y j

Yijo stolpična struktura kot delež


Yij vrednost pojava po spremenljivkah a in b
Y j stolpična vsota

Yij
Stolpična struktura kot odstotek: Yij %  100  100Yij
Y j

2.1.4. Pogojne strukture vsot vrednosti

Struktura po spremenljivki v glavi in čelu tabele

b1 b2 ... b g Skupaj
a1 Y11 Y12 ... Y1j ... Y1  
a2 Y21 Y22 ... Y2j ... Y2  
... ... ... ... ... ...
ak Yi1 Yi2 ... Yij ... Yi  
... ... ... ... ... ... ...
Skupaj Y 1 Y 2  ... Y j ... 100

Yij Yij
Struktura po vrstici in stolpcu kot delež: Yij  
Y N
Yij
Struktura po vrstici in stolpcu kot odstotek: Yij %  100  100Yij
Y

7
2.2. Koeficienti

Statistični koeficienti ali koeficienti nam omogočajo primerjavo raznovrstnih pojavov.


Torej je koeficient neko relativno število, pri katerem primerjamo dva različna podatka, ki
morata biti v smiselno povezavi.

Y
K  E*
X

K statistični keoficient
Y primerjani podatek
X primerjalni podatek
E število, ki pove na koliko enot primerjalnega podatka računamo statistični
koeficient (100, 1.000, 10.000, itd.)

2.3. Indeksi

Pri indeksnih številih ali indeksih primerjamo dva istovrsta enakovredna pojava v različnih
časovnih obdobjih.

Časovni indeks s stalno osnovo:

Yj
I j  100 *
o Yo

Ij časovni indeks s stalno osnovo


o

Y0 osnova
Yj podatek, ki ga primerjamo z osnovo

8
Časovni indeksi s premično osnovo:

Yj
V j  100 *
Y j 1

Vj verižni indeks
Yj podatek za tekoče časovno obdobje (j)
Y j 1 podatek za predhodno časovno obdobje (j-1)

Periodični indeks

Yj, p
I j, p  100 *
j 1, p Y j 1, p

I j, p periodični indeks
j 1, p

I j, p podatek za tekoče obdobje (za časovno enoto p)


I j 1, p podatek za predhodno obdobje (za časovno enoto p)

 Preračun verižnih indeksov v indekse s stalno osnovo v smeri prihodnosti:

I j 1  V j
Ij  0
;j0
0 100

 Preračun verižnih indeksov v indekse s stalno osnovo v smeri preteklosti:

I j 1
I j  100  0
;j0
0 V j 1

 Preračun vrste indeksov s stalno osnovo v vrsto verižnih indeksov


Ij
V j  100 * o

I j 1
o

Vj verižni indeks v časovni enoti j


Ij indeks v časovni enoti j s stalno osnovo v časovni enoti o
o

I j 1 indeks v časovni enoti j-1 s stalno osnovo v časovni enoti o


o

9
2.4. Razlika in relativna razlika med relativnimi števili

Razlika med relativnimi števili: D j /   Y j  Y


Rezultat razlike dveh imenovanih števil je imenovano število, rezultat razlike dveh
neimenovanih števil pa je izražen v točkah.

Y j  Y
Dj /  
Y
Relativna razlika med relativnimi števili:
Y j  Y
D j /  %  100
Y

Rezultat relativne imenovanih ali neimenovanih števil pa je vedno izražen v odstotkih.

10
3. Frekvenčne porazdelitve

Število enot, ki po vrednosti proučevane spremenljivke ustrezajo mejam posameznega


razreda preštejemo. Število enot posameznega razreda imenujemo frekvenca razreda in
označimo s f j .

k
N   fj
j 1

k = število razredov v katere so razdeljene vse enote proučevane populacije

Širina razreda: d j  y j , zg  y j , sp

y j , sp natančna spodnja meja j-tega razreda


y j , zg natančna zgornja meja j-tega razreda

y j , sp  y j , zg
Sredina razreda: yj 
2
fj
Relativna frekvenca: f j 
N
fj
Gostota frekvence: gj 
dj
gj gostota j-tega razreda
fj frekvenca j-tega razreda
dj širina j-tega razreda

gj fj f j
Relativna gostota frekvence: g j   
N N *dj dj
Kumulativa frekvenčne porazdelitve: Fj  F j 1  f j

Fj kumulativa frekvenc j-tega razreda


Fj 1 kumulativa frekvenc (j-1)-tega razreda
fj frekvenca j-tega razreda

Kumulativa relativne frekvenčne porazdelitve: Fj  Fj1  f j

11
4. Kvantili

Kvantil yP je tista vrednost številske spremenljivke, od katere ima 100*P odstotkov enot v
populaciji manjše ali njej enake vrednosti. Poznamo mediano, kvartile, decile, centile.

Računanje iz posameznih podatkov:

A.) zanima nas vrednost spremenljivke yP;


1. posamezne vrednosti razvrstimo v ranžirno vrsto;

2. na dani kvantilni rang izračunamo ustrezni rang RP ;

RP  N  P  0,5

3. v ranžirni vrsti pogledamo, med katera ranga uvrstimo izračunani rang RP ;

R1  RP  R0

RP izračunani rang iz danega kvantilnega ranga


R1 rang pred izračunanim rangom
Ro rang za izračunanim rangom

4. na osnovi linearne interpolacije izračunamo kvantil yP , ki ustreza kvantilnemu


rangu
yP  y1  ( y0  y1 )  ( RP  R1 )

yP izračunani kvantil
y0 vrednost, ki ustreza rangu RP
y 1 vrednost, ki ustreza rangu R1
Rp izračunani rang na osnovi danega kvantilnega ranga (P)
R1 rang pred izračunanim rangom

12
B.) zanima nas delež - kvantil Py
1. posamezne vrednosti razvrstimo v ranžirno vrsto;

2. v ranžirni vrsti pogledamo, med kateri vrednoti številske spremenljivke spada dana
vrednost, za katero iščemo kvantilni rang;

y1  yP  y0

yP vrednost (kvantil) za katero iščemo kvantilni rang


y0 vrednost, ki je večja od yP
y1 vrednost, ki je manjša od yP

3. na osnovi linearne interpolacije izračunamo ustrezni rang;

( y P  y1 )
Ry  R1 
( y0  y1 )

Ry rang, ki ustreza vrednosti yP


yP vrednost (kvantil) za katero iščemo kvantilni rang
y0 vrednost, ki je večja od yP
y1 vrednost, ki je manjša od yP
R1 rang, ki ustreza vrednosti y1

4. na osnovi dobljenega ranga izračunamo še kvantini rang


(Py = (Ry-0,5)/N).

( Ry  0,5)
Py 
N

13
Računanje iz frekvenčne porazdelitve:

A.) zanima nas vrednost spremenljivke yP;


1. iz frekvenčne porazdelitve izračunamo kumulativno frekvenčno porazdelitev Fj;

2. za dani kvantilni rang izračunamo rang;

RP  N  P  0,5

3. v kumulativni frekvenčni porazdelitvi pogledamo, med kateri kumulativni


frekvenci sodi izračunani rang;

F1  RP  F0

Rp izračunani rang na osnovi danega kvantilnega ranga (P)


F1 kumulativa absolutne frekvence, ki je manjša od ranga RP
F0 kumulativa absolutne frekvence, ki je večja od ranga RP

4. razred v katerem je kvantilni Fo imenujemo kvantilni razred. Podatke v njem


označimo z yo,sp, do, fo;

5. na osnovi linearne interpolacije izračunamo kvantil.

( RP  F1 )
yP  y0, sp  d 0 
f0

Rp izračunani rang na osnovi danega kvantilnega ranga (P)


F1 kumulativa absolutne frekvence, ki je manjša od ranga RP
f0 frekvenca kvantilnega razreda
y0, sp spodnja meja kvantilnega razreda
d0 širina kvantilnega razreda

14
B.) zanima nas delež - kvantil Py

1. izračunamo kumulativno frekvenčno porazdelitev Fj,;

2. v frekvenčni porazdelitvi pogledamo, v kateri razred spada vrednost dane številske


spremenljivke. Ta razred imenujemo kvantilni razred. Ustrezne vrednosti v njem
označimo z Fo, yo,sp, do, fo;

3. na osnovi linearne interpolacije izračunamo ustrezni rang;

( y P  y0, sp )
Ry  F1  f 0 
d0

yp dana vrednost številske spremenljivke


F1 kumulativa absolutne frekvence pred kvantilnim razredom
f0 frekvenca kvantilnega razreda
y0, sp spodnja meja kvantilnega razreda
d0 širina kvantilnega razreda

4. na osnovi izračunanega ranga izračunamo še kvantini rang.

( Ry  0,5)
Py 
N

15
5. Srednje vrednosti

5.1. Aritmetična sredina

y i
 Navadna aritmetična sredina: Y  i 1


Y  M y   y - aritmetična sredina (navadna)
yi - posamezna vrednost številske spremenljivke y
N - število enot v populaciji

f
j 1
j  yj
 Tehtana aritmetična sredina: Y  k

fj 1
j


Y - tehtana aritmetična sredina
yj - sredina posameznega razreda
fj - frekvenca posameznega razreda

f
j 1
j  Yj
 Aritmetična sredina iz delnih aritmetičnih sredin: Y  k

fj 1
j


Y  My - tehtana aritmetična sredina
_
Yj - delna aritmetična sredina razredov
fj - število enot v delni populaciji (frekvenca razreda)

16
 Aritmetična sredina iz strukturnih števil in statističnih koeficientov
(Poznan je koeficient Kj in imenovalec koeficienta Xj!)

Yj
Kj 
Xj
k

X
j 1
j  Kj
K k

Xj 1
j

_
K - povrečni koeficient
Kj - koeficienti dane populacije (iz katerih računamo povprečni koeficient)
Xj - podatki v imenovalcu koeficientov za dele populacije

 Standardizirana povprečna relativna števila

Y
j 1
jA % * Y jA
YA  k

Y
j 1
jA %

Y
j 1
jA % * Y jB
YB ( SA)  k

Y j 1
jA %

17
Agregatni indeksi

LASPEYRESOV INDEKS cen in količin - standardizirano povprečje s količino in ceno iz


baznega obdobja.

k n

 p
j 1 i 1
ji  q0i
Lp  100  k n

 p
j 1 i 1
0i  q0i

k n

 q
j 1 i 1
ji  p0i
Lq  100  k n

 q
j 1 i 1
0i  p0i

q ji količine i-tega proizvoda v tekočem obdobju j


q0i količine i-tega proizvoda v osnovnem obdobju o
p ji cena i-tega proizvoda v tekočem obdobju j
p0i cena i-tega proizvoda v tekočem obdobju o

PAASCHEJEV INDEKS cen in količin - standardizirano povprečje s količino in ceno iz


tekočega obdobja.

k n

 p
j 1 i 1
ji  q ji
Pp  100  k n

 p
j 1 i 1
0i  q ji

k n

 q
j 1 i 1
ji  p ji
Pq  100  k n

 q
j 1 i 1
0i  p ji

FISCHERJEV INDEKS cen in količin

Fp  Lp  Pp
Fq  Lq  Pq

18
5.2. Harmonična sredina

N
Navadna harmonična sredina: Hy  N
1
y
i 1 i

f
j 1
j

Tehtana harmonična sredina: Hy  k fj


y
j 1 j

Harmonična sredina iz strukturnih števil in statističnih koeficientov.


(Poznana sta koeficient Kj in števec koeficienta Yj!)
k

Y j 1
j

K k Yj
K
j 1 j

_
K - povprečni koeficient
Kj - delni koeficienti (iz katerih računamo povprečni koeficient)
Yj - podatki v števcu koeficientov za dele populacije

5.3. Geometrijska sredina


Gy  N y1  y2  ...  yN
Yt
V  N V1  V2  ...  VN  100 * M
Yt  M
K N K1  K 2  ...  K N
S  V  100  100  K  100

Povprečna letna razlika


Povprečno letno razliko, ki nastopa v osnovnih enotah moramo razlikovati od povprečnega
verižnega indeksa.

_
Yt  Yt  M Y tYt  M
D t ,M  
M N 1

_
D t ,M - povprečna razlika za M časovnih enot
N - število členov
Število časovnih enot je za 1 manjše od števila členov (prva razlika nastopi med prvim in
drugim členom  šele drugi člen prispeva prvo vrednost v zaporedju razlik).
19
5.4. Mediana

A.) Izračun iz posamičnih podatkov P=0,5:

1. posamezne vrednosti razvrstimo v ranžirno vrsto;

2. na dani kvantilni rang izračunamo ustrezni rang;

R0,5  N  0,5  0,5

3. v ranžirni vrsti pogledamo, med katera ranga uvrstimo izračunani rang;

R1  R0,5  R0

R0.5 izračunani rang iz danega kvantilnega ranga za mediano


R1 rang pred izračunanim rangom
Ro rang za izračunanim rangom

4. na osnovi linearne interpolacije izračunamo kvantil, ki ustreza kvantilnemu rangu .

Me  y1  ( y0  y1 )  ( R0,5  R1 )

Me mediana
y0 vrednost, ki ustreza rangu RP
y1 vrednost, ki ustreza rangu R1
R0.5 izračunani rang na osnovi danega kvantilnega ranga (P=0.5)
R1 rang pred izračunanim rangom

20
B.) Izračun iz grupiranih podatkov P=0,5:

1. iz frekvenčne porazdelitve izračunamo kumulativno frekvenčno porazdelitev Fj;

2. za dani kvantilni rang izračunamo rang;

R0,5  N  0,5  0,5

3. v kumulativni frekvenčni porazdelitvi pogledamo, med kateri kumulativni


frekvenci sodi izračunani rang;

F1  R0,5  F0

R0,5 izračunani rang na osnovi danega kvantilnega ranga (P=0,5)


F1 kumulativa absolutne frekvence, ki je manjša od ranga RP
F0 kumulativa absolutne frekvence, ki je večja od ranga RP

4. razred v katerem je kvantilni Fo imenujemo kvantilni razred. Podatke v njem


označimo z yo,sp, do, fo;

5. na osnovi linearne interpolacije izračunamo kvantil.

( R0,5  F1 )
Me  y0, sp  d0 
f0

R0,5 izračunani rang na osnovi danega kvantilnega ranga (P=0,5)


F1 kumulativa absolutne frekvence, ki je manjša od ranga RP
f0 frekvenca kvantilnega razreda
y0, sp spodnja meja kvantilnega razreda
d0 širina kvantilnega razreda

21
5.5. Modus

Izračun iz negrupiranih podatkov:

Mo  yi , max

Izračun iz grupiranih podatkov:

Modusni razred je razred z največjo frekvenco fj. Podatke v modusnem razredu označimo
z y0,sp in f0.

( f 0  f 1 )
Mo  y0, sp  d 
(2  f 0  f 1  f 1 )

f 1 frekvenca razreda pred modusnim razredom


f0 frekvenca modusnega razreda
f 1 frekvenca razreda za modusnim razredom
y0, sp spodnja meja modusnega razreda
d širina razredov

22
6. Mere veriabilnosti, asimetrije in sploščenosti

6.1. Mere variabilnosti

6.1.1. Odkloni od posamezne vrednosti

VR  ymax  ymin
Variacijski razmik:
VR  yk , z  y1, s

Decilni razmik: DR  D9  D1

Kvartilni razmik: QR  Q3  Q1

6.1.2. Odkloni od povprečja

ADY 
y i Y
N
k

f
j 1
j yj Y
Povprečni absolutni odklon od aritmetične sredine: ADY  k

f
j 1
j

ADMe 
y i  Me
N
k
Povprečni absolutni odklon od mediane: f
j 1
j y j  Me
ADMe  k

f
j 1
j

23
6.1.3. Varianca in standardni odklon

 y 
N 2
i Y
 y2  i 1

N
Varianca in standardni odklon iz negrupiranih podatkov: y   2
y

 f y 
k 2
j j Y
j 1
 y2  k

f
j 1
j

d2
Varianca in popravljeni standardni odklon iz grupiranih podatkov:  y2, pop   y2 
12
 y , pop   y2, pop

6.1.4. Relatno izraženi odkloni

Če vsako mero množimo z 100 dobino izraženo v odstotkih!

Q3  Q1
Relativni kvantilni razmik: 
QRMe 
Me

ADY
ADY 
Relativni povprečni absolutni odklon: Y
ADMe

ADMe 
Me

y
Koeficient variacije: KVy 
Y

24
6.2. Mere asimetrije
Zanima nas asimetričnost porazdelitve. Sama normalna porazdelitev nam služi kot mera za
določanje simetričnosti.

KAMe 

3 * Y  Me 
y
Q1  Q3  2 * Me
KAQ 
Q3  Q1

Vrednosti KAMe in KAQ se gibljejo od -3 do +3. Velja pa shema

KA < 0 Porazdelitev je asimetrična v levo


KA = 0 Porazdelitev je simetrična
KA > 0 Porazdelitev je asimetrična v desno

6.3. Mere sploščenosti

Tudi pri sploščenosti proučevane porazdelitve primerjamo z normalno porazdelitvijo.

Q3  Q1
KS  1,9 
D9  D1

Velja shema
KS < 1 porazdelitev je koničasta
Koeficient je enak 1 normalna porazdelitev
KS > 1 porazdelitev je sploščena

6.4. Odnosi med mediano, modusom in aritmetično sredino

Me  Mo  Y
normalna porazdelitev

Me  Mo  Y asimetrična v desno

Me  Mo  Y asimetrična v levo

25
7. Analiza časovnih vrst

7.1. Enostavni kazalci dinamike

Absolutna razlika: Dt , M  Yt  Yt  M

Yt podatek o pojavu v časovni enoti t


Yt  M podatek o pojavu M časovnih enot pred časovno enoto t
M število obdobnih sprememb (M=N-1)

Yt  Yt  M
Povprečna absolutna razlika: Dt , M 
M

Yt  Yt  M
Relativna razlika: Dt, M 
Yt  M

Yt
Dt, M  V  M V1 * V2 * ... * VM  100 * M
Povprečna relativna razlika: Yt  M
S  V  100

Poleg navedenih razlik dinamiko pojavov kažejo tudi indeksi s stalno osnovo, verižni
indeksi, koeficienti dinamike in stopnje rasti.

Yj
Indeks s stalno osnovo: I j /   100
Y

Yj
Verižni indeks: V j  100  K j * 100  S j  100
Y j 1

Vj Yj S j  100
Koeficient dinamike: Kj   
100 Y j 1 100

Stopnja rasti: S j  V j  100  100K j  100

Povprečna stopnja rasti: S  V  100

26
7.2. Metoda vrste drsečih sredin

7.2.1. Drseča sredina iz lihega števila vrednosti

~
Drseča sredina Yt iz lihega števila obdobij je enaka:

Y r 1  ...  Yt 1  Yt  Yt 1  ...  Y r 1
~ t ( ) t( )
Yt  2 2
r

r = število obdobij

7.2.2. Drseča sredina iz sodega števila vrednosti

~
Drseča sredina Yt iz sodega števila obdobij je enaka:

Y r Y r
t t
2
 ...  Yt 1  Yt  Yt 1  ...  2
~
Yt  2 2
r

r = število drsečih sredin obdobij

7.3. Metoda najmanjše vsote kvadratov

Ta metoda je najpogosteje uporabljena. Gre pa za to, da izračunamo funkcijo, ki se kar


najbolje prilega časovni vrsti. Odkloni od trenda - osnovne smeri razvoja (funkcija trenda),
so sicer lahko pri posameznik časovnih enotah pozitivni ali negativni

 (Y  T )  0
t 1
t t

 /Y  T )
t 1
t t
2
 min

Yt = vrednost časovne spremenljivke Y proučevanem obdobju t


Tt = funkcija trenda

27
7.3.1. Tehnični čas

Pri analizi trenda si pomagamo z vrednostmi proučevane spremenljivke Yt in tehnični čas


X (x=0 v sredini časovne vrste).

x
t 1
t 0

N 1
xt  t  ; t  1,2,..., N
2

7.3.2. Linearni trend

Model: Tt     * xt   t

Funkcija trenda: Tt '     * x t


N

Y t
 t 1
Y
N
N

Y  x t t
Ocena konstante in smernega koeficienta:  t 1
N

x
t 1
t
2

7.3.3. Ocenjevanje kakovosti trenda

T   (Y  T )
t t
2

Standardni odklon trenda: N

T
Koeficient variacije trenda: KVT %  100 *
Y

28
7.3.4. Napovedovanje

a.) Enostavne metode napovedovanja nadaljnega razvoja

Napovedovanje, če bodo na opazovani pojav vplivali enaki dejavniki kot v proučevani


časovni vrsti.

a. Model napovedovanja brez sprememb - vrednost v prihodnosti bo ista kot je v


sedanjosti

Yt '1  Yt

b. Model napovedovanja na podlagi enake zadnje spremembe - povečanje ali


zmanjšanje od predzadnjega opazovanega leta do zadnjega je enako kot
napredovanje od zadnjega opazovanega leta do napovedovanega.

Dt' 1  Dt

Yt ' 1  Yt  Dt'1

c. Model napovedovanja na podlagi povprečne letne razlike

Yt '1  Yt  Dt , M

d. metoda napovedovanja na podlagi povprečnega verižnega indeksa

Yt *Vt , M
Yt '1 
100

b.) Metoda napovedovanja na osnovi enačbe linearnega trenda

Yt ' r     * xt  r

c.) Metoda napovedovanja na osnovi novejših informacij

Yt ' r  Yt  r * 
r... število časovnih enot od zadnje v proučevani časovni vrsti do napovedovanega
obdobja

29
8. Analiza odvisnosti med množičnimi pojavi

8.1. Korelacija ranga

Ko nas zanima samo groba ocena stopnje in smeri korelacijske povezanosti. Metoda
temelji na ugotavljanju mesta enote v ranžirni vrsti glede na vrednost obeh spremenljivk.
Postopek:
 uredimo enote glede na vrednost obeh spremenljivk,
 vsakemu podatku v vrsti določimo rang,
 najnižji rang pripada najmanjši vrednosti spremenljivke v vrsti, enake vrednosti
imajo enake range,
 nato za vsak par vrednosti ranga odštejemo in razlike kvadriramo.

6 *  ( R y  Rx ) 2
 yx  1 
N * ( N 2  1)

Če koeficient korelacije ranga zavzema vrednosti potem


od 0,00 do 0,20 povezave ni
nad 0,20 do 0,40 povezava je šibka
nad 0,40 do 0,70 povezava je zmerna
nad 0,70 do 1,00 povezava je močna

8.2. Linearna regresija

Ta metoda je najpogosteje uporabljena. Gre pa za to, da izračunamo funkcijo, ki se kar


najbolje prilega proučevanemu pojavu. To izberemo na način, da je vsota kvadratov
odklonov minimalna.

(y
t 1
t  yi' )2  min

yi'     * xi

A.) Regresijska premica


Model: Yi     * X i   i

Regresijska funkcija: yi'     * xi

30
Dobimo:
 regresijsko premico, ki predstavlja prvi del enačbe in kaže splošne vplive
 standardna napaka ocene pokaže odklone individualnih vrednosti od izračunane
regresijske premice - zadnji člen
 korelacijski koeficient nam pove stopnjo in smer povezave, determinacijsii
koeficient pa delež variance y-a, ki ga lahko pojacnimo z vplivom x-a.

 Y *X
C
  xy2
x
N

Izračun regresijske konstante in koeficienta: (x  X ) i


2

 x2  i 1

N
N

 ( y  Y ) * (x  X )
i i
C xy  C yx  i 1

B.) Standardna napaka ocene

(y i  Y )2
 
2
y
i 1

N
Skupni vplivi: y   2
y

(y i
'
 Y )2
 xy2  i 1

N
Pojasnjeni vplivi:  xy   xy2

( y i  yi' )2
 2y  i 1

Standardna napaka ocene ali nepojasnjeni vplivi: N


C yx2
 y   2
y    2

 x2
y

31
C.) Korelacijski koeficient

C xy
 xy 
 y * x

Če korelacijski koeficient zavzema vrednosti potem


od 0,00 do +/- 0,20 povezanosti ni
nad +/- 0,20 do +/- 0,40 je povezanost šibka
nad +/- 0,40 do +/- 0,70 je povezanost zmerna
nad +/- 0,70 do +/- 1,00 je povezanost močna

D.) Determinacijski koeficient

 xy2 C yx2
 xy2    (  xy ) 2
 y2  y2 *  x2

8.3. Linearna korelacija

Ko enega pojava ne moremo opredeliti kot jasno posledico drugega, govorimo o korelaciji.
Ne gre za vzročno-posledično odvisnost, ampak obstaja samo povezava in cilj je ugotoviti
to povezanost. Največkrat gre za povezanost pojavov na katere vplivajo isti dejavniki (isti
splošni vplivi).

Regresijski premici sta dve:

yi'  1  1 * xi
xi'   2   2 * yi

32
Shema izračunavanja linearne regresije in korelacije

I yi xi ( yi  Y ) 2 ( xi  X ) 2 ( yi  Y ) * ( xi  X )
1 y1 x1 ( y1  Y ) 2 ( x1  X ) 2 ( y1  Y ) * ( x1  X )
2 x2
y2 ( y2  Y )2 ( x2  X )2 ( y2  Y ) * ( x2  X )
... ... ... ... ... ...
N yN xN
( yN  Y ) 2
( xN  X ) 2
( yN  Y ) * ( xN  X )

y i x  i ( yi  Y ) 2  (x  X )
i
2
(y i  Y ) * ( xi  X )

1.) Izračunamo varianco za x in y


N N

 ( yi  Y ) 2  (x  X )
i
2

 y2  i 1
 x2  i 1

N N

2.) Izračunamo kovarianco


N

 ( y  Y ) * (x  X )
i i
C xy  C yx  i 1

3.) Izračunamo regresijski koeficient in konstanto


C xy C xy
1  2 
 2
¸x  ¸2y

1  Y  1 * X 2  X   2 * Y

4.) Standardna napaka ocene


C yx2 C yx2
 y   y2   x   x2 
 x2  y2

5.) Korelacijski koeficient


C xy
 xy 
 y * x

6.) Determinacijski koeficient


 xy2 C yx2
 xy2    (  xy ) 2
 y2  y2 *  x2

33
9. Dodatek

9.1. Slovar simbolov

Simbol Opis
ADY Povprečni absolutni odklon od aritmetične sredine
ADMe Povprečni absolutni odklon od mediane

ADY Relativni povprečni absolutni odklon od aritmetične sredine



ADMe Relativni povprečni absolutni odklon od mediane

dj Širina razreda
DR Decilni razmik
Dt Navadna (absolutna) razlika za časovno vrsto

Dt Relativna razlika za enot časovno enoto (izražena v deležu)


Dt % Relativna razlika za enot časovno enoto (izražena v odstotku)
Dt , M Navadna (absolutna) razlika za M časovnih enot

Dt, M Relativna razlika za M časovnih enot (izražena v deležu)

Dt ,M % Relativna razlika za M časovnih enot (izražena v odstotku)


E Število k pove, na koliko enot primerjalnega podatka
računamo statistični koeficient (na 100, 1.000, 10.000, itd.)
Fj Kumulativa frekvenc

Fj Kumulativa relativnih frekvenc

Fp Fischerjev idealni agregatni indeks cen


Fq Fischerjev idealni agregatni indeks količin
fj Frekvenca (absolutna)

f j Relativna frekvenca

gj Gostota frekvence

g j Gostota relativne frekvence

Gy Geometrijska sredina

Hy Harmonična sredina
i Indeks za enoto v populaciji (i = 1,2,...,N)
Ip Agregatni indeks cen

34
Iq Agregatni indeks količin

I j / Indeks s stalno osnovo


K Statistični koeficient
Kj Koeficient dinamike

K Povprečni koeficient dinamike


KAMo Koeficient asimetrije izračunan iz modusa
KAMe Koeficient asimetrije izračunan iz mediane
KS Koeficient sploščenosti
KV Koeficient variacije
Lp Laspeyresov agregatni indeks cen

Lq Laspeyresov agregatni indeks količin


Me Mediana (vrednost od katere ima 50% enot manjšo vrednost
spremenljivke, 50% enot pa večjo)
Mo Modus (najpogostejše vrednost proučevane spremenljivke)
N Število enot v populaciji
Pp Paaschejev agregatni indeks cen

Pq Paaschejev agregatni indeks količin


QR Kvartilni razmik
R Rang
Sj Stopnja rasti
t Indeks za časovni razmik
T Oznaka za trend
Vj Verižni indeks

V Povprečni verižni indeks


VR Variacijski razmik
xt Tehnični čas
Yi Podatek o vrednosti pojava Y za enoto i
Yt Podatek o vrednosti pojava Y v časovni enoti t

Y j Strukturni delež

Yj % Strukturni odstotek
~ Drseča sredina za časovno enoto t
Yt
Yt '1 Ocenjena vrednost pojava v naslednji časovni enoti

Yt ' r Ocenjena vrednost pojava v r časovnih enot za enoto t

yj Sredina razreda

35
y j , sp Natančna spodnja meja razreda j

y j , zg Natančna zgornja meja razreda j

ymin Najmanjša vrednost številske spremenljivke v populaciji


ymax Največja vrednost številske spremenljivke v populaciji
yP Kvantil
 Alfa, konstanta linearnega trenda, regresijska konstanta
 Beta, smerni koeficient linearnega trenda, regresijski
koeficient
 Epsilon, naključni vplivi na odvisno spremenljivko
 Mi, znak za aritmetično sredino
 Sigma, znak za seštevanje
 xy Rho, korelacijski koeficient

 xy2 Determinacijski koeficient

y Sigma, standardni odklon individualni vrednosti od


aritmetična sredine
 y2 Varianca, skupna varianca pojava

T Standardni odklon od trenda


 Standardna napaka ocene

 xy2 Pojasnjena varianca pojava y zaradi vpliva x

 2y Nepojasnjena varianca pojava y

36
9.2. Pregled matematičnih in logičnih operacij
a+b seštevanje
a–b odštevanje
a*b Množenje
a/b Deljenje

xn Potenciranje
n
x Korenjenje
N Seštevanje
x
i 1
i

k Seštevanje produktov
f
j 1
j yj

N Seštevanje kvadratov
x
i 1
2
i

xi Absolutna vrednost

a<b a manjši od b
a>b a večji od b
a=b a je enako b
ab a ni enako b
ab a je večji ali enak b
ab a je manjši ali enak b
ab če a, potem b

37
Litaratura

Arh, F.: Statistika 1. Obrazci in postopki. Ljubljana: Ekonomska fakulteta, 1996.


Kachigan, S.K.: Statistical Analysis. New York: Radius press. 1982.
Košmelj, B. in Rovan, J.: Statistični obrazci in tabele. Ljubljana: Ekonomska fakulteta,
1999.
Mendenhall, W.: Probability and Statistics. Pacific Grove: Brooks/Cole – Thomson, 2003.
Sharma, S.: Applied Multivariate Techniques. John Wiley & Sons, 1996.
Seljak, J.: Statistika v javni upravi. Ljubljana: Fakulteta za upravo, 2002.

38

Anda mungkin juga menyukai