September 2004
311.2
ANDOLJŠEK, Žiga
Statistika : obrazci in postopki / Žiga Andoljšek. - V Ljubljani :
Fakulteta za upravo, 2004
ISBN 961-6139-55-X
216151296
Kazalo
Kazalo ............................................................................................................................... i
Predgovor ......................................................................................................................... 1
1. Temeljni pojmi.............................................................................................................. 2
1.1. Osnovni statistični pojmi...................................................................................... 2
1.2. Prikazovanje statističnih podatkov ....................................................................... 3
2. Relativna števila ......................................................................................................... 5
2.1. Strukture .............................................................................................................. 5
2.1.1. Dvorazsežna struktura vsote vrednosti .............................................................. 6
2.1.2. Pogojne vrstične strukture vsot vrednosti .......................................................... 6
2.1.3. Pogojne stolpične strukture vsot vrednosti......................................................... 7
2.1.4. Pogojne strukture vsot vrednosti ....................................................................... 7
2.2. Koeficienti ........................................................................................................... 8
2.3. Indeksi ................................................................................................................. 8
2.4. Razlika in relativna razlika med relativnimi števili ..............................................10
3. Frekvenčne porazdelitve ............................................................................................11
4. Kvantili .....................................................................................................................12
5. Srednje vrednosti .......................................................................................................16
5.1. Aritmetična sredina .............................................................................................16
5.2. Harmonična sredina ............................................................................................19
5.3. Geometrijska sredina...........................................................................................19
5.4. Mediana ..............................................................................................................20
5.5. Modus.................................................................................................................22
6. Mere veriabilnosti, asimetrije in sploščenosti.............................................................23
6.1. Mere variabilnosti ...............................................................................................23
6.1.1. Odkloni od posamezne vrednosti ..................................................................23
6.1.2. Odkloni od povprečja....................................................................................23
6.1.3. Varianca in standardni odklon.......................................................................24
6.1.4. Relatno izraženi odkloni ...............................................................................24
6.2. Mere asimetrije ...................................................................................................25
6.3. Mere sploščenosti................................................................................................25
6.4. Odnosi med mediano, modusom in aritmetično sredino.......................................25
7. Analiza časovnih vrst.................................................................................................26
7.1. Enostavni kazalci dinamike .................................................................................26
7.2. Metoda vrste drsečih sredin.................................................................................27
7.2.1. Drseča sredina iz lihega števila vrednosti ......................................................27
7.2.2. Drseča sredina iz sodega števila vrednosti.....................................................27
7.3. Metoda najmanjše vsote kvadratov......................................................................27
7.3.1. Tehnični čas.....................................................................................................28
7.3.2. Linearni trend ..................................................................................................28
7.3.3. Ocenjevanje kakovosti trenda...........................................................................28
7.3.4. Napovedovanje ................................................................................................29
8. Analiza odvisnosti med množičnimi pojavi................................................................30
8.1. Korelacija ranga ..................................................................................................30
8.2. Linearna regresija................................................................................................30
8.3. Linearna korelacija..............................................................................................32
9. Dodatek.....................................................................................................................34
9.1. Slovar simbolov ..................................................................................................34
9.2. Pregled matematičnih in logičnih operacij ...........................................................37
Litaratura .........................................................................................................................38
i
Predgovor
Priročnik Obrazci in postopki sem pripravil z namenom, da olajšam delo študentom pri
predmetih Statistika in Kvantitativne metode. Oba obvezna metodološka predmeta se
izvajata na Fakulteti za upravo v Ljubljani. Priročnik sledi obvezni literaturi za omenjena
predmeta.
Priročnik sestoji iz treh delov. Ker se slušatelji pri Statistiki prvič srečajo z vedo so v
prvem delu pojasnjeni temeljni pojmi statističnega proučevanja. Sledi osrednji del v
katerem je zbir obrazcev, postopkov in tabel za statistično obdelavo podatkov. Tretji del v
obliki dodatka pa obsega slovar simbolov in pregled matematičnih in logičnih operacij.
Osrednji del je logično razdeljen po poglavjih in sledi učbeniku Statistika v javni upravi.
Prva poglavja obsegajo spoznanje z relativnimi števili. Sledi obdelava grupiranih
podatkov, oziroma frekvenčne porazdelitve. Nadalje priročnik omogoča seznanitev z
izračunom osnovnih statističnih parametrov, kot so srednje vrednosti ter mere variabilnosti,
asimetrije in sploščenosti. Zadnji del je namenjen bivariatni analizi. Slušatelj spozna
analizo časovnih vrst in regresijsko analizo. Če prva poglavja predstavljajo osnovo za
statistično analizo, sta sedmo in osmo poglavje tista, ki slušateljem omogočata spoznanje
instumentarija za samostojno analizo množičnih pojavov.
1
1. Temeljni pojmi
1.1. Osnovni statistični pojmi
n
Y yi
i 1
n
Y f j * yj
j 1
2
1.2. Prikazovanje statističnih podatkov
14
12
Pridelek pšenice
10
8
Pridelek pšenice
6
4
2
0
1996 1997 1998 1999 2000 2001 2002
Leto
3
Črtni diagram – poligon
14
Pridelek pšenice (mio t)
12
10
8
Pridelek pšenice
6
0
1996 1997 1998 1999 2000 2001 2002
Leto
Strukturni krog
Visoka
Poklicna
Visoka
Srednja
Poklicna
Srednja
4
2. Relativna števila
Primerjava absolutnih podatkov ima majhno sporočilno moč. Absolutna števila nam ne
omogočajo primerjave, poleg tega pa nam tudi ne povedo razmerja med delom in celoto.
To nam povedo relativna števila. Relativno število je logičen izraz merjenja, ko se
določena količina meri s pomočjo druge. Relativna števila nam tako omogočajo številčno
izraziti odnose med pojavi in olajšajo nam primerjanje.
2.1. Strukture
Strukturna števila ali strukture nam dajo informacijo o sestavi določenega pojava.
Frekvenca Delež
a1 Y1 Y1
a2 Y2 Y2
… … …
ak Yi Yi
… … …
Skupaj Y 100
a: j = 1,2,…,k
Yj
Strukturni delež: Y j
Y
Y jo strukturni delež pojava za opazovano spremenljivko
Yj vrednost pojava za opazovano spremenljivko
Y total
Yj
Strukturni odstotek: Y j % 100 *
Y
Kotne stopinje: Y jst 3,6 * Y j %
Yv
Polmer strukturnega kroga: rv rm *
Ym
5
2.1.1. Dvorazsežna struktura vsote vrednosti
Shema podatkov:
b1 b2 ... b g Skupaj
a1 Y11 Y12 ... Y1j ... Y1
a2 Y21 Y22 ... Y2j ... Y2
... ... ... ... ... ...
ak Yi1 Yi2 ... Yij ... Yi
... ... ... ... ... ... ...
Skupaj Y 1 Y 2 ... Y j ... Y = N
a: i = 1,2,...,k
b: j = 1,2,...,g
b1 b2 ... b g Skupaj
a1 Y11 Y12 ... Y1j ... 100
a2 Y21 Y22 ... Y2j ... 100
... ... ... ... ... ...
ak Yi1 Yi2 ... Yij ... 100
... ... ... ... ... ... ...
Skupaj Y 1 Y 2 ... Y j ... 100
Yij
Vrstična struktura kot delež: Yij
Yi
Yij
Vrstična struktura kot odstotek: Yij % 100 100Yij
Yi
6
2.1.3. Pogojne stolpične strukture vsot vrednosti
b1 b2 ... b g Skupaj
a1 Y11 Y12 ... Y1j ... Y1
a2 Y21 Y22 ... Y2j ... Y2
... ... ... ... ... ...
ak Yi1 Yi2 ... Yij ... Yi
... ... ... ... ... ... ...
Skupaj 100 100 ... 100 ... 100
Yij
Stolpična struktura kot delež: Yij
Y j
Yij
Stolpična struktura kot odstotek: Yij % 100 100Yij
Y j
b1 b2 ... b g Skupaj
a1 Y11 Y12 ... Y1j ... Y1
a2 Y21 Y22 ... Y2j ... Y2
... ... ... ... ... ...
ak Yi1 Yi2 ... Yij ... Yi
... ... ... ... ... ... ...
Skupaj Y 1 Y 2 ... Y j ... 100
Yij Yij
Struktura po vrstici in stolpcu kot delež: Yij
Y N
Yij
Struktura po vrstici in stolpcu kot odstotek: Yij % 100 100Yij
Y
7
2.2. Koeficienti
Y
K E*
X
K statistični keoficient
Y primerjani podatek
X primerjalni podatek
E število, ki pove na koliko enot primerjalnega podatka računamo statistični
koeficient (100, 1.000, 10.000, itd.)
2.3. Indeksi
Pri indeksnih številih ali indeksih primerjamo dva istovrsta enakovredna pojava v različnih
časovnih obdobjih.
Yj
I j 100 *
o Yo
Y0 osnova
Yj podatek, ki ga primerjamo z osnovo
8
Časovni indeksi s premično osnovo:
Yj
V j 100 *
Y j 1
Vj verižni indeks
Yj podatek za tekoče časovno obdobje (j)
Y j 1 podatek za predhodno časovno obdobje (j-1)
Periodični indeks
Yj, p
I j, p 100 *
j 1, p Y j 1, p
I j, p periodični indeks
j 1, p
I j 1 V j
Ij 0
;j0
0 100
I j 1
I j 100 0
;j0
0 V j 1
I j 1
o
9
2.4. Razlika in relativna razlika med relativnimi števili
Y j Y
Dj /
Y
Relativna razlika med relativnimi števili:
Y j Y
D j / % 100
Y
10
3. Frekvenčne porazdelitve
k
N fj
j 1
Širina razreda: d j y j , zg y j , sp
y j , sp y j , zg
Sredina razreda: yj
2
fj
Relativna frekvenca: f j
N
fj
Gostota frekvence: gj
dj
gj gostota j-tega razreda
fj frekvenca j-tega razreda
dj širina j-tega razreda
gj fj f j
Relativna gostota frekvence: g j
N N *dj dj
Kumulativa frekvenčne porazdelitve: Fj F j 1 f j
11
4. Kvantili
Kvantil yP je tista vrednost številske spremenljivke, od katere ima 100*P odstotkov enot v
populaciji manjše ali njej enake vrednosti. Poznamo mediano, kvartile, decile, centile.
RP N P 0,5
R1 RP R0
yP izračunani kvantil
y0 vrednost, ki ustreza rangu RP
y 1 vrednost, ki ustreza rangu R1
Rp izračunani rang na osnovi danega kvantilnega ranga (P)
R1 rang pred izračunanim rangom
12
B.) zanima nas delež - kvantil Py
1. posamezne vrednosti razvrstimo v ranžirno vrsto;
2. v ranžirni vrsti pogledamo, med kateri vrednoti številske spremenljivke spada dana
vrednost, za katero iščemo kvantilni rang;
y1 yP y0
( y P y1 )
Ry R1
( y0 y1 )
( Ry 0,5)
Py
N
13
Računanje iz frekvenčne porazdelitve:
RP N P 0,5
F1 RP F0
( RP F1 )
yP y0, sp d 0
f0
14
B.) zanima nas delež - kvantil Py
( y P y0, sp )
Ry F1 f 0
d0
( Ry 0,5)
Py
N
15
5. Srednje vrednosti
y i
Navadna aritmetična sredina: Y i 1
Y M y y - aritmetična sredina (navadna)
yi - posamezna vrednost številske spremenljivke y
N - število enot v populaciji
f
j 1
j yj
Tehtana aritmetična sredina: Y k
fj 1
j
Y - tehtana aritmetična sredina
yj - sredina posameznega razreda
fj - frekvenca posameznega razreda
f
j 1
j Yj
Aritmetična sredina iz delnih aritmetičnih sredin: Y k
fj 1
j
Y My - tehtana aritmetična sredina
_
Yj - delna aritmetična sredina razredov
fj - število enot v delni populaciji (frekvenca razreda)
16
Aritmetična sredina iz strukturnih števil in statističnih koeficientov
(Poznan je koeficient Kj in imenovalec koeficienta Xj!)
Yj
Kj
Xj
k
X
j 1
j Kj
K k
Xj 1
j
_
K - povrečni koeficient
Kj - koeficienti dane populacije (iz katerih računamo povprečni koeficient)
Xj - podatki v imenovalcu koeficientov za dele populacije
Y
j 1
jA % * Y jA
YA k
Y
j 1
jA %
Y
j 1
jA % * Y jB
YB ( SA) k
Y j 1
jA %
17
Agregatni indeksi
k n
p
j 1 i 1
ji q0i
Lp 100 k n
p
j 1 i 1
0i q0i
k n
q
j 1 i 1
ji p0i
Lq 100 k n
q
j 1 i 1
0i p0i
k n
p
j 1 i 1
ji q ji
Pp 100 k n
p
j 1 i 1
0i q ji
k n
q
j 1 i 1
ji p ji
Pq 100 k n
q
j 1 i 1
0i p ji
Fp Lp Pp
Fq Lq Pq
18
5.2. Harmonična sredina
N
Navadna harmonična sredina: Hy N
1
y
i 1 i
f
j 1
j
Y j 1
j
K k Yj
K
j 1 j
_
K - povprečni koeficient
Kj - delni koeficienti (iz katerih računamo povprečni koeficient)
Yj - podatki v števcu koeficientov za dele populacije
_
Yt Yt M Y tYt M
D t ,M
M N 1
_
D t ,M - povprečna razlika za M časovnih enot
N - število členov
Število časovnih enot je za 1 manjše od števila členov (prva razlika nastopi med prvim in
drugim členom šele drugi člen prispeva prvo vrednost v zaporedju razlik).
19
5.4. Mediana
R1 R0,5 R0
Me mediana
y0 vrednost, ki ustreza rangu RP
y1 vrednost, ki ustreza rangu R1
R0.5 izračunani rang na osnovi danega kvantilnega ranga (P=0.5)
R1 rang pred izračunanim rangom
20
B.) Izračun iz grupiranih podatkov P=0,5:
F1 R0,5 F0
( R0,5 F1 )
Me y0, sp d0
f0
21
5.5. Modus
Mo yi , max
Modusni razred je razred z največjo frekvenco fj. Podatke v modusnem razredu označimo
z y0,sp in f0.
( f 0 f 1 )
Mo y0, sp d
(2 f 0 f 1 f 1 )
22
6. Mere veriabilnosti, asimetrije in sploščenosti
VR ymax ymin
Variacijski razmik:
VR yk , z y1, s
Decilni razmik: DR D9 D1
Kvartilni razmik: QR Q3 Q1
ADY
y i Y
N
k
f
j 1
j yj Y
Povprečni absolutni odklon od aritmetične sredine: ADY k
f
j 1
j
ADMe
y i Me
N
k
Povprečni absolutni odklon od mediane: f
j 1
j y j Me
ADMe k
f
j 1
j
23
6.1.3. Varianca in standardni odklon
y
N 2
i Y
y2 i 1
N
Varianca in standardni odklon iz negrupiranih podatkov: y 2
y
f y
k 2
j j Y
j 1
y2 k
f
j 1
j
d2
Varianca in popravljeni standardni odklon iz grupiranih podatkov: y2, pop y2
12
y , pop y2, pop
Q3 Q1
Relativni kvantilni razmik:
QRMe
Me
ADY
ADY
Relativni povprečni absolutni odklon: Y
ADMe
ADMe
Me
y
Koeficient variacije: KVy
Y
24
6.2. Mere asimetrije
Zanima nas asimetričnost porazdelitve. Sama normalna porazdelitev nam služi kot mera za
določanje simetričnosti.
KAMe
3 * Y Me
y
Q1 Q3 2 * Me
KAQ
Q3 Q1
Q3 Q1
KS 1,9
D9 D1
Velja shema
KS < 1 porazdelitev je koničasta
Koeficient je enak 1 normalna porazdelitev
KS > 1 porazdelitev je sploščena
Me Mo Y
normalna porazdelitev
Me Mo Y asimetrična v desno
Me Mo Y asimetrična v levo
25
7. Analiza časovnih vrst
Absolutna razlika: Dt , M Yt Yt M
Yt Yt M
Povprečna absolutna razlika: Dt , M
M
Yt Yt M
Relativna razlika: Dt, M
Yt M
Yt
Dt, M V M V1 * V2 * ... * VM 100 * M
Povprečna relativna razlika: Yt M
S V 100
Poleg navedenih razlik dinamiko pojavov kažejo tudi indeksi s stalno osnovo, verižni
indeksi, koeficienti dinamike in stopnje rasti.
Yj
Indeks s stalno osnovo: I j / 100
Y
Yj
Verižni indeks: V j 100 K j * 100 S j 100
Y j 1
Vj Yj S j 100
Koeficient dinamike: Kj
100 Y j 1 100
26
7.2. Metoda vrste drsečih sredin
~
Drseča sredina Yt iz lihega števila obdobij je enaka:
Y r 1 ... Yt 1 Yt Yt 1 ... Y r 1
~ t ( ) t( )
Yt 2 2
r
r = število obdobij
~
Drseča sredina Yt iz sodega števila obdobij je enaka:
Y r Y r
t t
2
... Yt 1 Yt Yt 1 ... 2
~
Yt 2 2
r
(Y T ) 0
t 1
t t
/Y T )
t 1
t t
2
min
27
7.3.1. Tehnični čas
x
t 1
t 0
N 1
xt t ; t 1,2,..., N
2
Model: Tt * xt t
Y t
t 1
Y
N
N
Y x t t
Ocena konstante in smernega koeficienta: t 1
N
x
t 1
t
2
T (Y T )
t t
2
T
Koeficient variacije trenda: KVT % 100 *
Y
28
7.3.4. Napovedovanje
Yt '1 Yt
Dt' 1 Dt
Yt ' 1 Yt Dt'1
Yt '1 Yt Dt , M
Yt *Vt , M
Yt '1
100
Yt ' r * xt r
Yt ' r Yt r *
r... število časovnih enot od zadnje v proučevani časovni vrsti do napovedovanega
obdobja
29
8. Analiza odvisnosti med množičnimi pojavi
Ko nas zanima samo groba ocena stopnje in smeri korelacijske povezanosti. Metoda
temelji na ugotavljanju mesta enote v ranžirni vrsti glede na vrednost obeh spremenljivk.
Postopek:
uredimo enote glede na vrednost obeh spremenljivk,
vsakemu podatku v vrsti določimo rang,
najnižji rang pripada najmanjši vrednosti spremenljivke v vrsti, enake vrednosti
imajo enake range,
nato za vsak par vrednosti ranga odštejemo in razlike kvadriramo.
6 * ( R y Rx ) 2
yx 1
N * ( N 2 1)
(y
t 1
t yi' )2 min
yi' * xi
30
Dobimo:
regresijsko premico, ki predstavlja prvi del enačbe in kaže splošne vplive
standardna napaka ocene pokaže odklone individualnih vrednosti od izračunane
regresijske premice - zadnji člen
korelacijski koeficient nam pove stopnjo in smer povezave, determinacijsii
koeficient pa delež variance y-a, ki ga lahko pojacnimo z vplivom x-a.
Y *X
C
xy2
x
N
x2 i 1
N
N
( y Y ) * (x X )
i i
C xy C yx i 1
(y i Y )2
2
y
i 1
N
Skupni vplivi: y 2
y
(y i
'
Y )2
xy2 i 1
N
Pojasnjeni vplivi: xy xy2
( y i yi' )2
2y i 1
x2
y
31
C.) Korelacijski koeficient
C xy
xy
y * x
xy2 C yx2
xy2 ( xy ) 2
y2 y2 * x2
Ko enega pojava ne moremo opredeliti kot jasno posledico drugega, govorimo o korelaciji.
Ne gre za vzročno-posledično odvisnost, ampak obstaja samo povezava in cilj je ugotoviti
to povezanost. Največkrat gre za povezanost pojavov na katere vplivajo isti dejavniki (isti
splošni vplivi).
yi' 1 1 * xi
xi' 2 2 * yi
32
Shema izračunavanja linearne regresije in korelacije
I yi xi ( yi Y ) 2 ( xi X ) 2 ( yi Y ) * ( xi X )
1 y1 x1 ( y1 Y ) 2 ( x1 X ) 2 ( y1 Y ) * ( x1 X )
2 x2
y2 ( y2 Y )2 ( x2 X )2 ( y2 Y ) * ( x2 X )
... ... ... ... ... ...
N yN xN
( yN Y ) 2
( xN X ) 2
( yN Y ) * ( xN X )
y i x i ( yi Y ) 2 (x X )
i
2
(y i Y ) * ( xi X )
( yi Y ) 2 (x X )
i
2
y2 i 1
x2 i 1
N N
( y Y ) * (x X )
i i
C xy C yx i 1
1 Y 1 * X 2 X 2 * Y
33
9. Dodatek
Simbol Opis
ADY Povprečni absolutni odklon od aritmetične sredine
ADMe Povprečni absolutni odklon od mediane
dj Širina razreda
DR Decilni razmik
Dt Navadna (absolutna) razlika za časovno vrsto
f j Relativna frekvenca
gj Gostota frekvence
Gy Geometrijska sredina
Hy Harmonična sredina
i Indeks za enoto v populaciji (i = 1,2,...,N)
Ip Agregatni indeks cen
34
Iq Agregatni indeks količin
Y j Strukturni delež
Yj % Strukturni odstotek
~ Drseča sredina za časovno enoto t
Yt
Yt '1 Ocenjena vrednost pojava v naslednji časovni enoti
yj Sredina razreda
35
y j , sp Natančna spodnja meja razreda j
36
9.2. Pregled matematičnih in logičnih operacij
a+b seštevanje
a–b odštevanje
a*b Množenje
a/b Deljenje
xn Potenciranje
n
x Korenjenje
N Seštevanje
x
i 1
i
k Seštevanje produktov
f
j 1
j yj
N Seštevanje kvadratov
x
i 1
2
i
xi Absolutna vrednost
a<b a manjši od b
a>b a večji od b
a=b a je enako b
ab a ni enako b
ab a je večji ali enak b
ab a je manjši ali enak b
ab če a, potem b
37
Litaratura
38