Anda di halaman 1dari 9

Segédanyag a Valószín¶ségszámítás és statisztika tantárgyhoz Mintavétel: Adott N termék, ezek közül M selejtes.

Az összes termékb®l
2011. november 30. kiveszünk n darabot. Mi a valószín¶sége, hogy ezek között k selejtes lesz?
(k = 0, 1, ..., n)
M N −M
 
• Visszetevés nélkül: k Nn−k 
Deníció. Véges valószín¶ségi mez®: (Ω, A, P ) hármas, ahol:   n
n k
• {ω1 , ..., ωn } = Ω: eseménytér; elemei: elemi események • Visszatevéssel: p (1 − p)n−k ahol p = M
N a selejtarány
k
• {A, B, ...} = A ⊂ 2Ω , ahol A, B, ...: események
• P : valószín¶ségi mérték
 P (Ω) = 1
 P (A) ≥ 0 minden A eseményre
 P (A∪B) = P (A)+P (B) minden A és B egymást kizáró eseményre Feltételes valószín¶ség: Ha B bekövetkezett, mi a valószín¶sége, hogy A
(A ∩ B = ∅). bekövetkezik?
(B) (P (B) 6= 0)
P (A|B) = P P(A∩B)
Deníció. Kolgomorov-féle vsz.-i mez®: (Ω, A, P ) hármas, ahol:
• Ω: nemüres halmaz Deníció. Teljes eseményrendszer (TER) B1 , B2 , ... események teljes
• A ⊂ 2Ω σ -algebra eseményrendszert alkotnak, ha
• P : A → [0; 1] halmazfüggény, amelyre • Bi ∩ Bj = ∅ minden i6=j-re

 P (Ω) = 1 •
S
Bi = Ω
 P (A) ≥ 0 ∀A ∈ A-ra i=1
 páronként kizáró A1 , A2 , ... ∈ A eseményekre Tétel. Teljes valószín¶ség tétele: Legyen B1 , B2 , ... teljes eseményrend-
∞ ∞
szer, A tetsz®leges esemény, P (Bj ) > 0 minden j-re
 
P (Ai ).
S P
P Ai = ∞
i=1 i=1
Ekkor P (A) = P (A|Bj )P (Bj ).
P
P (A ∪
 B) = P (A) + P (B) − P (A ∩ B)
j=1
P A = 1 − P (A) Tétel. Bayes-tétel: Legyen B1 , ..., Bn teljes eseményrendszer, A tet-
Permutáció: n elem összes lehetséges sorrendje: n! sz®leges esemény, P (Bj ) > 0 minden j-re
Ismétléses permutáció: n elem összes lehetséges sorrendje, ha ezek közül Ekkor P (Bk |A) = P∞
P (A|Bk )P (Bk )
.
k1 , ..., km darab megegyezik: k1 !·...·k
n! P (A|Bj )P (Bj )
j=1
m!

Adott n elem, ebb®l k darabot kiveszünk Deníció. Események függetlensége: A és B események függetlenek, ha
Kombináció: a kihúzás Variáció: a kihúzás P (A ∩ B) = P (A) · P (B) (A esemény bekövetkezése nem befolyásolja B
sorrendje NEM számít (nem sorrendje számít (szá- esemény bekövetkezését, és fordítva).
számozottak
  az elemek) mozottak az elemek) Deníció. Valószín¶ségi változó: X: Ω → R mérhet® függvény, azaz
n n! n!
Visszatevés nélkül = amire {ω : X(ω) ∈ B} ∈ A minden B⊆ R nyílt halmazra.
k k!(n − k)! (n − k)!
(ismétlés nélkül)   Deníció. Valószín¶ségi változó eloszlása: QX (B) = P (X ∈ B) =
n+k−1
Visszatevéssel n k P (ω : X(ω) ∈ B)
k
(ismétléssel) Deníció. Diszkrét valószín¶ségi változó: értékkészlete legfeljebb

1
megszámlálhatóan végtelen, azaz {x1 , ..., xn , ...} elemekb®l áll.
n
P
I(Xi <x)
Ekkor eloszlása: pi := P (X = xi ) = P (ω : X(ω) = xi ) • Tapasztalati eloszlásfüggvény : Fn (x) = i=1 n
1 ha Xi < x
(

Tétel. Binomiális tétel: (a + b)n =


n
P n

ak bn−k . ahol I(Xi < x) = karakterisztikus függvény
k 0 ha Xi ≥ x
k=0
∞ • z-kvantilis : qz = inf{x : F (x) > z}, és amennyiben F invertálható,
Geometriai sor összege: qn = 1−q ,
1
ha |q|<1. akkor qz = F −1 (z)-re egyszer¶södik
P
n=0
Konvergenciatartományon belül "be lehet deriválni" egy végtelen sort, így Értelmezése: a mintaelemek z -ed része qz -nél kisebb, (1 − z )-ed része
∞ qz -nél nagyobb
2 , ha |q|<1.
1
nq n−1 = (1−q)
P
n=1
Realizált mintából sokféleképpen számolható, interpolációs módszer:
1.) Sorszám megállapítása: (n + 1)z = e + t (e:egészrész, t:törtrész)
2.) qz = Xe∗ + t(Xe+1∗ − Xe∗ )
• kvartilisek : speciális kvantilisek
 Q1 := q 1 alsó kvartilis
Minta: X1 , ..., Xn valószín¶ségi változó sorozat. (Jel. X = X1 , ..., Xn ) 4

A továbbiakban feltesszük, hogy függetlenek és azonos eloszlásúak. Ma-  Q2 = M e := q 1 medián (középs® mintaelem)
2

gyarosan rövidítve FAE minta, de gyakrabban használják az angol i.i.d.  Q3 := q 3 fels® kvartilis
4
minta rövidítést (independent, identically distributed).
Az elméleti értékeket nagy, a konkrét, realizált mintából számolt értékeket
mindig kis bet¶ fogja jelölni, azaz minta esetén x1 , ..., xn .
Statisztika: a minta valamely függvénye: T : X → ... Legyen (Ω, A, P ) valószín¶ségi mez®, X: Ω → R valószín¶ségi változó.
Becslés: a minta eloszlásának ismeretlen paraméterét közelíti a minta segít-
Deníció. Várható érték X várható értéke: EX= X dP , ha ez létezik.
R
ségével Ω
Megj.: Minden becslés statisztika.
Néhány lényeges statisztika: Deníció. l. momentum : EXl = X l dP , ha ez létezik.
R

• Rendezett minta : X1∗ ≤ ... ≤ Xn∗ nem csökken® sorrendbe tesszük a


mintaelemeket P n Deníció. X szórásnégyzete : D2 X=E[(X-EX)]2 = EX2 -E2 X.


Xi
• Mintaátlag : X = i=1 √
n s
n
Deníció. X szórása : DX= D2 X .
(Xi −X)2
P

• Tapasztalati szórás : Sn = i=1


n Legyen X diszkrét valószín¶ségi változó, ami az x1 ,x2 ,... értékeket veszi

Értelmezése: az átlagtól való átlagosseltérés abszolút mértékegységben fel, p1 ,p2 ,... valószín¶ségekkel. Ekkor EX= xk pk , ha a végtelen összeg
P
n i=1
(Xi −X)2
P

• Korrigált tapasztalati szórás : Sn∗ i=1
abszolút konvergens. Ugyanígy EXl = (xk )l pk , ha a végtelen összeg
P
= n−1
i=1
• Szórási együttható : V = Sn
X abszolút konvergens.
Értelmezése: az átlagtól való átlagos eltérés százalékban Nevezetes diszkrét eloszlások:
Megj.: relatív szórásnak is hívják

2
Eloszlás neve
Karakterisztikus
Jelölése
Ind(p)
Eloszlása
P (X = 1) = p
EX
p
D2 X
p(1 − p)
• lim F (x) = 0, lim F (x) = 1.
x→−∞ x→∞
(indikátorvált.) P (X = 0) = 1 − p
Állítás. Tetsz®leges X val.változó esetén
• P (a ≤ X < b) = F (b) − F (a);
1 1−p
Geometriai Geo(p) P (X = k) = p(1 − p)k−1 p p2
(Pascal) k=1,2,...

M

N −M

• P (a < X ≤ b) = F (b+) − F (a+).
k
 n−k nM
  
Hipergeometriai Hipgeo(N, M, n) P (X = k) = nM 1− M n−1
1− N
Deníció. X val.változó abszolút folytonos, ha létezik olyan f(x) függ-

N N N N −1
n
k=0,1,...,n
Rx
vény, amelyre F (x) = f (t) dt. Ilyenkor f(x)-et s¶r¶ségfüggvénynek
 
Binomiális Bin(n, p) P (X = k) = nk
pk (1 − p)n−k np np(1 − p)
k=0,1,...,n
−∞
n n(1−p)
hívjuk.
 
k−1
Negatív bino- NegBin(n, p) P (X = k) = pn (1 − p)k−n
n−1 p p2
miális k=n,n+1,...
Poisson Poi(λ) P (X = k) = λk −λ
k!
e k=0,1,... λ λ Állítás. Legyen X abszolút folytonos eloszlású. Ekkor
El®fordulásuk: • f(x)=F'(x);
• f(x) ≥ 0;
• Indikátor változó: egy p valószín¶ség¶ esemény bekövetkezik-e vagy R∞
sem • f (x) dx = 1;
• Geometriai: hányadikra következik be el®ször egy p valószín¶ség¶ ese- −∞
• P (X = x) = 0 ∀x-re;
mény • P (a < X ≤ b) = P (a ≤ X < b) = F (b) − F (a).
• Hipergeometriai: visszatevés nélküli mintavétel R∞
• Binomiális: visszatevéses mintavétel Abszolút folytonos val.változó várható értéke: EX = xf (x) dx.
• Negatív binomiális: hányadikra következik be n. alkalommal egy p −∞
R∞
valószín¶ség¶ esemény Abszolút folytonos val.változó l. momentuma: EX l = xl f (x) dx.
−∞
Nevezetes abszolút folytonos eloszlások:
Állítás. Legyenek X, Y, X1 , ..., Xn valószín¶ségi változók; c, ci , a, b ∈ R.
Ekkor Eloszlás neve Jelölése
 Eloszlásfüggvény S¶r¶ségfüggvény EX D2 X

0 ha x ≤ a
• E(X + Y ) = EX + EY ;
(
1
ha a < x ≤ b

x−a b−a a+b (b−a)2
Egyenletes E(a, b) ha a<x≤b
• E(cX) = cEX ;
b−a 2 12
 0 különben
1 ha b < x

n n ( (
1 − e−λx ha x ≥ 0 λe−λx ha x ≥ 0
ci EXi ;
P P
• E ci Xi = Exponenciális Exp(λ) 1
λ
1
λ2
0 különben 0 különben
i=1 i=1
+ b) = a2 D2 X .
2
• D2 (aX Standard nor- N(0, 12 ) Φ(x) = ...

x
√1 e− 2 x∈R 0 1
mális
(x−m)2

Normális N(m, σ 2 ) ... √1 e 2σ 2 x∈R m σ2
Deníció. X val.változó eloszlásfüggvénye: FX (x) = P (X < x). 2πσ

Amennyiben egyértelm¶, melyik val.változó eloszlásfüggvényér®l van szó,


F(x)-et írunk.
Állítás. Val.változó függvényének várható értéke
Állítás. Az eloszlásfüggvény tulajdonságai:
• 0 ≤ FX (x) ≤ 1;
Legyen X val. változó; g: R → R függvény.
• monoton növ®;
Ekkor
• E(g(X)) = g(xk )pk , ha X diszkrét
P
• balról folytonos; k

3
R∞
• E(g(X)) = g(x)f (x) dx, ha X abszolút folytonos
−∞ S¶r¶ségfüggvény becslése magfüggvény segítségével n elem¶ mintából:
Mindkét esetben a várható érték létezéséhez a szumma/integrál abszolút n  
Parzen-Rosenblatt becslés: f (x) ≈ fn (x) = nh1n x−X
P
k hn i
konvergenciájára van szükség. i=1
n
Állítás. Abszolút folytonos val.változó szigorúan monoton függvé- Állítás. Az Fn (x) = I(Xi <x)
tapasztalati eloszlásfüggvény 1 valószí-
P
n
nyének eloszlás- és s¶r¶ségfüggvénye i=1
n¶séggel tart a (valódi) F(x) eloszlásfüggvényhez.
Legyen X abszolút folytonos val. változó; g: R → R szigorúan monoton,
folytonosan dierenciálható függvény. Ekkor Deníció. Torzítatlan becslés:
a.) Y=g(X) eloszlásfüggvénye: T(X) statisztika torzítatlan becslése θ-nak, ha Eθ T (X) = θ ∀θ-ra.
ha g szig. mon. növ®
(
FX (g −1 (y))
FY (y) = Fg(X) (y) =
1 − FX (g (y)) ha g szig. mon. csökken®
−1

b.) Y=g(X) s¶r¶ségfüggvénye: Deníció. Likelihood függvény: Legyen X = (X1 , ..., Xn ) i.i.d. minta
fX (g −1 (y)) n
fY (y) = fg(X) (y) = fX (g −1 (y)) · [g −1 (y)]0 =

fθ (xi ), ha az eloszlás folytonos
Q
|g 0 (g −1 (y))| • L(θ, x) = fθ (x) =
i=1
n
Állítás. Normálás • L(θ, x) = Pθ (X = x) =
Q
Pθ (Xi = xi ), ha az eloszlás diszkrét.
Legyen X∼ N (m, σ 2 ). Ekkor X−m
σ ∼ N (0, 1). i=1

Állítás. Φ(−x) = 1 − Φ(x) Deníció. Log-likelihood függvény: l(θ, x) = log(L(θ, x)).


Állítás. Φ−1 (q) = −Φ−1 (1 − q) 0 < q < 1 Paraméterbecslési módszerek
• Maximum likelihood módszer (ML-módszer): Azt a para-
Deníció. Val.változók konvolúciója: Legyenek X és Y független méterértéket keressük, ahol a likelihood függvény a legnagyobb értéket
val.változók. X és Y konvolúciójának (jel. X∗Y) az X+Y val.változót nevez- veszi fel: max L(θ, x)
θ
zük. Amennyiben a függvény deriválható θ szerint, akkor a maximumot
Állítás. A konvolúció eloszlásának meghatározása kereshetjük a szokásos módon, az els® és második deriváltak segít-
∞ ségével, azonban a feladatunkat jelent®sen megnehezíti, hogy olyan
• Diszkrét eset: P (X + Y = k) = n-szeres szorzatot kellene deriválni, amelyiknek minden tagjában ott
P
P (X = l) · P (Y = k − l)
l=0
R∞ van az a változó, ami szerint deriválnunk kellene. Ezért likelihood
• Folytonos eset: fX+Y (z) = fX (u)fY (z − u)du függvény helyett a log-likelihood függvény maximumhelyét keressük.
−∞
Ha θ 1 dimenziós, akkor az
Állítás. Legyenek X1 , ..., Xn , X és Y független val. változók  els®rend¶ feltétel: ∂θ l(θ, x) = 0 θ̂
• X1 ∼ Ind(p), ..., Xn ∼ Ind(p) ⇒ X1 + ... + Xn ∼ Bin(n, p)  másodrend¶ feltétel: ∂θ2 l(θ, x) < 0
• X ∼ Bin(n, p), Y ∼ Bin(m, p) ⇒ X + Y ∼ Bin(n + m, p) Ha θ p dimenziós, akkor θ = (θ1 , ..., θp ), az
• X1 ∼ Geo(p), ..., Xn ∼ Geo(p) ⇒ X1 + ... + Xn ∼ NegBin(n, p)  els®rend¶ feltétel:
• X ∼ Poi(λ1 ), Y ∼ Poi(λ2 ) ⇒ X + Y ∼ Poi(λ1 + λ2 ) ∂θi l(θ, x) = 0 θˆi (i = 1, ..., p) θ̂ = (θ̂1 , ..., θ̂p )
• X ∼ N (m1 , σ12 ), Y ∼ N (m2 , σ22 ) ⇒ X +Y ∼ N (m1 +m2 , σ12 +σ22 )  másodrend¶ feltétel: H(θ1 , ..., θp ) = ∂θi ∂θj l(θ, x) i,j=1,...,p Hesse-
mátrix negatív denit a θ = θ̂ helyen

4
• Momentum módszer: A mintából számítható tapasztalati momen-
 
(n−1)·(s∗n )2 (n−1)·(s∗n )2
P
xi
• σ 2 -re kondencia intervallum: χ2n−1,1− α
; χ2
tumokat (mi := nj j ) egyenl®vé tesszük az elméleti momentumokkal 2 n−1, α2

(Mi := Eθ X i ), az els®t®l kezdve, mégpedig annyit, amennyi paraméter Kondencia intervallum a valószín¶ségre (p) nagy minta esetén, ha normális
van. Tehát p darab ismeretlen paraméter esetén a következ® p is-
q
eloszlással közelítünk: p̂ ± u α2 n .
p̂(1−p̂)
meretlenes egyenletrendszert oldjuk meg:
M 1 = m1
..
.
Mp = mp Deníció. Valószín¶ségi vektorváltozó: X: Ω → Rd mérhet® függvény,
Megjegyzés: m1 = x azaz amire {ω : X(ω) ∈ B} ∈ A minden B⊆ Rd nyílt halmazra.
Fisher-tétel: Ha θ ML-becslése θ̂, akkor tetsz®leges g függvény esetén g(θ) Deníció. Valószín¶ségi vektorváltozó eloszlása:
ML-becslése g(θ̂). QX (B) = P (X ∈ B) = P (ω : X(ω) ∈ B)
Deníció. χ2 -eloszlás: Az X valószín¶ségi változó n szabadságfokú χ2 - Deníció. X valószín¶ségi vektorváltozó eloszlásfüggvénye:
eloszlást követ (jel.: X ∼ χ2n ), ha X = U12 + ... + Un2 , ahol Ui ∼ N (0, 1) FX (x) = P (X < x) = P (X1 < x1 , ..., Xd < xd ).
minden i-re és függetlenek egymástól.
Állítás. Az eloszlásfüggvény tulajdonságai:
Deníció. t-eloszlás: Az X valószín¶ségi változó n szabadságfokú Stu-
• 0 ≤ FX (x) ≤ 1;
dent-féle t-eloszlást követ (jel.: X ∼ tn ), ha X = qZ
Yn
, ahol Z ∼ N (0, 1) és • minden koordinátájában monoton növ®;
n
• minden koordinátájában balról folytonos;
Yn ∼ χ2n függetlenek egymástól.
Mostantól α egy 0-hoz közeli pozitív szám lesz (például 0.05 = 5%), és • lim FX (x1 , ..., xd ) = 1;
x1 ,...,xd →∞
vezessük be a következ® jelöléseket: • lim FX (x1 , ..., xd ) = 0 minden i-re.
xi →−∞
• uα : N (0, 1) eloszlás (1 − α)-kvantilise, azaz uα = Φ−1 (1 − α)
• zα := u1−α (sok könyvben ezt használják) Deníció. X valószín¶ségi vektorváltozó abszolút folytonos , ha
• tn,α : n szabadságfokú t-eloszlás (1 − α)-kvantilise létezik olyan fX (x1 , ..., xd ) függvény, amelyre
Rx1 Rxd
• χ2n,α : n szabadságfokú χ2 -eloszlás α-kvantilise FX (x1 , ..., xd ) = ... fX (t1 , ..., td ) dt1 ...dtd .
−∞ −∞
Deníció. Kondencia intervallum: Adott α-hoz legalább (1 − α) Ilyenkor fX (x)-et s¶r¶ségfüggvénynek hívjuk.
valószín¶séggel tartalmazza az adott
 paramétert (vagy annak egy függ- Mostantól d = 2 lesz, és a következ® jelöléseket és elnevezéseket használjuk:
vényét): Pθ T1 (X) < θ̂ < T2 (X) ≥ 1 − α.
• FX,Y (x, y) = P (X < x, Y < y) együttes eloszlásfüggvény
Gyakran keresünk szimmetrikus kondencia intervallumot, ilyenkor T1 =
FX (x) = P (X < x)
T2 =: ∆, és az intervallum θ̂ ± ∆ alakba írható. • peremeloszlásfüggvények
FY (y) = P (Y < y)
Legyen X1 , ..., Xn ∼ N (m, σ) i.i.d. minta • fX,Y (x, y) együttes s¶r¶ségfüggvény
• m-re kondencia intervallum • fX (x), fY (y) perems¶r¶ségfüggvények
 ha σ ismert, akkor x ± u α2 √σn Állítás.

 ha σ ismeretlen, akkor x ± tn−1, α2 √snn • FX (x) = lim FX,Y (x, y) és FY (y) = lim FX,Y (x, y)
y→∞ x→∞

5
Ry Rx R2 ∼ 1 ⇒ er®s a kapcsolat
• FX,Y (x, y) = fX,Y (u, v) dudv
−∞ −∞ • R2 ∼ 0.5 ⇒ közepes a kapcsolat
• fX,Y (x, y) = ∂y ∂x FX,Y (x, y) = ∂x ∂y FX,Y (x, y) R2 ∼ 0 ⇒ gyenge a kapcsolat
R∞ R∞
• fX,Y (x, y) dxdy = 1
−∞ −∞
R∞ R∞ Legyenek X és Y valószín¶ségi változók. Y -nak X -re vonatkozó feltételes
• fX (x) = fX,Y (x, y) dy és fY (y) = fX,Y (x, y) dx várható értéke − E(Y |X ) − precíz deniálására nem vállalkozok, úgy gon-
−∞ −∞
doljunk rá, mint egy valószín¶ségi változóra; és ha X egy adott értéket vesz
Állítás. fel − E(Y |X = x) −, akkor mint konkrét számra.
• X, Y függetlenek ⇔ FX,Y (x, y) = FX (x) · FY (y) E(Y |X ) abszolút folytonos eloszlások esetén a következ® képlettel számítha-
függetlenek

• X, Y ⇔ fX,Y (x, y) = fX (x) · fY (y) R∞
• X, Y függetlenek ⇔ P (X = x, Y = y) = P (X = x) · P (Y = y)
tó: E(Y |X) = yfY |X (y|x)dy

−∞
• X, Y függetlenek ⇒ E(XY ) = EX · EY x=X
ahol fY |X (y|x) = fX,Y (x,y)
fX (x) a feltételes s¶r¶ségfüggvény.
Deníció. X és Y kovarianciája: Cov(X, Y ) = E [(X − EX)(Y − EY )].
Nadarajah-módszer a feltételes várható érték becslésére (X1 , Y1 ), ..., (Xn , Yn )
Köv.: Cov(X, Y ) = E(XY ) − EXEY .  
x−X
Yi k h i
P
Elnevezés: ha Cov(X, Y ) = 0, akkor azt mondjuk, hogy X és Y korrelálat- minta alapján: E(Y |X = x) ≈ i
n
.
lanok.
P  x−Xi 
k h
n
i

Állítás. Állítás. Legyen g mérhet® függvény.


• Ha X és Y függetlenek egymástól, akkor korrelálatlanok is. • E[g(X)|X] = g(X)
• Ha X és Y korrelálatlanok, akkor ebb®l nem következik, hogy függet- • X, Y függetlenek ⇒ E(Y |X) = EY
lenek is!!!!!
Állítás. A kovariancia tulajdonságai: Feladat: Y val. változót szeretnénk közelíteni X val. változó tetsz®leges
Legyenek X, Y, X1 , ..., Xn valószín¶ségi változók, a, b ∈ R. Ekkor függvénye segítségével:
• Cov(X, X) = D2 X E[Y − f (X )]2 −→ min Megoldása: fopt =E(Y |X)
• Cov(X, Y ) =Cov(Y, X) f

• Cov(X, a) = 0
• Cov(aX, bY ) = abCov(X, Y ) Feladat: Y val. változót szeretnénk közelíteni X val. változó lineáris függ-
• D2 (X + Y ) = D2 X + D2 Y + 2Cov(X, Y ) vénye segítségével:
n n
• D2 ( D2 Xi + 2 Cov(Xi , Xj ) E[Y − (aX + b)]2 −→ min Megoldása: aopt = Cov(X,Y )
P P P
Xi ) =
a,b D2 (X)
i=1 i=1 1≤i<j≤n
• X,Y függetlenek ⇒ Cov(X, Y ) = 0 bopt = EY − aopt EX

Deníció. X és Y korrelációja: R(X, Y ) = Cov DXDY .


(X,Y )
Feladat (lineáris modell): Adottak (x1 , y1 ), . . . , (xn , yn ) pontok, ezekre
A korreláció két valószín¶ségi változó lineáris kapcsolatát méri: szeretnénk egyenest illeszteni (neve: regressziós egyenes ) legkisebb négyze-
R > 0 ⇒ pozitív a kapcsolat tek módszerével.
• A modell: Yi = aXi + b + εi , ahol Eεi = 0 és D2 εi = σ 2 < ∞ (i = 1, . . . , n)
R < 0 ⇒ negatív a kapcsolat

6
Megoldás: â = (xPi −x)(yi 2−y) , b̂ = y − âx Hipotézisvizsgálati feladat:
P
(xi −x)
Reziduumok: ε̂i = yi − âxi − b̂ (i=1,. . . , n) H0 : θ ∈ Θ0 nullhipotézis
Reziduális négyzetösszeg: RNÖ= ε̂2i = (yi − y)2 − (x
P P P
Pi −x)(yi 2−y) H1 : θ ∈ Θ1 ellenhipotézis
(xi −x)
σ̂ 2 = RNÖ Tehát ha X ∈ Xe , akkor elfogadjuk H0 -t; ha X ∈ Xk , akkor pedig elutasítjuk
n−2
H0 -t.
Amennyiben a Θ0 halmaz egyelem¶, akkor azt mondjuk, hogy H0 egyszer¶.
Tétel. Markov-egyenl®tlenség: Legyen g : R → R monoton növ® függ- H1 -re ugyanígy.
vény, X ≥ 0 val.változó, ε > 0 tetsz.
Ekkor P(X ≥ ε) ≤ E[g(X)] Az X mintatér felosztását általában egy statisztika (neve: próbastatisztika)
g(ε) .
segítségével végezzük el:
Spec., ha g(x) = x ⇒ P(X ≥ ε) ≤ E(X) ε legyen T: X → R, Xk = {x ∈ X : T(x) > c} c neve: kritikus érték
2
Tétel. Csebiseb-egyenl®tlenség: P(|X − EX| ≥ ε) ≤ D ε(X)
2 . Xe = {x ∈ X : T(x) ≤ c}
döntés H0 -t
Legyen X1 , X2 , . . . valószín¶ségi változók sorozata. "valóság" elfogadjuk (Xe ) elutasítjuk (Xk )
Deníció. 1 valószín¶ség¶ konvergencia: H0 teljesül (Θ0 ) helyes döntés els®fajú hiba
H0 nem teljesül (Θ1 ) másodfajú hiba helyes döntés
Xn −→ X 1 valószín¶séggel, ha P ({ω : Xn (ω) → X(ω)}) = 1.
n→∞ n→∞

Deníció. Gyenge konvergencia: Xn −→ X gyengén, ha az eloszlás-


n→∞
P(els®fajú hiba)=α(θ)=Pθ (Xk ), ahol θ ∈ Θ0
függvényeikre Fn (x) −→ F (x)
n→∞
F minden folytonossági pontjában. P(másodfajú hiba)=β(θ)=Pθ (Xe ), ahol θ ∈ Θ1
Er®függvény: ψ : Θ1 → R, ψ(θ) = Pθ (Xk )
Tétel. Nagy számok törvénye (NSZT): Terjedelem: α = sup {α(θ): θ ∈ Θ0 }
Legyenek X1 , X2 , . . . i.i.d. val. változók, EX1 = m < ∞. Azt mondjuk, hogy az 1-es próba er®sebb a 2-es próbánál, ha α1 = α2 és
Ekkor X1 +...+X
n → m 1 valószín¶séggel.
n n→∞
ψ1 (θ) ≥ ψ2 (θ) ∀θ ∈ Θ1 .
Próbafüggvény: ϕ: X →[0,1] ennyi valószín¶séggel vetem el a H0 -t a
Tétel. Centrális határeloszlás tétel (CHT): minta alapján
Legyenek X1 , X2 , . . . i.i.d. val. változók, EX1 = m, D2 (X1 ) = σ 2 < ∞. x ∈ Xk ⇒ ϕ(x) = 1
Ekkor   x ∈ Xe ⇒ ϕ(x) = 0
√ n −nm → N(0,1) gyengén, azaz P X1 +...+X → Φ(x).
n→∞ n→∞
X1 +...+X √ n −nm < x
nσ nσ p-érték: az az α terjedelem, ami esetén a próbastatisztika értéke egyenl® a
kritikus értékkel : T(x)= cα .
A p-érték a legkisebb terjedelem, amire még elutasítjuk a H0 -t. Ha egy
Hipotézis ∼ valami állítás, aminek igazságát vizsgálni szeretnénk próbát számítógép segítségével végzünk el, rendszerint a p-érték révén
tudunk dönteni: ha (p-érték)< α, akkor elvetjük H0 -t.
Paramétertér: Θ = Θ0 ∪∗ Θ1 −→ "valóság"
Mintatér: X = Xe ∪∗ Xk −→ "látszat" - MINTÁBÓL
Xk : kritikus tartomány - azon X meggyelések halmaza, amikre elutasítjuk Ha mind H0 , mind H1 egyszer¶, akkor adott α terjedelemhez lehet leg-
a nullhipotézist er®sebb próbát találni, ezt pedig úgy hívják, hogy valószín¶ség-hányados
Xe : elfogadási tartomány - azon X meggyelések halmaza, amikre elfogadjuk próba. A hipotéziseket folytonos esetre írom fel. Diszkrétre a s¶r¶ségfügg-
a nullhipotézist vény helyett a konkrét eloszlást kell írni.

7
H0 : f = f0 a két minta a két minta
független nem független
H1 : f = f1
n o σ1 és σ2 ismert b.) kétmintás u-próba egymintás u-próba
A valószín¶ség-hányados próba kritikus tartománya: Xk = x : f1 (x)
f0 (x) > cα a különbségekre
el®zetes F-próba
Tehát azokat az x-eket, amire az ff01 (x)
(x)
nagy, bepakoljuk a kritikus tar- σ1 és σ2 ismeretlen σ1 = σ2 σ1 6= σ2 egymintás t-próba
tományba egészen addig, míg az adott α terjedelmet el nem érjük. Diszkrét c.) kétmintás t-próba d.) Welch-próba a különbségekre
esetben ehhez általában véletlenítésre van szükség, azaz bizonyos x-ek esetén a.) F-próba
nem 1 vagy 0, hanem egy, e két szám közé es® (jelöljük pα -val) valószín¶séggel m1 , m2 , σ1 , σ2 paraméterek
vetjük el a nullhipotézist. H0 : σ1 = σ2 és H1 : ami a szövegkörnyezetben értelmes
 ∗2
 (s1∗ )2 H0 esetén
∼ Fn−1,m−1 ha s∗1 > s∗2
Néhány konkrét próba − az α végig a próba terjedelmét jelöli, ami el®re A próbastatisztika: F = (s 2)
∗ 2
 (s2∗ )2 H0 esetén
∼ Fm−1,n−1 ha s∗2 > s∗1
adott (s ) 1
1.) Egymintás próbák
b.) kétmintás u-próba
a.) Egymintás u-próba m1 , m2 paraméterek, σ1 , σ2 ismert
X1 , . . . , Xn ∼N(m, σ 2 ), ahol σ ismert, m paraméter H0 : m1 = m2 és H1 : ami a szövegkörnyezetben értelmes
a.) H0 : m = m0 b.) H0 : m = m0 c.) H0 : m = m0 H0 esetén
A próbastatisztika: u = rX−Y ∼ N(0,1)
H1 : m 6= m0 H1 : m > m0 H1 : m < m0 2 2 σ1 σ
+ m2
√ X−m0 H0 esetén n
A próbastatisztika: T(X)=u = n σ ∼ N (0, 1)
A kritikus tartományok: c.) kétmintás t-próba
a.) Xk = {x : |u| > uα/2 } m1 , m2 , σ1 = σ2 paraméterek
b.) Xk = {x : u > uα } H0 : m1 = m2 és H1 : ami q a szövegkörnyezetben értelmes
c.) Xk = {x : u < −uα } A próbastatisztika: t = n+m nm r X−Y
∗ 2 ∗ 2
H0 esetén
∼ tn+m−2
(n−1)(s1 ) +(m−1)(s2 )
n+m−1
b.) Egymintás t-próba
X1 , . . . , Xn ∼N(m, σ 2 ), ahol σ , m paraméter d.) Welch-próba
a.) H0 : m = m0 b.) H0 : m = m0 c.) H0 : m = m0 m1 , m2 , σ1 6= σ2 paraméterek
H1 : m 6= m0 H1 : m > m0 H1 : m < m0 H0 : m1 = m2 és H1 : ami a szövegkörnyezetben értelmes
√ X−m0 H0 esetén H0 esetén
A próbastatisztika: T(X)=t = n s∗ ∼ tn−1 A próbastatisztika: t0 = r ∗X−Y2 ∗ 2
∼ tf , ahol
A kritikus tartományok:
n (s1 ) (s2 )
n
+ m

a.) Xk = {x : |t| > tn−1,α/2 } 1


= c2
+ (1−c)2
f n−1 m−1
b.) Xk = {x : t > tn−1,α } (s∗
1)
2

c.) Xk = {x : t < −tn−1,α } c= (s∗ 2


n
∗ 2 , ha s∗1 > s∗2
1 ) + (s2 )
n m

2.) Kétmintás próbák


X1 , . . . , Xn ∼N(m1 , σ12 )
3.) χ2 -próbák
Y1 , . . . , Ym ∼N(m2 , σ22 ) a.) Diszkrét illeszkedésvizsgálat
Az elvégzend® próbák H0 : m1 = m2 nullhipotézis esetén: Feladat: adott egy X = (X1 , . . . , Xn ) n elem¶ minta, és azt akarjuk eldön-

8
teni, hogy a minta egy általunk "remélt" eloszlásból származik-e. Diszkrét H1 : nem azok
illeszkedésvizsgálatnál feltesszük, hogy a mintaelemek r különböz® értéket
!
r P
s 2
Ni,j H0 esetén
vehetnek fel: P(Xi = xj ) = pj j = 1, . . . , r. Jelöljük Nj -vel a gyakorisá- A próbastatisztika: Tn = n χ2(r−1)(s−1) elosz-
P
Ni• N•j −1 −→
i=1 j=1
gokat, azaz azt, hogy az n elem¶ mintában hány darab xj szerepel. lásban, ha n → ∞
Osztályok 1 2 . . . r Összesen A kritikus tartomány: Xk = {x : Tn (x) > χ2(r−1)(s−1),1−α }
Valószín¶ségek p1 p2 . . . pr 1
Gyakoriságok N1 N2 . . . Nr n
H0 : a valószín¶ségek: p=(p1 , . . . , pr )
H1 : nem ezek a valószín¶ségek
r
(Ni −npi )2 H0 esetén
A próbastatisztika: Tn = χ2r−1 eloszlásban, ha n → ∞
P
npi −→
i=1
A kritikus tartomány: Xk = {x : Tn (x) > χ2r−1,1−α }
Becsléses illeszkedésvizsgálat : csak annyit "sejtünk", hogy a minta valami-
lyen eloszlású, viszont a paramétereir®l nincs sejtésünk. Ilyenkor amennyi-
ben ML-módszerrel becsüljük meg az s darab ismeretlen paramétert, akkor
esetén 2
a próbastatisztika: Tn H0−→ χr−1−s eloszlásban, ha n → ∞.

b.) Függetlenségvizsgálat
Feladat: van egy minta, két szempont szerint csoportosítva. Azt kell eldön-
teni, hogy a két szempont független-e egymástól.
pi,j =P(egy meggyelés az (i,j) osztályba kerül)
Ni,j =ennyi meggyelés kerül az (i,j) osztályba
A mintavétel eredménye:
2. szempont
1 ... j ... s Összesen
1 N11 . . . N1j . . . N1s N1•
.. .. .. .. ..
. . . . .
1. szempont i Ni1 . . . Nij . . . Nis Ni•
.. .. .. .. ..
. . . . .
r Nr1 . . . Nrj . . . Nrs Nr•
Összesen N•1 . . . N•j . . . N•s n
s
P
Ni• = Ni,j
j=1
r
P
N•j = Ni,j
i=1
H0 : a szempontok függetlenek, azaz pi,j = pi• · p•j ∀i, j -re

Anda mungkin juga menyukai