this dir | view | cards | source | edit | dark
top
Pravděpodobnost a statistika
- Definice: Prostor jevů, pravděpodobnost, pravděpodobnostní prostor
- Ω … prostor všech možných výsledků
- u hrací kostky Ω={1,…,6}=[6]
- F … prostor jevů (event space)
- F⊆P(Ω)
- množiny, které nás zajímají
- F=P(Ω) jde jen pro ∣Ω∣≤∣N∣
- F⊆P(Ω) je prostor jevů, pokud…
- ∅,Ω∈F
- A∈F⟹AC=Ω∖A∈F
- A1,A2,…∈F⟹⋃Ai∈F
- pozorování
- A1,A2∈F⟹A1∪A2∈F (z 3. bodu definice, všechny ostatní množiny nekonečného sjednocení jsou prázdné)
- A1,A2∈F⟹A1∩A2∈F
- jelikož A1∩A2=(A1C∪A2C)C∈F
- P:F→[0,1] je pravděpodobnost, pokud…
- P(Ω)=1
- P(⋃Ai)=∑P(Ai) pro A1,A2,…∈F po dvou disjunktní
- pozorování
- P(∅)=0
- P(A1∪A2)=P(A1)+P(A2)
- jistý jev … P(A)=1
- nemožný jev … P(A)=0
- u reálného terče je pravděpodobnost, že trefím konkrétní bod, rovna nule
- takže neplatí implikace P(A)=0⟹A=∅
- pravděpodobnostní prostor … (Ω,F,P)
- příklad: spojitý pravděpodobnostní prostor
- Ω⊆Rd
- f:Ω→[0,∞)
- P(A)=∫Af
- musí platit ∫Ωf=1
- Věta: Základní vlastnosti jevů
- P(A)+P(AC)=1
- Ω=A∪AC
- 1=P(Ω)=P(A)+P(AC)
- lze použít, protože A∪AC=∅
- …
- Podmíněná pravděpodobnost
- diskrétní náhodné veličiny
- příklad: dva hody kostkou
- zajímá nás součet
- varianta – pravděpodobnostní prostor budou součty
- jednotlivé pravědpodobnosti jsou různé
- lepší varianta – uspořádané dvojice, co na kostkách může padnout
- uniformní prostor
- X(ω)=ω1+ω2 … příklad náhodné veličiny
- Y(ω)=ω1⋅ω2
- df: pro (Ω,F,P) pravděpodobnostní prostor je X diskrétní náhodná veličina ≡ X:Ω→R∧Im(X) je konečný spočetný ∧ ještě jedna podmínka
- Im je obor hodnot
- …
- poznámka: náhodná veličina X nám určí pravděpodobnostní prostor
- Ω′=Im(X)
- F′=P(Ω′)
- p(x)=P(X=x)
- tomu se říká distribuce X
- p=pX
- pravděpodobnostní funkce X
- probability mass function … pmf X
- pozorování: ∑x∈Im(X)pX(x)=1
- příklady diskrétní náhodné veličiny
- Bernoulliho rozdělení/distribuce
- X=1 s pravděpodobností p
- X=0 s pravděpodobností 1−p
- pX(1)=p
- pX(0)=1−p
- X∼Ber(p)
- indikátorová náhodná veličina
- jev A∈F
- ω∈A
- IA(ω)=1, pokud ω∈A
- IA(ω)=0, pokud ω∈/A
- IA∼Ber(P(A))
- geometrické rozdělení – „čas úspěchu“
- házíme kostkou
- X … kolikátým hodem padla první šestka
- p=61
- P(X=1)=p
- P(X=k)=(1−p)k−1⋅p
- takové veličině se říká geometrická, značí se X∼Geo(p)
- binomické rozdělení
- Poissonovo rozdělení
- střední hodnota – Expectation
- X je diskrétní náhodná veličina
- EX=∑x∈ImXx⋅P(X=x)
- pokud má ∑ smysl
- tedy pokud ∑∣x∣⋅p(x)≤∞
- pozorování: pokud Ω je konečný/diskrétní
- EX=∑ω∈ΩX(ω)⋅P({ω})
- kdy nás zajímá střední hodnota?
- survival function, funkce přežití … s(t)=P(X>t)
- věta
- X je diskrétní náhodná veličina, ImX⊆{0,1,2,…}
- EX=∑n=0∞P(X>n)
- důkaz
- EX=1p(1)+2p(2)+3p(3)+…
- =p(1)+p(2)+p(3)+…
- +p(2)+p(3)+…
- +p(3)+…
- pozorování
- pro A⊆R
- P(X∈A)=∑a∈ApX(a)
- příklad
- X∼Geo(p)
- EX=∑nP(X>n)=∑n(1−p)n=1−(1−p)1=p1
- df: rozptyl náhodné veličiny X
- Var(X)=E((X−EX)2)
- σX=σ(X)=Var(X)
- cv=EXσX … variační koeficient
- věta: Var(X)=E(X2)−(E(X))2=EX(X−1)+EX−E(X)2
- důkaz
- μ:=EX
- Var(X)=E((X−μ)2)=E(X2−2μX+μ2)=E(X2)−2μEX+Eμ2=
- =E(X2)−2μ2+μ2=E(X2)−μ2
- E(X2−X)=E(X(X−1))=E(X2)−EX
- příklad
- X∼Ber(p)
- …
- …
Náhodné vektory
- příklad – dva hody kostkou
- df: sdružená pravděpodobnostní funkce (joint pmf)
- pX,Y(x,y)=P(X=x∧Y=y)
- z pX,Y lze odvodit pX a pY
- ale z pX,pY nelze odvodit pX,Y
- věta
- pX(x)=∑y∈ImYpX,Y(x,y)
- podobně pro pY(y)
- důkaz
- je to disjunktní sjednocení, takže sčítám pravděpodobnosti
- věta – PNS pro vektory
Statistika
- boxplot
- čára uvnitř krabice – medián
- krabice pod čárou – 1. kvartil
- krabice na čárou – 3. kvartil
- celá krabice … IQR (interquartile range)
- čáry mimo krabici – ve vzdálenosti 1.5×IQR
- nebo tam, kde jsou nejvzdálenější hodnoty (tedy můžou mimo čáry, ale čáry nebudou sahat mimo data)
- spojitá křivka → je to nějaká fikce
- postup
- máme populaci Ω
- zajímá nás parametr θ (nebo ϑ)
- Θ … množina všech parametrů
- provedeme měření
- měření může být zavádějící, vzorek musí být reprezentativní
- X1,…,Xn∼F náhodný výběr z rozdělení s distribucí F
- nezávislé stejně rozdělené náhodné veličiny
- ∀i:F je distribuční funkce Xi
- realizace
- naměřená data x1,…,xn
- xi=Xi(ω) … naměřená hodnota náhodné veličiny Xi
- neparametrická statistika … malé předpoklady na F
- parametrická statistika … F je z množiny rozdělení popsané parametrem θ
- například
- Exp(λ) s parametrem θ=λ
- U(0,a) s parametrem θ=a
- N(μ,σ2) s parametrem θ=(μ,σ2)
- příklad
- náhodný výběr X1,…,Xn doby běhu programu
- p=P(Xi>100 ms)
- data x1,…,xn∈R+
- statistika … funkce naměřených dat
- t(x1,…,xn) … číslo (estimate)
- T(X1…,Xn) … náhodná veličina (estimator)
- možnost odhadu
- n∣{i:xi>100}∣ = p^ … odhad p
- možnost
- Xi∼N(μ,σ2)
- P(Xi>100)=1−P(Xi<100)=1−Φ(σ100−μ) pokud Xi∼N(μ,σ2)
- μ^=Xn=nX1+⋯+Xn … výběrový průměr – příklad statistiky
- σ2=n−11∑i=1n(Xi−Xn)2 … výběrový rozptyl
- σ^=σ2=S^n
Bodový odhad
- θ^ … odhad parametru θ – je to náhodná veličina závislá na měření (statistika)
- bias(θ^)=E(θ^−θ)
- θ^ je nevychýlený/unbiased
- bias(θ^)=0
- E(θ^)=θ
- asymptoticky nevychýlený
- bias(θ^)→0
- θ^n je konzistentní odhad θ⟺θ^npθ
- ∀ϵ>0:P(∣θ^n−θ∣>ε)→0
- příklad
- zákon velkých čísel
- Xn je konzistentní odhad EX
- MSE(θ^)=E(θ^−θ)2
- MSE … mean squared error (střední kvadratická odchylka)
- věta: MSE(θ^)=bias(θ^)2+var(θ^)
- důkaz
- var(X)=EX2−(EX)2
- var(θ^)=var(θ^−θ)=E(θ^−θ)2−[E(θ^−θ)]2=MSE(θ^)−bias(θ^)2
- věta
- Xn=n1∑i=1nXi
- Sn2=n−11∑i=1n(Xi−Xn)2
- →Xn je konzistentní nevychýlený odhad μ
- →Sn2 je konzistentní nevychýlený odhad σ2
- důkaz odložíme
- jak hledat odhady?
- metoda momentů
- r-tý moment X:EXr=mr(θ)
- závislé na neznámém parametru
- r-tý výběrový moment n1∑i=1nXir=mr(θ)
- dobrý odhad pro r-tý moment X
- náhodná veličina závislá na měření
- …
- metoda maximální věrohodnosti (MV, maximal likelihood ML)
- θ^ML=argmaxθp(x;θ)
- argmaxθf(x;θ)
- abych se nemusel rozhodovat mezi p a f, budu používat L
- …
- testy
- 1-výběrový
- 2-výběrový
- párový
- lineární regrese
- xi … nezávislá proměnná, predictor
- yi … závislá proměnná, response
- cíl … y=θ0+θ1x
- θ0 … intercept
- θ1 … slope
- chybu měříme pomocí kvadratické odchylky ∑i=1n(yi−(θ0+θ1xi))2
- řešení
- θ^1=var(x)cov(x,y)
- θ^0=yˉ−θ1xˉ
- zavádějící proměnná (confounding variable) – není v datech, ale kdybychom ji přidali, všechno by dávalo větší smysl
- Simpsonův paradox – jedna strana vítězí v jednotlivých kategoriích, ale dohromady vítězí ta druhá
- neparametrická statistika
- empirická distribuční funkce
- frekventistická vs. bayesovská statistika
- generování náhodných veličin
- uniformní rozdělení U(0,1) – dejme tomu, že ho máme (je těžké ho generovat)
- diskrétní náhodná veličina – uděláme rozklad intervalu od nuly do jedné tak, aby P(X=i)=∣Ai∣, kde ∣Ai∣ je část intervalu
- inverzní transformace
- QX(p)=FX−1(p) pro X spojitou
- QX=min{x:FX(x)≥p}
- věta: F−1(U) má distribuční funkci F
- kde U∼U(0,1)
- rejection sampling
- generujeme uniformně náhodně bod (x,y) pod křivkou fX
- pak x má hustotu fX