Zdarzenia losowe i prawdopodobieństwo
Rachunek prawdopodobieństwa zajmuje się badaniem praw rządzącymi zdarzeniami
losowymi. Pojęciami pierwotnymi są: zdarzenie elementarne i przestrzeń zdarzeń
elementarnych związane z doświadczeniem losowym D polegającym na realizacji
określonego zespołu warunków, Poszczególne wyniki doświadczenia losowego
traktujemy jako zdarzenia elementarne i zbiór wszystkich zdarzeń elementarnych jako
przestrzeń zdarzeń elementarnych .
Przykład I. Rzucamy kostką do gry - doświadczenie losowe D. Zdarzenie elementarne liczba wyrzuconych oczek. = { 1 , 2 , 3 , 4 , 5 , 6 }
Przykład II. Losujemy element z populacji generalnej Z tak aby każdy element miał
jednakowe szansę wylosowania - doświadczenie losowe D. Zdarzenie elementarne wylosowany element z populacji generalnej. - zbiór wszystkich możliwych elementów
populacji generalnej tzn. =Z. Tak będziemy traktować populację generalną za pomocą
rachunku prawdopodobieństwa.
Praktycznie interesują nas nie pojedyncze zdarzenia elementarne doświadczenia D lecz
podzbiory przestrzeni . W przypadku gdy przestrzeń jest skończona lub przeliczalna
to każdy podzbiór przestrzeni nazywamy zdarzeniem losowym. W przypadku gdy
przestrzeń jest nieprzeliczalna to nie każdy podzbiór jest zdarzeniem losowym.
-ciałem zdarzeń losowych przestrzeni nazywamy rodzinę podzbiorów przestrzeni
spełniających warunki (aksjomaty):
1o
2o Jeżeli A to A’ gdzie A’ = - A dopełnieniem (przeciwne) zdarzenia A.
3o Suma przeliczalnej lub skończonej liczby zbiorów z rodziny należy do rodziny ,
tzn. jeżeli A1 ,………, An ,….. to (A1…. An…… ) .
Każdy zbiór A należący do -ciała zdarzeń losowych (A ) będziemy nazywać
zdarzeniem losowym.
W przypadku przestrzeni skończonej lub przeliczalnej =2 = { A ; A podzbiór }
Czyli każdy podzbiór przestrzeni jest zdarzeniem losowym należącym do rodziny .
Aksjomatyczna definicja prawdopodobieństwa
Funkcje P : R przyporządkowującą każdemu zdarzeniu losowemu A liczbę
P(A) R nazywamy prawdopodobieństwem jeżeli są spełnione warunki (aksjomaty):
P1: P(A)≥0 dla dowolnego zdarzenia losowego A
P2: P()=1
P3: Jeżeli A1 ,………, An ,….. jest ciągiem parami rozłącznych zdarzeń losowych to
P(A1…. An…… )= P(A1)+….+P( An)+..…
Uwaga Zdarzenia A1 ,………, An ,….. są parami rozłączne jeżeli część wspólna
dowolnej pary zdarzeń jest pusta tzn. AiAj= dla i j i zbiór pusty.
Z definicji prawdopodobieństwa wynikają następujące własności prawdopodobieństwa.
1o P( )=0 2o Jeżeli zdarzenie losowe A pociąga zdarzenie B (A B ) to P(A) P(B ).
3o P(A) 1 dla dowolnego zdarzenia losowego A
4o Jeżeli zdarzenie losowe A pociąga zdarzenie B (A B ) to P(B - A) =P(B ) - P(A).
A1 ,………, An są parami rozłącznymi zdarzeniami losowymi to
P(A1…. An)= P(A1)+….+P( An)
6o P(A)+P( A’) =1 a stąd P(A)=1 - P( A’) i P(A’)=1 - P( A)
5o Jeżeli
7o P(A B) P(A)+P(B)-P(AB) dla dowolnych zdarzeń losowych A ,B .
8o Jeżeli przestrzeń zdarzeń elementarnych jest skończona lub przeliczalna. Wtedy
prawdopodobieństwa pi = P({i}) 0 dla i i
P1+….+ pn=1 gdy przestrzeń jest skończona n – elementowa
P1+….+ pn+…..=1 gdy przestrzeń jest przeliczalna
9o a) Jeżeli przestrzeń zdarzeń elementarnych jest n – elementowa tzn. n
b) zdarzenia elementarne {i} są jednakowo prawdopodobne tzn.
1
P({1})= P({2})=…….= P({n})=
n
to prawdopodobieństwo zdarzenia losowego A składającego się z k zdarzeń
elementarnych tzn. A k wyraża się wzorem
A k liczba zdarzen elementarnych sprzyjajacych zdarzeniu A
P(A)=
= =
n liczba wszystkich zdarzen elementarnych przestrzen i
Jest to klasyczna definicja prawdopodobieństwa.
Tak określoną trójkę ( , , P ) nazywamy przestrzenią probabilistyczną.
Prawdopodobieństwo warunkowe.
Niech B i P(B)>0.
Definicja. Prawdopodobieństwem warunkowym pod warunkiem zdarzenia B
dowolnego zdarzenia A nazywamy liczbę P( A B) określoną wzorem:
p( AB)
A, B
P( B) 0 . Stąd
P( B)
;
P( AB) P( B) P( A B)
P( B) 0
P( AB) P( A) P( B A)
P( A B)
Definicja. Zdarzenia
P( AB) P( A) P( B) .
A, B są niezależne P( A B) P( A)
P( A) 0
Definicja. Zdarzenia
A1 , A2 ,....., An są niezależne
każdego
mn i
rosnącego ciągu liczb naturalnych 1 i1 i2 ..... im n
P( Ai1 Ai2 ... Aim ) P( Ai1 ) P( Ai2 )...P( Aim ) .
Twierdzenie o prawdopodobieństwie zupełnym.
Jeżeli B jest dowolnym zdarzeniem i A1 , A2 ,..., An są zdarzeniami spełniającymi warunki:
i j
a). Parami rozłączne
tzn. Ai A j
b). Pokrywają zdarzenie B
tzn. B A1 A2 ... An
i
P( Ai ) 0
i 1,2,...., n
to P( B) P( A1 ) P( B A1 ) P( A2 ) P( B A2 ) .... P( An ) P( B An )
Twierdzenie Bayesa.
Jeżeli zdarzenia B, A1 , A2 ,..., An spełniają założenia twierdzenia o
prawdopodobieństwie zupełnym i P( B) 0 to prawdopodobieństwo warunkowe
P( Ak B) zdarzenia Ak pod warunkiem zdarzenia B wyraża się wzorem
P( Ak B)
P( Ak ) P( B Ak )
P ( B)
k 1,2,......, n
Wariancje i kombinacja
Jeżeli A {a1 , a2 ,..., an } jest zbiorem różnych elementów.
Wariancją bez powtórzeń nazywamy każdy k – wyrazowy ciąg k różnych elementów
zbioru A. Taki k – wyrazowy ciąg k różnych elementów zbioru A powstaje ciągnąc k razy
z zbioru A bez zwracania elementów. Liczba wszystkich k – wyrazowych wariancji bez
powtórzeń n – elementowego zbioru A wynosi
Vnk n(n 1)( n 2).......( n k 1) k n .
Wariancją z powtórzeniami nazywamy każdy k – wyrazowy ciąg k elementów zbioru A.
Taki k – wyrazowy ciąg k elementów zbioru A powstaje ciągnąc k razy z zbioru A z
zwracaniem wylosowanych elementów do zbioru A. Liczba wszystkich k – wyrazowych
Vn k n k .
wariancji z powtórzeniami n – elementowego zbioru A wynosi
Kombinacja bez powtórzeń nazywamy każdy k – wyrazowy ciąg k różnych elementów
zbioru A w którym kolejność występowania wyrazów jest nie istotna czyli każdy k
elementowy podzbiór zbioru A. Liczba wszystkich k – wyrazowych kombinacji bez
powtórzeń n – elementowego zbioru A wynosi
n n(n 1)( n 2).......( n k 1)
n!
Cnk
k n.
k!
k!(n k )!
k
Kombinacja z powtórzeniami nazywamy każdy k – wyrazowy ciąg k elementów zbioru
A w którym kolejność występowania wyrazów jest nie istotna . Liczba wszystkich k –
wyrazowych kombinacji z powtórzeniami n – elementowego zbioru A wynosi
nk
Cnk
.
k!
Zmienne losowe jednowymiarowe
Niech ( , , P ) będzie dowolną przestrzenią probabilistyczną
Definicja. Zmienną losową nazywamy dowolną funkcję X : R określoną na
przestrzeni zdarzeń elementarnych o wartościach ze zbioru liczb rzeczywistych R
jeżeli dla dowolnej liczby rzeczywistej x zbiór zdarzeń elementarnych X ( ) x
jest zdarzeniem losowym tzn. { : X ( ) x} dla każdego x R .
Gdy przestrzeń jest skończona lub przeliczalna to każda funkcja X : R jest
zmienną losową.
Zmienne losowe będziemy oznaczać dużymi literami np. X , Y, S, T, Z…… a
odpowiadające im wartości odpowiednio małymi literami x , y, s, t, z……
Prawdopodobieństwo przyjęcia przez zmienną losową wartości ze
zbioru A podzbioru liczb rzeczywistych R.
Gdy X jest zmienną losową to zdarzeniami losowymi są zbiory zdarzeń elementarnych
{ : X ( ) A} gdy np. A {x0 } , A a, b , A a, b) , A (a, b ,
A (a, b) , A (, b) , A a,) , A (a,) , A N itd.
Również w przypadku gdy A gdzie jest najmniejszym -ciałem zdarzeń losowych
przestrzeni =R zawierających różnego rodzaju przedziały liczbowe / zbiory Borelowskie /
zbiory { : X ( ) A} są zdarzeniami losowymi .
Wtedy określone są prawdopodobieństwa P ( X A) przyjęcia przez zmienną
losową X wartości ze zbioru A, określone w następujący sposób:
P( X A) P({ : X ( ) A}) .
A więc np. gdy A a, b) . Wtedy
P( X a, b)) P(a X b) P({ : a X ( ) b})
Tak określone prawdopodobieństwa określają rozkład prawdopodobieństwa
zmiennej losowej X .
Definicja. Dystrybuantą zmiennej losowej X nazywamy funkcję F : R R
określoną na zbiorze liczb rzeczywistych R taką , że F ( x) P( X x) dla każdego x R .
Dystrybuanty rozkładów prawdopodobieństwa pewnych zmiennych losowych są
stablicowane i z tablic możemy znaleźć najważniejsze prawdopodobieństwa zmiennej
losowej X . Np.
P(a X b) F (b) F (a) ; P( X a) 1 F (a) .
W badaniu statystycznym populacji generalnej ze względu na jedną cechę zmiennymi
losowymi będą funkcje X : Z R przyjmujące wartości – wartość cechy elementu
populacji.
Zmienne losowe określone na tym samym zbiorze zdarzeń elementarnych można
dodawać(mnożyć) – dodając(mnożąc) ich wartości dla zdarzenia elementarnego.
Zmiennymi losowymi są funkcje stałe tzn. przyjmujące tylko ustaloną określoną wartość dlatego też zmienne losowe można mnożyć i dzielić przez liczbę i dodawać lub odejmować
liczbę do zmiennej.
Zmienne losowe typu skokowego
Zmienna losowa X jest typu skokowego (dyskretnego) jeżeli istnieje skończony zbiór
WX {x1, x2 ,........, xn } lub przeliczalny WX {x1 , x2 ,........, xn ,.......} jej wartości taki, że:
P( X xi ) pi 0 i 1,2,...., n
i
n
p1 p2 ... pn pi 1 w przypadku skończonym
i 1
P( X xi ) pi 0 i N
i
p1 p2 ... pn .... pi 1 w przypadku przeliczalnym
i 1
Zmienną losową X typu skokowego i jej rozkład prawdopodobieństwa można zapisać za
pomocą tabelki:
X xi
x1 x 2 ........ x n .
w przypadku skończonym
P( X xi ) pi p1 p 2 ....... p n .
X xi
x1 x 2 ........ xn . .......
w przypadku przeliczalnym
P( X xi ) pi p1 p 2 ....... p n . ........
Wtedy: P( X A) pi i dystrybuanta
xiA
F ( x) pi
xi x
Wartość oczekiwana m E ( X ) określa się wzorem
n
m E ( X ) x1 p1 x2 p 2 ... xn pn xi pi
w przypadku skończonym
i 1
m E ( X ) x1 p1 x2 p 2 ... xn pn .... xi pi
w przypadku przeliczalnym
i 1
Wariancja
2 D 2 ( X ) określa się wzorem
n
2 D 2 ( X ) ( x1 m) 2 p1 ( x2 m) 2 p 2 ... ( xn m) 2 p n ( xi m) 2 pi w przypadku skończonym
i 1
2 D 2 ( X ) ( x1 m) 2 p1 ( x2 m) 2 p 2 ... ( xn m) 2 p n .. ( xi m) 2 pi w przypadku przeliczalnym
i 1
Twierdzenie
n
2 D 2 ( X ) x12 p1 x2 p 2 ... xn p n m 2 xi pi m 2 w przypadku skończonym
2
2
2
i 1
D ( X ) ( x p x2 p 2 ... xn p n ....) m xi pi m 2 w przypadku przeliczalnym
2
2
2
1 1
2
2
2
2
i 1
Odchylenie standardowe D(X ) określa się wzorem D( X ) 2
Przykład wykorzystania i interpretacja obliczonych parametrów patrz plik „ Wartość
oczekiwana w multi lotku” na mojej stronie internetowej.
Przykład
Rzucamy kostką do gry tak długo aż wypadnie szóstka. Wyznaczyć zmienną losową
X przyjmującą wartości - liczbę rzutów kostką do momentu wyrzucenia szóstki oraz
rozkład prawdopodobieństwa tej zmiennej losowej. Ponadto wyznaczyć wartość
oczekiwaną m tej zmiennej losowej i prawdopodobieństwo, że liczba rzutów będzie
większa niż 4.
Niech zdarzenie losowe Ai oznacza zdarzenie losowe, że w i – tym rzucie wypadnie
5
1
szóstka iN. P(Ai)=
i P(Bi)= gdzie Bi zdarzenie losowe przeciwne zdarzenia Ai a
6
6
więc zdarzenie, że w i – tym rzucie wypadnie inna liczba oczek niż 6. Ciąg zdarzeń Z1 , Z2 ,
…… , Zk
Z=A lub Z =B dla dowolnego kN jest niezależny. Do momentu wyrzucenia
szóstki w k – tym rzucie w poprzednich rzutach zachodzi zdarzenie Bi i=1,2,3,….,k-1 a w
k – tym rzucie wystąpi zdarzenie Ak. A więc zdarzenie, że zmienna losowa X przyjmie
wartość k, tzn.
{X=k}=B1B2…..Bk-1Ak . Z niezależności ciągu zdarzeń mamy
5k 1 1 5k 1
pk=P(X=k)=P(B1B2…..Bk-1Ak)= P(B1)P(B2)…..P(Bk-1)P(Ak)= k 1 k . Stąd tabelka zmiennej
6 6 6
losowej X typu skokowego przeliczalnego ma postać:
X xi
1
2 ........ k . .......
1 5
5 k 1
....... k . ........
2
6 6
6
P ( X xi ) p i
Uwaga
pk P( X k ) q k 1 p k 1,2,3,....
0 p 1
q 1 p
5
z parametrem 0 p 1 . W naszym przypadku P( X k )
6
k 1
- rozkład geometryczny
1
6
k 1,2,3,....;
p
1
.
6
1
1
1
n
stąd
x
nx n1 dla x 1 jako suma wyrazów
2
1 x n 0
1 x (1 x)
n 1
postępu geometrycznego dla q x i a1 1 oraz można różniczkować obie strony
Ponieważ
równości a prawą stronę wszystkie wyrazy szeregu potęgowego w obszarze zbieżności.
A więc
5
pk
k 1
k 1 6
k 1
1 1 5
6 6 k 1 6
k 1
k
1 5
1 1
1
6 k 0 6
6 1 5
6
Wartość oczekiwana
m E ( X ) x1 p1 x2 p 2 ... xn pn .... xi pi
i 1
m E( X ) k
k 1
5k 1 1 5
k
6k
6 k 1 6
k 1
1
1
6
6 5 2
1
6
Prawdopodobieństwo, że liczba rzutów będzie większa niż 4.
P(X>4)=1-P(X4)=1-P({X=1}{X=2}{X=3}{X=4})=1-(P(X=1)+P(X=2)+P(X=3)+P(X=4))
1 5 52 53
63 5 6 2 52 6 53
671
P( X 4) 1 ( 2 3 4 ) 1
1
1 0,5177 0,4823
4
6 6
6
6
6
1296
1
1
Analogicznie P(X>5)=0,4119 ; P(X>6)=0,3349 ; P(X>90)=
; P(X>91)=
13375568
16050678
Stąd prawdopodobieństwo zdarzenia losowego, że rzucimy co najmniej 90 razy kostką do
gry i nie pojawi się szóstka jest takie same a nico większe co prawdopodobieństwo trafienia
szóstki w dużym lotku , które wynosi
1
.
13983816
Niektóre rozkłady skokowe.
Rozkład zero-jedynkowy.
Zmienna losowa X typu skokowego ma rozkład zero-jedynkowy z parametrem p ,
p(0,1) jeżeli jej funkcja prawdopodobieństwa ma postać:
xi
0 1 .
pi
q
q 1 p
p .
m E ( X ) 0 (1 p) 1 p p
2 D 2 ( X ) pq
Rozkład dwumianowy (Bernoulliego )
Zmienna losowa X typu skokowego ma rozkład dwumianowy z parametrami
p , p (0,1) i n N , jeżeli jej funkcja prawdopodobieństwa ma postać:
n
Wartościami zmiennej są liczby k 0 ,1 , 2 ,......, n i pk P( X k ) p k q nk k 0,1,2,...., n
k
gdzie q 1 p
m E ( X ) np
Wtedy
2 D 2 ( X ) npq
Zmienna losowa X o rozkładzie dwumianowym jest związana z schematem
Bernoulliego z n niezależnymi doświadczeniami D1 , D2, …..,Dn w których
prawdopodobieństwo wystąpienia sukcesu A wynosi p . Wartościami zmiennej losowej X
jest liczba sukcesów w n doświadczeniach.
Rozkład Poissona
Zmienna losowa X typu skokowego ma rozkład Poissona z parametrami >0 jeżeli
jej funkcja prawdopodobieństwa ma postać:
Wartościami zmiennej są liczby k =0,1,2,……,n,…N0
i
k
e2,72
p k P ( X k ) e
k N 0
k!
m E( X )
2 D2 ( X )
Zmienna losowa X rozkładu Poissona zastępuje z dużą dokładnością rozkład
dwumianowy dla dużej liczby doświadczeń n i małym prawdopodobieństwem sukcesu p.
W rozkładzie Poissona =np. .
Zmienne losowe typu ciągłego.
Zmienne losowe X jest typu ciągłego jeżeli istnieje funkcja y f ( x) f : R R taka,
że:
10 Przyjmuje wartości nieujemne tzn. f ( x) 0 x R
20 Pole zawarte między wykresem funkcji y f (x) a osią OX jest równe 1 .
30 Prawdopodobieństwa P(a X b) a b a, b R , jest równe polu
zawartemu między wykresem funkcji y f (x) , prostymi x a , x b i osią OX.
Funkcja y f ( x) f : R R spełniająca powyższe własności nazywa się funkcją
gęstości rozkładu prawdopodobieństwa zmiennej losowej X .
Dla zmiennej losowej typu ciągłego P( X x0 ) 0 dla dowolnej ustalonej wartości x0 .
Stąd w prawdopodobieństwach
P ( a X b) P ( a X b) P ( a X b) P ( a X b) .
Dla zmiennej losowej typu skokowego rodzaj nierówności ma znaczenie.
Dla tych co nie znają teorii całek podstawowe parametry nie można zdefiniować i
poszczególne parametry będą podawane dla poszczególnych rozkładów którymi będziemy
posługiwać się i które są stablicowane.
Dla tych co znają całki poszczególne wzory są następujące:
Własność 20 w definicji funkcji gęstości ma postać
f ( x)dx 1
b
Własność 3 w definicji funkcji gęstości ma postać P(a X b)
0
f ( x)dx
a
m E( X )
xf ( x)dx
2 D 2 ( X ) ( x m) 2 f ( x)dx
x
Dystrybuanta F ( x) P( X x) f ( )d .
Niektóre rozkłady typu ciągłego.
Rozkład równomierny (jednostajny , prostokątny).
Zmienna losowa X typu ciągłego ma rozkład równomierny skoncentrowany na
przedziale < a , b > jeżeli funkcja gęstości tego rozkładu jest określona wzorem:
1
f ( x) b a
0
m E( X )
dla
a xb
dla pozostalyc h
ab
2
Wtedy
x
2 D2 (X )
0
x a
F ( x)
b a
1
dla
dla
dla
xa
a xb
xb
(b a) 2
12
Rozkład normalny.
Zmienna losowa X typu ciągłego ma rozkład normalny (gaussowski) jeżeli funkcja
gęstości tego rozkładu jest określona wzorem:
( x m )2
1
2
1
f ( x)
e 2
x
dla
gdzie e lim (1 ) n 2,72
n
n
2
Parametrami rozkładu są liczby m , R i 0
Zmienna losowa X typu ciągłego mająca rozkład normalny oznaczać będziemy symbolem
N (m, ) . Zapis X ~ N (m, ) oznacza, że zmienna losowa X ma rozkład normalny z
parametrami m , R i 0 .
Wtedy :
wartość oczekiwana
wariancja
odchylenie standardowe
m E( X ) m ;
współczynnik asymetrii (skośności)
2 D2 (X ) 2 ;
;
g3 0 ;
współczynnik spłaszczenia (eksces) g 4 0 ;
Współczynnik spłaszczenia dla dowolnej zmiennej losowej porównuje skupienie rozkładu wokół
jego wartości oczekiwanej m z rozkładem skupienia rozkładu N ( m, ) . Jeżeli g 4 0 to
rozkład jest bardziej skupiony (stromy) niż odpowiedni rozkład normalny. Jeżeli g 4 0 to jest
przeciwne.
Jest to najważniejszy i najczęściej występujący w zastosowaniach i w przyrodzie rozkład
typu ciągłego.
Twierdzenie
Jeżeli zmienna losowa X ma rozkład normalny ( X ~ N (m, ) ) to zmienna losowa
X m
U
ma rozkład normalny standaryzowany N (0,1) ( U ~ N (0,1) ).
Twierdzenie to pozwala na sprowadzenie obliczania zagadnień związanych z zmienną
losową X ~ N (m, ) do obliczania tych zagadnień związanych z zmienną losową
U ~ N (0,1) który jest stablicowany. Np. jeżeli X ~ N (m, ) to
am X m bm
am
bm
bm
am
P ( a X b) P (
) P(
U
) (
) (
)
bm
am
), (
) są wartościami dystrybuanty rozkładu normalnego
Gdzie wartości (
standaryzowanego U ~ N (0,1) który jest stablicowany.
Twierdzenie
P( X m 3 ) P(m 3 X m 3 ) 0,9973 99,73%
P( X m 2 ) P(m 2 X m 2 ) 0,9545 95,45%
P( X m ) P(m X m ) 0,6827 68,27%
Oznacza to np. że wszystkich wartości jakie przyjmie zmienna losowa X ~ N (m, ) z przedziału
m 3 , m 3 będzie w przybliżeniu 99,73%
Ponieważ np.
P(m 3 X m 3 ) P(3
X m
3) P(3 U 3) (3) (3) 0,99965 0,00135 0,9973
Inne rozkłady które będziemy wykorzystywać i które są stablicowane:
Rozkład chi-kwadrat
Jest to rozkład zmiennej losowej 2 n2 X 12 X 22 ..... X n2
i 1,2,...., n są zmiennymi niezależnymi.
losowe X i ~ N (0,1)
m E( ) n
2
gdzie zmienne
D 2 ( X ) 2n
2
Rozkład ten ma stopień swobody n.
Rozkład t Studenta .
Jest to rozkład zmiennej losowej t t n
X
/n
2
n
gdzie
X ~ N (0,1) i n2 ma
rozkład chi-kwadrat o n stopniach swobody.
n . Rozkład t Studenta ma n stopień swobody.
m E (t ) 0
2 D 2 (t )
n2
Dla n>30 rozkład ten ma rozkład asymptotycznie normalny
N (0,1) .
N (0,1) tzn. w przybliżeniu
Jeszcze będzie wykorzystywany rozkład stablicowany Snedecora F (r1 , r2 ) mający dwa
stopnie swobody r1 , r2 .
x 1