TESTOWANIE HIPOTEZ
Hipoteza statystyczna jest to przypuszczenie dotyczące
nieznanej własności rozkładu prawdopodobieństwa
badanej cechy populacji.
Przykłady
(a) Producent opon twierdzi, że nowy typ opony ma
trwałość większą niż 60000 km. Jeśli (km) oznacza
wartość średnią trwałości opon, to hipotezą producenta
jest H : 60000
(b) Socjolog twierdzi, że dzieci w miastach mają
lepsze wyniki w nauce niż dzieci poza ośrodkami
miejskimi. Niech p1 ( p 2 ) oznacza proporcję dzieci w
miastach (poza miastami) o średnich ocenach rocznych
co najmniej dobrych. Hipotezą socjologa jest
H : p1 p2
(c) Producent twierdzi, że średni czas bezawaryjnej
pracy drukarki to 200 godzin. Wówczas
H : 200
(d) Fizycy przypuszczają, że ilość cząstek
emitowanych przez substancję radioaktywną w
przedziałach czasu o danej długości jest zmienną
losową o rozkładzie Poissona. Wówczas
H : X ~ P( ), 0.
(e) Sprzedawca przypuszcza, że miesięczna wartość
sprzedaży ma rozkład normalny. Wówczas
H : X ~ N ( , ), , 0 .
Hipotezę nazywamy parametryczną, jeśli jest
stwierdzeniem dotyczącym nieznanego parametru
liczbowego lub wektorowego rozkładu cechy populacji,
np. hipotezy (a), (b), (c).
W przeciwnym przypadku hipoteza jest
nieparametryczną, np. hipotezy (d), (e).
W zadaniach testowania hipotez występują 2 hipotezy:
Hipoteza zerowa – hipoteza testowana celem
ewentualnego odrzucenia, oznaczana przez H 0 .
Hipoteza alternatywna – hipoteza, która będzie
przyjęta, jeśli odrzucimy hipotezę zerową, oznaczana
przez H1 .
Hipotezy wykluczają się: nie mogą być jednocześnie
prawdziwe, np. niech p (0,1) oznacza
prawdopodobieństwo sukcesu w doświadczeniu
Bernoulli’ego. Możliwe są hipotezy:
H0 : p
1
2
H1 : p
1
lub
2
1
1
H 0 : p , H1 : p , ale niemożliwe jest sytuacja gdy
2
2
1
1
1
H 0 : p , H1 : p , bo wartość p jest
2
3
2
parametrem z zakresu H 0 i H1 jednocześnie. Zbiory
parametrów wymieniane w obu hipotezach nie są
rozłączne.
Rola hipotez
H0
i
H1 nie jest symetryczna:
Hipoteza alternatywna, to ta którą zaakceptujemy, jeśli
próbka dostarczy nam dostatecznych dowodów jej
prawdziwości, ta o której sądzimy, że jest prawdziwa i
szukamy potwierdzenia w próbce, to ta na której nam
zależy aby była prawdziwa.
Hipoteza zerowa to ta co do której prawdziwości nie
jesteśmy przekonani w sytuacji gdy nie możemy
zaakceptować na podstawie próbki hipotezy
alternatywnej, ta którą poddajemy w wątpliwość.
Przykład. Załóżmy, że skuteczność pewnej terapii
medycznej wynosi p1 100% . Zaproponowano nową
terapię, której nieznana skuteczność p2 100% nie jest
gorsza, tzn. wiemy, że p2 p1. Nowa terapia będzie
szeroko stosowana, jeśli będziemy mieli po badaniach
wstępnych dostatecznie dużą „pewność”, że p2 p1 .
Wówczas
H 0 : p1 p2 ,
H1 : p2 p1 .
Przykład. Nowa technologia produkcji może zmniejszyć
dobowy poziom emisji zanieczyszczeń do atmosfery.
Chcielibyśmy wiedzieć, czy zmniejsza ona poziom
zanieczyszczeń? Wówczas:
H0 :
Nowa technologia nie zmniejsza dobowego
poziomu emisji zanieczyszczeń atmosfery, tzn. nie jest
lepsza od starej technologii.
H1 :
Nowa technologia zmniejsza dobowy poziom
emisji zanieczyszczeń atmosfery, tzn. jest lepsza.
Zadanie testowania powyższych hipotez polega na
podjęciu poniższych decyzji, na podstawie obserwacji
dobowych poziomów emisji zanieczyszczeń,:
Możliwe decyzje:
Nie ma dostatecznych dowodów aby odrzucić H 0 ,
tzn. przyjąć H1 : na podstawie obserwacji nie możemy
stwierdzić, że nowa technologia zmniejsza poziom
zanieczyszczeń.
Obserwacje dostarczają dostatecznych dowodów,
aby przyjąć H1 , równoważnie odrzucić H 0 , tzn.
stwierdzamy, iż można uznać, że nowa technologia
zmniejsza poziom zanieczyszczeń.
Model matematyczny:
Załóżmy, że
(a)
0
= znany średni poziom dobowy emisji
przy starej technologii
(b)
= nieznany średni poziom dobowy emisji
przy nowej technologii
(c)
wiemy, że 0 . Chcielibyśmy
stwierdzić, że nowa technologia zmniejsza
poziom emisji. Zatem:
H 0 : 0 ,
H1 : 0
(d) w ciągu n losowo wybranych dni obserwujemy
dobowe poziomy emisji przy nowej
technologii: X1 , X 2 ,..., X n
(e) zmienne losowe X1, X 2 ,..., X n są niezależne o
jednakowym rozkładzie N ( , ) , gdzie jest
znane
Decyzję: „ przyjąć H1 ” lub „ nie można odrzucić
H 0 ” rozsądnie jest oprzeć na podstawie realizacji
średniej z próby losowej X , tzn. średniej z próbki x .
Uzasadnienie:
Rozkładem X jest rozkład N ( ,
n
) skoncentrowany
wokół . Zatem dostatecznie małe wartości X
sugerują, że H1 : 0 jest prawdziwa, ponieważ
(1) jeśli H 0 : 0 jest prawdziwa, to wartości
X skupiają się wokół 0 , statystyka
Z
X 0
~ N (0,1)
/ n
(2) jeśli H1 : 0 jest prawdziwa: 1 0 ,
to wartości X skupiają się wokół 1 .
Wówczas Z jest sumą zmiennej o rozkładzie N (0,1)
oraz stałej ujemnej:
X 1 1 0
.
Z
/ n / n
(1) i (2) sugerują sposób testowania: niech c będzie
odpowiednio dobraną stałą, a x wartością X obliczoną
dla próbki, wówczas
x 0
c , to przyjmujemy H1 .
/ n
(i)
jeśli z
(ii)
jeśli z
x 0
c , to nie ma podstaw do
/ n
odrzucenia H 0 .
Wybór c: Niech będzie małą liczbą z (0,1), np.
0,05 lub 0, 01 lub 0,1, ...
Niech
c z z1 . Wówczas jeśli H 0 : 0
prawdziwa, to
PH 0 (Z z ) .
Stąd jest prawdopodobieństwem błędnej decyzji
(przyjęcia H1 ) w przypadku gdy hipoteza H 0 jest
prawdziwa. = prawdopodobieństwo błędu I rodzaju,
nazywane poziomem istotności testu.
Zbiór C {z : z z } nazywamy zbiorem
krytycznym, bo jest to zbiór wartości statystyki testowej
Z dla których odrzucamy H 0 na korzyść H1 .
Błędy testowania
Podjęta decyzja
Akceptacja H 0
Stan natury
(
H0
?
Odrzucenie H 0
nie (Akceptacja H1 )
odrzucamy H 0 )
H 0 prawdziwa
Decyzja
Błąd I rodzaju
prawidłowa
H1 prawdziwa
Błąd II rodzaju
(? )
Decyzja
prawidłowa
I. Testowanie hipotez o wartości średniej
rozkładu normalnego, gdy znana jest wariancja
Niech X1, X 2 ,..., X n będzie prostą próbą losowa z
rozkładu N ( , ) , - znane.
H 0 : 0 .
Statystyka testowa:
Z
X 0
X 0
=
.
/ n
/ n / n
Jeśli H 0 prawdziwa, to ZZZ ~ N (0,1) .
Model 1.
H 0 : 0
H1 : 0 .
Wówczas przyjmujemy C = {z : z z1 } = obszar
krytyczny testu hipotezy H 0 przeciw H1 na poziomie
istotności , gdzie
PH 0 (Z C ) PH 0 (Z z1 ) .
Model 2.
H 0 : 0
H1 : 0
Wówczas przyjmujemy C = {z : z z1 } - obszar
krytyczny, gdzie
PH 0 (Z C ) PH 0 (Z z1 ) .
Model 3.
H 0 : 0
H1 : 0
Wówczas
C ={z : z z1 / 2 } - obszar krytyczny, gdzie
PH 0 ( Z z1 / 2 ) / 2
PH 0 ( Z C ) PH 0 ( Z z1 / 2 )
Zadanie. Dotychczasowa dzienna wartość sprzedaży
pewnego artykułu miała rozkład normalny o średniej
1000 ($) i standardowym odchyleniu 100 ($). Po serii
reklam telewizyjnych w ciągu 9 losowo wybranych dni
uzyskano następujące wartości sprzedaży:
1280, 1250, 990, 1100, 880, 1300, 1100, 950, 1050.
Czy, na poziomie istotności 0,01 , można twierdzić,
że reklamy spowodowały zwiększenie sprzedaży, jeśli
można założyć, że wartości dziennych sprzedaży są
niezależnymi zmiennymi losowymi o jednakowym
rozkładzie normalnym ?
Rozwiązanie:
1. H 0 : 1000
2. H1 : 1000
3. Statystyka testowa: Z
X 1000
/ n
4. 0,01 , 1 0,99 , z 0,99 = 2,33.
Obszar krytyczny C = {z : z 2,33}
5. 100 , n 9 , z obliczeń x 1100 , stąd wartość
statystyki testowej
z
6.
x 1000 1100 1000
3.
/ n
100 / 3
3 2,33 , więc odrzucamy H 0 .
Odpowiedź: Na poziomie istotności 0,01
stwierdzamy, że średnia wartość sprzedaży wzrosła po
serii reklam.
II. Testowanie hipotez o wartości średniej rozkładu
normalnego, gdy nieznana jest wariancja
Niech X1, X 2 ,..., X n będzie prostą próbą losowa z
rozkładu N ( , ) , - nieznane.
H 0 : 0 .
Statystyka testowa:
X 0
X 0
=
.
T
S/ n
S/ n S/ n
Jeśli H 0 prawdziwa, to T ~ t n1.
Model 1.
H 0 : 0
H1 : 0
Wówczas przyjmujemy C = {t : t t1 , n 1} = obszar
krytyczny testu hipotezy H 0 przeciw H1 na poziomie
istotności , gdzie
PH 0 ( Z C ) PH 0 (T t1 , n 1 ) ,
t1 , n 1 = kwantyl rzędu 1 rozkładu t – Studenta z
n 1 stopniami swobody.
Model 2.
H 0 : 0
H1 : 0
Wówczas C = {t : t t1 , n 1} - obszar krytyczny,
gdzie
PH 0 (T t1 , n 1 ) .
Model 3.
H 0 : 0
H1 : 0
Wówczas
C = {t : t t1 / 2, n 1} - obszar krytyczny, gdzie
PH 0 (T t1 / 2, n 1 ) / 2 PH 0 ( T t1 / 2, n 1 )
Zadanie. Producent twierdzi, że jego nowy model
samochodu ma wartość średnią przebiegu nie
wymagającą żadnej interwencji 12000 (mil). W teście
dla 4 losowo wybranych samochodów uzyskano
następujące przebiegi nie wymagające żadnego serwisu:
11000, 12000, 11800, 11200. Czy można zaprzeczyć
twierdzeniu producenta, przyjmując 0,05 oraz
rozkład normalny przebiegu.
Rozwiązanie:
1. H 0 : 12000
2. H1 : 12000
3. Statystyka testowa: T
X 12000
S/ n
4. 0,05 , 1 0,95 , liczba stopni swobody =
n 1 4 1 3 , t 0,95,3 = 2,353.
Obszar krytyczny
C = {t : t 2,353} .
5. n 4 , z obliczeń x 11500 , s 2
680000
226667,
4 1
stąd wartość statystyki testowej
t
6.
x 12000 11500 12000
2,10 .
s/ n
226667 / 4
2,10 2,353 , więc nie ma podstaw do
odrzucenia H 0 na poziomie istotności 0,05.
Odpowiedź: Na poziomie istotności 0,05
stwierdzamy, że nie można odrzucić twierdzenia
producenta.
Definicja.
Najmniejszy
poziom
istotności,
przy
którym
zaobserwowana wartość statystyki testowej prowadzi do
odrzucenia hipotezy zerowej nazywamy p-wartością
przeprowadzonego testu.
Np. w ostatnim zadaniu
t 2,10 ,
PH 0 (T t1 , n 1 )
PH 0 (T 2,10) 0,063.
Im mniejsza jest p-wartość, tym mocniejsze staje się
przekonanie testującego o fałszywości hipotezy zerowej i
prawdziwości hipotezy alternatywnej.
III. Testowanie hipotez o wariancji rozkładu
normalnego, gdy nieznana jest wartość średnia
Niech X1, X 2 ,..., X n będzie prostą próbą losowa z
rozkładu N ( , ) , , - nieznane.
H 0 : 2 02 .
Statystyka testowa:
2
(n 1) S 2
02
( n 1) S 2 2
=
2
2
Jeśli H 0 prawdziwa, to 2 ~ n21.
0
Model 1.
H 0 : 2 02
Wówczas przyjmujemy C =
H1 : 2 02
2
{ obl
:
(n 1) s 2
02
12 ,n 1 }
= obszar krytyczny testu hipotezy H 0 przeciw H1 na
poziomie istotności , gdzie
PH 0 ( 2 C ) PH 0 ( 2 12 , n 1 ) ,
12 , n 1 = kwantyl rzędu 1 rozkładu n21.
Model 2.
H 0 : 2 02
2
:
Wówczas C = { obl
(n 1) s 2
02
H1 : 2 02
2 , n 1} - obszar
krytyczny, gdzie
PH 0 ( 2 C ) PH 0 ( 2 2 , n 1 ) .
Model 3.
H 0 : 2 02
H1 : 2 02
Wówczas obszar krytyczny C =
2
{ obl
:
(n 1) s 2
02
2
/ 2 } { obl
2
:
(n 1) s 2
02
12 / 2 } ,
gdzie 2 / 2 2 / 2, n 1 , 12 / 2 12 / 2, n 1 .
Zadanie. Zmierzono czas życia 15 losowo wybranych
żarówek z bieżącej produkcji. Policzono standardowe
odchylenie próbkowe s 13 (godz. ). Czy na poziomie
istotności 0,05 ( 5%) można twierdzić, że
odchylenie standardowe czasu życia losowo wybranej
żarówki jest różne od 10 ( godz.)
Rozwiązanie.
1.
H 0 : 10
2.
H1 : 10
( n 1) S 2
3. Statystyka testowa:
102
4. 0,05 , / 2 0,025, 1 / 2 0,975,
2
n 15 , liczba stopni swobody n 1 15 1 14 ,
2 / 2, n 1 02,025,14 5,629,
12 / 2, n 1 02,975,14 26,119.
Reguła decyzyjna ( na podstawie obszaru krytycznego ):
odrzuć H 0 , jeśli obliczona wartość statystyki
2
2
5,629 lub obl
26,119 .
obl
5. s =13, stąd wartość statystyki testowej
2
obl
=
(n 1) s 2 (14)(132 )
23,66 .
100
100
6. 5,629 23,66 26,119 , więc nie ma podstaw do
odrzucenia H 0 .
Odpowiedź. Na poziomie istotności 0,05, brak jest
dostatecznych dowodów aby twierdzić, że 10.
IV. Testy o różnicy wartości średnich dwóch
rozkładów normalnych
Niech X1 , X 2 ,..., X n1 oraz Y1 , Y2 ,...,Yn2 będą dwiema
niezależnymi prostymi próbami losowymi z rozkładów
normalnych N ( 1 , 1 ) oraz N ( 2 , 2 ) , odpowiednio.
Model 1. ( znane odchylenia standardowe 1 , 2 )
H 0 : 1 2 ,
lub równoważnie
H 0 : 1 2 0 .
Statystyka testowa:
Konstrukcja oparta na analizie X Y .
Statystka
X Y ma rozkład normalny o wartości
średniej 1 2 i wariancji
12
n1
22
n2
( gdyż
średnie z obu prób losowych X , Y są niezależnymi
zmiennymi losowymi o rozkładach normalnych
2
1
) , N (2 ,
) , odpowiednio ). Stąd, po
n1
n2
standaryzacji mamy
N ( 1 ,
Z
( X Y ) ( 1 2 )
12
/ n1 22
/ n2
~ N (0,1) .
(a) H 0 : 1 2 0 ,
H 1 : 1 2 0 .
Jeśli H 0 prawdziwa, to
Z
X Y
12
/ n1 22
~ N (0,1) .
/ n2
Przyjmujemy C = {z : z z1 } = obszar krytyczny
testu hipotezy H 0 przeciw H1 na poziomie istotności ,
gdzie
PH 0 (Z C ) PH 0 (Z z1 ) ,
z1 = kwantyl rzędu 1 rozkładu N (0,1) .
(b) H 0 : 1 2 0 ,
H 1 : 1 2 0 .
Przyjmujemy C = {z : z z } = obszar krytyczny.
(c) H 0 : 1 2 0 ,
H 1 : 1 2 0
Przyjmujemy C = {z : z z1 / 2 } = obszar krytyczny.
Przykład. Średnia waga losowo wybranych 15
Europejczyków wyniosła x = 154 (funty), podczas gdy
dla próbki 18 Amerykanów otrzymano y = 162 (funty).
Z poprzednich badań wiadomo, że wariancje wag
losowo wybranego Europejczyka i Amerykanina
wynoszą, odpowiednio: 12 100 i 22 169 . Czy
można twierdzić, że średnie wagi w populacji
Europejczyków i Amerykanów są różne? Przyjąć
0,05 oraz rozkład normalny wag.
1.
H 0 : 1 2 0 .
2. H1 : 1 2 0
3. Statystyka testowa: Z
X Y
12 / n1 22 / n2
4. 0,05 , 1 / 2 0,975, z0,975 1,96 .
Obszar krytyczny C = {z : z 1,96} .
5. Mamy x =154, y =162, 12 100 , 22 169 , n1 15 ,
n2 18 . Stąd wartość statystyki testowej
z
xy
12
/ n1 22
/ n2
154 162
8
= - 2.
100 / 15 169 / 18
16,056
6. 2 2 1,96 , więc odrzucamy H 0 .
Odpowiedź: Na poziomie istotności 0,05
stwierdzamy, że średnia waga Europejczyka różni się od
średniej wagi Amerykanina, przy czym dane sugerują, że
średnio Amerykanie ważą więcej niż Europejczycy.
Model 2. ( nieznane odchylenia standardowe 1 , 2 )
Założenie dodatkowe: 1 2 , - nieznane.
H 0 : 1 2 ,
lub równoważnie
H 0 : 1 2 0 .
Statystyka testowa:
Jeśli H 0 prawdziwa, to
Z
X Y
X Y
=
~ N (0,1) .
2
2
1
/
n
1
/
n
1 / n1 2 / n2
1
2
1 1
Var( X Y ) = 2 ,
n1 n2
Niech
1 n1
1 n2
2
2
2
( X i X ) , S2
(Yi Y ) n1 1 i 1
n2 1 i 1
nieobciążone estymatory 2 .
Estymatorem nieobciążonym 2 , opartym na dwu
próbach łącznie, jest statystyka
S12
S 2p
(n1 1) S12 (n2 1) S 22
.
n1 n2 2
Wówczas we wzorze na Z podstawiając S p S 2p
zamiast otrzymujemy statystykę
T
X Y
1 1
Sp
n1 n2
~ tn1 n2 2 .
Dla trzech przypadków możliwych hipotez
alternatywnych (a), (b), (c) z modelu 1 mamy
analogiczne obszary krytyczne, przy czym kwantyle
rozkładu N (0,1) zastępujemy kwantylami rozkładu
tn1 n2 2 .
Przykład. Klasyczne tranzystory domieszkowane
złotem ( występujące w układach scalonych ) mają tzw.
czas magazynowania ładunku rzędu 7 ns. Producent ma
nadzieję, że pewna zmiana technologii zmniejszyła czas
magazynowania. Producent chciałby przetestować
hipotezę H 0 : 1 2 przeciw H1 : 1 2 , gdzie 1
oznacza średni czas magazynowania przy starej
technologii a 2 przy nowej technologii. Z poprzednich
badań wiadomo, że obie technologie dają w przybliżeniu
normalne rozkłady czasu magazynowania, oraz że
odchylenia standardowe obu rozkładów są takie same.
Producent pobrał 2 niezależne 50 elementowe próbki
tranzystorów, produkowanych starą i nowa technologią.
Średnie czasy magazynowania dla obu próbek wyniosły
x 6,6 , y 6,3 oraz s p 0,5 .
Statystyka testowa
X Y
T
.
1 1
Sp
n1 n2
Wartość statystyki testowej:
t
6,6 6,3
3,0 .
1
1
0,5
50 50
H 0 : 1 2 , H1 : 1 2 . Stąd obszar krytyczny
C = {t : t t1 / 2,98 z1 / 2 }.
oraz p-wartość testu wynosi PH 0 (T 3,0) 0,002.
Zatem, można przyjąć, że nowa technologia zmniejszyła
średni czas magazynowania ładunku.
V. Testy o różnicy wartości średnich rozkładów
brzegowych
Niech ( X1, Y1 ), ( X 2 , Y2 ),..., ( X n , Yn ) będzie prostą próbą
losową z rozkładu dwuwymiarowego. Niech
Di X i Yi , i 1,.., n, tworzą prostą próbę losową z
rozkładu normalnego o nieznanej średniej D .
Hipoteza zerowa: H 0 : D 0 ,
Hipotezy alternatywne możliwe:
(a)
H1 : D 0 ,
(b)
H1 : D 0
(c)
Statystyka testowa:
H1 : D 0 .
T
D
.
SD / n
Jeśli H 0 prawdziwa, to T ~ tn 1.
Zatem, obszary krytyczne takie same jak przy
testowaniu hipotez o wartości średniej jednej populacji
normalnej przy nieznanym odchyleniu standardowym.
Przykład. Zmierzono ciśnienie tętnicze wśród losowo
wybranej grupy chorych na pewną chorobę przed i po
podaniu takiego samego leku każdemu z pacjentów.
Otrzymano następujące wyniki:
Pacjent:
1
2
3
4
5
6
7
Przed : 210 180 260 270 190 250 180
Po : 180 160 220 260 200 230 180
Czy można twierdzić, na poziomie istotności 0,05, że
lek powoduje zmniejszenie wartości średniej ciśnienia?
( podać odpowiednie założenia ).
1.
H 0 : 1 2 H 0 : D 1 2 0
2.
H1 : 1 2
H1 : D 1 2 0
3. Statystyka testowa:
T
D
.
SD / n
4. di : 30, 20, 40, 10, -10, 20, 0, d 15,7 , s D = 15,9,
n = 7,
t
15,7
2,24
15,9 / 7
5. 0,05, 1 0.95, n 1 7 1 6 ,
t0,95,6 1,94
6. 2,24 >1,94, więc odrzucamy hipotezę zerową.
Odpowiedź. Można twierdzić, że lek obniżył wartość
średnią ciśnienia w populacji pacjentów, na poziomie
istotności 0,05.
VI. Testowanie hipotezy o równości wariancji dwóch
rozkładów normalnych
Niech X1 , X 2 ,..., X n1 oraz Y1 , Y2 ,...,Yn2 będą dwiema
niezależnymi prostymi próbami losowymi z rozkładów
normalnych N ( 1 , 1 ) oraz N ( 2 , 2 ) , odpowiednio,
H 0 : 12 22 .
Statystyka testowa:
S12
F 2
S2
Jeśli H 0 prawdziwa, to F ~ F Snedecora o
n1 1, n2 1 stopniami swobody.
(a) H1 : 12 22 0 ,
(b) H1 : 12 22 0 ,
(c) H1 : 12 22 0 .
W przypadkach (a), (b), (c) odrzucamy hipotezę zerową,
na poziomie istotności , jeśli obliczona wartość
statystyki F Snedecora f spełnia nierówności,
odpowiednio:
(a) f f1 , n1 1, n2 1,
(b) f f ,n11,n2 1
(c) f f / 2, n1 1, n2 1 lub f f1 / 2,n11,n2 1,