Remiantis statistinių tyrimų metu surinktais duomenimis, juos apdorojus, daromos išvados apie tiriamus reiškinius. Šios išvados padarytos kuriant ir tikrinant statistines hipotezes.

Statistinė hipotezė yra bet koks teiginys apie eksperimento metu pastebėtų atsitiktinių dydžių pasiskirstymo tipą ar savybes. Statistinės hipotezės tikrinamos statistiniais metodais.

Tikrinama hipotezė vadinama pagrindinis (nulis) ir yra paskirtas N 0 . Be nulinio vieneto, jis taip pat tęsiasi alternatyvi (konkuruojanti) hipotezė H 1, paneigiant pagrindinį . Taigi, atlikus testą, bus priimta viena ir tik viena iš hipotezių , o antrasis bus atmestas.

Klaidų rūšys. Iškelta hipotezė patikrinama remiantis imties, gautos iš bendrosios populiacijos, tyrimu. Dėl imties atsitiktinumo testas ne visada daro teisingą išvadą. Gali susidaryti šios situacijos:
1. Pagrindinė hipotezė yra teisinga ir jai pritarta.
2. Pagrindinė hipotezė yra teisinga, tačiau ji atmetama.
3. Pagrindinė hipotezė nėra teisinga ir ji atmetama.
4. Pagrindinė hipotezė nėra teisinga, bet jai pritariama.
2 atveju mes kalbame apie I tipo klaida, pastaruoju atveju kalbame apie antrojo tipo klaida.
Taigi dėl vienų pavyzdžių priimamas teisingas sprendimas, dėl kitų – neteisingas. Sprendimas priimamas remiantis tam tikros atrankos funkcijos, vadinamos, verte statistinė charakteristika, statistinis kriterijus arba tiesiog statistika. Šios statistikos verčių rinkinį galima suskirstyti į du atskirus poaibius:

  • N 0 yra priimtas (neatmestas), vadinamas hipotezės priėmimo sritis (leistina sritis);
  • statistinių verčių poaibis, kuriame hipotezė N 0 atmetamas (atmetamas) ir hipotezė priimama N 1, paskambino kritinė sritis.

Išvados:

  1. kriterijus vadinamas atsitiktiniu dydžiu K, kuris leidžia priimti arba atmesti nulinę hipotezę H0.
  2. Tikrinant hipotezes galima padaryti dviejų tipų klaidas.
    Pirmos rūšies klaida yra ta, kad hipotezė bus atmesta H 0, jei tiesa ("trūkstamas tikslas"). Tikimybė padaryti I tipo klaidą žymima α ir vadinama reikšmingumo lygis. Dažniausiai praktikoje daroma prielaida, kad α = 0,05 arba α = 0,01.
    Antro tipo klaida yra tai, kad hipotezė H0 yra priimta, jei ji klaidinga („klaidingai teigiama“). Tokio tipo klaidos tikimybė žymima β.

Hipotezių klasifikacija

Pagrindinė hipotezė N 0 apie paskirstymo nežinomo parametro q reikšmę paprastai atrodo taip:
H 0: q = q 0.
Konkuruojanti hipotezė N 1 gali turėti tokią formą:
N 1: q < q 0 , N 1:q> q 0 arba N 1: qq 0 .
Atitinkamai paaiškėja kairiarankis, dešiniarankis arba dvišalis kritines sritis. Kritinių sričių ribiniai taškai ( kritinius taškus) nustatomi iš atitinkamos statistikos pasiskirstymo lentelių.

Tikrinant hipotezę, protinga sumažinti klaidingų sprendimų tikimybę. Priimtina I tipo klaidos tikimybė paprastai skiriami a ir yra vadinamas reikšmingumo lygis. Jo vertė paprastai yra maža ( 0,1, 0,05, 0,01, 0,001 ...). Tačiau I tipo klaidos tikimybės sumažėjimas padidina antrojo tipo klaidos tikimybę ( b), t.y. noras priimti tik teisingas hipotezes sukelia atmestų teisingų hipotezių skaičiaus padidėjimą. Todėl reikšmingumo lygio pasirinkimą lemia keliamos problemos svarba ir neteisingo sprendimo pasekmių sunkumas.
Statistinės hipotezės tikrinimas susideda iš šių žingsnių:
1) hipotezių apibrėžimas N 0 ir N 1 ;
2) statistikos parinkimas ir reikšmingumo lygio nustatymas;
3) kritinių taškų nustatymas K kr ir kritinė sritis;
4) statistinės vertės apskaičiavimas pagal imtį K ex;
5) statistinės reikšmės palyginimas su kritiniu regionu ( K kr Ir K ex);
6) sprendimo priėmimas: jei statistinė reikšmė yra ne kritinėje srityje, hipotezė priimama N 0 ir hipotezė atmetama H 1, o jei jis patenka į kritinę sritį, tada hipotezė atmetama N 0 ir hipotezė priimta N 1 . Tuo pačiu metu statistinės hipotezės tikrinimo rezultatai turėtų būti interpretuojami taip: jei hipotezė priimta N 1 , tada galime laikyti jį įrodytu, o jei hipotezę priimsime N 0 , tada jie pripažino, kad tai neprieštarauja stebėjimų rezultatams.Tačiau ši savybė kartu su N Kitos hipotezės taip pat gali turėti 0.

Hipotezių testų klasifikacija

Toliau panagrinėkime kelias skirtingas statistines hipotezes ir jų tikrinimo mechanizmus.
aš) Hipotezė apie normalaus skirstinio su nežinoma dispersija bendrą vidurkį. Darome prielaidą, kad populiacija turi normalųjį skirstinį, jos vidurkis ir dispersija nežinomi, tačiau yra pagrindo manyti, kad bendrasis vidurkis yra lygus a. Esant reikšmingumo lygiui α, hipotezę reikia patikrinti N 0: x =a. Kaip alternatyva gali būti naudojama viena iš trijų aukščiau aptartų hipotezių. Šiuo atveju statistika yra atsitiktinis kintamasis, turintis Stjudento pasiskirstymą su n– 1 laisvės laipsnis. Nustatoma atitinkama eksperimentinė (stebėta) vertė t ex t kr N 1: x >a jis randamas pagal reikšmingumo lygį α ir laisvės laipsnių skaičių n– 1. Jeigu t ex < t kr N 1: x ≠a kritinė reikšmė randama reikšmingumo lygyje α / 2 ir tiek pat laisvės laipsnių. Nulinė hipotezė priimtina, jei | t ex | II) hipotezė apie dviejų atsitiktinai paskirstytų populiacijų vidutinių verčių lygybę (didelės nepriklausomos imtys). Esant reikšmingumo lygiui α, hipotezę reikia patikrinti N 0: x ≠y . Jei abiejų imčių tūris yra didelis, tai galime daryti prielaidą, kad imties vidurkiai turi normalųjį pasiskirstymą ir žinomi jų dispersijos. Tokiu atveju atsitiktinis dydis gali būti naudojamas kaip statistika
,
turintys normalųjį pasiskirstymą ir M(Z) = 0, D(Z) = 1. Nustatoma atitinkama eksperimentinė vertė z pvz. Iš Laplaso funkcijų lentelės randama kritinė reikšmė z kr. Pagal alternatyvią hipotezę N 1: x >y randama iš sąlygos F(z kr) = 0,5 – a. Jeigu z pvz< z кр , tada nulinė hipotezė priimama, priešingu atveju ji atmetama. Pagal alternatyvią hipotezę N 1: x ≠y kritinė reikšmė randama iš sąlygos F(z kr) = 0,5×(1 – a). Nulinė hipotezė priimtina, jei | z ex |< z кр .

III) Hipotezė apie dviejų normaliai pasiskirstytų populiacijų, kurių dispersijos nežinomos ir identiškos, vidutinių verčių lygybę (mažos nepriklausomos imtys). Esant reikšmingumo lygiui α, reikia patikrinti pagrindinę hipotezę N 0: x =y . Kaip statistiką naudojame atsitiktinį kintamąjį
,
studentų paskirstymas su ( n x + n m– 2) laisvės laipsniai. Nustatoma atitinkama eksperimentinė vertė t ex. Iš Studento skirstinio kritinių taškų lentelės randama kritinė reikšmė t kr. Viskas išspręsta panašiai kaip hipotezė (I).

IV) Hipotezė apie dviejų normaliai išsidėsčiusių populiacijų dispersijų lygybę. Šiuo atveju – reikšmingumo lygmeniu a reikia patikrinti hipotezę N 0: D(X) = D(Y). Statistika yra atsitiktinis kintamasis, turintis Fišerio–Snedecoro pasiskirstymą f 1 = n b– 1 ir f 2 = n m– 1 laisvės laipsnis (S 2 b – didelė dispersija, jos mėginio tūris n b). Nustatoma atitinkama eksperimentinė (stebėta) vertė F pvz. Kritinė vertė F kr pagal alternatyvią hipotezę N 1: D(X) > D(Y) randamas iš Fisher–Snedecor skirstinio pagal reikšmingumo lygį kritinių taškų lentelės a ir laisvės laipsnių skaičius f 1 ir f 2. Nulinė hipotezė priimtina, jei F pvz < F kr.

Instrukcijos. Norėdami apskaičiuoti, turite nurodyti šaltinio duomenų matmenis.

V) hipotezė apie kelių normaliai pasiskirstytų populiacijų dispersijų lygybę to paties dydžio imtyse. Šiuo atveju – reikšmingumo lygmeniu a reikia patikrinti hipotezę N 0: D(X 1) = D(X 2) = …= D(X l). Statistika yra atsitiktinis dydis , turintis Cochran pasiskirstymą su laisvės laipsniais f = n– 1 ir l (n – kiekvieno mėginio tūris, l– mėginių skaičius). Ši hipotezė tikrinama taip pat, kaip ir ankstesnė. Naudojama Cochran skirstinio kritinių taškų lentelė.

VI) Hipotezė apie koreliacinio ryšio reikšmę.Šiuo atveju – reikšmingumo lygmeniu a reikia patikrinti hipotezę N 0: r= 0. (Jei koreliacijos koeficientas lygus nuliui, tai atitinkami dydžiai nesusiję vienas su kitu). Šiuo atveju statistika yra atsitiktinis dydis
,
turintys Studentų paskirstymą su f = n– 2 laisvės laipsniai. Šios hipotezės patikrinimas atliekamas panašiai kaip hipotezės (I) testas.

Instrukcijos. Nurodykite įvesties duomenų kiekį.

VII) Hipotezė apie įvykio tikimybės vertę. Gana didelis skaičius n nepriklausomi bandymai, kurių metu įvykis Aįvyko m kartą. Yra pagrindo manyti, kad tam tikro įvykio tikimybė vieno bandymo metu yra lygi 0 p. Reikalingas reikšmingumo lygiu a patikrinkite hipotezę, kad įvykio tikimybė A lygi hipotetinei tikimybei 0 p. (Kadangi tikimybė vertinama pagal santykinį dažnį, tikrinama hipotezė gali būti formuluojama ir kitaip: ar stebimas santykinis dažnis ir hipotetinė tikimybė reikšmingai skiriasi, ar ne).
Bandymų skaičius yra gana didelis, todėl santykinis įvykio dažnis A paskirstytas pagal įprastą dėsnį. Jei nulinė hipotezė yra teisinga, tada jos matematinis lūkestis yra teisingas 0 p, ir dispersija . Atsižvelgdami į tai, kaip statistiką pasirenkame atsitiktinį kintamąjį
,
kuri apytiksliai pasiskirsto pagal normalųjį dėsnį su nuline matematine lūkesčiu ir vieneto dispersija. Ši hipotezė tikrinama lygiai taip pat, kaip ir (I) atveju.

Instrukcijos. Norėdami apskaičiuoti, turite užpildyti pradinius duomenis.

Statistika yra sudėtingas įvairių duomenų matavimo ir analizės mokslas. Kaip ir daugelyje kitų disciplinų, ši pramonės šaka turi hipotezės koncepciją. Taigi, statistikos hipotezė yra bet koks pasiūlymas, kurį reikia priimti arba atmesti. Be to, šioje pramonės šakoje yra keletas tokių prielaidų tipų, kurių apibrėžimas yra panašus, bet praktiškai skiriasi. Nulinė hipotezė yra šiandienos tyrimo objektas.

Nuo bendro iki konkrečios: hipotezės statistikoje

Kitas ne mažiau svarbus nukrypimas nuo pagrindinio prielaidų apibrėžimo yra tas, kad statistinė hipotezė yra bendros mokslui svarbių objektų populiacijos tyrimas, dėl kurio mokslininkai daro išvadas. Jį galima patikrinti naudojant imtį (dalį populiacijos). Štai keletas statistinių hipotezių pavyzdžių:

1. Visos klasės rezultatai gali priklausyti nuo kiekvieno mokinio išsilavinimo lygio.

2. Matematikos pradinį kursą vienodai įvaldo ir vaikai, atėję į mokyklą 6 metų, ir vaikai, atėję į mokyklą 7 metų.

Paprasta statistikos hipotezė – tai prielaida, vienareikšmiškai apibūdinanti tam tikrą mokslininko paimto dydžio parametrą.

Sudėtingas susideda iš kelių arba begalinio skaičiaus paprastų. Nurodyta tam tikra sritis arba nėra tikslaus atsakymo.

Pravartu suprasti kelis statistikos hipotezių apibrėžimus, kad jų nesupainiotumėte praktikoje.

Nulinės hipotezės samprata

Nulinė hipotezė yra teorija, kad yra dvi populiacijos, kurios nesiskiria viena nuo kitos. Tačiau moksliniu lygmeniu nėra sąvokos „nesiskirti“, tačiau yra „jų panašumas yra nulis“. Iš šio apibrėžimo buvo suformuota sąvoka. Statistikoje nulinė hipotezė žymima H0. Be to, kraštutinė neįmanomo (mažai tikėtina) reikšmė laikoma nuo 0,01 iki 0,05 arba mažesnė.

Geriau suprasti, kas yra nulinė hipotezė; padės realus pavyzdys. Universiteto dėstytojas teigė, kad skirtingą abiejų grupių studentų pasirengimo testiniam darbui lygį lemia nereikšmingi parametrai, atsitiktinės priežastys, neturinčios įtakos bendram išsilavinimo lygiui (skirtingas dviejų grupių pasirengimas). studentų yra nulis).

Tačiau verta paprieštarauti alternatyvios hipotezės pavyzdžiu – prielaida, paneigiančia nulinės teorijos teiginį (H1). Pavyzdžiui: universiteto direktorius teigė, kad skirtingas abiejų grupių studentų pasirengimo kontroliniam darbui lygis atsiranda dėl to, kad dėstytojai naudoja skirtingus mokymo metodus (abiejų grupių pasirengimo skirtumas yra reikšmingas ir to paaiškinimas).

Dabar iškart matomas skirtumas tarp sąvokų „nulinė hipotezė“ ir „alternatyvi hipotezė“. Šias sąvokas iliustruoja pavyzdžiai.

Nulinės hipotezės tikrinimas

Daryti prielaidą nėra taip blogai. Tikras iššūkis pradedantiesiems yra patikrinti nulinę hipotezę. Čia daugelio laukia sunkumai.

Naudodami alternatyvios hipotezės metodą, teigiantį kažką priešingo nulinei teorijai, galite palyginti abu variantus ir pasirinkti tinkamą. Taip veikia statistika.

Tegul nulinė hipotezė yra H0, o alternatyvioji - H1, tada:

Н0: c = c0;
Н1: c ≠ c0.

Čia c yra tam tikra vidutinė populiacijos vertė, kurią reikia rasti, o c0 yra iš pradžių duota reikšmė, pagal kurią hipotezė tikrinama. Taip pat yra tam tikras skaičius X – vidutinė imties reikšmė, pagal kurią nustatomas c0.

Taigi, testą sudaro X ir c0 palyginimas, jei X = c0, tada priimama nulinė hipotezė. Jei X≠c0, tai pagal sąlygą alternatyva laikoma teisinga.

„Pasitikėjimo“ patikrinimo metodas

Yra veiksmingiausias būdas nulinę statistinę hipotezę lengvai patikrinti praktiškai. Jį sudaro verčių diapazono sudarymas iki 95% tikslumo.

Pirmiausia turite žinoti pasikliautinojo intervalo apskaičiavimo formulę:
X – t*Sx ≤ c ≤ X + t*Sx,

kur X yra iš pradžių pateiktas skaičius, pagrįstas alternatyvia hipoteze;
t - lentelės reikšmės (studento koeficientas);
Sx yra standartinė vidutinė paklaida, kuri apskaičiuojama kaip Sx = σ/√n, kur skaitiklis yra standartinis nuokrypis, o vardiklis yra imties dydis.

Taigi, įsivaizduokime situaciją. Prieš remontą konvejeris per dieną pagamindavo 32,1 kg galutinių gaminių, o po remonto, verslininko teigimu, efektyvumas išaugo, o konvejeris pagal savaitinį bandymą pradėjo gaminti vidutiniškai 39,6 kg.

Nulinė hipotezė teigtų, kad remontas neturėjo jokios įtakos konvejerio efektyvumui. Alternatyvi hipotezė teigtų, kad remontas kardinaliai pakeitė konvejerio efektyvumą, todėl padidėjo jo našumas.

Iš lentelės randame n=7, t = 2,447, iš kur formulė įgauna tokią formą:

39,6 – 2,447*4,2 ≤ c ≤ 39,6 + 2,447*4,2;

29,3 ≤ с ≤ 49,9.

Pasirodo, reikšmė 32,1 yra intervale, todėl alternatyvos pasiūlyta reikšmė - 39,6 - nėra automatiškai priimama. Atminkite, kad pirmiausia patikrinamas nulinės hipotezės teisingumas, o tada – priešinga.

Neigimo rūšys

Anksčiau mes svarstėme hipotezės konstravimo variantą, kai H0 kažką tvirtina, o H1 paneigia. Kur būtų galima sukurti tokią sistemą:

H0: c = c0;
Н1: с ≠ с0.

Tačiau yra dar du susiję paneigimo būdai. Pavyzdžiui, nulinė hipotezė teigia, kad klasės vidurkis yra didesnis nei 4,54, o alternatyvi hipotezė teigtų, kad tos pačios klasės vidurkis yra mažesnis nei 4,54. Ir tai atrodys taip kaip sistema:

Н0: с ⩾ 4,54;
H1: s< 4.54.

Atkreipkite dėmesį, kad nulinė hipotezė teigia, kad reikšmė yra didesnė arba lygi, o statistinė hipotezė teigia, kad ji yra griežtai mažesnė nei. Nelygybės ženklo sunkumas yra labai svarbus!

Statistinis testas

Nulinių hipotezių statistinis patikrinimas apima statistinio testo naudojimą. Tokiems kriterijams taikomi įvairūs platinimo įstatymai.

Pavyzdžiui, yra F testas, kuris apskaičiuojamas naudojant Fišerio skirstinį. Yra T testas, dažniausiai naudojamas praktikoje, priklausomai nuo Studento pasiskirstymo. Pirsono kvadrato tinkamumo testas ir kt.

Nulinės hipotezės priimtinumo diapazonas

Algebroje yra sąvoka „priimtinų verčių regionas“. Tai yra X ašies segmentas arba taškas, kuriame yra statistinių reikšmių rinkinys, kuriame nulinė hipotezė yra teisinga. Kraštutiniai segmento taškai yra kritinės reikšmės. Spinduliai dešinėje ir kairėje segmento pusėse yra kritinės sritys. Jei į juos įtraukiama rasta reikšmė, tada nulinė teorija paneigiama ir priimama alternatyva.

Nulinės hipotezės paneigimas

Nulinė hipotezė statistikoje kartais yra labai sudėtinga sąvoka. Tikrindami galite padaryti dviejų tipų klaidas:

1. Teisingos nulinės hipotezės atmetimas. Pirmąjį tipą pažymėkime kaip a=1.
2. Klaidingos nulinės hipotezės priėmimas. Antrąjį tipą žymime a=2.

Verta suprasti, kad tai nėra tie patys parametrai, klaidų pasekmės gali labai skirtis viena nuo kitos ir turėti skirtingus pavyzdžius.

Dviejų tipų klaidų pavyzdys

Sudėtingas sąvokas lengviau suprasti pateikus pavyzdį.

Gaminant tam tikrą vaistą, mokslininkai turi būti ypač atsargūs, nes vieno iš komponentų dozės viršijimas sukelia didelį gatavo vaisto toksiškumą, nuo kurio jį vartojantys pacientai gali mirti. Tačiau cheminiu lygiu perdozavimo nustatyti neįmanoma.
Dėl šios priežasties, prieš išleidžiant vaistą į pardavimą, nedidelė jo dozė tiriama su žiurkėmis ar triušiais, jiems suleidžiant vaisto. Jei dauguma tiriamųjų miršta, tai vaistai neleidžiami pardavinėti, jei tiriamieji gyvi, tai leidžiama prekiauti vaistinėse.

Pirmas atvejis: iš tikrųjų vaistas nebuvo toksiškas, tačiau eksperimento metu buvo padaryta klaida ir vaistas buvo priskirtas toksiškiems ir nebuvo leistas parduoti. A=1.

Antras atvejis: dar vieno eksperimento metu, tiriant kitą narkotikų partiją, buvo nuspręsta, kad vaistas nėra toksiškas, ir leista jį parduoti, nors iš tiesų vaistas buvo nuodingas. A=2.

Pirmasis variantas tiekėjui-verslininkui pareikalaus didelių finansinių išlaidų, nes jis turės sunaikinti visą vaistų partiją ir pradėti nuo nulio.

Antroji situacija išprovokuos pacientų, įsigijusių ir vartojusių šį vaistą, mirtį.

Tikimybių teorija

Pagal reikšmingumo lygį skirstomos ne tik nulinės hipotezės, bet ir visos statistikos ir ekonomikos hipotezės.

Reikšmingumo lygis – tai I tipo klaidų (teisingos nulinės hipotezės atmetimas) atsiradimo procentas.

Pirmasis lygis yra 5% arba 0,05, t. y. tikimybė klysti yra 5 iš 100 arba 1 iš 20.
antrasis lygis yra 1% arba 0,01, t.y. tikimybė yra 1 iš 100.
trečias lygis – 0,1% arba 0,001, tikimybė 1 iš 1000.

Hipotezių tikrinimo kriterijai

Jei mokslininkai jau padarė išvadą, kad nulinė hipotezė yra teisinga, tuomet ją reikia patikrinti. Tai būtina norint pašalinti klaidas. Yra pagrindinis nulinės hipotezės tikrinimo kriterijus, kurį sudaro keli etapai:

1. Leidžiama paklaidos tikimybė laikoma P=0,05.
2. 1 kriterijui parenkama statistika.
3. Taikant gerai žinomą metodą, randamas priimtinų verčių diapazonas.
4. Dabar apskaičiuojama T statistikos reikšmė.
5. Jeigu T (statistika) priklauso nulinės hipotezės priėmimo sričiai (kaip ir „pasitikėjimo“ metodu), tai prielaidos laikomos teisingomis, o tai reiškia, kad pati nulinė hipotezė išlieka teisinga.

Būtent taip veikia statistika. Nulinė hipotezė, jei ji bus tinkamai patikrinta, bus priimta arba atmesta.

Verta paminėti, kad paprastiems verslininkams ir vartotojams pirmuosius tris etapus gali būti labai sunku tiksliai atlikti, todėl jie patiki profesionaliems matematikams. Tačiau 4 ir 5 etapus gali atlikti kiekvienas, turintis pakankamai žinių apie statistinio tikrinimo metodus.

Studijuodamas šį skyrių, studentas turėtų:

žinoti

  • kas yra statistinė hipotezė;
  • teorinių, eksperimentinių ir statistinių hipotezių ryšys;
  • skirtumai tarp nulinių ir alternatyvių hipotezių;
  • statistinių hipotezių vertinimo, priėmimo ir atmetimo logika;
  • pirmos ir antros rūšies paklaidos sąvokos, statistinis reikšmingumas (patikimumas);
  • skirtumai tarp parametrinės ir neparametrinės statistikos, šių dviejų tipų statistinių testų galimybės ir apribojimai;

galėti

  • patikrinkite paprastas hipotezes apie vidurkio naudojimą t -Studento suporuotų (sujungtų) ir nesuporuotų (nepriklausomų) imčių t-testas;
  • įvertinkite dviejų mėginių homogeniškumą naudodami t -Mokinio testas ir F -Fisher testas;
  • sudaryti įvertintų parametrų pasikliautinuosius intervalus;

savo

  • metodinis aparatas ir pagrindiniai statistinių hipotezių iškėlimo ir tikrinimo įgūdžiai;
  • statistinių hipotezių vertinimo ir pasikliautinųjų intervalų sudarymo įgūdžiai.

Bendroji strategija

Jau žinote, kad statistinėje analizėje įprasta atskirti sąvokas „parametras“ ir „statistika“. Šie skirtumai išsamiai aptariami skyriuje. 1; lentelėje 2.1 apibendrina diskusija.

Prisiminkime, kad bet koks skirstinys gali būti apibūdinamas tam tikrais teoriniais parametrais. Tikėtis, sklaida, iškrypimas, kurtozė yra tokių atsitiktinio dydžio pasiskirstymo populiacijoje parametrų pavyzdžiai. Visi jie, dar kartą atkreipkime dėmesį į šį svarbų faktą, yra teoriniai dydžiai, kurie praktiškai niekada nežinomi. Praktinėje tyrėjo veikloje jie gali būti vertinami tik skirtingu tikslumu, skaičiuojant įvairias statistines reikšmes, kurios ne visada yra lygios teorinėms parametrų reikšmėms, taip pat viena kitai, kaip jau minėjome. 1.4 pastraipoje, nagrinėjant praktinius tokių asmenybės bruožų, kaip moteriškumas – vyriškumas, pasiskirstymo įvairiais parametrais pavyzdžius.

2.1 lentelė

Parametrų ir statistikos ryšys

Ir tai nenuostabu: juk statistika atsitiktinių dydžių elgseną atspindi tik eksperimentuotojo suformuotoje imtyje, o ne pačioje bendrojoje populiacijoje. Todėl eksperimentuotojui gali kilti klausimas, kaip apskaičiuota statistika yra susijusi su teoriniais skirstinio parametrais. Kitaip tariant, eksperimentuotojas gali būti suinteresuotas, ar jo turimi imties duomenys iš tikrųjų yra paimti iš populiacijos, kuriai būdingi teoriškai numatyti pasiskirstymo parametrai. Norėdamas atsakyti į šį klausimą, eksperimentatorius kelia ir patikrina statistines hipotezes.

Statistinės hipotezės iškviesti prielaidas apie galimas populiacijos atsitiktinio dydžio pasiskirstymo parametrų reikšmes. Statistinių hipotezių tikrinimas ir analizė atliekami renkant ir konstruojant statistiką. Šio darbo įrankis yra statistiniai testai, arba kriterijai, kurių kiekviena reprezentuoja tam tikrą standartizuotų taisyklių rinkinį. Remiantis šiomis taisyklėmis, priimamas sprendimas dėl statistinės hipotezės teisingumo ar klaidingumo.

Dar kartą pažvelkime į monetos metimo pavyzdį. Galime daryti prielaidą, kad metant įprastą, nepadirbtą ir nepažeistą monetą tikimybė gauti galvas yra 50%. Tai reiškia, kad tokio įvykio matematinis lūkestis metant monetą 100 kartų bus lygus 50. Šios hipotezės patikrinimas susideda iš panašaus testo atlikimo, įvertinant mus dominantį parametrą dėl to, apskaičiuojant atitinkamą statistiką. ir naudojant šią statistiką iškeltos hipotezės patikimumo patikrinimui. Pavyzdžiui, išbandę monetą 100 kartų, galime patikrinti, ar kiekviena pusė iš tikrųjų iškilo 50 kartų. Tačiau tikėtina, kad tokio testo rezultatas vis tiek kiek skirsis nuo teoriškai laukiamo. Kitaip tariant, net jei galvutės kyla šiek tiek mažiau ar šiek tiek daugiau nei 50 kartų, vargu ar turėsime pagrindo manyti, kad moneta yra padirbta. Situacija bus įtartina, kai toks nukrypimas nuo teoriškai numanomų verčių pasieks didesnes reikšmes, pavyzdžiui, kai „galvos“ neiškrenta net vieną kartą po 100 monetos bandymų. Tokia situacija atrodo mažai tikėtina, jei su moneta viskas tvarkoje.

Taigi, aišku, kad jei metant monetą 100 kartų „galvos“ iškyla lygiai 50 kartų, tai nieko blogo. Jei „galvos“ niekada neatsiranda, yra pagrindo manyti, kad su moneta kažkas negerai. Tačiau kur yra riba, skirianti teigiamas ir neigiamas išvadas? Šis klausimas yra susijęs su pasirinktu sprendimo kriterijumi. Būtent šie kriterijai yra matematinėje statistikoje sukurti statistiniai testai, skirti patikrinti statistines hipotezes, kurios dėl to dažnai vadinamos statistiniais kriterijais.

Taigi statistinių hipotezių tikrinimas atliekamas įvertinus atsitiktinio įvykio tikimybę, kuri laikoma statistine reikšme. Jei ši tikimybė yra labai nereikšminga, su sąlyga, kad iškelta hipotezė yra teisinga, tikrinama statistinė hipotezė atmetama, priešingu atveju hipotezė priimama.

Tačiau šios procedūros sudėtingumas gali būti susijęs su tuo, kad galime iš anksto nežinoti konkrečios analizuojamo atsitiktinio dydžio pasiskirstymo parametro reikšmės. Pavyzdžiui, monetos atveju galime manyti, kad moneta yra padirbta, todėl tikimybė gauti galvutes daugiau ar mažiau skiriasi nuo 50%. Tokiu atveju, atlikę bandymų seriją, negalėsime įvertinti, kiek gauta statistika, apibūdinanti analizuojamo įvykio matematinio lūkesčio reikšmę, skiriasi nuo jos tikrosios vertės. Ir tada patikrinti statistinę hipotezę gali atrodyti neįmanoma. Tačiau išeitis iš šios situacijos gali būti įvertinti priešingos hipotezės tikimybę. Kitaip tariant, šiuo atveju galima, pavyzdžiui, iškelti hipotezę apie 50% teorinės tikimybės lygybę. Jei ši hipotezė pasirodo neteisinga, priimama alternatyvi hipotezė.

Iš tiesų, tikrindamas statistines hipotezes, tyrėjas visada susiduria su ne viena, o dviem hipotezėmis, kurios žymimos kaip N 0 ir N 1. Viena iš šių hipotezių vadinama niekine, kita – alternatyvia, t.y. paneigiantis nulį.

Nulinė hipotezė H 0 visada yra konkretus. Jis visada tvirtina tam tikrą paskirstymo parametro reikšmę. Pavyzdžiui, hipotezę dėl matematinio lūkesčio galima suformuluoti taip: μ = A, Kur A yra tam tikra specifinė μ reikšmė, o hipotezė dėl dviejų dispersijos dydžių lygybės yra σ1 = σ2.

Alternatyvi hipotezė H 1 visada formuluojamas ne taip konkrečiai, pavyzdžiui: μ > A ; * σ2 ir kt. Tačiau, kaip taisyklė, paaiškėja, kad eksperimentuotojo nedomina konkreti nulinė hipotezė N 0, bet tik ne tokia konkreti alternatyvi hipotezė N 1, nes būtent tai labiau atitinka mokslinę hipotezę, kurią jis tikrina eksperimente.

Atlikdamas empirinį teorinio parametro vertinimą, eksperimentatorius nustato gauto rezultato statistinį reikšmingumą, remdamasis tiesos prielaida. N 0. Statistinis reikšmingumas – tai tikimybė, kad per begalinį skaičių eksperimentų, visiškai atkuriančių eksperimento sąlygas, gausime tokią pat ar net didesnę sukonstruotos statistikos reikšmę. Jei tikimybė gauti šią ir dar didesnes statistines vertes per begalinį skaičių eksperimentų su tomis pačiomis sąlygomis, atsižvelgiant į tai, kad nulinė hipotezė yra teisinga, pasirodo esanti maža, eksperimentatorius atsisako nulinės hipotezės ir pasirenka alternatyvą.

Aiškiai aprašyta logika parodyta fig. 2.1. Kaip akivaizdu, čia pateikiamos dvi alternatyvios hipotezės. Vienas iš jų yra specifinis ir daro prielaidą, kad matematinis lūkestis yra lygus nuliui. Ši hipotezė žymima kaip N 0. Atitinkama kreivė apibūdina atsitiktinio dydžio Z pasiskirstymą, numatytą pagal šią hipotezę. Antroji hipotezė, žymima kaip N 1, mažiau konkretus. Jame tik teigiama, kad matematinio lūkesčio vertė turi viršyti nulį. Iš esmės yra begalinis skaičius kreivių, apibūdinančių skirstinius, atitinkančius šią hipotezę. Pateikta kreivė yra viena iš galimų. Didumas Ζ exp apibūdina statistikos reikšmę, kuri įvertina teorinį parametrą μ eksperimente. Štai ką eksperimentuotojas turi savo žinioje, ką jam pavyko gauti rinkdamas empirinius duomenis. Pavyzdžiui, tai gali būti imties aritmetinis vidurkis. Tada iškeltų statistinių hipotezių testą turėtų sudaryti bandymas įvertinti, kokia tikimybė kitam panašiam eksperimentui gauti tą pačią ar net didesnę Zexp reikšmę, jei nulinė hipotezė yra teisinga. Akivaizdu, kad ši tikimybė yra lygi plotui po pasiskirstymo kreive, kuri prisiima pagal šią hipotezę. Ši sritis kairėje ribojama apskaičiuotos statistikos, dešinėje – neribota. Tokia sritis, kaip prisimename (žr. 1.2 pastraipą), vadinama skirstinio kvantiliu. Jį galima apibrėžti taip:

Ryžiai. 2.1.

Kvantilė, reikalinga hipotezei priimti arba atmesti R šioje lygtyje reiškia vadinamąjį reikšmingumo lygis skaičiuojama statistika Zexp. Kuo ši reikšmė didesnė, tuo labiau tikėtina, kad eksperimento metu gauti duomenys aprašomi skirstiniu f Ho( Z ), t.y. hipotezės prognozuojamas pasiskirstymas N 0. Priešingai, tuo mažesnė reikšmė R, tuo mažesnė tikimybė, kad empiriniai duomenys iš tikrųjų atitinka skirstinį f H0(Z), ir tuo labiau tikėtina, kad jie apibūdinami skirstiniu, darant prielaidą, kad μ reikšmė yra didesnė. Taigi, įvertinant vertę R, galima nuspręsti vienos iš dviejų iškeltų hipotezių naudai.

Hipotezė N 0 gali būti priimtas, jei kvantilio reikšmė, lemianti empirinės reikšmės statistinį reikšmingumą X, pasirodo gana didelis. Alternatyvi hipotezė N 1 priimamas, jei kvantilio reikšmė, lemianti eksperimente gauto rezultato statistinį reikšmingumą, pasirodo esanti nežymiai maža. Tačiau problema yra ta, kuri kvantilinė reikšmė, apibrėžianti statistinį reikšmingumą, laikoma pakankamai didele, o kuri nežymiai maža. Norėdami išspręsti šią problemą, išsamiau panagrinėkime, kokias galimybes turi eksperimentatorius vertindamas statistines hipotezes (2.2 lentelė).

Akivaizdu, kad iškeltos statistinės hipotezės gali būti teisingos arba klaidingos. Nuo hipotezių N 0 ir N 1 yra alternatyvūs, t.y. jie atmeta vienas kitą, yra tik du hipotetiniai atvejai, apibūdinantys nagrinėjamų hipotezių teisingumą ar klaidingumą: arba N 0 bus teisingas ir N 1 yra atitinkamai neteisingas arba atvirkščiai. Kadangi eksperimentatorius, vertinantis hipotezes, niekada nežino, kuri hipotezė yra teisinga, sprendimas yra priimti arba atmesti hipotezę. N 0 neturi nieko bendra su savo tiesa ar melagingumu – juk būtent tai jis ir bando nustatyti. Taigi, tikrinant statistines hipotezes, galimos keturios baigtys, iš kurių tik dvi gali būti laikomos palankiomis eksperimentuotojui, nepriklausomai nuo to, kurią hipotezę tyrėjas iš tikrųjų nori įrodyti.

2.2 lentelė

Rezultatų matrica vertinant statistines hipotezes

Jei hipotezė N 0 yra teisingas ir jis priimtas kaip statistinės analizės rezultatas, eksperimentatorius nedaro klaidos. Ir tai yra palankus rezultatas tyrėjui, net jei jis ir norėtų priimti alternatyvią hipotezę. Taip pat eksperimentatorius nedaro klaidų, kai atmeta hipotezę N 0, o tai iš tikrųjų yra neteisinga. Tačiau gali atsitikti taip, kad nulinė hipotezė iš tikrųjų yra teisinga, tačiau eksperimentuotojas vis tiek ją atmeta. Tokiu atveju jis daro klaidą, kuri dažniausiai vadinama pirmos rūšies klaida arba α( alfa )- klaida. Antros rūšies klaida, arba β( beta versija )- klaida, yra rezultatas, kai eksperimentatorius priima nulinę hipotezę, kuri iš tikrųjų pasirodo esanti klaidinga.

Akivaizdu, kad kuo didesnė tikimybė, lemianti eksperimente gauto rezultato statistinį reikšmingumą, kai eksperimentatorius yra pasirengęs atsisakyti nulinės hipotezės alternatyvos naudai, tuo didesnė pirmojo tipo klaidos tikimybė ir tuo mažesnė antrojo tipo klaidos tikimybė (2.2 pav.). Priešingai, sumažindamas tikimybės, kuriai esant eksperimentatorius atmeta nulinę hipotezę, vertę, jis rizikuoja padaryti II tipo klaidą su didesne tikimybe, bet taip labiau apsisaugo nuo I tipo klaidos. Taigi kyla klausimas, kokiame reikšmingumo lygmenyje yra hipotezė N 0 gali būti atmestas arba priimtas, iš tikrųjų yra susijęs su tuo, kuri iš dviejų galimų klaidų yra mažiau svarbi eksperimentuotojui. Naudodamas konservatyvesnę statistinės hipotezės tikrinimo strategiją, eksperimentatorius nepaiso II tipo klaidos pavojaus. Naudodamas radikalesnę veiksmo versiją, eksperimentatorius tarsi pamiršta apie pirmojo tipo klaidą.

Ryžiai. 2.2.

Jei statistinės hipotezės priėmimas reiškia kokių nors svarbių socialinių pasekmių, gali būti priimta konservatyvesnė jos vertinimo strategija. Jei atmetus statistinę hipotezę gali kilti rimtų pasekmių, galite elgtis ne taip konservatyviai.

Pavyzdžiui, apsvarstykite klausimą dėl konkretaus vaiko protinio atsilikimo nustatymo. Psichologinis tyrimas atskleidė, kad jo IQ buvo žemesnis už šios tiriamųjų populiacijos vidurkį. Taigi kilo prielaida apie nepakankamą šio vaiko intelektualinį išsivystymą ir dėl to būtinybę jį siųsti į specialią internatinę mokyklą protiškai atsilikusiems. Šiai hipotezei patikrinti buvo suformuluotos dvi alternatyvios statistinės hipotezės, iš kurių viena daro prielaidą, kad tyrimo metu gauti duomenys apibūdina įprastą populiacijos pasiskirstymą su matematiniu lūkesčiu, lygiu protinį atsilikimą apibrėžiančiai ribai, tarkime, 75 balais (hipotezė). N 0), o antroji prisiima mažesnę matematinio lūkesčio reikšmę, t.y. matematinis lūkestis yra mažesnis už nurodytą ribą (hipotezė N 1). Darykime prielaidą, kad, vertinant empirinio vaiko intelektualinio išsivystymo rodiklio statistinį reikšmingumą, paaiškėjo, kad tikimybė gauti tokį patį ar net mažesnį rezultatą kitame atsitiktiniame teste yra ne didesnė kaip viena galimybė iš 20. Kyla klausimas: ar pagal šį rezultatą galima spręsti apie nepakankamą nulinės hipotezės empirinį pagrįstumą ir dėl to jos atsisakyti alternatyvios hipotezės naudai. N 1? Aišku, atsakymas į šį klausimą labai priklausys nuo to, kokie klaidingi veiksmai gali būti laikomi priimtinesniais. Jei esame įsitikinę, kad normalus vaikas, nors ir turintis silpnus protinius gebėjimus, gyventi protiškai atsilikusių internate yra geriau nei protiškai atsilikusį vaiką ugdyti įprastoje mokykloje, galime priimti vieną sprendimą dėl ribų nustatymo. reikšmingumo lygį, jei tikime kitaip, reikia priimti kitą sprendimą.

Laimei, tyrėjui paprastai nekyla sunkumų sprendžiant tokio pobūdžio problemą. Faktas yra tas, kad statistiškai neįmanoma pagrįsti optimalaus reikšmingumo lygio, kuriuo būtų galima vadovautis renkantis statistines hipotezes. Tuo pačiu metu yra keletas kvazistatistinių susitarimų, priimtų pagal nutylėjimą (2.3 lentelė). Atsižvelgiama į empirinį rezultatą statistiškai reikšmingas atmesti nulinę hipotezę, jei tikimybė gauti tokį patį arba didesnį (mažesnį) rezultatą kitam atsitiktiniam testui yra mažesnė nei viena galimybė iš 20, t.y. kai vertė R pasirodo mažesnis nei 0,05. Jei vertė R pasirodo mažesnis nei 0,01, tada laikomas gautas rezultatas labai reikšmingas atmesti nulinę hipotezę. Tuo atveju, kai vertė R viršija 0,10, laikoma, kad eksperimentas nenustato statistiškai reikšmingų skirtumų nuo teorinio parametro, priimto pagal nulinę hipotezę. Jei gauta vertė R yra tarp 0,10 ir 0,05, rezultatas laikomas neapibrėžtu. Teigiama, kad ji yra ant reikšmingumo lygių ribos. Šis rezultatas vadinamas kitaip nežymiai reikšmingas.

2.3 lentelė

Standartinės kvantilės reikšmės, kurios lemia statistinių sprendimų priėmimą

Aprašyta hipotezių tikrinimo ir priėmimo strategija yra universali ir labiausiai paplitusi. Konservatyvesnė strategija gali būti priimti atitinkamai 0,01 ir 0,001 tikimybių reikšmes kaip patikimus ir labai patikimus lygius, o nepatikimo lygio tikimybės reikšmę nustatyti iki 0,05 (O. Yu. Ermolaev, ). Tada nežymiai reikšmingas rezultatas bus nuo 0,01 iki 0,05. Tačiau tokia strategija vis dar retai naudojama psichologiniuose tyrimuose.

Bet kuriuo atveju reikia turėti omenyje, kad statistinių hipotezių analizės rezultatai negali būti laikomi pakankamais eksperimentinėms hipotezėms įvertinti, jeigu jos imamos atskirai, nesusijusios su visa eksperimentine situacija.

Statistinės hipotezės neturėtų būti painiojamos su eksperimentinėmis ir teorinėmis hipotezėmis. Teorinės hipotezės atspindi tiriamų reiškinių ryšių ir modelių prigimtį. Eksperimentinės hipotezės keliamos remiantis tokių teorinių žinių tam tikroje srityje tyrimu ir tokiu būdu patikslinant pačias teorines hipotezes. Kaip ir statistinės hipotezės, jos apima tuo pačiu metu konkuruojančių hipotezių formulavimą kaip tariamo priežastinio ryšio egzistavimo neigimą. Dėl šio fakto tiriamas empirinis modelis gali leisti įvairias priežastines interpretacijas, vadinamas konkuruojančiomis hipotezėmis.

Skirtingai nei eksperimentinės, statistinės hipotezės yra tik įrankis, leidžiantis įvertinti eksperimento metu surinktus duomenis ir iš pradžių neprisiima jokio empirinio modelio. Jų testavimo rezultatas yra tik statistinio pobūdžio, todėl tai nereiškia, kad eksperimentinės ir ypač teorinės hipotezės automatiškai priimamos arba atmetamos.

Skirtinguose statistinio tyrimo ir modeliavimo etapuose atsiranda poreikis suformuluoti ir eksperimentiškai patikrinti tam tikras prielaidas (hipotezes) dėl analizuojamos populiacijos (populiacijų) nežinomų parametrų pobūdžio ir dydžio. Pavyzdžiui, tyrėjas daro prielaidą: „imtis paimta iš normalios populiacijos“ arba „bendras analizuojamos populiacijos vidurkis yra penki“. Tokios prielaidos vadinamos statistines hipotezes.

Iškeltos hipotezės dėl bendrosios aibės palyginimas su turimais imties duomenimis, kartu įvertinus gautos išvados patikimumo laipsnį kiekybiškai, atliekamas taikant vieną ar kitą statistinį kriterijų ir vadinamas statistinių hipotezių tikrinimas .

Iškelta hipotezė vadinama nulis (pagrindinis) . Įprasta jį žymėti H 0.

Kalbant apie išdėstytą (pagrindinę) hipotezę, visada galima suformuluoti alternatyva (konkuruojanti) , tam prieštarauja. Alternatyvi (konkuruojanti) hipotezė dažniausiai žymima kaip H 1.

Statistinių hipotezių tikrinimo tikslas yra nuspręsti dėl pagrindinės hipotezės pagrįstumo remiantis imties duomenimis H 0.

Jei keliama hipotezė nukrenta į teiginį, kad kokio nors nežinomo populiacijos parametro reikšmė lygiai lygus duota vertė, tada ši hipotezė vadinama paprastas, pavyzdžiui: „vidutinės vieno gyventojo bendros Rusijos gyventojų pajamos yra 650 rublių per mėnesį“; „Nedarbo lygis (bedarbių dalis tarp ekonomiškai aktyvių gyventojų) Rusijoje yra 9 proc. Kitais atvejais hipotezė vadinama kompleksas.

Kaip nulinė hipotezė H 0Įprasta iškelti paprastą hipotezę, nes Paprastai patogiau patikrinti tvirtesnį teiginį.

Hipotezės apie tiriamojo atsitiktinio dydžio pasiskirstymo dėsnio formą;

Hipotezės apie tiriamos populiacijos parametrų skaitines reikšmes;

Hipotezės apie dviejų ar daugiau mėginių homogeniškumą arba tam tikras analizuojamų populiacijų charakteristikas;

Hipotezės apie bendrą modelio formą, apibūdinančią statistinę priklausomybę tarp charakteristikų ir kt.

Kadangi statistinių hipotezių tikrinimas atliekamas remiantis imties duomenimis, t.y. ribota stebėjimų serija, sprendimai dėl nulinės hipotezės H 0 yra tikimybinio pobūdžio. Kitaip tariant, tokį sprendimą neišvengiamai lydi tam tikra, nors galbūt labai maža, klaidingos išvados bet kuria kryptimi tikimybė.



Taigi, kai kuriais nedidele dalimi atvejų α nulinė hipotezė H 0 gali būti atmestas, nors iš tikrųjų tai yra teisinga plačiajai visuomenei. Ši klaida vadinama pirmos rūšies klaida . O jo tikimybė dažniausiai vadinama reikšmingumo lygis ir paskirti α .

Atvirkščiai, kai kuriais nedidele dalimi atvejų β nulinė hipotezė H 0 yra priimtas, o iš tikrųjų bendrojoje populiacijoje jis yra klaidingas, o alternatyvi hipotezė yra teisinga H 1. Ši klaida vadinama antrojo tipo klaida . Paprastai žymima II tipo klaidos tikimybė β . Tikimybė 1 - β paskambino kriterijų galia .

Naudodami fiksuotą imties dydį, savo nuožiūra galite pasirinkti tik vienos iš klaidų tikimybę α arba β . Padidėjus vieno iš jų tikimybei, sumažėja kitos. Įprasta nustatyti I tipo klaidos tikimybę α - reikšmingumo lygis. Paprastai naudojami kai kurie standartiniai reikšmingumo lygiai α : 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Tada, aišku, iš dviejų kriterijų, apibūdinamų ta pačia tikimybe α atmesti hipotezę, kuri iš tikrųjų yra teisinga H 0, turėtumėte priimti tą, kurią lydi mažesnė antrojo tipo klaida β , t.y. daugiau galios. Sumažinti abiejų klaidų tikimybę α Ir β galima pasiekti padidinus imties dydį.

Teisingas sprendimas dėl nulinės hipotezės H 0 taip pat gali būti dviejų tipų:

Nulinė hipotezė bus priimta H 0, tuo tarpu iš tikrųjų bendrojoje populiacijoje nulinė hipotezė yra teisinga H 0; tokio sprendimo tikimybė 1 - α;

Nulinė hipotezė H 0 bus atmestas alternatyvos naudai N 1, kadangi iš tikrųjų populiacijoje nulinė hipotezė H 0 atmetė už alternatyvą H 1; tokio sprendimo tikimybė 1 - β - kriterijaus galia.

Nulinės hipotezės sprendimo rezultatus galima iliustruoti naudojant 8.1 lentelę.

8.1 lentelė

Statistinės hipotezės tikrinamos naudojant statistinis kriterijus(vadinkime tai bendrai KAM), kuri yra stebėjimo rezultatų funkcija.

Statistinis kriterijus yra taisyklė (formulė), pagal kurią nustatomas neatitikimo tarp imties stebėjimo rezultatų ir iškeltos hipotezės matas H 0.

Statistinis kriterijus, kaip ir bet kuri stebėjimo rezultatų funkcija, yra atsitiktinis kintamasis ir darant prielaidą, kad nulinė hipotezė yra teisinga H 0 yra taikomas tam tikras gerai ištirtas (ir lentelėse pateiktas) teorinis pasiskirstymo dėsnis su pasiskirstymo tankiu f(k).

Statistinių hipotezių tikrinimo kriterijaus pasirinkimas gali būti atliekamas remiantis įvairiais principais. Dažniausiai jie tai naudoja tikimybių santykio principas, kuri leidžia sukonstruoti galingiausią kriterijų tarp visų galimų kriterijų. Jo esmė priklauso nuo tokio kriterijaus pasirinkimo KAM su žinoma tankio funkcija f(k) su sąlyga, kad hipotezė H 0 galioja, todėl tam tikram reikšmingumo lygiui α būtų galima rasti kritinį tašką K kr.paskirstymai f(k), kuris padalytų kriterijaus reikšmių diapazoną į dvi dalis: priimtinų reikšmių diapazoną, kuriame imties stebėjimo rezultatai atrodo patikimiausi, ir kritinę sritį, kurioje imties stebėjimo rezultatai atrodo mažiau. tikėtinas nulinės hipotezės atžvilgiu H 0.

Jeigu toks kriterijus KAM pasirinktas ir žinomas jo pasiskirstymo tankis, tada statistinės hipotezės patikrinimo užduotis susiveda į tai, kad tam tikram reikšmingumo lygiui α apskaičiuokite stebimą kriterijaus reikšmę iš imties duomenų Į stebėjimą ir nustatyti, ar jis yra labiausiai ar mažiausiai tikėtinas nulinės hipotezės atžvilgiu H 0.

Kiekvienas statistinės hipotezės tipas tikrinamas pagal atitinkamą kriterijų, kuris kiekvienu konkrečiu atveju yra galingiausias. Pavyzdžiui, hipotezės apie atsitiktinio dydžio pasiskirstymo dėsnio formą patikrinimas gali būti atliktas naudojant Pearsono tinkamumo testą. χ 2; hipotezės apie dviejų bendrųjų populiacijų dispersijų nežinomų reikšmių lygybę tikrinimas - naudojant kriterijų F- Fišeris; pagal kriterijų patikrinama daugybė hipotezių apie nežinomas bendrųjų populiacijų parametrų reikšmes. Z- normalaus pasiskirstymo atsitiktinis dydis ir kriterijus T- Mokinio testas ir kt.

Vadinama kriterijaus vertė, apskaičiuota pagal specialias taisykles, remiantis pavyzdiniais duomenimis pastebėta kriterijaus vertė (Į stebėjimą).

Kriterijų reikšmės, padalijančios kriterijų reikšmių rinkinį į priimtinų verčių diapazoną(labiausiai tikėtina, atsižvelgiant į nulinę hipotezę H 0) Ir kritinis regionas(reikšmių sritis, kuri yra mažiau tikėtina, palyginti su atsitiktinių dydžių paskirstymo lentelėmis KAM, pasirinkti kaip kriterijus, yra vadinami kritiniai taškai (K kr.).

Priimtinų verčių sritis (nulinės hipotezės priėmimo sritis H 0) KAM H 0 nenukrypsta.

Kritinė sritis iškviesti kriterijų reikšmių rinkinį KAM , pagal kurią nulinė hipotezė H 0 atmestas konkuruojančios naudai H 1 .

Išskirti vienpusis(dešiniarankiams arba kairiarankiams) ir dvipusės kritinės sritys.

Jei konkuruojanti hipotezė yra dešinioji, pvz. H 1: a > a 0, tada kritinė sritis yra dešiniarankiams(Figūra 1). Pagal dešiniąją konkuruojančią hipotezę, kritinis taškas (Dešinioji pusė) priima teigiamas vertybes.

Jei konkuruojanti hipotezė yra kairiarankė, pvz. H 1: a< а 0 , tada kritinė sritis yra kairiarankis(2 pav.). Pagal kairiąją konkuruojančią hipotezę kritinis taškas įgauna neigiamas reikšmes (K kraštas kairiarankis).

Jei konkuruojanti hipotezė yra dvipusė, pvz. H 1: a¹ a 0, tada kritinė sritis yra dvišalis(3 pav.). Naudojant dvipusę konkuruojančią hipotezę, nustatomi du kritiniai taškai (K kraštas kairiarankis Ir Į kr. dešiniarankiams).


Priimtinas diapazonas Kritinis

verčių diapazonas

Susipažinkime su terminija, vartojama tikrinant hipotezes.

· Bet – nulinė hipotezė (skeptiko hipotezė) yra hipotezė apie skirtumų nebuvimą tarp palyginamų mėginių. Skeptikas mano, kad skirtumai tarp imties įverčių, gautų iš tyrimų rezultatų, yra atsitiktiniai

· H 1 – alternatyvi hipotezė (optimistinė hipotezė) – tai hipotezė apie skirtumų buvimą tarp lyginamų imčių. Optimistas mano, kad imties įverčių skirtumus lemia objektyvios priežastys ir jie atitinka populiacijos skirtumus

Tikrinti statistines hipotezes įmanoma tik tada, kai įmanoma jas sukurti dydis(kriterijus), kurio pasiskirstymo dėsnis, jei H 0 teisingas, yra žinomas. Tada šį kiekį galime nurodyti pasitikėjimo intervalas, į kurią jo reikšmė patenka su nurodyta tikimybe P d. Šis intervalas vadinamas kritinė sritis. Jei kriterijaus reikšmė patenka į kritinę sritį, tada hipotezė H 0 yra priimta. Priešingu atveju hipotezė H 1 yra priimta.

Medicininiuose tyrimuose naudojamas P d = 0,95 arba P d = 0,99. Šios vertybės atitinka reikšmingumo lygiai a = 0,05 arba a = 0,01.

Tikrinant statistines hipotezes reikšmingumo lygis a) yra tikimybė atmesti nulinę hipotezę, kai ji yra teisinga.

Atkreipkite dėmesį, kad iš esmės hipotezės tikrinimo procedūra siekiama aptikti skirtumus, o ne patvirtinti jų nebuvimą. Kai kriterijaus reikšmė peržengia kritinę sritį, „skeptikui“ tyra širdimi galime pasakyti – ko dar norite?! Jei skirtumų nebūtų, tada su 95% (arba 99%) tikimybe apskaičiuota vertė būtų nurodytose ribose. Bet ne!...

Na, o jei kriterijaus reikšmė patenka į kritinę sritį, tai nėra pagrindo manyti, kad hipotezė H 0 yra teisinga. Tai greičiausiai rodo vieną iš dviejų galimų priežasčių.



a) Mėginių dydžiai nėra pakankamai dideli, kad būtų galima nustatyti skirtumus. Tikėtina, kad tolesnis eksperimentavimas atneš sėkmės.

b) Yra skirtumų. Bet jie tokie maži, kad neturi jokios praktinės reikšmės. Šiuo atveju tęsti eksperimentus nėra prasmės.

Pereikime prie kai kurių statistinių hipotezių, naudojamų medicininiuose tyrimuose.

§ 3.6. Tikrinant hipotezes apie dispersijų lygybę,
F – Fišerio kriterijus

Kai kuriuose klinikiniuose tyrimuose teigiamas poveikis nėra įrodytas tiek daug dydžio tiriamo parametro, kiek jo stabilizavimas, sumažinant jo svyravimus. Šiuo atveju kyla klausimas dėl dviejų bendrųjų dispersijų palyginimo remiantis atrankinės apklausos rezultatais. Šią problemą galima išspręsti naudojant Fisher testas.

Problemos formulavimas

normalus įstatymas paskirstymus. Mėginių dydžiai n 1 ir n 2 ir imties dispersijos yra atitinkamai vienodi. Reikia lyginti bendrieji skirtumai.

Tikrinamos hipotezės:

H 0– bendrieji skirtumai yra tas pats;

N 1 – bendrieji skirtumai skirtinga.

Rodoma, jei pavyzdžiai paimti iš populiacijų su normalus įstatymas pasiskirstymas, tada, jei hipotezė H 0 yra teisinga, imties dispersijų santykis paklūsta Fišerio skirstiniui. Todėl kaip H 0 galiojimo patikrinimo kriterijų imame reikšmę F, apskaičiuotas pagal formulę

kur yra imties dispersijos.

Šis santykis paklūsta Fišerio skirstiniui su skaitiklio laisvės laipsnių skaičiumi n 1 = n 1 -1, o vardiklio laisvės laipsnių skaičius n 2 = n 2-1. Kritinės srities ribos randamos naudojant Fisher paskirstymo lenteles arba naudojant kompiuterinę funkciją FDISC.

Lentelėje pateiktam pavyzdžiui. 3.4, gauname: n 1 = n 2 = 20 – 1 = 19; F = 2,16/4,05 = 0,53. Kai a = 0,05, kritinės srities ribos yra atitinkamai: F kairė = 0,40, F dešinė = 2,53.

Kriterijaus reikšmė pateko į kritinę sritį, todėl priimta hipotezė H 0: bendrosios imties dispersijos yra tas pats.

§ 3.7. Tikrinant hipotezes dėl priemonių lygybės,
t-Studento t-testas

Palyginimo užduotis vidutinis dvi bendros populiacijos atsiranda tada, kai yra būtent praktinė reikšmė dydžio tiriama charakteristika. Pavyzdžiui, kai lyginamas dviejų skirtingų metodų gydymo laikas arba komplikacijų, kylančių juos naudojant, skaičius. Tokiu atveju galite naudoti Stjudento t testą.

Problemos formulavimas.

Buvo gauti du mėginiai (X 1) ir (X 2), paimti iš bendrųjų populiacijų su normalus įstatymas platinimas ir vienodos dispersijos. Mėginio tūris n 1 ir n 2, pavyzdys reiškia yra lygūs ir imties dispersijos- , atitinkamai. Reikia lyginti bendrieji vidurkiai.

Tikrinamos hipotezės:

H 0– bendrieji vidurkiai yra tas pats;

N 1 – bendrieji vidurkiai skirtinga.

Parodyta, kad jei hipotezė H 0 teisinga, reikšmė t, apskaičiuotas pagal formulę

, (3.10)

paskirstytas pagal Stjudento dėsnį su laisvės laipsnių skaičiumi n= n 1 + n 2 – 2.

Čia n 1 = n 1 - 1 – pirmosios imties laisvės laipsnių skaičius; n 2 = n 2 – 1 – antrojo mėginio laisvės laipsnių skaičius.

Kritinės srities ribos randamos naudojant lenteles t-platinimas arba naudojant kompiuterio funkciją STUDAR. Studento skirstinys yra simetriškas nuliui, todėl kairiosios ir dešiniosios kritinės srities ribos yra identiškos pagal dydį ir priešingos ženklu: - t gr ir t gr.

Lentelėje pateiktam pavyzdžiui. 3.4, gauname: n 1 = n 2 = 20 – 1 = 19; t= –2,51, n= 38. Esant a = 0,05 t gr = 2,02.

Kriterijos reikšmės išeina už kairiosios kritinės srities ribos, todėl priimame H 1 hipotezę: bendrieji vidurkiai skirtinga. Tuo pačiu gyventojų vidurkis pirmasis pavyzdys mažiau.


Uždaryti