Tegul žinomos jų tikimybės ir atitinkamos sąlyginės tikimybės. Tada įvykio tikimybė yra tokia:

Ši formulė vadinama bendrosios tikimybės formulės. Vadovėliuose jis formuluojamas teorema, kurios įrodymas elementarus: pagal įvykių algebra, (įvykis įvyko ir arbaįvyko įvykis ir po to atėjo įvykis arbaįvyko įvykis ir po to atėjo įvykis arba …. arbaįvyko įvykis ir sekė įvykis). Kadangi hipotezės yra nesuderinami, o įvykis yra priklausomas, tada pagal nesuderinamų įvykių tikimybių sudėjimo teorema (Pirmas žingsnis) ir priklausomų įvykių tikimybių daugybos teorema (antras žingsnis):

Tikriausiai daugelis numato pirmojo pavyzdžio turinį =)

Kur spjaudysi – visur urna:

1 užduotis

Yra trys vienodos urnos. Pirmoje urnoje yra 4 balti ir 7 juodi rutuliai, antroje – tik balti, trečioje – tik juodi rutuliai. Atsitiktinai parenkama viena urna ir atsitiktinai iš jos ištraukiamas rutulys. Kokia tikimybė, kad šis rutulys yra juodas?

Sprendimas: apsvarstykite įvykį – iš atsitiktinai parinktos urnos bus ištrauktas juodas rutulys. Šis įvykis gali įvykti arba neįvykti dėl vienos iš šių hipotezių:
– bus parinkta 1-oji urna;
– bus pasirinkta 2-oji urna;
– bus renkama 3 urna.

Kadangi urna parenkama atsitiktinai, pasirenkama bet kuri iš trijų urnų vienodai įmanoma, Todėl:

Atkreipkite dėmesį, kad aukščiau pateiktos hipotezės susidaro pilna renginių grupė, tai pagal sąlygą juodas rutulys gali pasirodyti tik iš šių urnų, o pavyzdžiui, neskristi nuo biliardo stalo. Atlikime paprastą tarpinį patikrinimą:
Gerai, eikime toliau:

Pirmoje urnoje yra 4 balti + 7 juodi = 11 kamuoliukų klasikinis apibrėžimas:
yra tikimybė ištraukti juodą rutulį su salyga kad bus parinkta 1-oji urna.

Antroje urnoje yra tik balti rutuliukai, taigi jei pasirinktas juodo rutulio išvaizda tampa neįmanomas: .

Ir, galiausiai, trečioje urnoje yra tik juodi rutuliai, o tai reiškia, kad atitinkami sąlyginė tikimybė juodojo rutulio ištraukimas bus (įvykis neabejotinas).



yra tikimybė, kad iš atsitiktinai parinktos urnos bus ištrauktas juodas rutulys.

Atsakymas:

Nagrinėjamas pavyzdys dar kartą rodo, kaip svarbu SUPRASTAI SĄLYGĄ. Paimkime tas pačias problemas su urnomis ir kamuoliukais - dėl išorinio panašumo sprendimo būdai gali būti visiškai skirtingi: kai kur reikia taikyti tik klasikinis tikimybės apibrėžimas, kažkur įvykiai nepriklausomas, kažkur priklausomas, o kai kur kalbame apie hipotezes. Tuo pačiu nėra aiškaus formalaus sprendimo kelio pasirinkimo kriterijaus – beveik visada reikia apie tai pagalvoti. Kaip patobulinti savo įgūdžius? Sprendžiame, sprendžiame ir dar kartą sprendžiame!

2 užduotis

Šaudykloje yra 5 skirtingi šautuvai. Tikimybės pataikyti į taikinį tam tikram šauliui yra atitinkamai lygios 0,5; 0,55; 0,7; 0,75 ir 0,4. Kokia tikimybė pataikyti į taikinį, jei šaulys paleidžia vieną šūvį iš atsitiktinai parinkto šautuvo?

Trumpas sprendimas ir atsakymas pamokos pabaigoje.

Daugumoje teminių problemų hipotezės, žinoma, nėra vienodai tikėtinos:

3 užduotis

Piramidėje yra 5 šautuvai, iš kurių trys yra su optiniu taikikliu. Tikimybė, kad šaulys pataikys į taikinį šaudydamas iš šautuvo su teleskopiniu taikikliu yra 0,95; šautuvui be teleskopinio taikiklio ši tikimybė yra 0,7. Raskite tikimybę, kad taikinys bus pataikytas, jei šaulys iššovė vieną šūvį iš atsitiktinai paimto šautuvo.

Sprendimas: šioje užduotyje šautuvų skaičius yra lygiai toks pat kaip ir ankstesniame, tačiau yra tik dvi hipotezės:
- šaulys išsirinks šautuvą su optiniu taikikliu;
- šaulys išsirinks šautuvą be teleskopinio taikiklio.
Autorius klasikinis tikimybės apibrėžimas: .
Kontrolė:

Apsvarstykite įvykį: - šaulys pataiko į taikinį atsitiktinai parinktu šautuvu.
Pagal sąlygą:.

Pagal bendrosios tikimybės formulę:

Atsakymas: 0,85

Praktiškai gana priimtinas sutrumpintas užduoties kūrimo būdas, su kuriuo taip pat žinote:

Sprendimas: pagal klasikinį apibrėžimą: yra šautuvo su optiniu taikikliu ir be jo pasirinkimo tikimybės.

Pagal sąlygą, – tikimybės pataikyti į taikinį atitinkamų tipų šautuvais.

Pagal bendrosios tikimybės formulę:
yra tikimybė, kad šaulys pataikys į taikinį atsitiktinai parinktu šautuvu.

Atsakymas: 0,85

Ši užduotis savarankiškam sprendimui:

4 užduotis

Variklis veikia trimis režimais: normaliu, priverstiniu ir tuščiąja eiga. Tuščiosios eigos režimu jo gedimo tikimybė yra 0,05, įprastu režimu - 0,1, o priverstiniu režimu - 0,7. 70 % laiko variklis dirba įprastu režimu, o 20 % – priverstiniu režimu. Kokia variklio gedimo tikimybė eksploatacijos metu?

Tik tuo atveju, priminsiu – norint gauti tikimybes, procentus reikia padalyti iš 100. Būkite labai atsargūs! Mano pastebėjimais, bendrosios tikimybės formulės uždavinių sąlygos dažnai bandomos supainioti; ir aš specialiai pasirinkau tokį pavyzdį. Išduosiu paslaptį – pati vos nesupainiojau =)

Sprendimas pamokos pabaigoje (suformuluotas trumpai)

Bajeso formulių problemos

Medžiaga glaudžiai susijusi su ankstesnės pastraipos turiniu. Tegul įvykis įvyksta įgyvendinus vieną iš hipotezių . Kaip nustatyti tikimybę, kad įvyko konkreti hipotezė?

Su salyga tą įvykį jau įvyko, hipotezių tikimybės pervertintas pagal formules, kurios gavo anglų kunigo Thomaso Bayeso vardą:


- tikimybė, kad hipotezė įvyko;
- tikimybė, kad hipotezė įvyko;

yra tikimybė, kad hipotezė buvo teisinga.

Iš pirmo žvilgsnio tai atrodo visiškas absurdas – kam perskaičiuoti hipotezių tikimybes, jei jos jau žinomos? Bet iš tikrųjų yra skirtumas:

- tai yra a priori(apskaičiuota prieš testai) tikimybės.

- tai yra a posteriori(apskaičiuota po to testai) tų pačių hipotezių tikimybės, perskaičiuotos atsižvelgiant į „naujai nustatytas aplinkybes“ – atsižvelgiant į tai, kad įvykis įvyko.

Pažvelkime į šį skirtumą konkrečiu pavyzdžiu:

5 užduotis

Sandėlyje buvo gautos 2 partijos produkcijos: pirmoji - 4000 vnt., antroji - 6000 vnt. Vidutinis nestandartinių gaminių procentas pirmoje partijoje yra 20%, o antroje - 10%. Atsitiktinai paimta iš sandėlio prekė pasirodė standartinė. Raskite tikimybę, kad ji yra: a) iš pirmosios partijos, b) iš antrosios partijos.

Pirma dalis sprendimus susideda iš bendrosios tikimybės formulės naudojimo. Kitaip tariant, skaičiavimai atliekami darant prielaidą, kad bandymas dar nepagaminta ir renginys "prekė pasirodė standartinė" kol ateis.

Panagrinėkime dvi hipotezes:
- atsitiktine tvarka paimtas produktas bus iš 1-os partijos;
- atsitiktinai paimtas produktas bus iš 2 partijos.

Iš viso: 4000 + 6000 = 10000 prekių sandėlyje. Pagal klasikinį apibrėžimą:
.

Kontrolė:

Apsvarstykite priklausomą įvykį: – prekė, atsitiktinai paimta iš sandėlio bus standartinis.

Pirmoje partijoje 100% - 20% = 80% standartinių produktų, todėl: su salyga kad ji priklauso 1-ajai šaliai.

Panašiai antroje partijoje 100% - 10% = 90% standartinių produktų ir yra tikimybė, kad atsitiktinai parinkta prekė sandėlyje bus standartinė su salyga kad ji priklauso 2-ajai šaliai.

Pagal bendrosios tikimybės formulę:
yra tikimybė, kad atsitiktinai iš sandėlio parinkta prekė bus standartinė.

Antra dalis. Tarkime, kad atsitiktinai iš sandėlio paimta prekė pasirodė standartinė. Ši frazė yra tiesiogiai nurodyta sąlygoje ir nurodo faktą, kad įvykis įvyko.

Pagal Bayes formules:

a) - tikimybė, kad pasirinktas standartinis produktas priklauso 1-ajai partijai;

b) - tikimybė, kad pasirinktas standartinis produktas priklauso 2-ajai partijai.

Po to perkainojimas hipotezės, žinoma, vis dar formuojasi pilna grupė:
(egzaminas ;-))

Atsakymas:

Ivanas Vasiljevičius, vėl pakeitęs profesiją ir tapęs gamyklos direktoriumi, padės suprasti hipotezių pervertinimo prasmę. Jis žino, kad šiandien 1-oji parduotuvė į sandėlį išvežė 4000 prekių, o 2-oji – 6000 prekių, ir atvyksta tuo įsitikinti. Tarkime, kad visi produktai yra tos pačios rūšies ir yra toje pačioje talpykloje. Natūralu, kad Ivanas Vasiljevičius anksčiau apskaičiavo, kad produktas, kurį jis dabar pašalins patikrinimui, greičiausiai bus pagamintas 1-ajame ceche ir greičiausiai antrame. Tačiau pasirinktam daiktui pasirodžius standartiniu, jis sušunka: „Koks šaunus varžtas! - tai greičiau išleido 2-asis dirbtuvės. Taigi antrosios hipotezės tikimybė yra pervertinta geresnė pusė, o pirmosios hipotezės tikimybė neįvertinta: . Ir šis pervertinimas nėra nepagrįstas – juk 2-asis cechas ne tik pagamino daugiau gaminių, bet ir dirba 2 kartus geriau!

Sakysite, grynas subjektyvizmas? Iš dalies – taip, be to, interpretavo pats Bayesas a posteriori tikimybės kaip pasitikėjimo lygis. Tačiau ne viskas taip paprasta – Bajeso požiūriu yra objektyvus grūdas. Juk tikimybė, kad prekė bus standartinė (0,8 ir 0,9 atitinkamai 1 ir 2 parduotuvėms) tai yra preliminarus(a priori) ir vidutinis sąmatos. Bet, kalbant filosofiškai, viskas teka, viskas keičiasi, taip pat ir tikimybės. Visai įmanoma, kad tyrimo metu sėkmingesnė 2-oji parduotuvė padidino standartinių produktų procentą (ir (arba) sumažinta 1-oji parduotuvė), o jei patikrinsite daugiau ar visas 10 tūkstančių sandėlyje esančių prekių, tada pervertintos vertės bus daug arčiau tiesos.

Beje, jei Ivanas Vasiljevičius išgauna nestandartinę dalį, tada atvirkščiai - jis daugiau ir mažiau „įtars“ 1-ąją parduotuvę - antrąją. Siūlau pasidomėti patiems:

6 užduotis

Sandėlyje buvo gautos 2 partijos produkcijos: pirmoji - 4000 vnt., antroji - 6000 vnt. Vidutinis nestandartinių gaminių procentas pirmoje partijoje yra 20%, antroje - 10%. Paaiškėjo, kad atsitiktinai iš sandėlio paimta prekė ne standartinis. Raskite tikimybę, kad ji yra: a) iš pirmosios partijos, b) iš antrosios partijos.

Būklė bus atskirta dviem raidėmis, kurias paryškinau paryškintu šriftu. Problemą galima išspręsti nuo nulio arba galite naudoti ankstesnių skaičiavimų rezultatus. Pavyzdyje turiu pilnas sprendimas, bet kad nebūtų formalaus sutapimo su 5 užduotimi, renginiu „Atsitiktinai iš sandėlio paimta prekė bus nestandartinė“ pažymėtas .

Bajesiška tikimybių pervertinimo schema randama visur, ja taip pat aktyviai naudojasi įvairūs sukčiai. Pasvarstykime apie buitiniu pavadinimu tapusią trijų raidžių akcinę bendrovę, kuri pritraukia gyventojų indėlius, neva juos kur nors investuoja, reguliariai moka dividendus ir pan. Kas vyksta? Bėga diena po dienos, mėnuo po mėnesio ir vis daugiau naujų faktų, perduodamų per reklamą ir iš lūpų į lūpas, tik didina pasitikėjimą finansine piramide. (užpakalinis Bajeso pakartotinis įvertinimas dėl praeities įvykių!). Tai yra, indėlininkų akimis, nuolat didėja tikimybė, kad "tai rimtas biuras"; o priešingos hipotezės tikimybė („tai įprasti sukčiai“), žinoma, mažėja ir mažėja. Likusi dalis, manau, aišku. Pastebėtina, kad pelnyta reputacija organizatoriams suteikia laiko sėkmingai pasislėpti nuo Ivano Vasiljevičiaus, kuris liko ne tik be partijos varžtų, bet ir be kelnių.

Prie ne mažiau įdomių pavyzdžių grįšime kiek vėliau, tačiau kol kas bene dažniausias atvejis su trimis hipotezėmis yra šalia:

7 užduotis

Elektros lempos gaminamos trijose gamyklose. 1-oji gamykla gamina 30% viso lempų skaičiaus, 2-oji - 55%, o 3-oji - likusius. 1-os gamyklos gaminiuose yra 1% brokuotų lempų, 2-osios - 1,5%, 3-osios - 2%. Parduotuvė gauna gaminius iš visų trijų gamyklų. Mano pirkta lempa buvo su defektu. Kokia tikimybė, kad jį pagamino 2 gamykla?

Atkreipkite dėmesį, kad problemos dėl Bayes formulių sąlygoje būtinai kai kurie kas nutikoįvykis, šiuo atveju – lempos pirkimas.

Renginių padaugėjo ir sprendimas patogiau išdėstyti „greituoju“ stiliumi.

Algoritmas lygiai toks pat: pirmame žingsnyje randame tikimybę, kad įsigyta lempa tiks bus defektinis.

Naudodami pradinius duomenis, procentus išverčiame į tikimybes:
yra tikimybė, kad lempa bus pagaminta atitinkamai 1-oje, 2-oje ir 3-ioje gamyklose.
Kontrolė:

Panašiai: - sugedusios lempos gamybos tikimybė atitinkamoms gamykloms.

Pagal bendrosios tikimybės formulę:

- tikimybė, kad įsigyta lempa bus sugedusi.

Antras žingsnis. Tegul įsigyta lempa yra sugedusi (įvykis įvyko)

Pagal Bayes formulę:
- tikimybė, kad įsigyta brokuota lempa pagaminta antroje gamykloje

Atsakymas:

Kodėl po pakartotinio vertinimo padidėjo pradinė 2-osios hipotezės tikimybė? Juk antroji gamykla gamina vidutinės kokybės lempas (pirma geresnė, trečia prastesnė). Taigi kodėl jis padidėjo a posteriori tikimybe, kad sugedusi lempa yra is 2-os gamyklos? Tai jau ne dėl „reputacijos“, o dėl dydžio. Kadangi gamykla Nr. 2 pagamino daugiausiai lempų, jie kaltina ją (bent jau subjektyviai): „Greičiausiai ši sugedusi lempa yra iš ten“.

Įdomu pastebėti, kad 1 ir 3 hipotezių tikimybės buvo pervertintos laukiamomis kryptimis ir tapo lygios:

Kontrolė: , kuris turėjo būti patikrintas.

Beje, apie neįvertintus ir pervertintus:

8 užduotis

AT studentų grupė 3 žmonės turi aukštą pasirengimo lygį, 19 žmonių – vidutinį, 3 žmonės – žemą. Tikimybės sėkmingas pristatymasšių studentų egzaminas yra atitinkamai lygus: 0,95; 0,7 ir 0,4. Yra žinoma, kad kai kurie mokiniai išlaikė egzaminą. Kokia tikimybė, kad:

a) jis buvo labai gerai pasiruošęs;
b) buvo vidutiniškai pasiruošęs;
c) buvo prastai paruoštas.

Atlikti skaičiavimus ir analizuoti hipotezių pervertinimo rezultatus.

Užduotis artima realybei ir ypač tikėtina neakivaizdinių studentų grupei, kai mokytojas praktiškai nežino to ar kito mokinio gebėjimų. Tokiu atveju rezultatas gali sukelti gana netikėtų pasekmių. (ypač 1 semestro egzaminams). Jei blogai pasiruošusiam mokiniui pasiseka gauti bilietą, mokytojas greičiausiai laikys jį geru mokiniu ar net stipriu mokiniu, o tai atneš gerų dividendų ateityje. (žinoma, reikia „pakelti kartelę“ ir išlaikyti savo įvaizdį). Jei studentas mokėsi, susigrūdo, kartojo 7 dienas ir 7 naktis, bet jam tiesiog nepasisekė, tada tolimesni įvykiai gali vystytis pačiu blogiausiu būdu – su daugybe pakartojimų ir balansuojant ant išvykimo slenksčio.

Savaime suprantama, reputacija yra svarbiausias kapitalas, neatsitiktinai daugelis korporacijų nešioja savo įkūrėjų vardus ir pavardes, kurie prieš 100-200 metų vadovavo verslui ir išgarsėjo savo nepriekaištinga reputacija.

Taip, Bajeso požiūris tam tikru mastu subjektyvu, bet ... taip gyvenimas veikia!

Sutvirtinkime medžiagą galutiniu pramoniniu pavyzdžiu, kuriame kalbėsiu apie technines sprendimo subtilybes, su kuriomis dar nebuvo susidurta:

9 užduotis

Trys gamyklos cechai gamina to paties tipo dalis, kurios surenkamos į bendrą konteinerį surinkimui. Yra žinoma, kad pirmoje parduotuvėje pagaminama 2 kartus daugiau dalių nei antroje, ir 4 kartus daugiau nei trečioje. Pirmajame ceche defektas 12%, antrame - 8%, trečiame - 4%. Kontrolei iš konteinerio paimama viena dalis. Kokia tikimybė, kad jis bus sugedęs? Kokia tikimybė, kad ištrauktą brokuotą detalę pagamino 3-ioji parduotuvė?

Taki Ivanas Vasiljevičius vėl ant žirgo =) Filmas turi turėti laimingą pabaigą =)

Sprendimas: priešingai nei 5-8 užduotyse, čia aiškiai užduodamas klausimas, kuris sprendžiamas naudojant bendrosios tikimybės formulę. Tačiau, kita vertus, sąlyga yra šiek tiek „užšifruota“, o mokyklinis įgūdis sudaryti paprasčiausias lygtis padės mums išspręsti šią rebusą. „x“ patogu paimti mažiausią reikšmę:

Tegul yra trečiojo cecho pagamintų dalių dalis.

Pagal sąlygą pirmame ceche pagaminama 4 kartus daugiau nei trečiame, taigi 1 cecho dalis yra .

Be to, pirmame ceche pagaminama 2 kartus daugiau produkcijos nei antrajame, tai reiškia, kad pastarųjų dalis: .

Sudarykime ir išspręskime lygtį:

Taigi: - tikimybė, kad iš konteinerio išimta dalis buvo išleista atitinkamai 1, 2 ir 3 dirbtuvėse.

Kontrolė: . Be to, nebus nereikalinga dar kartą pažvelgti į frazę „Žinoma, kad pirmame ceche gaminių pagaminama 2 kartus daugiau nei antrame ir 4 kartus daugiau nei trečiame ceche“ ir įsitikinkite, kad gautos tikimybės tikrai atitinka šią sąlygą.

Už „X“ iš pradžių buvo galima paimti 1-os arba 2-os parduotuvės dalį – tikimybės išeis tokios pat. Tačiau vienaip ar kitaip sunkiausia atkarpa įveikta, o sprendimas yra kelyje:

Iš sąlygos randame:
- tikimybę pagaminti sugedusią dalį atitinkamoms dirbtuvėms.

Pagal bendrosios tikimybės formulę:
yra tikimybė, kad dalis, atsitiktinai ištraukta iš konteinerio, bus nestandartinė.

Antras klausimas: kokia tikimybė, kad ištrauktą brokuotą dalį pagamino 3-ioji parduotuvė? Šis klausimas daro prielaidą, kad dalis jau buvo pašalinta ir nustatyta, kad ji sugedusi. Mes iš naujo įvertiname hipotezę naudodami Bayes formulę:
yra norima tikimybė. Visai tikėtasi – juk trečias cechas gamina ne tik mažiausią dalių dalį, bet ir pirmauja kokybe!

Šiuo atveju aš turėjau supaprastinti keturių aukštų trupmeną, kurią Bayes formulėse tenka daryti gana dažnai. Tačiau šiai pamokai kažkaip netyčia paėmiau pavyzdžius, kuriuose daug skaičiavimų galima atlikti be įprastų trupmenų.

Kadangi sąlygoje nėra taškų „a“ ir „be“, geriau atsakymą pateikti tekstiniais komentarais:

Atsakymas: - tikimybė, kad iš konteinerio išimta dalis bus sugedusi; - tikimybė, kad ištrauktą brokuotą detalę išleido 3-ias cechas.

Kaip matote, bendrosios tikimybės formulės ir Bayes formulių problemos yra gana paprastos ir tikriausiai dėl šios priežasties jos taip dažnai bando apsunkinti sąlygą, kurią jau minėjau straipsnio pradžioje.

Papildomi pavyzdžiai yra faile su paruošti sprendimai F.P.V. ir Bayes formules, be to, tikriausiai yra norinčių giliau susipažinti su šia tema kituose šaltiniuose. O tema tikrai labai įdomi – ko verta vieni Bayes paradoksas, kuris pateisina kasdienius patarimus, kad jei žmogui diagnozuojama reta liga, jam prasminga atlikti antrą ir net du pakartotinius nepriklausomus tyrimus. Atrodytų, kad jie tai daro vien iš nevilties... - bet ne! Bet nekalbėkime apie liūdnus dalykus.


yra tikimybė, kad atsitiktinai pasirinktas studentas išlaikys egzaminą.
Leiskite mokiniui išlaikyti egzaminą. Pagal Bayes formules:
a) – tikimybė, kad egzaminą išlaikęs mokinys buvo pasiruošęs labai gerai. Objektyvi pradinė tikimybė yra pervertinta, nes beveik visada kuriam nors „vidurkiui“ pasiseka su klausimais ir jie labai stipriai atsako, o tai sukuria klaidingą nepriekaištingo pasiruošimo įspūdį.
b) yra tikimybė, kad egzaminą išlaikęs mokinys buvo vidutiniškai pasiruošęs. Pradinė tikimybė pasirodo šiek tiek pervertinta, nes Vidutinio pasirengimo lygio mokinių dažniausiai būna dauguma, be to, mokytojas čia įtrauks ir nesėkmingai atsakytus „puikūs mokiniai“, o retkarčiais ir prastai besimokantį mokinį, kuriam labai pasisekė su bilietu.
in) - tikimybė, kad egzaminą išlaikęs studentas buvo prastai pasiruošęs. Pradinė tikimybė buvo pervertinta blogiau. Nenuostabu.
Egzaminas:
Atsakymas : Bayes formulė:

Hipotezių H i tikimybės P(H i) vadinamos a priori tikimybėmis – tikimybėmis prieš eksperimentus.
Tikimybės P(A/H i) vadinamos a posteriori tikimybėmis – hipotezių H i, patikslintų eksperimento rezultatu, tikimybėmis.

1 pavyzdys. Prietaisą galima surinkti iš aukštos kokybės dalių ir iš įprastos kokybės dalių. Apie 40% įrenginių surenkami iš aukštos kokybės dalių. Jei įrenginys surinktas iš kokybiškų dalių, jo patikimumas (tikimybė be gedimų) per laiką t yra 0,95; jei iš įprastos kokybės dalių - jo patikimumas yra 0,7. Prietaisas buvo išbandytas laikui t ir veikė nepriekaištingai. Raskite tikimybę, kad jis bus surinktas iš aukštos kokybės dalių.
Sprendimas. Galimos dvi hipotezės: H 1 - įrenginys surinktas iš kokybiškų dalių; H 2 - prietaisas surinktas iš įprastos kokybės dalių. Šių hipotezių tikimybės prieš eksperimentą: P(H 1) = 0,4, P(H 2) = 0,6. Eksperimento metu buvo pastebėtas įvykis A – prietaisas nepriekaištingai veikė laiką t. Sąlyginės šio įvykio tikimybės pagal hipotezes H 1 ir H 2 yra: P(A|H 1) = 0,95; P(A|H2) = 0,7. Naudodami (12) formulę randame hipotezės H 1 tikimybę po eksperimento:

2 pavyzdys. Du šauliai savarankiškai šaudo į tą patį taikinį, kiekvienas iššauna po vieną šūvį. Tikimybė pataikyti į taikinį pirmajam šauliui yra 0,8, antrajam – 0,4. Po šaudymo taikinyje buvo rasta viena skylė. Darant prielaidą, kad du šauliai negali pataikyti į tą patį tašką, suraskite tikimybę, kad pirmasis šaulys pataikys į taikinį.
Sprendimas. Tegul įvykis A yra viena skylė, rasta taikinyje po šaudymo. Prieš pradedant šaudyti, galimos hipotezės:
H 1 - nepataikys nei pirmas, nei antras šaulys, šios hipotezės tikimybė: P(H 1) = 0,2 0,6 = 0,12.
H 2 – pataikys abu šauliai, P(H 2) = 0,8 0,4 = 0,32.
H 3 - pirmas šaulys pataikys, o antrasis nepataikys, P(H 3) = 0,8 0,6 = 0,48.
H 4 - pirmas šaulys nepataikys, bet pataikys antrasis, P (H 4) = 0,2 0,4 = 0,08.
Sąlyginės įvykio A tikimybės pagal šias hipotezes yra šios:

Po patirties hipotezės H 1 ir H 2 tampa neįmanomos, o hipotezių H 3 ir H 4 tikimybės.
bus lygus:


Taigi, labiausiai tikėtina, kad į taikinį pataiko pirmasis šaulys.

3 pavyzdys. Surinkimo ceche prie įrenginio prijungiamas elektros variklis. Elektros variklius tiekia trys gamintojai. Sandėlyje yra atitinkamai 19,6 ir 11 įvardintų gamyklų elektros variklių, kurie gali veikti be gedimų iki garantinio laikotarpio pabaigos, atitinkamai 0,85, 0,76 ir 0,71 tikimybės. Darbuotojas atsitiktinai paima vieną variklį ir pritvirtina jį prie įrenginio. Raskite tikimybę, kad sumontuotas ir be gedimų iki garantinio laikotarpio pabaigos veikiantis elektros variklis buvo tiekiamas atitinkamai pirmojo, antrojo ar trečiojo gamintojo.
Sprendimas. Pirmasis bandymas – elektros variklio pasirinkimas, antrasis – elektros variklio veikimas garantiniu laikotarpiu. Apsvarstykite šiuos įvykius:
A - elektros variklis veikia nepriekaištingai iki garantinio laikotarpio pabaigos;
H 1 - montuotojas paims variklį iš pirmosios gamyklos produktų;
H 2 - montuotojas paims variklį iš antrosios gamyklos produktų;
H 3 - montuotojas paims variklį iš trečiosios gamyklos produktų.
Įvykio A tikimybė apskaičiuojama pagal bendrosios tikimybės formulę:

Sąlyginės tikimybės nurodytos problemos teiginyje:

Raskime tikimybes


Naudodamiesi Bayes formulėmis (12), apskaičiuojame hipotezių H i sąlygines tikimybes:

4 pavyzdys. Tikimybės, kad veikiant sistemai, susidedančiai iš trijų elementų, suges elementai su skaičiais 1, 2 ir 3, siejamos kaip 3: 2: 5. Tikimybės aptikti šių elementų gedimus yra atitinkamai 0,95; 0,9 ir 0,6.

b) Šios užduoties sąlygomis sistemos veikimo metu buvo aptiktas gedimas. Kuris elementas greičiausiai sugenda?

Sprendimas.
Tegul A yra nesėkmės įvykis. Įveskime hipotezių sistemą H1 - pirmojo elemento gedimas, H2 - antrojo elemento gedimas, H3 - trečiojo elemento gedimas.
Randame hipotezių tikimybes:
P(H1) = 3/(3+2+5) = 0,3
P(H2) = 2/(3+2+5) = 0,2
P(H3) = 5/(3+2+5) = 0,5

Atsižvelgiant į problemos sąlygą, sąlyginės įvykio A tikimybės yra:
P(A|H1) = 0,95, P(A|H2) = 0,9, P(A|H3) = 0,6

a) Raskite tikimybę aptikti sistemos gedimą.
P(A) = P(H1)*P(A|H1) + P(H2)*P(A|H2) + P(H3)*P(A|H3) = 0,3*0,95 + 0,2*0,9 + 0,5 *0,6 = 0,765

b) Šios užduoties sąlygomis sistemos veikimo metu buvo aptiktas gedimas. Kuris elementas greičiausiai suges?
P1 = P(H1)*P(A|H1)/ P(A) = 0,3*0,95 / 0,765 = 0,373
P2 = P(H2)*P(A|H2)/ P(A) = 0,2*0,9 / 0,765 = 0,235
P3 = P(H3)*P(A|H3)/ P(A) = 0,5*0,6 / 0,765 = 0,392

Didžiausia trečiojo elemento tikimybė.

Kas yra Bayes? Ir ką tai turi bendro su valdymu? – gali būti visai teisingas klausimas. Kol kas laikykis mano žodžio: tai labai svarbu! .. ir įdomu (bent jau man).

Kokia paradigma veikia dauguma vadovų: jei ką nors stebiu, kokias išvadas iš to galiu padaryti? Ko Bayes moko: kas iš tikrųjų turi būti, kad galėčiau tai stebėti? Taip vystosi visi mokslai, apie tai jis rašo (cituoju iš atminties): žmogus, kurio galvoje nėra teorijos, įvairių įvykių (stebėjimų) įtakoje išsiskirs nuo vienos idėjos prie kitos. Ne veltui sakoma: nėra nieko praktiškesnio už gerą teoriją.

Pavyzdys iš praktikos. Mano pavaldinys daro klaidą, o kolega (kito skyriaus vedėja) sako, kad reikėtų daryti vadybinę įtaką aplaidžiam darbuotojui (kitaip tariant, nubausti/barti). Ir žinau, kad šis darbuotojas per mėnesį padaro 4-5 tūkstančius tos pačios rūšies operacijų ir per tiek laiko padaro ne daugiau kaip 10 klaidų. Jaučiate paradigmos skirtumą? Mano kolega reaguoja į pastebėjimą, o aš turiu a priori žinių, kad darbuotojas daro tam tikrą skaičių klaidų, todėl kita šioms žinioms įtakos neturėjo... Dabar, jei mėnesio pabaigoje paaiškės, kad yra, pavyzdžiui, 15 tokių klaidų!.. Tai jau taps priežastimi tirti standartų nesilaikymo priežastis.

Įsitikinęs Bajeso požiūrio svarba? Susidomėjote? Tikiuosi". O dabar musė tepalu. Deja, Bajeso idėjos retai pateikiamos iš pirmo karto. Atvirai pasakius, man nepasisekė, nes su šiomis idėjomis susipažinau per populiariąją literatūrą, kurią perskaičius liko daug klausimų. Planuodamas rašyti pastabą, surinkau viską, ką anksčiau aprašiau pagal Bayesą, taip pat ištyriau, ką jie rašo internete. Pateikiu jums savo geriausią spėjimą šia tema. Įvadas į Bajeso tikimybę.

Bayes’o teoremos išvedimas

Apsvarstykite tokį eksperimentą: pavadiname bet kurį skaičių, esantį atkarpoje, ir pataisome, kai šis skaičius yra, pavyzdžiui, nuo 0,1 iki 0,4 (1a pav.). Šio įvykio tikimybė yra lygi atkarpos ilgio ir viso atkarpos ilgio santykiui su sąlyga, kad atkarpoje atsiras skaičiai lygiavertis. Matematiškai tai galima parašyti p(0,1 <= x <= 0,4) = 0,3, или кратко R(X) = 0,3, kur R- tikimybė, X yra atsitiktinis kintamasis diapazone , X yra atsitiktinis kintamasis diapazone . Tai yra, tikimybė patekti į segmentą yra 30%.

Ryžiai. 1. Grafinis tikimybių aiškinimas

Dabar apsvarstykite kvadratą x (1b pav.). Tarkime, kad turime įvardyti skaičių poras ( x, y), kurių kiekvienas yra didesnis už nulį ir mažesnis už vienetą. Tikimybė, kad x(pirmasis skaičius) bus segmente (mėlynas plotas 1), lygus mėlynojo ploto ir viso kvadrato ploto santykiui, ty (0,4 - 0,1). ) * (1 - 0) / (1 * 1) = 0, 3, tai yra tie patys 30%. Tikimybė, kad y yra segmento viduje (žalias plotas 2) yra lygus žaliosios zonos ploto ir viso kvadrato ploto santykiui p(0,5 <= y <= 0,7) = 0,2, или кратко R(Y) = 0,2.

Ką tuo pačiu metu galima sužinoti apie vertybes x ir y. Pavyzdžiui, kokia tikimybė, kad tiek x ir y yra atitinkamuose duotuose segmentuose? Norėdami tai padaryti, turite apskaičiuoti 3 domeno ploto (žalios ir mėlynos juostelių sankirtos) santykį su viso kvadrato plotu: p(X, Y) = (0,4 – 0,1) * (0,7 – 0,5) / (1 * 1) = 0,06.

Dabar tarkime, kad norime sužinoti, kokia yra to tikimybė y yra intervale if x jau yra diapazone. Tai yra, iš tikrųjų mes turime filtrą ir kai skambiname poras ( x, y), tada iškart atmetame tas poras, kurios neatitinka radimo sąlygos x tam tikrame intervale, o tada iš išfiltruotų porų skaičiuojame tas, kurioms y tenkina mūsų sąlygą ir laikykime tikimybę porų skaičiaus santykiu y yra aukščiau esančiame segmente iki bendro išfiltruotų porų skaičiaus (tai yra, kurioms x yra segmente). Šią tikimybę galime parašyti kaip p(Y|X adresu X pataikė į diapazoną“. Akivaizdu, kad ši tikimybė yra lygi 3 srities ploto ir mėlynojo 1 ploto santykiui. 3 srities plotas yra (0,4 - 0,1) * (0,7 - 0,5) = 0,06 ir mėlynos srities plotas 1 ( 0,4 - 0,1) * (1 - 0) = 0,3, tada jų santykis yra 0,06 / 0,3 = 0,2. Kitaip tariant, tikimybė rasti y segmente, jei x priklauso segmentui p(Y|X) = 0,2.

Ankstesnėje pastraipoje mes iš tikrųjų suformulavome tapatybę: p(Y|X) = p(X, Y) /p( X). Jame parašyta: „smūgio tikimybė adresu diapazone, su sąlyga X pataikymas diapazone yra lygus vienalaikio pataikymo tikimybės santykiui X diapazone ir adresu diapazone, į pataikymo tikimybę Xį diapazoną“.

Pagal analogiją apsvarstykite tikimybę p(X|Y). Mes vadiname poras x, y) ir filtruokite tuos, kuriems y yra tarp 0,5 ir 0,7, tada tikimybė, kad x yra segmente su sąlyga y priklauso segmentui, yra lygus 3 ploto ir 2 žaliosios zonos ploto santykiui: p(X|Y) = p(X, Y) / p(Y).

Atkreipkite dėmesį, kad tikimybės p(X, Y) ir p(Y, X) yra lygūs ir abu yra lygūs 3 zonos ploto ir viso kvadrato ploto santykiui, tačiau tikimybės p(Y|X) ir p(X|Y) nėra lygus; o tikimybė p(Y|X) yra lygus 3 ploto ir 1 ploto santykiui ir p(X|Y) – domenas 3 į domeną 2. Taip pat atkreipkite dėmesį, kad p(X, Y) dažnai žymimas kaip p(X&Y).

Taigi turime du apibrėžimus: p(Y|X) = p(X, Y) /p( X) ir p(X|Y) = p(X, Y) / p(Y)

Perrašykime šias lygybes taip: p(X, Y) = p(Y|X)*p( X) ir p(X, Y) = p(X|Y) * p(Y)

Kadangi kairiosios pusės yra lygios, taip pat ir dešinės: p(Y|X)*p( X) = p(X|Y) * p(Y)

Arba paskutinę lygybę galime perrašyti taip:

Tai Bayeso teorema!

Ar gali būti, kad iš tokių paprastų (beveik tautologinių) transformacijų atsiranda puiki teorema!? Neskubėkite daryti išvadų. Pakalbėkime dar kartą apie tai, ką gavome. Buvo tam tikra pradinė (a priori) tikimybė R(X) kad atsitiktinis dydis X tolygiai paskirstytas segmente patenka į diapazoną X. Įvyko kažkoks įvykis Y, dėl to gavome to paties atsitiktinio dydžio a posteriori tikimybę X: R(X|Y), o ši tikimybė skiriasi nuo R(X) pagal koeficientą . Renginys Y vadinami įrodymais, daugiau ar mažiau patvirtinančiais ar paneigiančiais X. Šis koeficientas kartais vadinamas įrodymų galia. Kuo įrodymai stipresni, tuo labiau stebėjimo Y faktas keičia pirminę tikimybę, tuo labiau posteriorinė tikimybė skiriasi nuo pirminės. Jei įrodymai yra silpni, posterior yra beveik lygus pirminiam.

Bayes'o diskrečiųjų atsitiktinių dydžių formulė

Ankstesniame skyriuje išvedėme Bayes formulę nuolatiniams atsitiktiniams dydžiams x ir y, apibrėžtiems intervale . Apsvarstykite pavyzdį su atskirais atsitiktiniais dydžiais, kurių kiekvienas turi dvi galimas reikšmes. Įprastų medicininių apžiūrų metu buvo nustatyta, kad keturiasdešimties metų amžiaus moterų krūties vėžiu suserga 1 proc. 80% vėžiu sergančių moterų gauna teigiamus mamografijos rezultatus. 9,6% sveikų moterų taip pat gauna teigiamus mamografijos rezultatus. Apžiūros metu šios amžiaus grupės moteris gavo teigiamą mamografijos rezultatą. Kokia tikimybė, kad ji iš tikrųjų serga krūties vėžiu?

Samprotavimo/skaičiavimų eiga yra tokia. Iš 1% vėžiu sergančių pacientų mamografija duos 80% teigiamų rezultatų = 1% * 80% = 0,8%. Iš 99 % sveikų moterų mamografija duos 9,6 % teigiamų rezultatų = 99 % * 9,6 % = 9,504 %. Iš viso iš 10,304 % (9,504 % + 0,8 %), kurių mamogramos rezultatai teigiami, serga tik 0,8 %, o likę 9,504 % sveiki. Taigi tikimybė, kad moteris, kurios mamograma teigiama, serga vėžiu, yra 0,8 % / 10,304 % = 7,764 %. Ar manai, kad 80 proc.

Mūsų pavyzdyje Bayes formulė yra tokia:

Dar kartą pakalbėkime apie „fizinę“ šios formulės prasmę. X yra atsitiktinis kintamasis (diagnozė), kurio reikšmės yra šios: X 1- serga ir X 2- sveikas; Y– atsitiktinis dydis (matavimo rezultatas – mamografija), kurio reikšmės yra: T 1- teigiamas rezultatas ir Y2- neigiamas rezultatas; p(X 1)- susirgimo tikimybė prieš mamografiją (a priori tikimybė), lygi 1%; R(Y 1 |X 1 ) – teigiamo rezultato tikimybė, jei pacientas serga (sąlyginė tikimybė, nes ji turi būti nurodyta užduoties sąlygose), lygi 80 %; R(Y 1 |X 2 ) – teigiamo rezultato tikimybė, jei pacientas sveikas (taip pat sąlyginė tikimybė), lygi 9,6 %; p(X 2)- tikimybė, kad pacientas yra sveikas prieš mamografiją (a priori tikimybė), lygi 99%; p(X 1|Y 1 ) – tikimybė, kad pacientas serga, gavus teigiamą mamogramos rezultatą (užpakalinė tikimybė).

Matyti, kad užpakalinė tikimybė (ko mes ieškome) yra proporcinga ankstesnei tikimybei (pradinei) su šiek tiek sudėtingesniu koeficientu . Dar kartą pabrėžsiu. Mano nuomone, tai yra esminis Bajeso požiūrio aspektas. Matmenys ( Y) prie iš pradžių turimos (a priori) pridėjo tam tikrą kiekį informacijos, kuri patikslino mūsų žinias apie objektą.

Pavyzdžiai

Norėdami konsoliduoti apimtą medžiagą, pabandykite išspręsti keletą problemų.

1 pavyzdys Yra 3 urnos; pirmuose 3 baltuose rutuliuose ir 1 juodas; antrajame - 2 balti rutuliai ir 3 juodi; trečioje - 3 balti rutuliai. Kažkas atsitiktinai prieina prie vienos iš urnų ir ištraukia iš jos 1 rutulį. Šis rutulys yra baltas. Raskite užpakalines tikimybes, kad rutulys ištrauktas iš 1, 2, 3 urnos.

Sprendimas. Turime tris hipotezes: H 1 = (pasirinkta pirmoji urna), H 2 = (pasirinkta antra urna), H 3 = (pasirinkta trečia urna). Kadangi urna parenkama atsitiktinai, hipotezių apriorinės tikimybės yra tokios: Р(Н 1) = Р(Н 2) = Р(Н 3) = 1/3.

Eksperimento rezultate atsirado įvykis A = (iš pasirinktos urnos buvo ištrauktas baltas rutulys). Sąlyginės įvykio A tikimybės pagal hipotezes H 1, H 2, H 3: P(A|H 1) = 3/4, P(A|H 2) = 2/5, P(A|H 3) = 1. Pavyzdžiui, pirmoji lygybė skamba taip: „tikimybė nupiešti baltą rutulį, jei pasirenkama pirmoji urna, yra 3/4 (nes pirmoje urnoje yra 4 rutuliukai, iš kurių 3 yra balti)“.

Taikydami Bayes formulę, randame hipotezių posteriorines tikimybes:

Taigi, atsižvelgiant į informaciją apie įvykio A įvykimą, hipotezių tikimybės pasikeitė: labiausiai tikėtina tapo hipotezė H 3 , mažiausiai tikėtina - hipotezė H 2 .

2 pavyzdys Du šauliai savarankiškai šaudo į tą patį taikinį, kiekvienas iššauna po vieną šūvį. Tikimybė pataikyti į taikinį pirmajam šauliui yra 0,8, antrajam - 0,4. Po šaudymo taikinyje buvo rasta viena skylė. Raskite tikimybę, kad ši skylė priklauso pirmajam šauliui (rezultatą (abi skylės sutapo) atmetame kaip nežymiai mažai tikėtiną).

Sprendimas. Prieš eksperimentą galimos šios hipotezės: H 1 = (nepataikys nei pirmoji, nei antroji strėlė), H 2 = (pataikys abi strėlės), H 3 - (pirmas šaulys pataikys, o antrasis nepataikys). ), H 4 = (pirmas šaulys nepataikys, o antrasis pataikys). Ankstesnės hipotezių tikimybės:

P (H 1) \u003d 0,2 * 0,6 \u003d 0,12; P (H 2) \u003d 0,8 * 0,4 \u003d 0,32; P (H 3) \u003d 0,8 * 0,6 \u003d 0,48; P (H 4) \u003d 0,2 * 0,4 \u003d 0,08.

Sąlyginės stebimo įvykio tikimybės A = (taikinyje yra viena skylė) pagal šias hipotezes yra: P(A|H 1) = P(A|H 2) = 0; P(A|H 3) = P(A|H 4) = 1

Po patirties hipotezės H 1 ir H 2 tampa neįmanomos, o hipotezių H 3 ir H 4 užpakalinės tikimybės pagal Bayes formulę bus:

Bayes nuo šiukšlių

Bayes formulė buvo plačiai pritaikyta kuriant šiukšlių filtrus. Tarkime, kad norite išmokyti kompiuterį nustatyti, kurie el. laiškai yra šlamštas. Pradėsime nuo žodyno ir žodžių junginių, naudodami Bajeso įverčius. Pirmiausia sukurkime hipotezių erdvę. Iškelkime 2 hipotezes dėl bet kurios raidės: H A yra šlamštas, H B yra ne šlamštas, o įprasta, reikalinga raidė.

Pirmiausia „apmokykime“ savo būsimą anti-spam sistemą. Paimkime visas turimas raides ir padalinkime jas į dvi „krūvas“ po 10 raidžių. Į vieną dedame šlamšto laiškus ir vadiname H A krūva, į kitą dedame reikiamą korespondenciją ir vadiname H B krūva. Dabar pažiūrėkime: kokie žodžiai ir frazės randami šlamšte ir reikalinguose el. laiškuose ir kokiu dažnumu? Šie žodžiai ir frazės bus vadinami įrodymais ir žymimi E 1 , E 2... Pasirodo, dažniausiai vartojami žodžiai (pavyzdžiui, žodžiai „patinka“, „tavo“) krūvose H A ir H B atsiranda su maždaug tas pats dažnis. Taigi, šių žodžių buvimas laiške nieko nepasako apie tai, kuriai krūvai jis priklauso (silpni įrodymai). Šiems žodžiams priskirkime neutralią „spamo“ tikimybės įvertinimo reikšmę, tarkime, 0,5.

Tegul frazė „šnekamoji anglų kalba“ pasirodo tik 10 raidžių ir dažniau šlamšto laiškuose (pavyzdžiui, 7 šlamšto laiškuose iš visų 10) nei teisinguose (3 iš 10). Suteikime šiai frazei didesnį balą 7/10 už šlamštą ir žemesnį balą įprastiems el. laiškams: 3/10. Ir atvirkščiai, paaiškėjo, kad žodis „bičiulis“ dažniau pasitaiko įprastomis raidėmis (6 iš 10). Ir taip gavome trumpą laišką: „Draugas! Kaip sekasi kalbėti angliškai?. Pabandykime įvertinti jo „spamiškumą“. Pateiksime bendruosius priklausomybės kiekvienai krūvai įverčius P(H A), P(H B), naudodamiesi šiek tiek supaprastinta Bayes formule ir apytiksliais įverčiais:

P(H A) = A/(A+B), kur A \u003d p a1 * p a2 * ... * pan, B \u003d p b1 * p b2 * ... * p b n \u003d (1 - p a1) * (1 - p a2) * ... * ( 1 - p an).

1 lentelė. Supaprastintas (ir neišsamus) Bajeso rašymo vertinimas

Taigi mūsų hipotetinis laiškas gavo priklausymo tikimybės įvertinimą su akcentu „spam“ kryptimi. Ar galime nuspręsti mesti laišką į vieną iš krūvų? Nustatykime sprendimo ribas:

  • Laikysime, kad raidė priklauso krūvai H i, jei P(H i) ≥ T.
  • Raidė nepriklauso krūvai, jei P(H i) ≤ L.
  • Jei L ≤ P(H i) ≤ T, tada sprendimas negali būti priimtas.

Galite imti T = 0,95 ir L = 0,05. Kadangi už nagrinėjamą laišką ir 0,05< P(H A) < 0,95, и 0,05 < P(H В) < 0,95, то мы не сможем принять решение, куда отнести данное письмо: к спаму (H A) или к нужным письмам (H B). Можно ли улучшить оценку, используя больше информации?

Taip. Apskaičiuokime kiekvieno įrodymo balą skirtingai, kaip pasiūlė Bayesas. Leisti:

F a yra bendras el. pašto šiukšlių skaičius;

F ai – raidžių su sertifikatu skaičius išiukšlių krūvoje;

F b – bendras reikalingas raidžių skaičius;

F bi – raidžių su sertifikatu skaičius i reikalingų (aktualių) laiškų krūvoje.

Tada: p ai = F ai /F a , p bi = F bi /F b . P(H A) = A/(A+B), P(H B) = B/(A+B), kurА = p a1 *p a2 *…*p an , B = p b1 *p b2 *…*p b n

Atkreipkite dėmesį, kad įrodymų žodžiai p ai ir p bi tapo objektyvūs ir gali būti apskaičiuoti be žmogaus įsikišimo.

2 lentelė. Tikslesnis (bet neišsamus) Bajeso įvertinimas galimoms ypatybėms iš laiško

Gavome gana aiškų rezultatą – esant didelei tikimybei, raidę galima priskirti reikiamoms raidėms, nes P(H B) = 0,997 > T = 0,95. Kodėl rezultatas pasikeitė? Kadangi naudojome daugiau informacijos – atsižvelgėme į raidžių skaičių kiekvienoje krūvoje ir, beje, daug teisingiau nustatėme įverčius p ai ir p bi. Jie buvo nustatyti taip pat, kaip tai padarė pats Bayesas, skaičiuojant sąlygines tikimybes. Kitaip tariant, p a3 yra tikimybė, kad el. laiške pasirodys žodis „bičiulis“, atsižvelgiant į tai, kad el. laiškas jau priklauso šiukšlių krūvai H A . Rezultato laukti nereikėjo ilgai – atrodo, kad galime drąsiau apsispręsti.

Bayes prieš įmonių sukčiavimą

Įdomų Bajeso metodo taikymą aprašė MAGNUS8.

Mano dabartinis projektas (IS, skirtas aptikti sukčiavimą gamybos įmonėje) naudoja Bayes formulę, kad nustatytų sukčiavimo (sukčiavimo) tikimybę, jei yra / nėra kelių faktų, netiesiogiai patvirtinančių sukčiavimo galimybės hipotezę. Algoritmas yra savarankiškai besimokantis (su grįžtamuoju ryšiu), t.y. perskaičiuoja savo koeficientus (sąlygines tikimybes), faktiškai patvirtinus arba nepatvirtinus sukčiavimo ūkinės apsaugos tarnybos patikrinimo metu.

Tikriausiai verta pasakyti, kad tokie metodai kuriant algoritmus reikalauja gana aukštos kūrėjo matematinės kultūros, nes menkiausia klaida išvedant ir (arba) įgyvendinant skaičiavimo formules panaikins ir diskredituos visą metodą. Dėl to ypač kalti tikimybiniai metodai, nes žmogaus mąstymas nėra pritaikytas darbui su tikimybinėmis kategorijomis ir atitinkamai nėra tarpinių ir galutinių tikimybinių parametrų „fizinės reikšmės“ „matomumo“ ir supratimo. Toks supratimas egzistuoja tik pagrindinėms tikimybių teorijos sąvokoms, o tada tereikia labai atsargiai derinti ir išvesti sudėtingus dalykus pagal tikimybių teorijos dėsnius – sudėtiniams objektams sveikas protas jau nepadės. Tai visų pirma siejama su gana rimtomis metodologinėmis kovomis, vykstančiomis šiuolaikinių knygų apie tikimybių filosofiją puslapiuose, taip pat su daugybe sofizmų, paradoksų ir įdomybių šia tema.

Dar vienas niuansas, su kuriuo teko susidurti – deja, beveik viskas, kas daugiau ar mažiau NAUDINGA PRAKTIKĖJE šia tema yra parašyta anglų kalba. Rusų kalbos šaltiniuose iš esmės yra tik gerai žinoma teorija su demonstraciniais pavyzdžiais tik primityviausiems atvejams.

Visiškai sutinku su paskutiniu komentaru. Pavyzdžiui, Google, bandydama rasti kažką panašaus į knygą „Bayesian Probability“, nepateikė nieko suprantamo. Tiesa, jis teigė, kad knyga su Bajeso statistika Kinijoje buvo uždrausta. (Statistikos profesorius Andrew Gelmanas Kolumbijos universiteto tinklaraštyje pranešė, kad jo knyga „Duomenų analizė su regresija ir daugiapakopiais/hierarchiniais modeliais“ buvo uždrausta leisti Kinijoje. tekstas.) Įdomu, ar dėl panašios priežasties nebuvo knygų Bajeso kalba. tikimybe Rusijoje?

Konservatizmas žmogaus informacijos apdorojimo procese

Tikimybės lemia neapibrėžtumo laipsnį. Tikimybė, tiek pagal Bayesą, tiek pagal mūsų intuiciją, yra tiesiog skaičius tarp nulio ir tai, kas parodo, kiek idealizuotas žmogus mano, kad teiginys yra teisingas. Priežastis, dėl kurios žmogus yra šiek tiek idealizuojamas, yra ta, kad jo tikimybių suma dviem vienas kitą paneigiantiems įvykiams turi būti lygi jo tikimybei, kad įvyks bet kuris iš šių įvykių. Adityvumo savybė turi tokias pasekmes, kad tik nedaugelis žmonių gali juos visus prilygti.

Bajeso teorema yra trivialus adityvumo savybės padarinys, nepaneigiamas ir sutinkamas visų tikimybių, tiek Bajeso, tiek kitų. Vienas iš būdų jį parašyti yra toks. Jei P(H A |D) yra vėlesnė tikimybė, kad hipotezė A buvo po nurodytos vertės D stebėjimo, P(H A) yra jos ankstesnė tikimybė prieš stebint nurodytą reikšmę D, P(D|H A ) yra tikimybė, kad bus stebima duota reikšmė D, jei H A yra teisinga, o P(D) yra besąlyginė nurodytos vertės D tikimybė, tada

(1) P(H A |D) = P(D|H A) * P(H A) / P(D)

P(D) geriausia įsivaizduoti kaip normalizuojančią konstantą, dėl kurios užpakalinės tikimybės sumuojasi iki vienos, palyginti su visa svarstoma viena kitą paneigiančių hipotezių rinkiniu. Jei reikia apskaičiuoti, tai gali būti taip:

Tačiau dažniau P(D) pašalinamas, o ne skaičiuojamas. Patogus būdas tai pašalinti – paversti Bayeso teoremą tikimybės ir šansų santykio forma.

Apsvarstykite kitą hipotezę H B , viena kitą paneigiančią H A, ir pakeiskite savo nuomonę apie ją remdamiesi tuo pačiu dydžiu, kuris pakeitė jūsų nuomonę apie H A. Bayeso teorema sako, kad

(2) P(H B |D) = P(D|H B) * P(H B) / P(D)

Dabar 1 lygtį padalijame iš 2 lygties; rezultatas bus toks:

kur Ω 1 yra užpakaliniai šansai H A naudai pagal H B , Ω 0 yra pirmieji šansai, o L yra statistikams žinomas skaičius kaip tikimybių santykis. 3 lygtis yra ta pati aktuali Bayes teoremos versija, kaip ir 1 lygtis, ir dažnai yra daug naudingesnė, ypač atliekant eksperimentus su hipotezėmis. Bajeso šalininkai teigia, kad Bayeso teorema yra formaliai optimali taisyklė, kaip peržiūrėti nuomones atsižvelgiant į naujus duomenis.

Mums įdomu palyginti idealų elgesį, apibrėžtą Bayeso teorema, su realiu žmonių elgesiu. Kad suprastumėte, ką tai reiškia, pabandykime eksperimentuoti su jumis kaip subjektu. Šiame krepšyje yra 1000 pokerio žetonų. Turiu du tokius maišelius, vienas su 700 raudonų ir 300 mėlynų žetonų, o kitas su 300 raudonų ir 700 mėlynų. Išverčiau monetą, kad nuspręsčiau, kurią naudoti. Taigi, jei mūsų nuomonės sutampa, jūsų dabartinė tikimybė ištraukti maišelį su daugiau raudonų žetonų yra 0,5. Dabar atsitiktine tvarka atrenkate atranką ir grįžtate po kiekvieno žetono. Iš 12 žetonų gausite 8 raudonus ir 4 mėlynus. Dabar, remiantis viskuo, ką žinote, kokia tikimybė, kad maišelyje buvo daugiau raudonų spalvų? Aišku, kad jis didesnis nei 0,5. Prašome netęsti skaitymo, kol neįrašęs įvertinimo.

Jei atrodote kaip įprastas dalykas, jūsų balas nukrenta nuo 0,7 iki 0,8. Tačiau jei atliktume atitinkamą skaičiavimą, atsakymas būtų 0,97. Iš tiesų, labai retai žmogus, kuriam anksčiau nebuvo parodyta konservatyvumo įtaka, pateikia tokį aukštą įvertinimą, net jei jis buvo susipažinęs su Bayeso teorema.

Jei raudonųjų traškučių dalis maišelyje yra R, tada tikimybė gauti r raudonos drožlės ir ( n-r) mėlyna n pavyzdžiai su grąžinimu - p r (1–p)n-r. Taigi, atliekant tipišką maišo ir pokerio žetonų eksperimentą, jei HA reiškia, kad raudonųjų žetonų dalis yra r A ir HB reiškia, kad dalis yra RB, tada tikimybės santykis:

Taikant Bayeso formulę, reikia atsižvelgti tik į tikrojo stebėjimo tikimybę, o ne į kitų stebėjimų, kuriuos jis galėjo atlikti, bet to nepadarė, tikimybę. Šis principas turi plačią reikšmę visiems statistiniams ir nestatistiniams Bajeso teoremos taikymams; tai svarbiausias Bajeso mąstymo techninis įrankis.

Bajeso revoliucija

Jūsų draugai ir kolegos kalba apie tai, kas vadinama „Bayeso teorema“ arba „Bajeso taisykle“, arba apie kažką, vadinamą Bajeso mąstymu. Jie tikrai to domisi, todėl prisijungiate prie interneto ir randate puslapį apie Bayeso teoremą ir... Tai lygtis. Ir viskas... Kodėl matematinė sąvoka sukelia tokį entuziazmą mintyse? Kokia „Bayeso revoliucija“ vyksta tarp mokslininkų ir teigiama, kad net patį eksperimentinį metodą galima apibūdinti kaip ypatingą jos atvejį? Kokia paslaptis, kurią žino Bayeso pasekėjai? Kokią šviesą jie mato?

Bajeso revoliucija moksle neįvyko, nes vis daugiau kognityvinių mokslininkų staiga pradėjo pastebėti, kad psichiniai reiškiniai turi Bajeso struktūrą; ne todėl, kad kiekvienos srities mokslininkai pradėjo taikyti Bajeso metodą; bet todėl, kad pats mokslas yra ypatingas Bayes’o teoremos atvejis; eksperimentiniai įrodymai yra Bajeso įrodymai. Bajeso revoliucionieriai teigia, kad kai jūs atliekate eksperimentą ir gaunate įrodymų, kurie „palaiko“ arba „paneigia“ jūsų teoriją, tai patvirtinimas arba paneigimas vyksta pagal Bajeso taisykles. Pavyzdžiui, turite atsižvelgti ne tik į tai, kad jūsų teorija gali paaiškinti reiškinį, bet ir į tai, kad yra kitų galimų paaiškinimų, kurie taip pat gali numatyti šį reiškinį.

Anksčiau populiariausia mokslo filosofija buvo senoji filosofija, kurią išstūmė Bajeso revoliucija. Karlo Popperio mintis, kad teorijas galima visiškai suklastoti, bet niekada iki galo nepatvirtinti, yra dar vienas ypatingas Bajeso taisyklių atvejis; jei p(X|A) ≈ 1 - jei teorija daro teisingas prognozes, tai stebėjimas ~X labai stipriai klasto A. Kita vertus, jei p(X|A) ≈ 1 ir stebime X, tai nepatvirtina teorija labai daug; galima ir kita sąlyga B, pvz., p(X|B) ≈ 1 ir kuriai esant X stebėjimas liudija ne A, o B įrodymą. Norėdami pastebėti, kad X neabejotinai patvirtina A, turėtume žinoti, kad p( X|A) ≈ 1 ir kad p(X|~A) ≈ 0, kurio mes negalime žinoti, nes negalime apsvarstyti visų galimų alternatyvių paaiškinimų. Pavyzdžiui, kai Einšteino bendrosios reliatyvumo teorija pranoko Niutono gravitacijos teoriją, kurią labai galima patikrinti, visos Niutono teorijos prognozės tapo ypatingu Einšteino atveju.

Panašiai Popperio teiginys, kad idėja turi būti falsifikuojama, gali būti interpretuojamas kaip Bajeso taisyklės apie tikimybės išsaugojimą apraiška; jei rezultatas X yra teigiamas teorijos įrodymas, tai rezultatas ~X turi tam tikru mastu sufalsifikuoti teoriją. Jei bandote interpretuoti ir X, ir ~ X kaip „palaikančius“ teoriją, Bajeso taisyklės sako, kad tai neįmanoma! Norėdami padidinti teorijos tikimybę, turite jai atlikti testus, kurie gali sumažinti jos tikimybę; tai ne tik taisyklė šarlatanams aptikti moksle, bet ir Bajeso tikimybių teoremos pasekmė. Kita vertus, Popperio mintis, kad reikia tik falsifikavimo ir nereikia patvirtinimo, yra klaidinga. Bayes'o teorema rodo, kad falsifikavimas yra labai stiprus įrodymas, palyginti su patvirtinimu, tačiau falsifikacija vis tiek yra tikimybinio pobūdžio; jis nereglamentuojamas iš esmės skirtingų taisyklių ir tuo nesiskiria nuo patvirtinimo, kaip teigia Popperis.

Taigi matome, kad daugelis pažinimo mokslų reiškinių, taip pat mokslininkų naudojami statistiniai metodai ir pats mokslinis metodas yra ypatingi Bayeso teoremos atvejai. Štai apie ką Bajeso revoliucija.

Sveiki atvykę į Bajeso sąmokslą!

Literatūra apie Bajeso tikimybę

2. Nobelio ekonomikos premijos laureatas Kahnemanas (ir kt.) nuostabioje knygoje aprašo daugybę skirtingų Bayes pritaikymų. Vien šios labai didelės knygos santraukoje suskaičiavau 27 nuorodas į presbiteriono ministro vardą. Minimalios formulės. (.. labai patiko. Tiesa, sudėtinga, daug matematikos (o kur be jos), bet atskiri skyriai (pvz. 4 skyrius. Informacija), aiškiai į temą. Patariu visiems. Net jei matematika yra jums sunku, perskaitykite eilutę, praleiskite matematiką ir žvejokite naudingus grūdus ...

14. (2017-01-15 papildymas), skyrius iš Tony Crilly knygos. 50 idėjų, apie kurias reikia žinoti. Matematika.

Fizikas Richardas Feynmanas, Nobelio premijos laureatas, ypač pasipūtęs kalbėdamas apie vieną filosofą, kartą pasakė: „Mane nervina visai ne filosofija kaip mokslas, o aplink ją sukurta pompastika. Jei tik filosofai galėtų juoktis iš savęs! Jei tik jie galėtų pasakyti: „Aš sakau, kad taip, bet von Leipcigas manė, kad yra kitaip, ir jis taip pat kažką apie tai žino“. Jei tik jie prisimintų patikslinti, kad tai tik jų .

Galbūt niekada negirdėjote apie Bayeso teoremą, bet naudojote ją visą laiką. Pavyzdžiui, iš pradžių tikimybę gauti atlyginimo padidėjimą įvertinote 50 proc. Sulaukę teigiamų vadovo atsiliepimų, pakoregavote savo įvertinimą į gerąją pusę, o, priešingai, sumažinote, jei darbe sulaužėte kavos virimo aparatą. Taip kaupiant informaciją patikslinama tikimybės reikšmė.

Pagrindinė Bayeso teoremos mintis yra gauti didesnį įvykio tikimybės įvertinimo tikslumą, atsižvelgiant į papildomus duomenis.

Principas paprastas: yra pradinis pagrindinis tikimybės įvertis, kuris patikslinamas pateikiant daugiau informacijos.

Bayes formulė

Intuityvūs veiksmai formalizuojami paprasta, bet galinga lygtimi ( Bayeso tikimybės formulė):

Kairioji lygties pusė yra įvykio A tikimybės a posteriori įvertinimas esant įvykio B atsiradimo sąlygai (vadinamoji sąlyginė tikimybė).

  • P(A)- įvykio A tikimybė (bazinis, a priori įvertinimas);
  • P(B|A) – tikimybė (taip pat sąlyginė), kurią gauname iš savo duomenų;
  • a P(B) yra normalizavimo konstanta, kuri riboja tikimybę iki 1.

Ši trumpoji lygtis yra pagrindas Bajeso metodas.

Abstraktus įvykių A ir B pobūdis neleidžia aiškiai suprasti šios formulės prasmės. Norėdami suprasti Bayeso teoremos esmę, panagrinėkime tikrą problemą.

Pavyzdys

Viena iš temų, su kuria dirbu, yra miego modelių tyrimas. Mano „Garmin Vivosmart“ laikrodis užfiksavo dviejų mėnesių duomenis, rodančius, kada einu miegoti ir pabundu. Galutinis modelio rodymas greičiausiai Toliau pateikiamas miego tikimybės pasiskirstymas kaip laiko funkcija (MCMC yra apytikslis metodas).

Diagrama rodo tikimybę, kad aš miegosiu, priklausomai tik nuo laiko. Kaip pasikeis, jei atsižvelgsite į laiką, per kurį miegamajame dega šviesa? Norint patikslinti įvertinimą, reikalinga Bayeso teorema. Patikslintas įvertinimas pagrįstas a priori ir turi tokią formą:

Kairėje esanti išraiška reiškia tikimybę, kad aš miegu, nes žinoma, kad mano miegamajame dega šviesa. Ankstesnis įvertis tam tikru momentu (parodytas aukščiau esančiame grafike) žymimas kaip P (miegas). Pavyzdžiui, 22.00 val. išankstinė tikimybė, kad aš miegu, yra 27,34%.

Pridėkite daugiau informacijos naudodami tikimybę P (miegamojo šviesa|miegas) gauta iš stebimų duomenų.

Iš savo stebėjimų žinau štai ką: tikimybė, kad miegu, kai dega šviesa, yra 1%.

Tikimybė, kad miego metu šviesa išjungta, yra 1-0,01 = 0,99 („-“ ženklas formulėje reiškia priešingą įvykį), nes priešingų įvykių tikimybių suma yra 1. Kai aš miegu, šviesa miegamasis įjungtas arba išjungtas.

Galiausiai, lygtis taip pat apima normalizavimo konstantą P (šviesa) tikimybę, kad lemputė dega. Šviesa dega ir kai miegu, ir kai būnu. Todėl, žinodami a priori miego tikimybę, normalizavimo konstantą apskaičiuojame taip:

Į tikimybę, kad lemputė užsidegs, atsižvelgiama į abi parinktis: arba aš miegu, arba ne ( P (-miegas) = 1 — P (miegas) yra tikimybė, kad aš pabudęs.)

Tikimybė, kad šviesa dega, kai aš pabudau P(lengvas|-miegas), ir nustatomas stebint. Žinau, kad yra 80% tikimybė, kad lemputė dega, kai aš pabudau (tai reiškia, kad yra 20% tikimybė, kad šviesa nedega, jei aš pabudau).

Galutinė Bayes lygtis tampa tokia:

Tai leidžia apskaičiuoti tikimybę, kad aš miegu, atsižvelgiant į tai, kad šviesa dega. Jei mus domina tikimybė, kad šviesa išjungta, mums reikia kiekvienos konstrukcijos P(šviesa|… pakeistas P(-šviesa|….

Pažiūrėkime, kaip gautos simbolinės lygtys naudojamos praktikoje.

Taikykime formulę laikui 22:30 ir atsižvelgsime į tai, kad lemputė dega. Žinome, kad yra 73,90% tikimybė, kad aš miegojau. Šis skaičius yra mūsų vertinimo atskaitos taškas.

Patobulinkime jį, atsižvelgdami į informaciją apie apšvietimą. Žinodami, kad lemputė dega, pakeičiame skaičius į Bayes formulę:

Papildomi duomenys dramatiškai pakeitė tikimybės įvertinimą – nuo ​​daugiau nei 70% iki 3,42%. Tai rodo Bayeso teoremos galią: mes galėjome patobulinti savo pradinį situacijos vertinimą įtraukdami daugiau informacijos. Galbūt intuityviai tai darėme anksčiau, bet dabar, galvodami apie tai formaliomis lygtimis, galėjome patvirtinti savo prognozes.

Panagrinėkime dar vieną pavyzdį. Ką daryti, jei laikrodis yra 21:45 ir šviesos išjungtos? Pabandykite patys apskaičiuoti tikimybę, darydami prielaidą, kad išankstinis įvertinimas yra 0,1206.

Užuot kiekvieną kartą skaičiuojęs rankiniu būdu, šiems skaičiavimams parašiau paprastą Python kodą, kurį galite išbandyti „Jupyter Notebook“. Gausite tokį atsakymą:

Laikas: 21:45:00 Šviesa IŠJUNGTA.

Ankstesnė miego tikimybė: 12,06%
Atnaujinta miego tikimybė: 40,44%

Vėlgi, papildoma informacija keičia mūsų sąmatą. Dabar, jei mano sesuo nori man paskambinti 21.45 val., žinodama, kad mano lemputė dega, pagal šią lygtį ji gali nustatyti, ar galiu pakelti ragelį (darant prielaidą, kad paimu tik pabudęs)! Kas sako, kad statistika netaikoma kasdieniame gyvenime?

Tikimybių vizualizacija

Skaičiavimų stebėjimas yra naudingas, tačiau vizualizacija padeda giliau suprasti rezultatą. Visada stengiuosi naudoti grafikus idėjoms generuoti, jei jos neatsiranda natūraliai tiriant lygtis. Naudodami papildomus duomenis galime vizualizuoti ankstesnį ir užpakalinį miego tikimybių pasiskirstymą:

Kai dega lemputė, grafikas pasislenka į dešinę, o tai rodo, kad tuo metu mažiau miegosiu. Taip pat grafika pasislenka į kairę, jei mano lemputė išjungta. Suprasti Bayes teoremos prasmę nėra lengva, tačiau ši iliustracija aiškiai parodo, kodėl ją reikia naudoti. Bayes formulė yra įrankis, skirtas tikslinti prognozes naudojant papildomus duomenis.

O jeigu duomenų yra dar daugiau?

Kodėl verta sustoti ties miegamojo apšvietimu? Savo modelyje galime naudoti dar daugiau duomenų, kad dar labiau patikslintume įvertinimą (tol, kol duomenys bus naudingi nagrinėjamam atvejui). Pavyzdžiui, aš žinau, kad jei mano telefonas kraunasi, yra 95% tikimybė, kad aš užmigsiu. Į šį faktą galima atsižvelgti mūsų modelyje.

Tarkime, kad tikimybė, kad mano telefonas kraunasi, nepriklauso nuo miegamojo apšvietimo (įvykių nepriklausomybė yra stiprus supaprastinimas, bet tai labai palengvins užduotį). Padarykime naują, dar tikslesnę tikimybės išraišką:

Gauta formulė atrodo sudėtinga, tačiau naudodami Python kodą galime parašyti funkciją, kuri atliks skaičiavimus. Bet kuriuo momentu ir bet kokiu apšvietimo / telefono įkrovimo deriniu ši funkcija grąžina pakoreguotą tikimybę, kad aš miegu.

Laikas yra 23:00:00 Šviesa dega Telefonas NĖRA kraunamas.

Ankstesnė miego tikimybė: 95,52%
Atnaujinta miego tikimybė: 1,74%

23.00 val. be papildomos informacijos beveik neabejotinai galėtume pasakyti, kad sapnuoju. Tačiau kai turime papildomos informacijos, kad dega lemputė ir telefonas nesikrauna, darome išvadą, kad tikimybė, kad aš miegu, praktiškai lygi nuliui. Štai dar vienas pavyzdys:

Laikas yra 22:15:00 Šviesa IŠJUNGTA Telefonas įkraunamas.

Ankstesnė miego tikimybė: 50,79%
Atnaujinta miego tikimybė: 95,10%

Tikimybė keičiasi žemyn arba aukštyn, priklausomai nuo konkrečios situacijos. Norėdami tai parodyti, apsvarstykite keturias papildomas duomenų konfigūracijas ir kaip jos keičia tikimybių pasiskirstymą:

Šiame grafike pateikiama daug informacijos, tačiau pagrindinis dalykas yra tas, kad tikimybių kreivė keičiasi priklausomai nuo papildomų veiksnių. Kai bus pridėta daugiau duomenų, gausime tikslesnį įvertinimą.

Išvada

Bayeso teoremą ir kitas statistines sąvokas gali būti sunku suprasti, kai jos vaizduojamos abstrakčiomis lygtimis, naudojant tik raides arba įsivaizduojamas situacijas. Tikrasis mokymasis ateina tada, kai abstrakčias sąvokas taikome tikroms problemoms spręsti.

Duomenų mokslo sėkmę lemia nuolatinis mokymasis, naujų metodų įtraukimas į įgūdžių rinkinį ir geriausio metodo problemoms spręsti radimas. Bayeso teorema leidžia patikslinti savo tikimybių įvertinimus naudojant papildomą informaciją, kad būtų galima geriau modeliuoti tikrovę. Informacijos kiekio didinimas leidžia daryti tikslesnes prognozes, o Bayesas pasirodė esąs naudingas įrankis šiai užduočiai atlikti.

Laukiu atsiliepimų, diskusijų ir konstruktyvios kritikos. Galite susisiekti su manimi Twitter.

Pamoka numeris 4.

Tema: Bendrosios tikimybės formulė. Bayes formulė. Bernulli schema. Polinominė schema. Hipergeometrinė schema.

BENDROSIOS TIKIMYBĖS FORMULĖ

BAYES FORMULĖ

TEORIJA

Bendrosios tikimybės formulė:

Tegul yra visa nesuderinamų įvykių grupė:

(, Tada įvykio A tikimybę galima apskaičiuoti pagal formulę

(4.1)

Įvykiai vadinami hipotezėmis. Iškeltos hipotezės dėl tos eksperimento dalies, kurioje yra neapibrėžtumo.

, kur yra hipotezių apriorinės tikimybės

Bayes formulė:

Tegul eksperimentas baigiamas ir žinoma, kad eksperimento rezultatas įvyko A. Tada, atsižvelgdami į šią informaciją, galime pervertinkite hipotezių tikimybę:

(4.2)

, kur užpakalinės hipotezių tikimybės

PROBLEMŲ SPRENDIMAS

1 užduotis.

Būklė

3 partijose detalių, gautų sandėlyje, geros yra 89 %, 92 % ir 97 % atitinkamai. Dalių skaičius partijomis vadinamas 1:2:3.

Kokia tikimybė, kad atsitiktinai iš sandėlio parinkta detalė bus brokuota. Leiskite žinoti, kad atsitiktinai parinkta detalė pasirodė sugedusi. Raskite tikimybę, kad jis priklauso pirmajai, antrai ir trečiajai šaliai.

Sprendimas:

Pažymėkite A įvykį, kai atsitiktinai parinkta dalis pasirodo esanti sugedusi.

1 klausimas - į bendrosios tikimybės formulę

2 klausimas - pagal Bayes formulę

Iškeltos hipotezės dėl tos eksperimento dalies, kurioje yra neapibrėžtumo. Šioje užduotyje neapibrėžtis yra tai, iš kurios partijos yra atsitiktinai parinkta dalis.

Įleisk pirmąjį žaidimą a detales. Tada antrame žaidime - 2 a detalės, o trečioje - 3 a detales. Tik trys žaidimai 6 a detales.

(santuokos procentas pirmoje eilutėje buvo išverstas į tikimybę)


(santuokos procentas antroje eilutėje buvo išverstas į tikimybę)

(santuokos procentas trečioje eilutėje konvertuotas į tikimybę)

Naudodamiesi bendrosios tikimybės formule, apskaičiuojame įvykio tikimybę A

-atsakymas į 1 klausimą

Tikimybė, kad sugedusi dalis priklausys pirmai, antrai ir trečiai partijoms, apskaičiuojama pagal Bayes formulę:

2 užduotis.

Būklė:

Pirmoje urnoje 10 kamuoliukai: 4 baltas smėlis 6 juodas. Antroje urnoje 20 kamuoliukai: 2 baltas smėlis 18 juodas. Iš kiekvienos urnos atsitiktine tvarka parenkamas vienas kamuoliukas ir įdedamas į trečią urną. Tada iš trečiosios urnos atsitiktinai parenkamas vienas rutulys. Raskite tikimybę, kad iš trečiosios urnos ištrauktas rutulys yra baltas.

Sprendimas:

Atsakymą į problemos klausimą galima gauti naudojant bendrosios tikimybės formulę:

Nežinomybė slypi, kur kamuoliai atsidūrė trečioje urnoje. Mes iškėlėme hipotezes dėl kamuoliukų sudėties trečiojoje urnoje.

H1 = (trečioje urnoje yra 2 balti rutuliai)

H2 = (trečioje urnoje yra 2 juodi rutuliai)

H3 = (trečioje urnoje yra 1 baltas rutulys ir 1 juodas rutulys)

A = (iš 3 urnos paimtas rutulys bus baltas)

3 užduotis.

Baltas rutulys įmetamas į urną, kurioje yra 2 neaiškios spalvos rutuliukai. Po to iš šios urnos ištraukiame 1 rutulį. Raskite tikimybę, kad iš urnos ištrauktas rutulys yra baltas. Iš aukščiau aprašytos urnos paimtas kamuolys pasirodė baltas. Raskite tikimybes kad prieš perkėlimą urnoje buvo 0 baltų rutulių, 1 baltas rutuliukas ir 2 balti rutuliai .

1 klausimas c - į bendrosios tikimybės formulę

2 klausimas- pagal Bayes formulę

Neaiškumas slypi pradinėje urnoje esančių kamuoliukų sudėtyje. Kalbant apie pradinę rutulių sudėtį urnoje, iškeliame šias hipotezes:

Sveiki=( urnoje prieš pamainąi-1 baltas rutulys),i=1,2,3

, i=1,2,3(visiško neapibrėžtumo situacijoje hipotezių a priori tikimybes laikome vienodomis, nes negalime sakyti, kad vienas variantas yra labiau tikėtinas už kitą)

A = (po perdavimo iš urnos ištrauktas rutulys bus baltas)

Apskaičiuokime sąlygines tikimybes:

Atlikime skaičiavimus naudodami bendrosios tikimybės formulę:

Atsakymas į 1 klausimą

Norėdami atsakyti į antrąjį klausimą, naudojame Bayes formulę:

(sumažėja, palyginti su ankstesne tikimybe)

(nepakitęs nuo ankstesnės tikimybės)

(padidėjęs, palyginti su ankstesne tikimybe)

Išvada palyginus ankstesnes ir posteriorines hipotezių tikimybes: pradinė neapibrėžtis kiekybiškai pasikeitė

4 užduotis.

Būklė:

Perpilant kraują būtina atsižvelgti į donoro ir paciento kraujo grupes. Asmuo, turintis ketvirta grupė kraujo galima perpilti bet kokio tipo kraują, žmogui su antrąja ir trečia grupe galima pilti arba jo grupės kraujas, arba pirmas.žmogui su pirmąja kraujo grupe galite perpilti kraują tik pirmoji grupė. Yra žinoma, kad tarp gyventojų 33,7 % turėti pirmoji grupė pu, 37,5 % turėti antroji grupė, 20,9 proc. turėti trečioji grupė ir 7,9% turi 4 grupę. Raskite tikimybę, kad atsitiktinai paimtam pacientui gali būti perpiltas atsitiktinai paimto donoro kraujas.


Sprendimas:

Mes iškėlėme hipotezes apie atsitiktinai paimto paciento kraujo grupę:

Sveiki = (pacienteI-oji kraujo grupė),i=1,2,3,4

(procentai konvertuoti į tikimybes)

A = (galima perpilti)

Pagal bendrosios tikimybės formulę gauname:

y., perpylimas gali būti atliktas apie 60 proc

Bernulio schema (arba dvinario schema)

Bernulio bandymai - tai yra nepriklausomi testai 2 rezultatas, kurį sąlyginai vadiname sėkmės ir nesėkmės.

p- sėkmės rodiklis

q- gedimo tikimybė

Sėkmės tikimybė nesikeičia nuo patirties iki patirties

Ankstesnio testo rezultatas neturi įtakos kitam bandymui.

Aukščiau aprašytų testų atlikimas vadinamas Bernulio schema arba binomine schema.

Bernoulli testų pavyzdžiai:

Monetos metimas

Sėkmė - herbas

Nesėkmė- uodegos

Teisingos monetos dėklas

neteisinga monetų dėžė

p ir q nesikeiskite iš patirties į patirtį, jei eksperimento metu nepakeisime monetos

Kauliuko metimas

Sėkmė - ritinys "6"

Nesėkmė - Visa kita

Įprasto kauliuko atvejis

Neteisingo kauliuko atvejis

p ir q nekeiskite iš patirties į patirtį, jei atlikdami eksperimentą nekeičiame kauliuko

Šaudymo strėlė į taikinį

Sėkmė - pataikyti

Nesėkmė - panele

p = 0,1 (šaulio pataikymas vienu šūviu iš 10)

p ir q nekeiskite iš patirties į patirtį, jei atlikdami eksperimentą nekeičiame rodyklės

Bernulio formulė.

Leisti vyko n p. Apsvarstykite įvykius

n Bernoulli bandymai su sėkmės tikimybep atsitiksm sėkmės),

-yra standartinis tokių įvykių tikimybių žymėjimas

<-Bernulio formulė tikimybei apskaičiuoti (4.3)

Formulės paaiškinimas : tikimybė, kad bus m sėkmės (tikimybės padauginamos, nes bandymai yra nepriklausomi, o kadangi jie visi vienodi, atsiranda laipsnis), - tikimybė, kad įvyks n-m nesėkmių (paaiškinimas panašus kaip ir sėkmės atveju), - įvykių įgyvendinimo būdų skaičius, tai yra, kiek būdų m sėkmės galima sudėti į n vietas.

Bernulio formulės pasekmės:

1 išvada:

Leisti vyko n Bernoulli bandymai su sėkmės tikimybe p. Apsvarstykite įvykius

A(m1,m2)=(sėkmių skaičiusn Bernoulli bandymai bus įtraukti į diapazoną [m1;m2])

(4.4)

Formulės paaiškinimas: Formulė (4.4) išplaukia iš (4.3) formulės ir tikimybių sudėjimo teoremos nesuderinami įvykiai, nes - nesuderinamų įvykių suma (sąjunga), o kiekvieno tikimybė nustatoma pagal (4.3) formulę.

2 pasekmė

Leisti vyko n Bernoulli bandymai su sėkmės tikimybe p. Apsvarstykite įvykį

A=( inn Bernoulli bandymai baigsis bent 1 sėkme}

(4.5)

Formulės paaiškinimas: ={ nebus sėkmės n Bernoulli bandymuose)=

(visi n bandymai bus nesėkmingi)

Problema (dėl Bernulio formulės ir jos pasekmių) 1.6-D problemos pavyzdys. h.

Teisinga moneta mesti 10 kartų. Raskite šių įvykių tikimybę:

A = (herbas nukris lygiai 5 kartus)

B = (herbas nukris ne daugiau kaip 5 kartus)

C = (herbas nukris bent kartą)

Sprendimas:

Performuluokime problemą Bernoulli testų prasme:

n = 10 bandymų skaičius

sėkmė- herbas

p=0,5 – sėkmės tikimybė

q=1-p=0,5 – gedimo tikimybė

Norėdami apskaičiuoti įvykio A tikimybę, naudojame Bernulio formulė:

Norėdami apskaičiuoti įvykio B tikimybę, naudojame pasekmė 1į Bernulio formulė:

Norėdami apskaičiuoti įvykio C tikimybę, naudojame pasekmė 2į Bernulio formulė:

Bernulli schema. Skaičiavimas apytikslėmis formulėmis.

APytikrioji MOIAVRE-LAPLACE FORMULĖ

Vietinė formulė

p sėkmės ir q nesėkmė, tada visiems m galioja apytikslė formulė:

, (4.6)

m.

Funkcijos reikšmę galima rasti specialioje stalo. Jame yra tik reikšmės . Bet funkcija lygi, t.y.

Jei , tai tarkime

integrali formulė

Jei Bernoulli schemoje bandymų skaičius n yra didelis, o tikimybės taip pat didelės p sėkmės ir q gedimas, tada apytikslė formulė galioja visiems (4.7) :

Funkcijos reikšmę galima rasti specialioje lentelėje. Jame yra tik reikšmės . Bet funkcija yra nelyginė, t.y. .

Jei , tai tarkime

APytikrioji NUODŲ FORMULĖ

Vietinė formulė

Tegul bandymų skaičius n pagal Bernoulli schemą yra didelis, o vieno bandymo sėkmės tikimybė yra maža, o produktas taip pat yra mažas. Tada jis nustatomas pagal apytikslę formulę:

, (4.8)

Tikimybė, kad sėkmingų n Bernulli bandymų skaičius yra m.

Funkcijų reikšmės galima peržiūrėti specialioje lentelėje.

integrali formulė

Tegul bandymų skaičius n pagal Bernoulli schemą yra didelis, o vieno bandymo sėkmės tikimybė yra maža, o produktas taip pat yra mažas.

Tada nustatoma pagal apytikslę formulę:

, (4.9)

Tikimybė, kad sėkmingų n Bernoulli bandymų skaičius yra intervale .

Funkcijų reikšmės galima peržiūrėti specialioje lentelėje ir tada susumuoti per diapazoną.

Formulė

Puasono formulė

Moivre-Laplace formulė

Kokybė

sąmatos

įvertinimai yra apytiksliai

10

naudojamas apytiksliam įvertinimui

skaičiavimai

naudojamas pritaikyti

inžineriniai skaičiavimai

100 0

naudojami bet kokiems inžineriniams skaičiavimams

n > 1000

labai geri pažymiai

Galite peržiūrėti 1.7 ir 1.8 D. z užduočių pavyzdžių kokybę.

Skaičiavimas pagal Puasono formulę.

Problema (Puasono formulė).

Būklė:

Vieno simbolio iškraipymo tikimybė perduodant pranešimą ryšio linija yra lygi 0.001. Pranešimas laikomas priimtu, jei joje nėra iškraipymų. Raskite tikimybę gauti pranešimą, kurį sudaro 20 žodžius po 100 kiekviena simbolių kiekvienas.

Sprendimas:

Pažymėti BET

-simbolių skaičius žinutėje

sėkmė: charakteris neiškreiptas

Sėkmės tikimybė

Paskaičiuokime. Žr. rekomendacijas, kaip naudoti apytiksles formules ( ) : skaičiavimui reikia kreiptis Puasono formulė

Puasono formulės tikimybės irm galima rasti specialioje lentelėje.

Būklė:

Telefono stotis aptarnauja 1000 abonentų. Tikimybė, kad per minutę bet kuriam abonentui prireiks ryšio, yra 0,0007. Apskaičiuokite tikimybę, kad per minutę į telefono stotį ateis bent 3 skambučiai.

Sprendimas:

Performuluokite problemą pagal Bernulio schemą

sėkmės: gautas skambutis

Sėkmės tikimybė

– diapazonas, kuriame turi būti sėkmingų rezultatų skaičius

A = (bus bent trys skambučiai) – įvykis, kurio tikimybė yra būtina. rasti užduotyje

(Sulauksime mažiau nei trys skambučiai) Mes pereiname prie papildomo. įvykis, nes jo tikimybę lengviau apskaičiuoti.

(terminų apskaičiavimą žr. specialioje lentelėje)

Šiuo būdu,

Problema (vietinė Mouvre-Laplace formulė)

Būklė

Tikimybė pataikyti į taikinį vienu šūviu lygus 0,8. Nustatykite tikimybę, kad prie 400įvyks šūviai lygiai 300 hitai.

Sprendimas:

Performuluokite problemą pagal Bernulio schemą

n=400 – bandymų skaičius

m=300 – sėkmės skaičius

sėkmė – pataikė

(Klausimas dėl Bernulio schemos)

Įvertinimas:

Mes leidžiame nepriklausomi testai, kurių kiekviename išskiriame m variantų.

p1 - ​​tikimybė gauti pirmąjį variantą per vieną bandymą

p2 – tikimybė gauti antrąjį variantą vieno bandymo metu

…………..

pm yra tikimybė gautim-tas variantas per vieną bandymą

p1,p2, ………………..,pm nesikeis nuo patirties prie patirties

Aukščiau aprašyta testų seka vadinama daugianario schema.

(kai m=2, daugianario schema virsta dvinariu), t. y. aukščiau aprašyta dvinario schema yra specialus bendresnės schemos, vadinamos daugianario, atvejis.

Apsvarstykite šiuos įvykius

А(n1,n2,….,nm)=( n aukščiau aprašytų bandymų 1 variantas pasirodė n1 kartų, 2 variantas pasirodė n2 kartus, ….. ir tt, nm kartų variantas m)

Tikimybių skaičiavimo pagal daugianario schemą formulė

Būklė

kauliukai mesti 10 kartų. Reikia rasti tikimybę, kad „6“ iškris 2 kartus, ir „5“ iškris 3 kartus.

Sprendimas:

Pažymėti BET įvykis, kurio tikimybę reikia rasti užduotyje.

n=10 – bandymų skaičius

m = 3

1 variantas – numesk 6

p1=1/6n1=2

2 variantas – nuleiskite 5

p2=1/6n2=3

3 parinktis – numeskite bet kurį veidą, išskyrus 5 ir 6

p3=4/6n3=5

P(2,3,5)-? (problemos sąlygoje nurodyto įvykio tikimybė)

Polinominės grandinės problema

Būklė

Raskite tikimybę, kad tarp 10 Atsitiktinai atrinkti žmonės pirmąjį ketvirtį švęs keturis gimtadienius, antrąjį – tris, trečiąjį – du, o ketvirtąjį – vieną.

Sprendimas:

Pažymėti BET įvykis, kurio tikimybę reikia rasti užduotyje.

Performuluokime problemą daugianario schema:

n=10 – bandymų skaičius = žmonių skaičius

m = 4 yra pasirinkimų, kuriuos išskiriame kiekviename bandyme, skaičius

1 variantas – gimdymas per 1 ketvirtį

p1=1/4n1=4

2 variantas – gimdymas II ketvirtį

p2=1/4n2=3

3 variantas – gimimas 3 ketvirtį

p3=1/4n3=2

4 variantas – gimimas IV ketvirtį

p4=1/4n4=1

P(4,3,2,1)-? (problemos sąlygoje nurodyto įvykio tikimybė)

Darome prielaidą, kad tikimybė gimti bet kuriame ketvirtyje yra tokia pati ir lygi 1/4. Atlikime skaičiavimą pagal daugianario schemos formulę:

Polinominės grandinės problema

Būklė

urnoje 30 kamuoliukai: Sveikas sugrįžęs.3 balti, 2 žalios, 4 mėlynos ir 1 geltonos.

Sprendimas:

Pažymėti BET įvykis, kurio tikimybę reikia rasti užduotyje.

Performuluokime problemą daugianario schema:

n=10 – bandymų skaičius = pasirinktų kamuoliukų skaičius

m = 4 yra pasirinkimų, kuriuos išskiriame kiekviename bandyme, skaičius

1 variantas – pasirinkite baltą rutulį

p1=1/3n1=3

2 variantas – pasirinkite žalią rutulį

p2=1/6n2=2

3 variantas – mėlyno kamuoliuko pasirinkimas

p3=4/15n3=4

4 variantas – pasirinkite geltoną rutulį

p4=7/30n4=1

P(3,2,4,1)-? (problemos sąlygoje nurodyto įvykio tikimybė)

p1,p2, p3,p4 nesikeiskite iš patirties į patirtį, nes pasirinkimas daromas su grąža

Atlikime skaičiavimą pagal daugianario schemos formulę:

Hipergeometrinė schema

Tegul yra n k tipų elementų:

n1 pirmojo tipo

n2 antrojo tipo

nk tipo k

Iš šių n elementų atsitiktinai jokios grąžos pasirinkti m elementų

Apsvarstykite įvykį A(m1,…,mk), kuris susideda iš to, kad tarp pasirinktų m elementų bus

m1 pirmojo tipo

m2 antrojo tipo

mk k-tas tipas

Šio įvykio tikimybė apskaičiuojama pagal formulę

P(A(m1,…,mk))= (4.11)

1 pavyzdys

Hipergeometrinės schemos uždavinys (1.9 uždavinio pavyzdys D. h)

Būklė

urnoje 30 kamuoliukai: 10 baltų, 5 žalių, 8 mėlynų ir 7 geltonų(kamuoliai skiriasi tik spalva). Iš urnos atsitiktine tvarka atrenkama 10 kamuoliukų. jokios grąžos. Raskite tikimybę, kad tarp pasirinktų kamuoliukų bus: 3 balti, 2 žalios, 4 mėlynos ir 1 geltonos.

Mes turimen = 30,k = 4,

n1 = 10,n2 = 5,n3 = 8,n4 = 7,

m1=3,m2=2,m3=4,m4=1

P(A(3,2,4,1))= = gali būti suskaičiuotas iki skaičiaus, žinant derinių formulę

2 pavyzdys

Skaičiavimo pagal šią schemą pavyzdys: žr. Sportloto žaidimo skaičiavimus (1 tema)


Uždaryti