Нека са известни техните вероятности и съответните условни вероятности. Тогава вероятността събитието да се случи е:

Тази формула се нарича формули за пълна вероятност. В учебниците тя е формулирана с теорема, чието доказателство е елементарно: съгл алгебра на събитията, (събитието се случи и илислучи се събитие ислед него дойде събитието илислучи се събитие ислед него дойде събитието или …. илислучи се събитие ипоследвано събитие). Тъй като хипотезите са несъвместими, а събитието е зависимо, то съгл теорема за добавяне за вероятностите от несъвместими събития (първа стъпка)и теоремата за умножение на вероятностите от зависими събития (втора стъпка):

Вероятно мнозина очакват съдържанието на първия пример =)

Където и да плюеш - навсякъде урната:

Задача 1

Има три еднакви урни. Първата урна съдържа 4 бели и 7 черни топки, втората урна съдържа само бели топки, а третата урна съдържа само черни топки. Една урна се избира произволно и от нея произволно се тегли топка. Каква е вероятността тази топка да е черна?

Решение: разгледайте събитието - черна топка ще бъде изтеглена от произволно избрана урна. Това събитие може или не може да се случи в резултат на една от следните хипотези:
– ще бъде избрана 1-ва урна;
– ще бъде избрана 2-ра урна;
– ще бъде избрана 3-та урна.

Тъй като урната е избрана на случаен принцип, изборът на която и да е от трите урни еднакво възможно, Следователно:

Имайте предвид, че горните хипотези формират пълна група от събития, тоест според условието черна топка може да се появи само от тези урни и например да не лети от билярдна маса. Нека направим проста междинна проверка:
Добре, да продължим:

Първата урна съдържа 4 бели + 7 черни = 11 топки, всяка класическа дефиниция:
е вероятността да изтеглите черна топка в състояниече ще бъде избрана 1-вата урна.

Втората урна съдържа само бели топки, така че ако е избранопоявата на черна топка става невъзможен: .

И накрая, в третата урна има само черни топки, което означава, че съответните условна вероятностизвличането на черната топка ще бъде (събитието е сигурно).



е вероятността черна топка да бъде изтеглена от произволно избрана урна.

Отговор:

Анализираният пример отново подсказва колко важно е да РАЗБЕРЕТЕ УСЛОВИЕТО. Да вземем същите проблеми с урни и топки - с външното им сходство методите за решаване могат да бъдат напълно различни: някъде се изисква да се прилагат само класическо определение на вероятността, някъде събития независима, някъде зависим, а някъде говорим за хипотези. В същото време няма ясен формален критерий за избор на път за решение - почти винаги трябва да мислите за това. Как да подобрите уменията си? Решаваме, решаваме и пак решаваме!

Задача 2

В стрелбището има 5 различни пушки. Вероятностите за попадение в целта за даден стрелец са съответно равни на 0,5; 0,55; 0,7; 0,75 и 0,4. Каква е вероятността за попадение в целта, ако стрелецът произведе един изстрел от произволно избрана пушка?

Кратко решение и отговор в края на урока.

В повечето тематични проблеми хипотезите, разбира се, не са еднакво вероятни:

Задача 3

В пирамидата има 5 пушки, три от които са оборудвани с оптичен мерник. Вероятността стрелецът да уцели целта при изстрел от пушка с телескопичен мерник е 0,95; за пушка без телескопичен мерник тази вероятност е 0,7. Намерете вероятността мишената да бъде улучена, ако стрелецът произведе един изстрел от произволна пушка.

Решение: в тази задача броят на пушките е точно същият като в предишната, но има само две хипотези:
- стрелецът ще избере пушка с оптически мерник;
- стрелецът ще избере пушка без телескопичен мерник.
от класическо определение на вероятността: .
Контрол:

Помислете за събитието: - стрелецът уцелва целта с произволно избрана пушка.
По условие:.

Според формулата за обща вероятност:

Отговор: 0,85

На практика съкратеният начин за проектиране на задача, с който също сте запознати, е напълно приемлив:

Решение: според класическата дефиниция: са вероятностите за избор на пушка съответно с и без оптичен мерник.

По условие, – вероятности за поразяване на целта със съответните видове пушки.

Според формулата за обща вероятност:
е вероятността стрелецът да уцели целта с произволно избрана пушка.

Отговор: 0,85

Следната задача за самостоятелно решение:

Задача 4

Двигателят работи в три режима: нормален, принуден и празен ход. В режим на празен ход вероятността от повреда е 0,05, в нормален режим - 0,1, а в принудителен режим - 0,7. 70% от времето двигателят работи в нормален режим и 20% във форсиран режим. Каква е вероятността от повреда на двигателя по време на работа?

За всеки случай да ви напомня - за да получите вероятностите, процентите трябва да се разделят на 100. Бъдете много внимателни! Според моите наблюдения условията на задачите за формулата за пълна вероятност често се опитват да бъдат объркани; и специално избрах такъв пример. Ще ви кажа една тайна - аз почти се обърках =)

Решение в края на урока (формулирано накратко)

Задачи за формули на Бейс

Материалът е тясно свързан със съдържанието на предходния параграф. Нека събитието се случи в резултат на изпълнението на една от хипотезите . Как да определим вероятността определена хипотеза да се осъществи?

В състояниетова събитие вече се случи, вероятности на хипотези надценениспоред формулите, получили името на английския свещеник Томас Бейс:


- вероятността хипотезата да се осъществи;
- вероятността хипотезата да се осъществи;

е вероятността хипотезата да е вярна.

На пръв поглед изглежда като пълен абсурд - защо да преизчислявате вероятностите на хипотезите, ако те вече са известни? Но всъщност има разлика:

- това е априори(приблизително предитестове) вероятности.

- това е a posteriori(приблизително следтестове) вероятностите на същите хипотези, преизчислени във връзка с "новооткрити обстоятелства" - като се вземе предвид фактът, че събитието се случи.

Нека разгледаме тази разлика с конкретен пример:

Задача 5

Складът получи 2 партиди продукти: първата - 4000 броя, втората - 6000 броя. Средният процент на нестандартните продукти в първата партида е 20%, а във втората - 10%. Взет на случаен принцип от склада, продуктът се оказа стандартен. Намерете вероятността да е: а) от първата партида, б) от втората партида.

Първа част решениясе състои в използването на формулата за пълна вероятност. С други думи, изчисленията се извършват при допускането, че тестът все още не са произведении събитие "продуктът се оказа стандартен"докато дойде.

Нека разгледаме две хипотези:
- продукт, взет на случаен принцип ще бъде от 1-ва партида;
- продукт взет на случаен принцип ще бъде от 2-ра партида.

Общо: 4000 + 6000 = 10000 артикула на склад. Според класическото определение:
.

Контрол:

Разгледайте зависимото събитие: – артикул, взет на случаен принцип от склада ще бъдестандартен.

В първата партида 100% - 20% = 80% стандартни продукти, следователно: в състояниече принадлежи на 1-ва страна.

По същия начин във втората партида 100% - 10% = 90% стандартни продукти и е вероятността произволно избран артикул в склада да бъде стандартен артикул в състояниече принадлежи на 2-та страна.

Според формулата за обща вероятност:
е вероятността продукт, избран произволно от склада, да бъде стандартен продукт.

Част две. Да предположим, че случайно взет продукт от склада се оказа стандартен. Тази фраза е директно изписана в условието и посочва факта, че събитието се случи.

Според формулите на Бейс:

а) - вероятността избраният стандартен продукт да принадлежи към 1-ва партида;

б) - вероятността избраният стандартен продукт да принадлежи към 2-ра партида.

След преоценкахипотези, разбира се, все още се формират пълна група:
(Преглед;-))

Отговор:

Иван Василиевич, който отново промени професията си и стана директор на завода, ще ни помогне да разберем смисъла на преоценката на хипотезите. Той знае, че днес 1-ви магазин е изпратил в склада 4000 артикула, а 2-ри магазин - 6000 продукта и идва да се увери в това. Да предположим, че всички продукти са от един и същи тип и са в един и същи контейнер. Естествено, Иван Василиевич предварително изчисли, че продуктът, който сега ще премахне за проверка, най-вероятно ще бъде произведен от 1-ви цех и с вероятност от втория. Но след като избраният елемент се оказва стандартен, той възкликва: „Какъв готин болт! - по-скоро е пуснат от 2-ри цех. По този начин вероятността от втората хипотеза е надценена по-добра страна, а вероятността на първата хипотеза е подценена: . И това надценяване не е неоснователно - в края на краищата вторият цех не само произвежда повече продукти, но и работи 2 пъти по-добре!

Ще кажете, чист субективизъм? Отчасти – да, освен това самият Байс интерпретира a posterioriвероятности като ниво на доверие. Не всичко обаче е толкова просто – има обективно зрънце в байесовия подход. В края на краищата, вероятността продуктът да бъде стандартен (0,8 и 0,9 съответно за 1-ви и 2-ри магазини)това е предварителен(априори) и среденоценки. Но, казано философски, всичко тече, всичко се променя, включително и вероятностите. Напълно възможно е това към момента на изследванетопо-успешен 2-ри магазин увеличи процента на стандартните продукти (и/или 1-ви магазин намален), и ако проверите повече или всички 10 хиляди артикула на склад, тогава надценените стойности ще бъдат много по-близо до истината.

Между другото, ако Иван Василиевич извлече нестандартна част, тогава обратното - той ще „подозира“ повече първия магазин и по-малко - втория. Предлагам ви да проверите сами:

Задача 6

Складът получи 2 партиди продукти: първата - 4000 броя, втората - 6000 броя. Средният процент на нестандартните продукти в първата партида е 20%, във втората - 10%. Стока взета на случаен принцип от склада се оказа нестандартен. Намерете вероятността да е: а) от първата партида, б) от втората партида.

Условието ще се отличава с две букви, които съм маркирал с удебелен шрифт. Проблемът може да бъде решен от нулата или можете да използвате резултатите от предишни изчисления. В мостра, която имам цялостно решение, но така че да няма формално припокриване със Задача No 5 събитието „Произволно взет продукт от склада ще бъде нестандартен“отбелязани с .

Бейсовата схема за преоценка на вероятностите се среща навсякъде и също така се използва активно от различни видове измамници. Помислете за едно трибуквено акционерно дружество, станало нарицателно, което привлича депозити от населението, уж ги инвестира някъде, редовно изплаща дивиденти и т.н. Какво се случва? Минава ден след ден, месец след месец и все повече и повече нови факти, предадени чрез реклама и от уста на уста, само повишават нивото на доверие във финансовата пирамида (задна байесова преоценка поради минали събития!). Тоест, в очите на вложителите има постоянно нарастване на вероятността това "това е сериозен офис"; докато вероятността от противоположната хипотеза („това са обикновени измамници“), разбира се, намалява и намалява. Останалото, мисля, е ясно. Трябва да се отбележи, че спечелената репутация дава време на организаторите да се скрият успешно от Иван Василиевич, който остана не само без партида болтове, но и без панталони.

Ще се върнем към не по-малко интересни примери малко по-късно, но засега може би най-често срещаният случай с три хипотези е следващият:

Задача 7

Електрическите лампи се произвеждат в три завода. Първият завод произвежда 30% от общия брой лампи, вторият - 55%, а третият - останалите. Продуктите на 1-ви завод съдържат 1% дефектни лампи, 2-ри - 1,5%, 3-ти - 2%. Магазинът получава продукти и от трите фабрики. Лампата, която купих беше дефектна. Каква е вероятността да е произведен от завод 2?

Обърнете внимание, че в задачи върху формули на Бейс в условието непременнонякои какво станасъбитие, в този случай покупката на лампа.

Събитията се увеличиха и решениепо-удобно е да се подреди в "бърз" стил.

Алгоритъмът е абсолютно същият: на първата стъпка намираме вероятността закупената лампа да стане ще бъдедефектен.

Използвайки първоначалните данни, превеждаме процентите във вероятности:
са вероятностите лампата да е произведена съответно от 1-ви, 2-ри и 3-ти заводи.
Контрол:

По същия начин: - вероятностите за производство на дефектна лампа за съответните фабрики.

Според формулата за обща вероятност:

- вероятността закупената лампа да бъде дефектна.

Стъпка втора. Нека закупената лампа е дефектна (събитието се случи)

Според формулата на Бейс:
- вероятността закупената дефектна лампа да е произведена от втория завод

Отговор:

Защо първоначалната вероятност на втората хипотеза се увеличи след преоценката? В крайна сметка вторият завод произвежда лампи със средно качество (първият е по-добър, третият е по-лош). Така че защо се увеличи a posterioriвероятността дефектната лампа да е от втория завод? Това вече не се дължи на "репутацията", а на размера. Тъй като завод № 2 произвежда най-голям брой лампи, те го обвиняват (поне субективно): „най-вероятно тази дефектна лампа е от там“.

Интересно е да се отбележи, че вероятностите на 1-ва и 3-та хипотеза бяха надценени в очакваните посоки и станаха равни:

Контрол: , което трябваше да бъде проверено.

Между другото, за подценени и надценени:

Задача 8

AT студентска група 3 човека са с високо ниво на подготовка, 19 човека със средно ниво и 3 човека с ниско ниво. Вероятности успешна доставкаизпит за тези ученици са съответно равни на: 0,95; 0,7 и 0,4. Известно е, че някой студент е издържал изпита. Каква е вероятността, че:

а) беше много добре подготвен;
б) беше средно подготвен;
в) беше лошо подготвен.

Извършвайте изчисления и анализирайте резултатите от преоценката на хипотезите.

Задачата е близка до реалността и е особено правдоподобна за група задочни студенти, където учителят практически не познава способностите на този или онзи ученик. В този случай резултатът може да доведе до доста неочаквани последици. (особено за изпити в 1-ви семестър). Ако зле подготвен ученик има късмета да получи билет, тогава учителят вероятно ще го сметне за добър ученик или дори за силен ученик, което ще донесе добри дивиденти в бъдеще (разбира се, трябва да „вдигнете летвата“ и да поддържате имиджа си). Ако ученик е учил, натъпкан, повторен в продължение на 7 дни и 7 нощи, но той просто е имал късмет, тогава по-нататъшните събития могат да се развият по най-лошия възможен начин - с многобройни повторения и балансиране на ръба на заминаването.

Излишно е да казвам, че репутацията е най-важният капитал, неслучайно много корпорации носят имената и фамилиите на бащите си основатели, ръководили бизнеса преди 100-200 години и станали известни с безупречната си репутация.

Да, байесовият подход до някъдесубективно, но ... така върви животът!

Нека консолидираме материала с последен индустриален пример, в който ще говоря за техническите тънкости на решението, които все още не са срещани:

Задача 9

Три цеха на завода произвеждат еднотипни части, които се сглобяват в общ контейнер за сглобяване. Известно е, че първият цех произвежда 2 пъти повече части от втория цех и 4 пъти повече от третия цех. В първия цех дефектът е 12%, във втория - 8%, в третия - 4%. За контрола се взема една част от контейнера. Каква е вероятността той да е дефектен? Каква е вероятността извлечената дефектна част да е произведена от 3-ти цех?

Таки Иван Василиевич отново е на кон =) Филмът трябва да има щастлив край =)

Решение: за разлика от задачи № 5-8, тук изрично е зададен въпрос, който се решава по формулата за пълна вероятност. Но от друга страна, условието е малко „шифровано“ и училищното умение да съставяме най-простите уравнения ще ни помогне да решим този ребус. За "x" е удобно да вземете най-малката стойност:

Нека е делът на частите, произведени от третия цех.

Според условието първият цех произвежда 4 пъти повече от третия цех, така че делът на 1-ви цех е .

Освен това първият цех произвежда 2 пъти повече продукти от втория цех, което означава, че делът на последния: .

Нека съставим и решим уравнението:

Така: - вероятностите, че извадената част от контейнера е била освободена съответно от 1-ви, 2-ри и 3-ти цех.

Контрол: . Освен това няма да е излишно да погледнете отново фразата „Известно е, че първият цех произвежда 2 пъти повече продукти от втория цех и 4 пъти повече от третия цех“и се уверете, че получените вероятности наистина отговарят на това условие.

За "X" първоначално беше възможно да вземете дела на 1-ви или дял на 2-ри магазин - вероятностите ще излязат същите. Но по един или друг начин най-трудният участък е преминат и решението е на път:

От условието намираме:
- вероятността за производство на дефектна част за съответните работилници.

Според формулата за обща вероятност:
е вероятността част, произволно извлечена от контейнера, да бъде нестандартна.

Втори въпрос: каква е вероятността извлечената дефектна част да е произведена от 3-ти цех? Този въпрос предполага, че частта вече е била премахната и е установено, че е дефектна. Ние преоценяваме хипотезата, използвайки формулата на Бейс:
е желаната вероятност. Съвсем очаквано - все пак третият цех произвежда не само най-малък дял части, но и води по качество!

В този случай трябваше опростете четириетажната част, което при задачи с формули на Бейс трябва да се прави доста често. Но за този урок някак си случайно взех примери, в които много изчисления могат да се правят без обикновени дроби.

Тъй като в условието няма точки „а“ и „бе“, по-добре е да предоставите отговора с текстови коментари:

Отговор: - вероятността частта, извадена от контейнера, да бъде дефектна; - вероятността извлечената дефектна част да бъде освободена от 3-ти цех.

Както можете да видите, проблемите с формулата за пълна вероятност и формулите на Бейс са доста прости и вероятно поради тази причина толкова често се опитват да усложнят условието, което вече споменах в началото на статията.

Допълнителни примери са във файла с готови решения за F.P.V. и формули на Бейс, освен това вероятно има хора, които желаят да се запознаят по-задълбочено с тази тема в други източници. А темата наистина е много интересна - какво струва само парадокс на Бейс, което оправдава ежедневните съвети, че ако човек е диагностициран с рядко заболяване, тогава има смисъл той да направи втори и дори два повторни независими прегледа. Изглежда, че го правят само от отчаяние ... - но не! Но да не говорим за тъжни неща.


е вероятността произволно избран студент да издържи изпита.
Нека студентът издържи изпита. Според формулите на Бейс:
а) - вероятността студентът, издържал изпита, да е бил много добре подготвен. Обективната първоначална вероятност е надценена, защото почти винаги някои "средни" имат късмет с въпросите и отговарят много силно, което създава погрешното впечатление за безупречна подготовка.
б) е вероятността студентът, издържал изпита, да е бил средно подготвен. Първоначалната вероятност се оказва леко надценена, т.к учениците със средно ниво на подготовка обикновено са мнозинство, освен това учителят ще включи тук неуспешно отговорени „отлични ученици“, а понякога и слабо представящ се ученик, който е имал голям късмет с билет.
в) - вероятността студентът, който е издържал изпита, да е бил лошо подготвен. Първоначалната вероятност беше надценена към по-лошо. Не е изненадващо.
Преглед:
Отговор : Формула на Бейс:

Вероятностите P(H i) на хипотезите H i се наричат ​​априорни вероятности - вероятностите преди експериментите.
Вероятностите P(A/H i) се наричат ​​апостериорни вероятности - вероятностите на хипотезите H i, прецизирани в резултат на експеримента.

Пример #1. Устройството може да бъде сглобено от висококачествени части и от части с обикновено качество. Около 40% от устройствата са сглобени от висококачествени части. Ако устройството е сглобено от висококачествени части, неговата надеждност (вероятност за безотказна работа) за време t е 0,95; ако е от части с обикновено качество - неговата надеждност е 0,7. Уредът е тестван за време t и работи безупречно. Намерете вероятността той да е сглобен от висококачествени части.
Решение.Възможни са две хипотези: H 1 - устройството е сглобено от висококачествени части; H 2 - устройството е сглобено от части с обикновено качество. Вероятностите на тези хипотези преди експеримента: P(H 1) = 0.4, P(H 2) = 0.6. В резултат на експеримента се наблюдава събитие А - устройството работи безотказно за време t. Условните вероятности за това събитие при хипотези H 1 и H 2 са: P(A|H 1) = 0.95; P(A|H2) = 0,7. Използвайки формула (12), намираме вероятността на хипотезата H 1 след експеримента:

Пример #2. Двама стрелци независимо стрелят по една и съща мишена, като всеки стреля по един изстрел. Вероятността за попадение в целта за първия стрелец е 0,8, за втория 0,4. След стрелбата е открита една дупка в мишената. Ако приемем, че двама стрелци не могат да ударят една и съща точка, намерете вероятността първият стрелец да уцели целта.
Решение.Нека събитие А е една дупка, открита в мишената след стрелба. Преди началото на снимките са възможни хипотези:
H 1 - нито първият, нито вторият стрелец ще уцелят, вероятността на тази хипотеза: P(H 1) = 0,2 0,6 = 0,12.
H 2 - и двамата стрелци ще уцелят, P(H 2) = 0,8 0,4 = 0,32.
H 3 - първият стрелец ще уцели, а вторият няма да уцели, P(H 3) = 0.8 0.6 = 0.48.
H 4 - първият стрелец няма да уцели, но вторият ще уцели, P (H 4) = 0,2 0,4 = 0,08.
Условните вероятности за събитие А при тези хипотези са:

След опита хипотезите H 1 и H 2 стават невъзможни, а вероятностите на хипотезите H 3 и H 4
ще бъде равно:


Така че, най-вероятно е целта да бъде улучена от първия стрелец.

Пример #3. В монтажния цех към устройството е свързан електрически мотор. Електрическите двигатели се доставят от три производителя. В склада има съответно 19,6 и 11 електродвигателя от посочените заводи, които могат да работят безотказно до края на гаранционния срок съответно с вероятности 0,85, 0,76 и 0,71. Работникът произволно взема един двигател и го монтира към устройството. Намерете вероятността електродвигателят, монтиран и работещ безотказно до края на гаранционния период, да е доставен съответно от първия, втория или третия производител.
Решение.Първият тест е изборът на електродвигателя, вторият е работата на електродвигателя в гаранционния период. Помислете за следните събития:
А - електродвигателят работи безупречно до края на гаранционния срок;
H 1 - монтьорът ще вземе двигателя от продуктите на първия завод;
H 2 - монтьорът ще вземе двигателя от продуктите на втория завод;
H 3 - монтьорът ще вземе двигателя от продуктите на третия завод.
Вероятността за събитие А се изчислява по формулата за обща вероятност:

Условните вероятности са посочени в изложението на проблема:

Нека намерим вероятностите


Използвайки формулите на Bayes (12), изчисляваме условните вероятности на хипотезите H i:

Пример #4. Вероятностите, че по време на работа на системата, която се състои от три елемента, елементите с номера 1, 2 и 3 ще се повредят, се отнасят като 3: 2: 5. Вероятностите за откриване на повреди на тези елементи са съответно 0,95; 0,9 и 0,6.

б) При условията на тази задача е открита повреда по време на работа на системата. Кой елемент е най-вероятно да се провали?

Решение.
Нека A е събитие на неуспех. Нека въведем система от хипотези H1 - отказ на първия елемент, H2 - отказ на втория елемент, H3 - отказ на третия елемент.
Намираме вероятностите на хипотезите:
P(H1) = 3/(3+2+5) = 0,3
P(H2) = 2/(3+2+5) = 0,2
P(H3) = 5/(3+2+5) = 0,5

Според условието на задачата условните вероятности за събитие А са:
P(A|H1) = 0,95, P(A|H2) = 0,9, P(A|H3) = 0,6

а) Намерете вероятността за откриване на повреда в системата.
P(A) = P(H1)*P(A|H1) + P(H2)*P(A|H2) + P(H3)*P(A|H3) = 0,3*0,95 + 0,2*0,9 + 0,5 *0,6 = 0,765

б) При условията на тази задача е открита повреда по време на работа на системата. Кой елемент е най-вероятно да се провали?
P1 = P(H1)*P(A|H1)/ P(A) = 0,3*0,95 / 0,765 = 0,373
P2 = P(H2)*P(A|H2)/ P(A) = 0,2*0,9 / 0,765 = 0,235
P3 = P(H3)*P(A|H3)/ P(A) = 0,5*0,6 / 0,765 = 0,392

Максималната вероятност на третия елемент.

Кой е Байс? И какво общо има с управлението? – може да последва съвсем справедлив въпрос. Засега повярвайте на думата ми: това е много важно!.. и интересно (поне за мен).

В каква парадигма работят повечето мениджъри: ако наблюдавам нещо, какви заключения мога да направя от него? Какво учи Байс: какво всъщност трябва да бъде, за да мога да наблюдавам това нещо? Така се развиват всички науки и той пише за това (цитирам по памет): човек, който няма теория в главата си, ще се отклонява от една идея към друга под влияние на различни събития (наблюдения). Не напразно казват: няма нищо по-практично от добрата теория.

Пример от практиката. Моят подчинен прави грешка, а моят колега (ръководител на друг отдел) казва, че ще е необходимо да се упражни управленско влияние върху небрежния служител (с други думи, да се накаже / скара). И знам, че този служител прави 4-5 хиляди еднотипни операции на месец и през това време прави не повече от 10 грешки. Усещате ли разликата в парадигмата? Моят колега реагира на наблюдение, а аз предварително знам, че един служител прави определен брой грешки, така че друг не е повлиял на това знание ... Сега, ако в края на месеца се окаже, че има, за например, 15 такива грешки! .. Това вече ще стане причина за разследване на причините за неспазване на стандартите.

Убедени ли сте във важността на байесовия подход? Заинтригуван? Надявам се". И сега муха в мехлема. За съжаление, идеите на Бейс рядко се дават на първо място. Откровено нямах късмет, тъй като се запознах с тези идеи чрез популярна литература, след прочитането на която останаха много въпроси. Когато планирах да напиша бележка, събрах всичко, което преди това бях очертал според Байс, а също така проучих какво пишат в Интернет. Представям ви най-доброто си предположение по темата. Въведение в байесовата вероятност.

Извеждане на теоремата на Бейс

Помислете за следния експеримент: назоваваме всяко число, лежащо на сегмента, и фиксираме, когато това число е например между 0,1 и 0,4 (фиг. 1а). Вероятността за това събитие е равна на съотношението на дължината на сегмента към общата дължина на сегмента, при условие че появата на числа на сегмента равновероятно. Математически това може да се напише стр(0,1 <= х <= 0,4) = 0,3, или кратко Р(х) = 0,3, където Р- вероятност, хе случайна променлива в диапазона, хе случайна променлива в диапазона. Това означава, че вероятността да уцелите сегмента е 30%.

Ориз. 1. Графична интерпретация на вероятностите

Сега разгледайте квадрата x (фиг. 1b). Да кажем, че трябва да назовем двойки числа ( х, г), всяко от които е по-голямо от нула и по-малко от едно. Вероятността, че х(първото число) ще бъде в рамките на сегмента (синя зона 1), равна на съотношението на площта на синята зона към площта на целия квадрат, т.е. (0,4 - 0,1 ) * (1 - 0) / (1 * 1) = 0, 3, тоест същите 30%. Вероятността, че ге вътре в сегмента (зелена зона 2) е равно на съотношението на площта на зелената зона към площта на целия квадрат стр(0,5 <= y <= 0,7) = 0,2, или кратко Р(Y) = 0,2.

Какво може да се научи за стойностите едновременно хи г. Например, каква е вероятността и двете хи гса в съответните дадени сегменти? За да направите това, трябва да изчислите съотношението на площта на домейн 3 (пресечната точка на зелените и сините ивици) към площта на целия квадрат: стр(х, Y) = (0,4 – 0,1) * (0,7 – 0,5) / (1 * 1) = 0,06.

Сега да предположим, че искаме да знаем каква е вероятността, че ге в интервала ако хвече е в диапазона. Тоест всъщност имаме филтър и когато извикваме двойки ( х, г), тогава незабавно отхвърляме онези двойки, които не отговарят на условието за намиране хв даден интервал, а след това от филтрираните двойки броим тези, за които гудовлетворява нашето условие и разглеждаме вероятността като съотношението на броя двойки, за които глежи в горния сегмент към общия брой филтрирани двойки (тоест, за които хлежи в сегмента). Можем да запишем тази вероятност като стр(Y|х при худар в диапазона." Очевидно тази вероятност е равна на съотношението на площта на зона 3 към площта на синята зона 1. Площта на зона 3 е (0,4 - 0,1) * (0,7 - 0,5) = 0,06, и площта на синята зона 1 (0,4 - 0,1) * (1 - 0) = 0,3, тогава съотношението им е 0,06 / 0,3 = 0,2. С други думи, вероятността за намиране гна сегмента, при условие че хпринадлежи към сегмента стр(Y|х) = 0,2.

В предишния параграф всъщност формулирахме идентичността: стр(Y|х) = стр(х, Y) /p( х). Той гласи: „вероятност от удар прив диапазона, при условие че хпопадение в диапазона е равно на съотношението на вероятността за едновременно попадение хв обхват и прив диапазона, до вероятността за попадение хв диапазона."

По аналогия разгледайте вероятността стр(х|Y). Обаждаме се на двойки х, г) и филтрирайте тези, за които глежи между 0,5 и 0,7, тогава вероятността, че хе в сегмента при условие, че гпринадлежи на сегмента е равно на съотношението на площта на зона 3 към площта на зелената зона 2: стр(х|Y) = стр(х, Y) / стр(Y).

Обърнете внимание, че вероятностите стр(х, Y) и стр(Y, X) са равни и двете са равни на съотношението на площта на зона 3 към площта на целия квадрат, но вероятностите стр(Y|х) и стр(х|Y) не е равно; докато вероятността стр(Y|х) е равно на съотношението на площта на зона 3 към площ 1 и стр(х|Y) – домейн 3 към домейн 2. Обърнете внимание и на това стр(х, Y) често се означава като стр(х&Y).

Така че имаме две дефиниции: стр(Y|х) = стр(х, Y) /p( х) и стр(х|Y) = стр(х, Y) / стр(Y)

Нека пренапишем тези равенства като: стр(х, Y) = стр(Y|х)*p( х) и стр(х, Y) = стр(х|Y) * стр(Y)

Тъй като левите страни са равни, десните също са: стр(Y|х)*p( х) = стр(х|Y) * стр(Y)

Или можем да пренапишем последното равенство като:

Това е теоремата на Бейс!

Възможно ли е такива прости (почти тавтологични) трансформации да пораждат велика теорема!? Не бързайте със заключенията. Нека да поговорим отново за това, което имаме. Имаше някаква първоначална (априорна) вероятност Р(X), че случайната променлива хравномерно разпределен върху сегмента, попада в диапазона х. Някакво събитие се е случило Y, в резултат на което получихме апостериорната вероятност на същата случайна променлива х: Р(X|Y) и тази вероятност се различава от Р(X) чрез коефициента . Събитие Yнаречени доказателства, повече или по-малко потвърждаващи или опровергаващи х. Този коефициент понякога се нарича доказателствена сила. Колкото по-силни са доказателствата, толкова повече фактът на наблюдението Y променя предишната вероятност, толкова повече последващата вероятност се различава от предишната. Ако доказателствата са слаби, задната е почти равна на предишната.

Формула на Бейс за дискретни случайни променливи

В предишния раздел изведехме формулата на Байс за непрекъснати случайни променливи x и y, дефинирани на интервала. Помислете за пример с дискретни случайни променливи, всяка от които приема две възможни стойности. В хода на рутинни медицински прегледи е установено, че на четиридесетгодишна възраст 1% от жените страдат от рак на гърдата. 80% от жените с рак получават положителен резултат от мамография. 9,6% от здравите жени също получават положителни резултати от мамография. При прегледа жена от тази възрастова група е получила положителен мамографски резултат. Каква е вероятността тя наистина да има рак на гърдата?

Ходът на разсъжденията/изчисленията е следният. От 1% пациенти с рак, мамографията ще даде 80% положителни резултати = 1% * 80% = 0,8%. От 99% от здравите жени мамографията ще даде 9,6% положителни резултати = 99% * 9,6% = 9,504%. Общо от 10,304% (9,504% + 0,8%) с положителен мамографски резултат само 0,8% са болни, а останалите 9,504% са здрави. По този начин вероятността жена с положителна мамография да има рак е 0,8% / 10,304% = 7,764%. Мислите ли, че 80% или нещо такова?

В нашия пример формулата на Bayes приема следната форма:

Нека отново да поговорим за "физическото" значение на тази формула. хе случайна променлива (диагноза), която приема следните стойности: X 1- болен и X 2- здрави; Y– случайна величина (резултат от измерване – мамография), която приема стойностите: Y 1- положителен резултат и Y2- отрицателен резултат; p(X 1)- вероятността от заболяване преди мамография (априорна вероятност), равна на 1%; R(Y 1 |х 1 ) – вероятността за положителен резултат, ако пациентът е болен (условна вероятност, тъй като трябва да бъде посочена в условията на задачата), равна на 80%; R(Y 1 |х 2 ) – вероятността за положителен резултат, ако пациентът е здрав (също условна вероятност), равна на 9,6%; p(X 2)- вероятността пациентът да е здрав преди мамография (априорна вероятност), равна на 99%; p(X 1|Y 1 ) – вероятността пациентът да е болен при положителен резултат от мамография (постериорна вероятност).

Може да се види, че постериорната вероятност (това, което търсим) е пропорционална на предходната вероятност (първоначална) с малко по-сложен коефициент . Пак ще подчертая. Според мен това е фундаментален аспект на байесовия подход. Измерение ( Y) добави известно количество информация към първоначално наличната (априори), което изясни нашите знания за обекта.

Примери

За да консолидирате преминатия материал, опитайте се да разрешите няколко задачи.

Пример 1Има 3 урни; в първите 3 бели топки и 1 черна; във втория - 2 бели топки и 3 черни; в третата - 3 бели топки. Някой произволно се приближава до една от урните и изтегля 1 топка от нея. Тази топка е бяла. Намерете задните вероятности, че топката е изтеглена от 1-ва, 2-ра, 3-та урна.

Решение. Имаме три хипотези: H 1 = (избрана първа урна), H 2 = (избрана втора урна), H 3 = (избрана трета урна). Тъй като урната е избрана произволно, априорните вероятности на хипотезите са: Р(Н 1) = Р(Н 2) = Р(Н 3) = 1/3.

В резултат на експеримента се появи събитието A = (от избраната урна беше извадена бяла топка). Условни вероятности за събитие A при хипотези H 1, H 2, H 3: P(A|H 1) = 3/4, P(A|H 2) = 2/5, P(A|H 3) = 1. Например, първото равенство гласи така: „вероятността да се изтегли бяла топка, ако бъде избрана първата урна, е 3/4 (тъй като в първата урна има 4 топки и 3 от тях са бели)“.

Прилагайки формулата на Бейс, намираме задните вероятности на хипотезите:

Така, в светлината на информацията за настъпването на събитие А, вероятностите на хипотезите се промениха: най-вероятната стана хипотезата H 3 , най-малко вероятната - хипотезата H 2 .

Пример 2Двама стрелци независимо стрелят по една и съща мишена, като всеки стреля по един изстрел. Вероятността за попадение в целта за първия стрелец е 0,8, за втория - 0,4. След стрелбата е открита една дупка в мишената. Намерете вероятността тази дупка да принадлежи на първия стрелец (отхвърляме резултата (и двете дупки съвпадат) като пренебрежимо малко вероятен).

Решение. Преди експеримента са възможни следните хипотези: H 1 = (нито първата, нито втората стрела ще уцели), H 2 = (и двете стрели ще уцелят), H 3 - (първият стрелец ще уцели, а вторият няма ), H 4 = (първият стрелец няма да уцели, а вторият ще уцели). Предишни вероятности на хипотези:

P (H 1) \u003d 0,2 * 0,6 \u003d 0,12; P (H 2) \u003d 0,8 * 0,4 \u003d 0,32; P (H 3) \u003d 0,8 * 0,6 \u003d 0,48; P (H 4) \u003d 0,2 * 0,4 \u003d 0,08.

Условните вероятности на наблюдаваното събитие A = (има една дупка в целта) при тези хипотези са: P(A|H 1) = P(A|H 2) = 0; P(A|H 3) = P(A|H 4) = 1

След опита хипотезите H 1 и H 2 стават невъзможни и задните вероятности на хипотезите H 3 и H 4 според формулата на Байс ще бъдат:

Bayes срещу спам

Формулата на Bayes намери широко приложение при разработването на спам филтри. Да приемем, че искате да обучите компютър да определя кои имейли са спам. Ще започнем от речника и словосъчетанията, използвайки байесови оценки. Нека първо създадем пространство от хипотези. Нека имаме 2 хипотези по отношение на всяко писмо: H A е спам, H B не е спам, а нормално, необходимо писмо.

Първо, нека "обучим" нашата бъдеща антиспам система. Нека вземем всички букви, които имаме, и ги разделим на две "купчини" по 10 букви. В едната поставяме спам писма и я наричаме H A heap, в другата поставяме необходимата кореспонденция и я наричаме H B heap. Сега нека да видим: какви думи и фрази се намират в спама и необходимите имейли и с каква честота? Тези думи и фрази ще бъдат наречени доказателства и ще бъдат обозначени с E 1 , E 2 ... Оказва се, че често използваните думи (например думите „като“, „ваш“) в купчините H A и H B се срещат приблизително с същата честота. По този начин присъствието на тези думи в писмо не ни казва нищо за това към коя купчина принадлежи (слабо доказателство). Нека присвоим на тези думи неутрална стойност на оценката на вероятността за "спам", да речем, 0,5.

Нека фразата "разговорен английски" се появява само в 10 букви и по-често в спам имейли (например в 7 спам имейла от всичките 10), отколкото в правилните (в 3 от 10). Нека дадем на тази фраза по-висок резултат от 7/10 за спам и по-нисък резултат за нормални имейли: 3/10. Обратно, оказа се, че думата "приятел" е по-често срещана в нормалните букви (6 от 10). И така получихме кратко писмо: „Приятелю! Как говориш английски?. Нека се опитаме да оценим неговата "спам". Ще поставим общите оценки P(H A), P(H B) за принадлежност към всяка купчина, като използваме донякъде опростена формула на Бейс и нашите приблизителни оценки:

P(H A) = A/(A+B), където A \u003d p a1 * p a2 * ... * тиган, B = p b1 * p b2 * ... * p b n \u003d (1 - p a1) * (1 - p a2) * ... * ( 1 - p an).

Таблица 1. Опростена (и непълна) байесова оценка на писането

Така нашето хипотетично писмо получи оценка на вероятността за принадлежност с акцент в посока „спам“. Можем ли да решим да хвърлим писмото в една от купчините? Нека зададем праговете за вземане на решения:

  • Ще приемем, че буквата принадлежи на купчината H i, ако P(H i) ≥ T.
  • Буквата не принадлежи на купчината, ако P(H i) ≤ L.
  • Ако L ≤ P(H i) ≤ T, тогава не може да се вземе решение.

Можете да вземете T = 0,95 и L = 0,05. Тъй като за въпросното писмо и 0.05< P(H A) < 0,95, и 0,05 < P(H В) < 0,95, то мы не сможем принять решение, куда отнести данное письмо: к спаму (H A) или к нужным письмам (H B). Можно ли улучшить оценку, используя больше информации?

да Нека изчислим резултата за всяко доказателство по различен начин, точно както предложи Байс. Позволявам:

F a е общият брой спам имейли;

F ai е броят на буквите със сертификат азв купчина спам;

F b е общият брой необходими букви;

F bi е броят на буквите със сертификат азв купчина необходими (релевантни) писма.

Тогава: p ai = F ai /F a , p bi = F bi /F b . P(H A) = A/(A+B), P(H B) = B/(A+B), къдетоА = p a1 *p a2 *…*p an , B = p b1 *p b2 *…*p b n

Моля, имайте предвид, че оценките на доказателствените думи p ai и p bi са станали обективни и могат да бъдат изчислени без човешка намеса.

Таблица 2. По-точна (но непълна) байесова оценка за налични функции от писмо

Получихме доста определен резултат - с голяма вероятност буквата може да бъде приписана на необходимите букви, тъй като P(H B) = 0,997 > T = 0,95. Защо се промени резултатът? Тъй като използвахме повече информация - взехме предвид броя на буквите във всяка от купчините и, между другото, определихме оценките p ai и p bi много по-правилно. Те бяха определени по същия начин, както самият Байс, чрез изчисляване на условните вероятности. С други думи, p a3 е вероятността думата "приятел" да се появи в имейла, като се има предвид, че имейлът вече принадлежи към купчината спам H A . Резултатът не закъсня - изглежда, че можем да вземем решение с по-голяма сигурност.

Bayes срещу корпоративна измама

Интересно приложение на байесовия подход е описано от MAGNUS8.

Настоящият ми проект (IS за откриване на измама в производствено предприятие) използва формулата на Bayes за определяне на вероятността от измама (измама) при наличие/отсъствие на няколко факта косвено в полза на хипотезата за възможността за измама. Алгоритъмът е самообучаващ се (с обратна връзка), т.е. преизчислява своите коефициенти (условни вероятности) при действително потвърждаване или непотвърждаване на измамата по време на проверката от службата за икономическа сигурност.

Вероятно си струва да се каже, че такива методи при проектирането на алгоритми изискват доста висока математическа култура на разработчика, т.к. най-малката грешка в извеждането и/или прилагането на изчислителните формули ще анулира и дискредитира целия метод. Вероятностните методи са особено виновни за това, тъй като човешкото мислене не е адаптирано да работи с вероятностни категории и съответно няма „видимост“ и разбиране на „физическото значение“ на междинните и крайните вероятностни параметри. Такова разбиране съществува само за основните понятия на теорията на вероятностите и тогава просто трябва много внимателно да комбинирате и извеждате сложни неща според законите на теорията на вероятностите - здравият разум вече няма да помогне за съставните обекти. Това, по-специално, е свързано с доста сериозни методологически битки, които се провеждат на страниците на съвременни книги по философия на вероятността, както и с голям брой софизми, парадокси и любопитни факти по тази тема.

Друг нюанс, с който трябваше да се сблъскам, е, че за съжаление почти всичко повече или по-малко ПОЛЕЗНО НА ПРАКТИКАТА по тази тема е написано на английски. В източниците на руски език има основно само добре известна теория с демонстрационни примери само за най-примитивните случаи.

Напълно съм съгласна с последния коментар. Например Google, когато се опита да намери нещо като книга „Байесова вероятност“, не даде нищо разбираемо. Вярно, той каза, че книга с байесова статистика е забранена в Китай. (Професорът по статистика Андрю Гелман съобщи в блог на Колумбийския университет, че книгата му „Анализ на данни с регресия и многостепенни/йерархични модели“ е забранена за публикуване в Китай. текст.“) Чудя се дали подобна причина е довела до липсата на книги за Байес вероятност в Русия?

Консерватизъм в процеса на обработка на информация от човека

Вероятностите определят степента на несигурност. Вероятността, както според Байс, така и според нашата интуиция, е просто число между нула и това, което представлява степента, в която донякъде идеализиран човек вярва, че твърдението е вярно. Причината, поради която човек е донякъде идеализиран, е, че сумата от неговите вероятности за две взаимно изключващи се събития трябва да е равна на вероятността за настъпване на някое от тези събития. Свойството адитивност има такива последици, че малко реални хора могат да ги съпоставят.

Теоремата на Бейс е тривиално следствие от свойството адитивност, неоспоримо и съгласувано от всички вероятностни, байесови и други. Един от начините да го напишете е следният. Ако P(H A |D) е последващата вероятност, че хипотеза A е била след като дадената стойност D е била наблюдавана, P(H A) е нейната предишна вероятност преди дадената стойност D да е била наблюдавана, P(D|H A ) е вероятността, че a ще се наблюдава дадена стойност D, ако H A е вярно и P(D) е безусловната вероятност за дадена стойност D, тогава

(1) P(H A |D) = P(D|H A) * P(H A) / P(D)

P(D) е най-добре да се разглежда като нормализираща константа, която кара последващите вероятности да се добавят до единица над изчерпателния набор от взаимно изключващи се хипотези, които се разглеждат. Ако трябва да се изчисли, може да бъде така:

Но по-често P(D) се елиминира, вместо да се брои. Удобен начин да се елиминира е да се трансформира теоремата на Байс във формата на връзка вероятност-коефициенти.

Помислете за друга хипотеза, H B , взаимно изключваща се за H A, и променете мнението си за нея въз основа на същото дадено количество, което е променило мнението ви за H A. Теоремата на Байс казва, че

(2) P(H B |D) = P(D|H B) * P(H B) / P(D)

Сега разделяме Уравнение 1 на Уравнение 2; резултатът ще бъде така:

където Ω 1 са последващите шансове в полза на H A по отношение на H B , Ω 0 са предходните шансове и L е число, познато на статистиците като съотношение на вероятностите. Уравнение 3 е същата подходяща версия на теоремата на Байс като уравнение 1 и често е много по-полезно, особено за експерименти, включващи хипотези. Поддръжниците на Bayesian твърдят, че теоремата на Bayes е формално оптимално правило за това как да се преразгледат мненията в светлината на нови данни.

Интересуваме се да сравним идеалното поведение, дефинирано от теоремата на Байс, с действителното поведение на хората. За да ви дадем известна представа какво означава това, нека опитаме експеримент с вас като обект. Тази чанта съдържа 1000 покер чипа. Имам две от тези чанти, едната със 700 червени и 300 сини чипа, а другата с 300 червени и 700 сини. Хвърлих монета, за да определя коя да използвам. Така, ако мненията ни са еднакви, текущата ви вероятност да изтеглите торба с повече червени чипове е 0,5. Сега взимате проба на случаен принцип, връщайки се след всеки жетон. В 12 чипа получавате 8 червени и 4 сини. Сега, въз основа на всичко, което знаете, каква е вероятността една чанта да е с повече червени? Ясно е, че е по-висока от 0,5. Моля, не продължавайте да четете, докато не запишете оценката си.

Ако изглеждате като типичен предмет, резултатът ви пада между 0,7 и 0,8. Ако обаче направим съответното изчисление, отговорът ще бъде 0,97. Наистина, много рядко се случва човек, на когото преди това не е било показано влиянието на консерватизма, да излезе с толкова висока оценка, дори ако е бил запознат с теоремата на Бейс.

Ако делът на червените чипове в торбата е Р, тогава вероятността да се получи rчервени чипове и ( н-r) синьо в нмостри с връщане - p r (1–п)н-r. По този начин, в типичен експеримент с чанта и покер чип, ако зАозначава, че делът на червените чипове е r Aи збозначава, че делът е Рб, тогава съотношението на вероятността:

Когато се прилага формулата на Бейс, трябва да се вземе предвид само вероятността от действителното наблюдение, а не вероятностите от други наблюдения, които той може да е направил, но не е направил. Този принцип има широко значение за всички статистически и нестатистически приложения на теоремата на Байс; това е най-важният технически инструмент на байесовото мислене.

Байесовска революция

Вашите приятели и колеги говорят за нещо, наречено "теорема на Байс" или "правило на Байес", или нещо, наречено мислене на Байес. Те наистина се интересуват от това, така че влизате онлайн и намирате страница за теоремата на Байс и... Това е уравнение. И това е всичко... Защо една математическа концепция поражда такъв ентусиазъм в умовете? Какъв вид „Байесова революция“ се случва сред учените и се твърди, че дори самият експериментален подход може да се опише като неин специален случай? Каква е тайната, която знаят последователите на Байс? Каква светлина виждат?

Байесовската революция в науката не се случи, защото все повече и повече когнитивни учени внезапно започнаха да забелязват, че менталните феномени имат байесова структура; не защото учени във всяка област са започнали да използват метода на Байес; а защото самата наука е частен случай на теоремата на Бейс; експерименталните доказателства са байесови доказателства. Байесовите революционери твърдят, че когато направите експеримент и получите доказателства, които „подкрепят“ или „опровергават“ вашата теория, това потвърждение или опровержение се случва според правилата на Байес. Например, трябва да вземете под внимание не само, че вашата теория може да обясни явлението, но и че има други възможни обяснения, които също могат да предскажат това явление.

Преди това най-популярната философия на науката беше старата философия, която беше изместена от Байевата революция. Идеята на Карл Попър, че теориите могат да бъдат напълно фалшифицирани, но никога напълно потвърдени, е друг специален случай на правилата на Байес; ако p(X|A) ≈ 1 - ако теорията прави правилни прогнози, тогава наблюдението ~X много силно фалшифицира A. От друга страна, ако p(X|A) ≈ 1 и наблюдаваме X, това не подкрепя теорията много; е възможно друго условие B, такова, че p(X|B) ≈ 1, и при което наблюдението на X не е доказателство за A, а е доказателство за B. За да наблюдаваме, че X определено потвърждава A, ние не трябва да знаем, че p( X|A) ≈ 1 и че p(X|~A) ≈ 0, което не можем да знаем, защото не можем да разгледаме всички възможни алтернативни обяснения. Например, когато теорията на Айнщайн за общата теория на относителността надмина теорията на Нютон за гравитацията, която може да бъде много проверена, това направи всички предсказания на теорията на Нютон специален случай на тази на Айнщайн.

По същия начин твърдението на Попър, че една идея трябва да бъде фалшифицируема, може да се тълкува като проява на правилото на Байес за запазване на вероятността; ако резултатът X е положително доказателство за теорията, тогава резултатът ~X трябва да фалшифицира теорията до известна степен. Ако се опитвате да тълкувате както X, така и ~X като „поддържащи“ теория, правилата на Bayes казват, че това е невъзможно! За да увеличите вероятността от теория, трябва да я подложите на тестове, които потенциално могат да намалят нейната вероятност; това не е просто правило за откриване на шарлатани в науката, а следствие от теоремата на Байесовата вероятност. От друга страна, идеята на Попър, че е необходима само фалшификация и не е необходимо потвърждение, е погрешна. Теоремата на Байс показва, че фалшификацията е много силно доказателство в сравнение с потвърждението, но фалшификацията все още е вероятностна по природа; не се управлява от принципно различни правила и не се различава по това от потвърждението, както твърди Попър.

Така откриваме, че много явления в когнитивните науки, плюс статистическите методи, използвани от учените, плюс самия научен метод, всички са специални случаи на теоремата на Байс. Ето какво представлява Байевата революция.

Добре дошли в Байевата конспирация!

Литература за байесовската вероятност

2. Нобеловият лауреат по икономика Kahneman (et al.) описва много различни приложения на Bayes в една чудесна книга. Само в моето резюме на тази много голяма книга преброих 27 препратки към името на презвитериански свещеник. Минимални формули. (.. Много ми хареса. Вярно, че е сложно, много математика (и къде без нея), но отделни глави (например Глава 4. Информация), ясно по темата. Съветвам всички. Дори ако математиката е трудно за вас, прочетете реда, като прескочите математиката и ловете полезни зърна ...

14. (допълнение от 15.01.2017г), глава от книгата на Тони Крили. 50 идеи, за които трябва да знаете. Математика.

Физикът Ричард Файнман, нобелов лауреат, говорейки за един философ с особено високо самонадеяност, веднъж каза: „Изобщо не ме дразни философията като наука, а помпозността, която се създаде около нея. Ако само философите можеха да се смеят на себе си! Само ако можеха да кажат: „Аз казвам, че е така, но Фон Лайпциг смяташе, че е различно, и той също знае нещо за това.“ Само да се сетят да пояснят, че е само техен .

Може никога да не сте чували за теоремата на Байс, но сте я използвали през цялото време. Например, първоначално оценихте вероятността да получите увеличение на заплатата като 50%. След като получихте положителна обратна връзка от мениджъра, коригирахте оценката си към по-добро и, обратно, намалихте я, ако счупите кафеварката по време на работа. Ето как стойността на вероятността се прецизира при натрупване на информация.

Основната идея на теоремата на Байсе да се получи по-голяма точност на оценката на вероятността на събитието, като се вземат предвид допълнителни данни.

Принципът е прост: има първоначална основна оценка на вероятността, която се усъвършенства с повече информация.

Формула на Бейс

Интуитивните действия са формализирани в просто, но мощно уравнение ( Вероятностна формула на Бейс):

Лявата страна на уравнението е апостериорна оценка на вероятността за събитие А при условие за настъпване на събитие Б (така наречената условна вероятност).

  • P(A)- вероятност за събитие А (базова, априорна оценка);
  • P(B|A) —вероятността (също условна), която получаваме от нашите данни;
  • а P(B)е нормализационна константа, която ограничава вероятността до 1.

Това кратко уравнение е основата Байесов метод.

Абстрактният характер на събития А и Б не ни позволява ясно да разберем значението на тази формула. За да разберем същността на теоремата на Бейс, нека разгледаме един реален проблем.

Пример

Една от темите, по които работя, е изучаването на моделите на съня. Имам два месеца данни, записани с моя часовник Garmin Vivosmart, показващи кога заспивам и се събуждам. Показване на окончателния модел най-вероятноРазпределението на вероятността за сън като функция на времето (MCMC е приблизителен метод) е дадено по-долу.

Графиката показва вероятността да спя в зависимост само от времето. Как ще се промени, ако вземете предвид времето, през което свети светлината в спалнята? За да се прецизира оценката, е необходима теоремата на Бейс. Уточнената оценка се основава на априорната и има формата:

Изразът вляво е вероятността да спя, като се има предвид, че светлината в спалнята ми свети. Предварителната оценка в даден момент от време (показана на графиката по-горе) се означава като P (сън). Например в 22:00 ч. предварителната вероятност да спя е 27,34%.

Добавете повече информация, като използвате вероятността P(светлина в спалнята|сън)получени от наблюдаваните данни.

От собствените си наблюдения знам следното: вероятността да спя, когато лампата свети е 1%.

Вероятността светлината да е изключена по време на сън е 1-0,01 = 0,99 (знакът „-“ във формулата означава обратното събитие), тъй като сумата от вероятностите за противоположните събития е 1. Когато спя, светлината в спалнята е активирана или деактивирана.

И накрая, уравнението включва и нормализационната константа P (светлина)вероятността светлината да свети. Лампата свети и когато спя, и когато съм буден. Следователно, знаейки априорната вероятност за сън, ние изчисляваме нормализационната константа, както следва:

Вероятността светлината да свети се взема предвид и в двата варианта: или спя, или не ( P (-сън) = 1 — P (сън)е вероятността да съм буден.)

Вероятността светлината да свети, когато съм буден е P(лек|-сън),и се определя чрез наблюдение. Знам, че има 80% шанс светлината да свети, когато съм буден (което означава, че има 20% вероятност светлината да не свети, ако съм буден).

Крайното уравнение на Бейс става:

Позволява ви да изчислите вероятността да спя, като се има предвид, че светлината е включена. Ако се интересуваме от вероятността светлината да е изключена, имаме нужда от всяка конструкция P(светлина|…заменен от P(-светлина|….

Нека да видим как получените символни уравнения се използват на практика.

Нека приложим формулата към времето 22:30 и вземем предвид, че светлината свети. Знаем, че има 73,90% вероятност да съм заспал. Това число е отправната точка за нашата оценка.

Нека го прецизираме, като вземем предвид информацията за осветлението. Знаейки, че лампичката свети, заместваме числата във формулата на Бейс:

Допълнителните данни промениха драматично оценката на вероятността от над 70% на 3,42%. Това показва силата на теоремата на Байс: успяхме да прецизираме първоначалната си оценка на ситуацията, като включихме повече информация. Може да сме правили това интуитивно преди, но сега, като го разглеждаме от гледна точка на формални уравнения, успяхме да потвърдим прогнозите си.

Нека разгледаме още един пример. Ами ако часовникът е 21:45 и светлините са изключени? Опитайте сами да изчислите вероятността, като приемете предварителна оценка от 0,1206.

Вместо да броим ръчно всеки път, написах прост код на Python, за да направя тези изчисления, които можете да изпробвате в Jupyter Notebook. Ще получите следния отговор:

Час: 21:45:00 Светлината е ИЗКЛЮЧЕНА.

Предварителна вероятност за сън: 12,06%
Актуализираната вероятност за сън: 40,44%

Отново допълнителна информация променя нашата оценка. Сега, ако сестра ми иска да ми се обади в 21:45, знаейки, че лампата ми свети, тя може да използва това уравнение, за да определи дали мога да вдигна телефона (ако приемем, че вдигам само когато съм буден)! Кой казва, че статистиката не е приложима в ежедневието?

Визуализация на вероятностите

Наблюдаването на изчисленията е полезно, но визуализацията помага за по-задълбочено разбиране на резултата. Винаги се опитвам да използвам графики, за да генерирам идеи, ако те не идват естествено от просто изучаване на уравнения. Можем да визуализираме предишното и последващото разпределение на вероятностите за сън, като използваме допълнителни данни:

Когато светлината свети, графиката се измества надясно, което показва, че е по-малко вероятно да съм заспал по това време. По същия начин графиката се измества наляво, ако светлината ми е изключена. Разбирането на значението на теоремата на Байс не е лесно, но тази илюстрация ясно демонстрира защо трябва да я използвате. Формулата на Bayes е инструмент за прецизиране на прогнози с допълнителни данни.

Ами ако има още повече данни?

Защо да се спрете на осветлението в спалнята? Можем да използваме още повече данни в нашия модел, за да прецизираме допълнително оценката (стига данните да остават полезни за разглеждания случай). Например знам, че ако телефонът ми се зарежда, тогава има 95% шанс да спя. Този факт може да бъде взет предвид в нашия модел.

Да приемем, че вероятността телефонът ми да се зарежда не зависи от осветлението в спалнята (независимостта на събитията е силно опростяване, но ще направи задачата много по-лесна). Нека направим нов, още по-точен израз за вероятността:

Получената формула изглежда тромава, но използвайки код на Python, можем да напишем функция, която ще направи изчислението. За всеки момент от време и всяка комбинация от осветление/зареждане на телефона, тази функция връща коригираната вероятност, че съм заспал.

Часът е 23:00:00 Светлината свети Телефонът НЕ се зарежда.

Предварителна вероятност за сън: 95,52%
Актуализираната вероятност за сън: 1,74%

В 23:00 часа, без допълнителна информация, почти със сигурност бихме могли да кажем, че сънувах. След като обаче имаме допълнителна информация, че лампичката свети и телефонът не се зарежда, заключаваме, че вероятността да спя е практически нулева. Ето още един пример:

Часът е 22:15:00 Светлината е ИЗКЛЮЧЕНА Телефонът се зарежда.

Предварителна вероятност за сън: 50,79%
Актуализираната вероятност за сън: 95,10%

Вероятността се измества надолу или нагоре в зависимост от конкретната ситуация. За да демонстрирате това, разгледайте четири допълнителни конфигурации на данни и как те променят разпределението на вероятностите:

Тази графика предоставя много информация, но основното е, че кривата на вероятността се променя в зависимост от допълнителни фактори. С добавянето на повече данни ще получим по-точна оценка.

Заключение

Теоремата на Байс и други статистически концепции могат да бъдат трудни за разбиране, когато са представени чрез абстрактни уравнения, използващи само букви или въображаеми ситуации. Истинското обучение идва, когато прилагаме абстрактни концепции към реални проблеми.

Успехът в науката за данни е свързан с непрекъснато учене, добавяне на нови методи към вашия набор от умения и намиране на най-добрия метод за решаване на проблеми. Теоремата на Байс ни позволява да прецизираме нашите оценки на вероятността с допълнителна информация, за да моделираме по-добре реалността. Увеличаването на количеството информация позволява по-точни прогнози и Bayes се оказва полезен инструмент за тази задача.

Приветствам обратна връзка, дискусия и градивна критика. Можете да се свържете с мен в Twitter.

Урок номер 4.

Тема: Формула за пълна вероятност. Формула на Бейс. Схема на Бернули. Полиномиална схема. Хипергеометрична схема.

ФОРМУЛА ЗА ОБЩА ВЕРОЯТНОСТ

ФОРМУЛА НА БАЙЕС

ТЕОРИЯ

Формула за обща вероятност:

Нека има пълна група от несъвместими събития:

(, Тогава вероятността за събитие А може да се изчисли по формулата

(4.1)

Събитията се наричат ​​хипотези. Излагат се хипотези относно тази част от експеримента, в която има несигурност.

, където са априорните вероятности на хипотезите

Формула на Бейс:

Нека експериментът е завършен и е известно, че в резултат на експеримента е настъпило събитие А. Тогава, като вземем предвид тази информация, можем надценяват вероятностите на хипотезите:

(4.2)

, където задни вероятности на хипотези

РАЗРЕШАВАНЕ НА ПРОБЛЕМ

Задача 1.

Състояние

В 3 партиди части, получени в склада, добрите са 89 %, 92 % и 97 % съответно. Броят на частите в партидите се нарича 1:2:3.

Каква е вероятността произволно избрана част от склада да е дефектна. Уведомете, че произволно избрана част се е оказала дефектна. Намерете вероятностите, че принадлежи на първата, втората и третата страна.

Решение:

Означете с A събитието, при което произволно избрана част се окаже дефектна.

1ви въпрос - към формулата за обща вероятност

2-ри въпрос - към формулата на Бейс

Излагат се хипотези относно тази част от експеримента, в която има несигурност. В този проблем несигурността се състои в това от коя партида е произволно избраната част.

Нека в първия мач аподробности. След това във втората игра - 2 аподробности, а в третата - 3 аподробности. Само три игри 6 аподробности.

(процентът на брака на първия ред беше преведен във вероятност)


(процентът на брака на втория ред беше преведен във вероятност)

(процентът на брака в третия ред, превърнат във вероятност)

Използвайки формулата за обща вероятност, ние изчисляваме вероятността за събитие А

-отговор на 1 въпрос

Вероятностите дефектната част да принадлежи към първата, втората и третата партида се изчисляват с помощта на формулата на Bayes:

Задача 2.

Състояние:

В първата урна 10 топки: 4 бял пясък 6 черен. Във втората урна 20 топки: 2 бял пясък 18 черен. Една топка се избира произволно от всяка урна и се поставя в третата урна. След това една топка се избира произволно от третата урна. Намерете вероятността топката, изтеглена от третата урна, да е бяла.

Решение:

Отговорът на въпроса на проблема може да бъде получен с помощта на формулата за пълна вероятност:

Несигурността се крие в това кои топки са се озовали в третата урна. Излагаме хипотези относно състава на топките в третата урна.

H1=(в третата урна има 2 бели топки)

H2=(в третата урна има 2 черни топки)

H3=(третата урна съдържа 1 бяла топка и 1 черна топка)

A=(топката, взета от урна 3, ще бъде бяла)

Задача 3.

Бяла топка се пуска в урна, съдържаща 2 топки с неизвестен цвят. След това извличаме 1 топка от тази урна. Намерете вероятността топката, извадена от урната, да е бяла. Топката, взета от описаната по-горе урна, се оказа бяла. Намерете вероятностите че е имало 0 бели топки, 1 бяла топка и 2 бели топки в урната преди прехвърлянето .

1 въпрос c - към формулата за обща вероятност

2 въпрос- по формулата на Бейс

Несигурността се крие в първоначалния състав на топките в урната. По отношение на първоначалния състав на топките в урната излагаме следните хипотези:

Здравей=( в урната преди смяната бешеi-1 бяла топка),i=1,2,3

, i=1,2,3(в ситуация на пълна несигурност ние приемаме априорните вероятности на хипотезите за еднакви, тъй като не можем да кажем, че едната опция е по-вероятна от другата)

A = (топката, изтеглена от урната след прехвърлянето, ще бъде бяла)

Нека изчислим условните вероятности:

Нека направим изчисление, използвайки формулата за обща вероятност:

Отговор на 1 въпрос

За да отговорим на втория въпрос, използваме формулата на Бейс:

(намалена в сравнение с предишната вероятност)

(непроменена от предишна вероятност)

(увеличена в сравнение с предишната вероятност)

Заключение от сравнението на предишни и последващи вероятности на хипотези: първоначалната несигурност се е променила количествено

Задача 4.

Състояние:

При кръвопреливане е необходимо да се вземат предвид кръвните групи на донора и пациента. Човекът, който има четвърта групакръв може да се прелива всякакъв вид кръв, на човек с втора и трета групаможе да се излее или кръвта на неговата група, или първо.на човек с първа кръвна групаможете да прелеете кръв само първата група.Известно е, че сред населението 33,7 % имат първа групапу, 37,5 % имат втора група, 20,9%имат трета групаи 7,9% имат 4-та група.Намерете вероятността на произволно избран пациент да бъде прелята кръвта на произволно избран донор.


Решение:

Излагаме хипотези за кръвната група на произволно избран пациент:

Здравейте=(при пациентi-та кръвна група),i=1,2,3,4

(Проценти, превърнати във вероятности)

A=(може да се прелива)

Според формулата за обща вероятност получаваме:

т.е. трансфузията може да се извърши в около 60% от случаите

Схема на Бернули (или биномна схема)

Изпитания на Бернули -това е независими тестове 2 резултат, който условно наричаме успех и провал.

п-успеваемост

р- вероятност за провал

Вероятност за успех не се променя от опит на опит

Резултатът от предишния тест не влияе на следващия тест.

Провеждането на описаните по-горе тестове се нарича схема на Бернули или биномна схема.

Примери за тестове на Бернули:

Хвърляне на монета

успех -ГЕРБ

провал-опашки

Корпусът на правилната монета

грешна кутия за монети

стри рне променяйте от опит на опит, ако не променим монетата по време на експеримента

Хвърляне на зарове

успех -ролка "6"

неуспех -всички останали

Случаят на обикновен зар

Случай на грешни зарове

стри рне се променят от опит на опит, ако в процеса на провеждане на експеримента не сменим заровете

Стрелба със стрела в целта

успех -удари

неуспех -мис

p =0,1 (стрелецът попадне в един изстрел от 10)

стри рне се променят от опит на опит, ако в процеса на провеждане на експеримента не променим стрелката

Формула на Бернули.

ПозволявамДържани н стр. Обмислете събитията

(въвn опити на Бернули с вероятност за успехp ще се случиm успехи),

-има стандартна нотация за вероятностите от такива събития

<-Формулата на Бернули за изчисляване на вероятностите (4.3)

Обяснение на формулата : вероятност да има m успеха (вероятностите се умножават, тъй като опитите са независими и тъй като всички са еднакви, се появява степен), - вероятността да се появят n-m неуспехи (обяснението е подобно на успехите), - броя на начините за реализиране на събитието, тоест по колко начина могат да бъдат поставени m успеха на n места.

Последици от формулата на Бернули:

Следствие 1:

ПозволявамДържани нИзпитания на Бернули с вероятност за успех стр. Обмислете събитията

A(m1,m2)=(брой успехи вn опитите на Бернули ще бъдат затворени в диапазона [m1;м2])

(4.4)

Обяснение на формулата: Формула (4.4) следва от формула (4.3) и теоремата за добавяне на вероятност за несъвместими събития, защото - сумата (обединението) от несъвместими събития, като вероятността за всяко се определя по формула (4.3).

Следствие 2

ПозволявамДържани нИзпитания на Бернули с вероятност за успех стр. Помислете за събитие

A=( вn Опитите на Бернули ще доведат до поне 1 успех}

(4.5)

Обяснение на формулата: ={ няма да има успех в n опита на Бернули)=

(всички n опита ще се провалят)

Проблем (върху формулата на Бернули и последствията от нея)пример за задача 1.6-D. ч.

Правилна монета хвърлете 10 пъти. Намерете вероятностите за следните събития:

A=(гербът ще падне точно 5 пъти)

B=(гербът ще падне не повече от 5 пъти)

C=(гербът ще падне поне веднъж)

Решение:

Нека преформулираме проблема по отношение на тестовете на Бернули:

n=10 брой опити

успех- ГЕРБ

p=0,5 – вероятност за успех

q=1-p=0.5 – вероятност за повреда

За да изчислим вероятността от събитие А, използваме Формула на Бернули:

За да изчислим вероятността от събитие B, използваме следствие 1да се Формула на Бернули:

За да изчислим вероятността от събитие C, използваме следствие 2да се Формула на Бернули:

Схема на Бернули. Изчисляване по приблизителни формули.

ПРИБЛИЗИТЕЛНА ФОРМУЛА НА MOIAVRE-LAPLACE

Местна формула

струспех и рпровал, тогава за всички мважи приблизителната формула:

, (4.6)

м.

Стойността на функцията може да се намери в специалния маса. Съдържа само стойности за. Но функцията е четна, т.е.

Ако , тогава да предположим

интегрална формула

Ако броят на опитите n в схемата на Бернули е голям, и вероятностите също са големи струспех и рповреда, тогава приблизителната формула е валидна за всички (4.7) :

Стойността на функцията може да се намери в специална таблица. Съдържа само стойности за. Но функцията е странна, т.е. .

Ако , тогава да предположим

ПРИБЛИЗИТЕЛНА ФОРМУЛА НА ПОАСОН

Местна формула

Нека броят на опитите нспоред схемата на Бернули е голяма и вероятността за успех в един тест е малка, а продуктът също е малък. След това се определя по приблизителната формула:

, (4.8)

Вероятността, че броят на успехите в n опити на Бернули е м.

Функционални стойности може да се види в специална таблица.

интегрална формула

Нека броят на опитите нспоред схемата на Бернули е голяма и вероятността за успех в един тест е малка, а продуктът също е малък.

Тогава определя се по приблизителната формула:

, (4.9)

Вероятността броят на успехите в n опита на Бернули да е в диапазона .

Функционални стойности могат да се видят в специална таблица и след това да се сумират в диапазона.

Формула

Формула на Поасон

Формула на Моавр-Лаплас

качество

оценки

оценките са груби

10

използвани за груби оценки

изчисления

използвани за прилагане

инженерни изчисления

100 0

използвани за всякакви инженерни изчисления

n>1000

много добри оценки

Можете да разгледате качеството на примерите за задачи 1.7 и 1.8 D. z.

Изчисляване по формулата на Поасон.

Проблем (формула на Поасон).

Състояние:

Вероятността за изкривяване на един символ при предаване на съобщение по комуникационна линия е равна на 0.001. Съобщението се счита за прието, ако в него няма изкривявания. Намерете вероятността да получите съобщение, състоящо се от 20 думи по 100 всекизнака всеки.

Решение:

Означаваме с НО

-брой знаци в съобщението

успех: характерът не е изкривен

Вероятност за успех

Нека изчислим. Вижте препоръки за използване на приблизителни формули ( ) : за изчислението трябва да приложите Формула на Поасон

Вероятности за формулата на Поасон по отношение на иm могат да бъдат намерени в специална таблица.

Състояние:

Телефонната централа обслужва 1000 абоната. Вероятността в рамките на минута всеки абонат да има нужда от връзка е 0,0007. Изчислете вероятността поне 3 повиквания да пристигнат на телефонната централа за минута.

Решение:

Преформулирайте проблема по отношение на схемата на Бернули

успех: обаждането е получено

Вероятност за успех

– диапазонът, в който трябва да е броят на успехите

A = (ще пристигнат поне три обаждания) - събитие, чиято вероятност се изисква. намери в задачата

(Ще пристигнат по-малко от три обаждания) Продължаваме към допълнителните. събитие, тъй като неговата вероятност е по-лесна за изчисляване.

(изчисляване на термините вижте специална таблица)

По този начин,

Проблем (местна формула на Мувър-Лаплас)

Състояние

Вероятност за попадение в целта с един изстрел е равно на 0,8.Определете вероятността, че на 400изстрели ще се случат точно 300хитове.

Решение:

Преформулирайте проблема по отношение на схемата на Бернули

n=400 – брой опити

m=300 – брой успехи

успех - хит

(Проблемен въпрос по отношение на схемата на Бернули)

Оценка:

Ние харчим независими тестове, във всяка от които разграничаваме m опции.

p1 - ​​вероятността да получите първата опция в един опит

p2 - вероятността за получаване на втората опция в един опит

…………..

pm е вероятността да се получиm-та опция в един тест

p1,p2, ……………..,pm не се променят от опит на опит

Последователността от тестове, описана по-горе, се извиква полиномна схема.

(когато m=2, полиномиалната схема се превръща в биномиална), т.е. биномиалната схема, описана по-горе, е частен случай на по-обща схема, наречена полиномиална).

Помислете за следните събития

А(n1,n2,….,nm)=( в n опита, описани по-горе, вариант 1 се появява n1 пъти, вариант 2 се появява n2 пъти, ….. и т.н., nm пъти се появява вариант m)

Формула за изчисляване на вероятности с помощта на полиномна схема

Състояние

зарове хвърлете 10 пъти.Необходимо е да се намери вероятността "6" да падне 2 пъти, и ще падне "5". 3 пъти.

Решение:

Означаваме с НО събитието, чиято вероятност трябва да се открие в проблема.

n=10 -брой опити

m=3

1 вариант - капка 6

p1=1/6n1=2

Вариант 2 - Капка 5

p2=1/6n2=3

Вариант 3 - Премахнете всяко лице с изключение на 5 и 6

р3=4/6n3=5

P(2,3,5)-? (вероятност на събитието, посочено в условието на проблема)

Задача за полиномната верига

Състояние

Намерете вероятността сред 10 Произволно избраните хора ще имат четири рождени дни през първото тримесечие, три през второто, два през третото и един през четвъртото.

Решение:

Означаваме с НО събитието, чиято вероятност трябва да се открие в проблема.

Нека преформулираме проблема от гледна точка на полиномна схема:

n=10 -брой опити = брой хора

m=4е броят на опциите, които разграничаваме във всеки опит

Вариант 1 - раждане в 1 квартал

p1=1/4n1=4

Вариант 2 - раждане през 2-ро тримесечие

p2=1/4n2=3

Вариант 3 - раждане през 3-то тримесечие

p3=1/4n3=2

Вариант 4 - раждане през 4-то тримесечие

p4=1/4n4=1

P(4,3,2,1)-? (вероятност на събитието, посочено в условието на проблема)

Приемаме, че вероятността да се родиш във всяко тримесечие е еднаква и равна на 1/4.Нека извършим изчислението по формулата за полиномната схема:

Задача за полиномната верига

Състояние

в урната 30 топки: добре дошъл обратно.3 бели, 2 зелени, 4 сини и 1 жълта.

Решение:

Означаваме с НО събитието, чиято вероятност трябва да се открие в проблема.

Нека преформулираме проблема от гледна точка на полиномна схема:

n=10 -брой опити = брой избрани топки

m=4е броят на опциите, които разграничаваме във всеки опит

Вариант 1 - изберете бяла топка

p1=1/3n1=3

Вариант 2 - изберете зелената топка

p2=1/6n2=2

3-ти вариант - избор на синята топка

р3=4/15n3=4

Вариант 4 - изберете жълтата топка

р4=7/30n4=1

P(3,2,4,1)-? (вероятност на събитието, посочено в условието на проблема)

p1,p2, p3,p4 не се променяйте от опит на опит, тъй като изборът се прави с връщане

Нека извършим изчислението по формулата за полиномната схема:

Хипергеометрична схема

Нека има n елемента от k типа:

n1 от първия тип

n2 от втори тип

nk тип k

От тези n елемента произволно без връщанеизберете m елемента

Да разгледаме събитието A(m1,…,mk), което се състои в това, че сред избраните m елемента ще има

m1 от първия тип

m2 от втория вид

mk k-ти тип

Вероятността за това събитие се изчислява по формулата

P(A(m1,…,mk))= (4.11)

Пример 1

Задача за хипергеометрична схема (образец за задача 1.9 D. h)

Състояние

в урната 30 топки: 10 бели, 5 зелени, 8 сини и 7 жълти(топките се различават само по цвят). 10 топки се избират на случаен принцип от урната. без връщане. Намерете вероятността сред избраните топки да има: 3 бели, 2 зелени, 4 сини и 1 жълта.

Ние имамеn=30,k=4,

n1=10,n2=5,n3=8,n4=7,

m1=3,m2=2,m3=4,m4=1

P(A(3,2,4,1))= = може да се преброи до число, като се знае формулата за комбинации

Пример 2

Пример за изчисление по тази схема: вижте изчисленията за играта Sportloto (тема 1)


близо