Módne tendencie a trendy.  Doplnky, topánky, krása, účesy

Módne tendencie a trendy. Doplnky, topánky, krása, účesy

» Bayesov vzorec celkovej pravdepodobnosti. Jednoduché vysvetlenie Bayesovej vety

Bayesov vzorec celkovej pravdepodobnosti. Jednoduché vysvetlenie Bayesovej vety

kto je Bayes? A čo to má spoločné s manažmentom? – môže nasledovať celkom spravodlivá otázka. Zatiaľ ma berte za slovo: toto je veľmi dôležité! .. a zaujímavé (aspoň pre mňa).

V akej paradigme funguje väčšina manažérov: ak niečo pozorujem, aké závery z toho môžem vyvodiť? Čo učí Bayes: čo vlastne musí byť, aby som to mohol pozorovať? Takto sa vyvíjajú všetky vedy a o tom píše (citujem naspamäť): človek, ktorý nemá v hlave teóriu, pod vplyvom rôznych udalostí (pozorovaní) uhne od jednej myšlienky k druhej. Nie nadarmo sa hovorí: nie je nič praktickejšie ako dobrá teória.

Príklad z praxe. Môj podriadený sa pomýli a kolega (vedúci iného oddelenia) hovorí, že na nedbalého zamestnanca by bolo potrebné uplatniť manažérsky vplyv (inými slovami potrestať / pokarhať). A viem, že tento zamestnanec urobí 4-5 tisíc operácií rovnakého typu mesačne a počas tejto doby neurobí viac ako 10 chýb. Cítite rozdiel v paradigme? Kolegyňa reaguje na pozorovanie a ja mám a priori vedomosť o tom, že zamestnanec robí určitý počet chýb, takže ešte jedna táto vedomosť neovplyvnila... Teraz, ak sa na konci mesiaca ukáže, že existuje, napríklad 15 takýchto chýb!.. To sa už stane dôvodom na skúmanie príčin nedodržiavania noriem.

Ste presvedčení o dôležitosti bayesovského prístupu? Zaujatý? Dúfam". A teraz mucha. Žiaľ, Bayesovské myšlienky sú len zriedkakedy dané na prvý pokus. Úprimne povedané, nemal som šťastie, pretože som sa s týmito myšlienkami zoznámil prostredníctvom populárnej literatúry, po ktorej prečítaní zostalo veľa otázok. Keď som plánoval napísať poznámku, zozbieral som všetko, čo som predtým načrtol podľa Bayesa, a naštudoval som si aj to, čo píšu na internete. Predstavujem vám svoj najlepší odhad na túto tému. Úvod do Bayesovskej pravdepodobnosti.

Odvodenie Bayesovej vety

Uvažujme nasledujúci experiment: pomenujeme ľubovoľné číslo ležiace na segmente a zafixujeme, keď je toto číslo napríklad medzi 0,1 a 0,4 (obr. 1a). Pravdepodobnosť tejto udalosti sa rovná pomeru dĺžky segmentu k celkovej dĺžke segmentu za predpokladu, že výskyt čísel na segmente ekvipravdepodobný. Matematicky sa to dá napísať p(0,1 <= X <= 0,4) = 0,3, или кратко R(X) = 0,3, kde R- pravdepodobnosť, X je náhodná premenná v rozsahu , X je náhodná premenná v rozsahu . To znamená, že pravdepodobnosť zasiahnutia segmentu je 30 %.

Ryža. 1. Grafická interpretácia pravdepodobností

Teraz uvažujme štvorec x (obr. 1b). Povedzme, že musíme pomenovať dvojice čísel ( X, r), z ktorých každá je väčšia ako nula a menšia ako jedna. Pravdepodobnosť, že X(prvé číslo) bude v rámci segmentu (modrá oblasť 1), rovná sa pomeru plochy modrej plochy k ploche celého štvorca, tj (0,4 - 0,1 ) * (1 - 0) / (1 * 1) = 0, 3, teda rovnakých 30 %. Pravdepodobnosť, že r je vo vnútri segmentu (zelená plocha 2) sa rovná pomeru plochy zelenej plochy k ploche celého štvorca p(0,5 <= y <= 0,7) = 0,2, или кратко R(Y) = 0,2.

Čo sa zároveň dá naučiť o hodnotách X a r. Napríklad, aká je pravdepodobnosť, že obaja X a r sú v zodpovedajúcich daných segmentoch? Aby ste to dosiahli, musíte vypočítať pomer plochy domény 3 (priesečník zeleného a modrého pruhu) k ploche celého štvorca: p(X, Y) = (0,4 – 0,1) * (0,7 – 0,5) / (1 * 1) = 0,06.

Teraz predpokladajme, že chceme vedieť, aká je to pravdepodobnosť r je v intervale ak X je už v dosahu. To znamená, že v skutočnosti máme filter a keď voláme páry ( X, r), potom tie dvojice, ktoré nespĺňajú podmienku na nájdenie, ihneď vyradíme X v danom intervale a potom z vyfiltrovaných dvojíc spočítame tie, pre ktoré r spĺňa našu podmienku a pravdepodobnosť považujeme za pomer počtu párov, pre ktoré r leží vo vyššie uvedenom segmente k celkovému počtu filtrovaných párov (to znamená, pre ktoré X leží v segmente). Túto pravdepodobnosť môžeme zapísať ako p(Y|X pri X zasiahnuť na dosah." Je zrejmé, že táto pravdepodobnosť sa rovná pomeru plochy oblasti 3 k ploche modrej oblasti 1. Plocha oblasti 3 je (0,4 - 0,1) * (0,7 - 0,5) = 0,06 a plocha modrej oblasti 1 ( 0,4 - 0,1) * (1 - 0) = 0,3, potom je ich pomer 0,06 / 0,3 = 0,2. Inými slovami, pravdepodobnosť nájdenia r na segmente za predpokladu, že X patrí do segmentu p(Y|X) = 0,2.

V predchádzajúcom odseku sme vlastne sformulovali identitu: p(Y|X) = p(X, Y) /p( X). Znie: „pravdepodobnosť zasiahnutia pri v rozsahu za predpokladu, že X zásah v dosahu sa rovná pomeru pravdepodobnosti súčasného zásahu X v dosahu a pri v rozsahu, na pravdepodobnosť zásahu X do rozsahu."

Analogicky zvážte pravdepodobnosť p(X|Y). Voláme páry X, r) a filtrovať tie, pre ktoré r leží medzi 0,5 a 0,7, potom je pravdepodobnosť, že X je v segmente za predpokladu, že r patrí do segmentu sa rovná pomeru plochy 3 k ploche zelene 2: p(X|Y) = p(X, Y) / p(Y).

Všimnite si, že pravdepodobnosti p(X, Y) a p(Y, X) sú rovnaké a obe sa rovnajú pomeru plochy zóny 3 k ploche celého štvorca, ale pravdepodobnosti p(Y|X) a p(X|Y) nerovná sa; kým pravdepodobnosť p(Y|X) sa rovná pomeru plochy 3 k ploche 1 a p(X|Y) – doména 3 až doména 2. Všimnite si aj to p(X, Y) sa často označuje ako p(X&Y).

Máme teda dve definície: p(Y|X) = p(X, Y) /p( X) a p(X|Y) = p(X, Y) / p(Y)

Prepíšme tieto rovnosti ako: p(X, Y) = p(Y|X)*p( X) a p(X, Y) = p(X|Y) * p(Y)

Keďže ľavé strany sú rovnaké, sú rovnaké aj pravé: p(Y|X)*p( X) = p(X|Y) * p(Y)

Alebo môžeme prepísať poslednú rovnosť ako:

Toto je Bayesova veta!

Je možné, že takéto jednoduché (takmer tautologické) transformácie dávajú vznik veľkej vete!? Neponáhľajte sa k záverom. Poďme sa znova porozprávať o tom, čo sme dostali. Existovala určitá počiatočná (a priori) pravdepodobnosť R(X), že náhodná premenná X rovnomerne rozložené na segmente spadá do rozsahu X. Stala sa nejaká udalosť Y, v dôsledku čoho sme získali aposteriórnu pravdepodobnosť tej istej náhodnej premennej X: R(X|Y) a táto pravdepodobnosť sa líši od R(X) koeficientom . Udalosť Y nazývané dôkazy, viac-menej potvrdzujúce alebo vyvracajúce X. Tento koeficient sa niekedy nazýva dôkaznú silu. Čím silnejší je dôkaz, tým viac skutočnosť pozorovania Y mení predchádzajúcu pravdepodobnosť, tým viac sa neskoršia pravdepodobnosť líši od predchádzajúcej. Ak sú dôkazy slabé, posterior je takmer rovnaký ako predchádzajúci.

Bayesov vzorec pre diskrétne náhodné premenné

V predchádzajúcej časti sme odvodili Bayesov vzorec pre spojité náhodné premenné x a y definované na intervale . Uvažujme o príklade s diskrétnymi náhodnými premennými, z ktorých každá nadobúda dve možné hodnoty. Pri bežných lekárskych prehliadkach sa zistilo, že vo veku 40 rokov trpí rakovinou prsníka 1 % žien. 80% žien s rakovinou má pozitívne výsledky mamografie. 9,6 % zdravých žien má tiež pozitívne výsledky mamografie. Pri vyšetrení mala žena tejto vekovej kategórie pozitívny výsledok na mamografii. Aká je pravdepodobnosť, že skutočne má rakovinu prsníka?

Priebeh uvažovania/výpočtov je nasledovný. Z 1 % pacientov s rakovinou poskytne mamografia 80 % pozitívnych výsledkov = 1 % * 80 % = 0,8 %. Z 99 % zdravých žien poskytne mamografia 9,6 % pozitívnych výsledkov = 99 % * 9,6 % = 9,504 %. Celkovo je z 10,304 % (9,504 % + 0,8 %) s pozitívnymi výsledkami na mamografii iba 0,8 % chorých a zvyšných 9,504 % je zdravých. Pravdepodobnosť, že žena s pozitívnym mamografom má rakovinu, je teda 0,8 % / 10,304 % = 7,764 %. Mysleli ste si 80% alebo tak?

V našom príklade má Bayesov vzorec nasledujúcu formu:

Povedzme si ešte raz o „fyzickom“ význame tohto vzorca. X je náhodná premenná (diagnóza), ktorá nadobúda tieto hodnoty: X 1- chorý a X 2- zdravý; Y– náhodná premenná (výsledok merania - mamografia), ktorá nadobúda hodnoty: Y 1- pozitívny výsledok a Y2- negatívny výsledok; p(X 1)- pravdepodobnosť ochorenia pred mamografiou (a priori pravdepodobnosť), rovná 1 %; R(Y 1 |X 1 ) - pravdepodobnosť pozitívneho výsledku, ak je pacient chorý (podmienená pravdepodobnosť, pretože musí byť špecifikovaná v podmienkach problému), rovná 80%; R(Y 1 |X 2 ) – pravdepodobnosť pozitívneho výsledku, ak je pacient zdravý (aj podmienená pravdepodobnosť), rovná 9,6 %; p(X 2)- pravdepodobnosť, že je pacientka zdravá pred mamografiou (a priori pravdepodobnosť), rovná sa 99 %; p(X1|Y 1 ) – pravdepodobnosť, že je pacientka chorá pri pozitívnom výsledku mamografie (zadná pravdepodobnosť).

Je vidieť, že zadná pravdepodobnosť (to, čo hľadáme) je úmerná predchádzajúcej pravdepodobnosti (počiatočnej) s trochu zložitejším koeficientom . Ešte raz zdôrazním. Toto je podľa mňa základný aspekt bayesovského prístupu. rozmer ( Y) pridal k pôvodne dostupným (a priori) určité množstvo informácií, ktoré objasnili naše poznatky o objekte.

Príklady

Ak chcete konsolidovať pokrytý materiál, skúste vyriešiť niekoľko problémov.

Príklad 1 Sú tam 3 urny; v prvých 3 biele guličky a 1 čierna; v druhom - 2 biele gule a 3 čierne; v treťom - 3 biele gule. Niekto náhodne pristúpi k jednej z urien a vytiahne z nej 1 loptičku. Táto guľa je biela. Nájdite zadné pravdepodobnosti, že loptičku vytiahnete z 1., 2., 3. urny.

Riešenie. Máme tri hypotézy: H 1 = (vybratá prvá urna), H 2 = (vybratá druhá urna), H 3 = (vybratá tretia urna). Keďže urna je vybraná náhodne, apriórne pravdepodobnosti hypotéz sú: Р(Н 1) = Р(Н 2) = Р(Н 3) = 1/3.

V dôsledku experimentu sa objavila udalosť A = (z vybranej urny bola vybratá biela guľa). Podmienené pravdepodobnosti udalosti A pri hypotézach H 1, H 2, H 3: P(A|H 1) = 3/4, P(A|H 2) = 2/5, P(A|H 3) = 1. Napríklad prvá rovnosť znie takto: „pravdepodobnosť vytiahnutia bielej gule, ak je vybratá prvá urna, je 3/4 (keďže v prvej urne sú 4 gule a 3 z nich sú biele)“.

Použitím Bayesovho vzorca nájdeme zadné pravdepodobnosti hypotéz:

Vo svetle informácií o výskyte udalosti A sa teda zmenili pravdepodobnosti hypotéz: najpravdepodobnejšou sa stala hypotéza H 3, najmenej pravdepodobnou - hypotéza H 2 .

Príklad 2 Dvaja strelci nezávisle strieľajú na ten istý cieľ, pričom každý strieľa jednu ranu. Pravdepodobnosť zasiahnutia cieľa pre prvého strelca je 0,8, pre druhého - 0,4. Po streľbe sa našla jedna diera v terči. Nájdite pravdepodobnosť, že táto jamka patrí prvému strelcovi (výsledok (obe jamky sa zhodujú) zahodíme ako zanedbateľne nepravdepodobný).

Riešenie. Pred experimentom sú možné nasledujúce hypotézy: H 1 = (prvý ani druhý šíp nezasiahne), H 2 = (zasiahnu oba šípy), H 3 - (prvý strelec zasiahne a druhý nezasiahne). ), H 4 = (prvý strelec nezasiahne a druhý zasiahne). Predchádzajúce pravdepodobnosti hypotéz:

P (H 1) \u003d 0,2 * 0,6 \u003d 0,12; P (H2) \u003d 0,8 * 0,4 \u003d 0,32; P (H 3) \u003d 0,8 * 0,6 \u003d 0,48; P (H 4) \u003d 0,2 * 0,4 \u003d 0,08.

Podmienené pravdepodobnosti pozorovaného javu A = (v cieli je jedna diera) podľa týchto hypotéz sú: P(A|H 1) = P(A|H 2) = 0; P(A|H3) = P(A|H4) = 1

Po skúsenostiach sa hypotézy H 1 a H 2 stanú nemožnými a zadné pravdepodobnosti hypotéz H 3 a H 4 podľa Bayesovho vzorca budú:

Bayes proti spamu

Bayesov vzorec našiel široké uplatnenie pri vývoji spamových filtrov. Povedzme, že chcete trénovať počítač, aby určil, ktoré e-maily sú spam. Vychádzame zo slovníka a slovných spojení pomocou bayesovských odhadov. Najprv vytvorte priestor pre hypotézy. Urobme si 2 hypotézy týkajúce sa akéhokoľvek písmena: H A je spam, H B nie je spam, ale normálne, potrebné písmeno.

Najprv si „natrénujme“ náš budúci antispamový systém. Zoberme si všetky písmenká, ktoré máme, a rozdeľme ich na dve „kopy“ po 10 písmen. Do jedného vložíme spamové listy a nazveme ho halda H A, do druhého vložíme potrebnú korešpondenciu a nazveme ho halda H B. Teraz sa pozrime: aké slová a frázy sa nachádzajú v spame a potrebných e-mailoch a s akou frekvenciou? Tieto slová a frázy sa budú nazývať dôkazy a označovať ich E 1 , E 2 ... Ukazuje sa, že bežne používané slová (napríklad slová „ako“, „váš“) v haldách HA a HB sa vyskytujú približne s rovnakú frekvenciu. Prítomnosť týchto slov v liste nám teda nehovorí nič o tom, do ktorej haldy patrí (slabý dôkaz). Priraďme týmto slovám neutrálnu hodnotu odhadu pravdepodobnosti „spamu“, povedzme 0,5.

Nech sa fráza „konverzačná angličtina“ objavuje len v 10 písmenách a častejšie v spamových e-mailoch (napríklad v 7 spamových e-mailoch zo všetkých 10) ako v tých správnych (3 z 10). Dajme tejto fráze vyššie skóre 7/10 pre spam a nižšie skóre pre bežné e-maily: 3/10. Naopak, ukázalo sa, že slovo „kamarát“ sa častejšie vyskytuje v bežných písmenách (6 z 10). A tak sme dostali krátky list: „Priateľ! Ako sa hovorí po anglicky?. Skúsme zhodnotiť jeho „spamovosť“. Uvedieme všeobecné odhady P(H A), P(H B) príslušnosti ku každej halde pomocou trochu zjednodušeného Bayesovho vzorca a našich približných odhadov:

P(HA) = A/(A+B), kde A \u003d p a1 * p a2 * ... * panvica, B \u003d p b1 * p b2 * ... * pbn \u003d (1 - p a1) * (1 - p a2) * ... * ( 1 - p an).

Tabuľka 1. Zjednodušené (a neúplné) Bayesovské hodnotenie písania

Náš hypotetický list teda dostal hodnotenie pravdepodobnosti spolupatričnosti s dôrazom v smere „spamu“. Môžeme sa rozhodnúť hodiť list do jednej z kôp? Stanovme si prahy rozhodovania:

  • Budeme predpokladať, že písmeno patrí do haldy H i, ak P(Hi) ≥ T.
  • Písmeno nepatrí do haldy, ak P(H i) ≤ L.
  • Ak L ≤ P(Hi) ≤ T, potom nemožno urobiť žiadne rozhodnutie.

Môžete si vziať T = 0,95 a L = 0,05. Keďže za predmetný list a 0,05< P(H A) < 0,95, и 0,05 < P(H В) < 0,95, то мы не сможем принять решение, куда отнести данное письмо: к спаму (H A) или к нужным письмам (H B). Можно ли улучшить оценку, используя больше информации?

Áno. Vypočítajme skóre pre každý dôkaz iným spôsobom, presne ako navrhol Bayes. Nechajte:

F a je celkový počet spamových e-mailov;

F ai je počet písmen s certifikátom i v hromade spamu;

Fb je celkový počet potrebných písmen;

F bi je počet písmen s certifikátom i v hromade potrebných (relevantných) písmen.

Potom: p ai = F ai /Fa, pbi = Fbi /Fb. P(HA) = A/(A+B), P(HB) = B/(A+B), kdeА = p a1 *p a2 *…*p an , B = p b1 *p b2 *…*p b n

Upozorňujeme, že skóre dôkazových slov p ai a p bi sa stalo objektívnym a možno ich vypočítať bez ľudského zásahu.

Tabuľka 2. Presnejší (ale neúplný) Bayesovský odhad dostupných funkcií z listu

Dostali sme celkom jednoznačný výsledok - s veľkou pravdepodobnosťou možno písmenu priradiť potrebné písmená, keďže P(H B) = 0,997 > T = 0,95. Prečo sa zmenil výsledok? Pretože sme použili viac informácií - zohľadnili sme počet písmen v každej z kôp a mimochodom oveľa správnejšie určili odhady p ai a p bi. Boli určené rovnakým spôsobom ako samotný Bayes, a to výpočtom podmienených pravdepodobností. Inými slovami, p a3 je pravdepodobnosť, že sa v e-maile objaví slovo „kamarát“, keďže e-mail už patrí do haldy spamu H A . Výsledok na seba nenechal dlho čakať – zdá sa, že sa vieme rozhodnúť s väčšou istotou.

Bayes vs korporátne podvody

Zaujímavú aplikáciu Bayesovho prístupu opísal MAGNUS8.

Môj aktuálny projekt (IS na odhaľovanie podvodov vo výrobnom podniku) využíva Bayesov vzorec na určenie pravdepodobnosti podvodu (podvodu) za prítomnosti / absencie viacerých skutočností nepriamo v prospech hypotézy o možnosti podvodu. Algoritmus je samoučiaci sa (so spätnou väzbou), t.j. prepočítava svoje koeficienty (podmienené pravdepodobnosti) pri skutočnom potvrdení alebo nepotvrdení podvodu počas overovania ekonomickou bezpečnostnou službou.

Pravdepodobne stojí za to povedať, že takéto metódy pri navrhovaní algoritmov vyžadujú pomerne vysokú matematickú kultúru vývojára, pretože najmenšia chyba pri odvodzovaní a/alebo implementácii výpočtových vzorcov anuluje a zdiskredituje celú metódu. Na vine sú najmä pravdepodobnostné metódy, pretože ľudské myslenie nie je prispôsobené na prácu s pravdepodobnostnými kategóriami, a preto neexistuje „viditeľnosť“ a pochopenie „fyzikálneho významu“ medziľahlých a konečných pravdepodobnostných parametrov. Takéto chápanie existuje len pre základné pojmy teórie pravdepodobnosti a potom už len treba veľmi opatrne kombinovať a odvodzovať zložité veci podľa zákonov teórie pravdepodobnosti – pri zložených objektoch už zdravý rozum nepomôže. S tým sú spojené najmä dosť vážne metodologické súboje, ktoré sa odohrávajú na stránkach moderných kníh o filozofii pravdepodobnosti, ako aj veľké množstvo sofizmov, paradoxov a rébusov kuriozít na túto tému.

Ešte jedna nuansa, ktorej som musel čeliť – žiaľ, takmer všetko, čo je na túto tému viac či menej UŽITOČNÉ V PRAXI, je napísané v angličtine. V ruskojazyčných zdrojoch je v podstate len známa teória s demonštračnými príkladmi len pre najprimitívnejšie prípady.

Plne súhlasím s posledným komentárom. Napríklad Google, keď sa snažil nájsť niečo ako kniha „Bayesian Probability“, nedal nič zrozumiteľné. Pravda, povedal, že kniha s Bayesovskou štatistikou bola v Číne zakázaná. (Profesor štatistiky Andrew Gelman informoval na blogu Kolumbijskej univerzity, že jeho kniha Analýza údajov s regresiou a viacúrovňovými/hierarchickými modelmi bola v Číne zakázaná. text.“) Zaujímalo by ma, či podobný dôvod neviedol k absencii kníh o Bayesianovi. pravdepodobnosť v Rusku?

Konzervativizmus v procese spracovania informácií človeka

Pravdepodobnosti určujú stupeň neistoty. Pravdepodobnosť, ako podľa Bayesa, tak aj podľa našej intuície, je jednoducho číslo medzi nulou a tým, čo predstavuje mieru, do akej trochu idealizovaný človek verí, že tvrdenie je pravdivé. Dôvod, prečo je človek do istej miery idealizovaný, je ten, že súčet jeho pravdepodobností pre dve navzájom sa vylučujúce udalosti sa musí rovnať jeho pravdepodobnosti, že nastane jedna z týchto udalostí. Vlastnosť aditivity má také dôsledky, že len málo skutočných ľudí sa s nimi všetkým vyrovná.

Bayesov teorém je triviálnym dôsledkom vlastnosti aditivity, nepopierateľný a schválený všetkými pravdepodobnostami, bayesovskými aj inými. Jedným zo spôsobov, ako to napísať, je nasledujúci. Ak P(H A |D) je následná pravdepodobnosť, že hypotéza A bola po pozorovaní danej hodnoty D, P(HA) je jej predchádzajúca pravdepodobnosť pred pozorovaním danej hodnoty D, P(D|HA ) je pravdepodobnosť, že a bude dodržaná daná hodnota D, ak je HA pravdivá a P(D) je bezpodmienečná pravdepodobnosť danej hodnoty D, potom

(1) P(HA |D) = P(D|HA) * P(HA) / P(D)

P(D) je najlepšie chápať ako normalizujúcu konštantu, ktorá spôsobuje, že zadné pravdepodobnosti sa pridávajú k jednej v rámci vyčerpávajúceho súboru vzájomne sa vylučujúcich hypotéz, ktoré sa zvažujú. Ak to treba vypočítať, môže to byť takto:

Ale častejšie sa P(D) skôr eliminuje ako počíta. Pohodlný spôsob, ako to odstrániť, je transformovať Bayesovu vetu do podoby vzťahu pravdepodobnosť-pravdepodobnosť.

Zvážte ďalšiu hypotézu, H B , vzájomne sa vylučujúcu s H A, a zmeňte svoj názor na to na základe rovnakej danej veličiny, ktorá zmenila váš názor na HA. ​​Bayesova veta hovorí, že

(2) P(HB |D) = P(D|HB) * P(HB) / P(D)

Teraz vydelíme rovnicu 1 rovnicou 2; výsledok bude takýto:

kde Ω 1 je zadná pravdepodobnosť v prospech HA z hľadiska HB, Ω 0 je skoršia pravdepodobnosť a L je číslo známe štatistikom ako pomer pravdepodobností. Rovnica 3 je rovnakou relevantnou verziou Bayesovej vety ako rovnica 1 a je často oveľa užitočnejšia najmä pre experimenty zahŕňajúce hypotézy. Bayesovskí zástancovia tvrdia, že Bayesov teorém je formálne optimálnym pravidlom, ako revidovať názory vo svetle nových údajov.

Máme záujem o porovnanie ideálneho správania definovaného Bayesovou vetou so skutočným správaním ľudí. Aby ste mali predstavu o tom, čo to znamená, skúsme experiment s vami ako subjektom. Táto taška obsahuje 1000 pokrových žetónov. Mám dve z týchto vrecúšok, jednu so 700 červenými a 300 modrými žetónmi a druhú s 300 červenými a 700 modrými. Hodil som si mincou, aby som sa rozhodol, ktorý použijem. Ak sú teda naše názory rovnaké, vaša aktuálna pravdepodobnosť, že vytiahnete vrece s viacerými červenými žetónmi, je 0,5. Teraz náhodne odoberáte vzorky a vraciate sa po každom tokene. V 12 žetónoch získate 8 červených a 4 modré. Teraz, na základe všetkého, čo viete, aká je pravdepodobnosť, že taška má viac červených? Je jasné, že je vyššia ako 0,5. Prosím, nepokračujte v čítaní, kým si nezaznamenáte svoje hodnotenie.

Ak vyzeráte ako typický subjekt, vaše skóre sa pohybuje medzi 0,7 a 0,8. Ak by sme však urobili zodpovedajúci výpočet, odpoveď by bola 0,97. Skutočne je veľmi zriedkavé, aby človek, u ktorého sa predtým nepreukázal vplyv konzervativizmu, prišiel s takým vysokým odhadom, aj keď poznal Bayesovu vetu.

Ak je podiel červených lupienkov vo vrecúšku R, potom pravdepodobnosť získania rčervené žetóny a ( n-r) modrá in n vzorky s návratom - pr r (1–p)n–r. V typickom experimente s bagom a žetónom, ak HA znamená, že podiel červených žetónov je r A a HB znamená, že podiel je RB, potom pomer pravdepodobnosti:

Pri aplikácii Bayesovho vzorca sa musí brať do úvahy iba pravdepodobnosť skutočného pozorovania a nie pravdepodobnosti iných pozorovaní, ktoré mohol urobiť, ale neurobil. Tento princíp má široké dôsledky pre všetky štatistické a neštatistické aplikácie Bayesovej vety; je najdôležitejším technickým nástrojom bayesovského myslenia.

Bayesovská revolúcia

Vaši priatelia a kolegovia hovoria o niečom, čo sa nazýva "Bayesov teorém" alebo "Bayesovské pravidlo" alebo niečo, čo sa nazýva Bayesovské myslenie. Naozaj ich to baví, takže idete online a nájdete stránku o Bayesovej vete a... Je to rovnica. A to je všetko... Prečo matematický pojem vyvoláva v mysliach také nadšenie? Aká „Bayesovská revolúcia“ prebieha medzi vedcami a tvrdí sa, že aj samotný experimentálny prístup možno označiť za jej špeciálny prípad? Aké je tajomstvo, ktoré prívrženci Bayesa poznajú? Aké svetlo vidia?

Bayesovská revolúcia vo vede nenastala, pretože čoraz viac kognitívnych vedcov si zrazu začalo všímať, že duševné javy majú bayesovskú štruktúru; nie preto, že by vedci v každej oblasti začali používať Bayesovu metódu; ale pretože samotná veda je špeciálnym prípadom Bayesovej vety; experimentálny dôkaz je Bayesovský dôkaz. Bayesiánski revolucionári tvrdia, že keď urobíte experiment a získate dôkaz, ktorý „podporí“ alebo „vyvráti“ vašu teóriu, dôjde k potvrdeniu alebo vyvráteniu podľa Bayesovských pravidiel. Napríklad musíte vziať do úvahy nielen to, že vaša teória môže vysvetliť tento jav, ale aj to, že existujú ďalšie možné vysvetlenia, ktoré môžu tiež predpovedať tento jav.

Predtým bola najpopulárnejšou filozofiou vedy stará filozofia, ktorú vytlačila Bayesovská revolúcia. Myšlienka Karla Poppera, že teórie možno úplne sfalšovať, ale nikdy nie úplne potvrdiť, je ďalším špeciálnym prípadom Bayesovských pravidiel; ak p(X|A) ≈ 1 - ak teória robí správne predpovede, potom pozorovanie ~X veľmi silne falšuje A. Na druhej strane, ak p(X|A) ≈ 1 a pozorujeme X, nie je to veľmi podporovať teóriu; je možná nejaká iná podmienka B, taká, že p(X|B) ≈ 1, a pri ktorej pozorovanie X nie je dôkazom pre A, ale dôkazom pre B. Aby sme pozorovali, že X definitívne potvrdzuje A, museli by sme vedieť, že p( X|A) ≈ 1 a to p(X|~A) ≈ 0, čo nemôžeme vedieť, pretože nemôžeme zvážiť všetky možné alternatívne vysvetlenia. Napríklad, keď Einsteinova teória všeobecnej relativity prekonala Newtonovu vysoko overiteľnú teóriu gravitácie, urobila zo všetkých predpovedí Newtonovej teórie špeciálny prípad Einsteinovej.

Podobne Popperovo tvrdenie, že myšlienka musí byť falzifikovateľná, možno interpretovať ako prejav Bayesovho pravidla o zachovaní pravdepodobnosti; ak je výsledok X pozitívnym dôkazom teórie, potom výsledok ~X musí do určitej miery falšovať teóriu. Ak sa snažíte interpretovať X aj ~X ako „podporu“ teórie, Bayesovské pravidlá hovoria, že je to nemožné! Ak chcete zvýšiť pravdepodobnosť teórie, musíte ju podrobiť testom, ktoré môžu potenciálne znížiť jej pravdepodobnosť; nie je to len pravidlo na odhaľovanie šarlatánov vo vede, ale dôsledok Bayesovskej vety o pravdepodobnosti. Na druhej strane, Popperova myšlienka, že je potrebná iba falšovanie a nie je potrebné žiadne potvrdenie, je mylná. Bayesov teorém ukazuje, že falšovanie je v porovnaní s potvrdením veľmi silným dôkazom, ale falšovanie má stále pravdepodobnostný charakter; neriadi sa zásadne odlišnými pravidlami a nelíši sa v tomto od potvrdenia, ako tvrdí Popper.

Zisťujeme teda, že mnohé javy v kognitívnych vedách plus štatistické metódy používané vedcami, plus samotná vedecká metóda, to všetko sú špeciálne prípady Bayesovej vety. O tom je Bayesovská revolúcia.

Vitajte v Bayesianskom sprisahaní!

Literatúra o Bayesovej pravdepodobnosti

2. Nositeľ Nobelovej ceny za ekonómiu Kahneman (et al.) opisuje množstvo rôznych aplikácií Bayesa v nádhernej knihe. Len vo svojom zhrnutí tejto veľmi rozsiahlej knihy som napočítal 27 zmienok o mene presbyteriánskeho kazateľa. Minimálne vzorce. (.. veľmi sa mi to páčilo. Pravda, je to komplikované, veľa matematiky (a kde bez nej), ale jednotlivé kapitoly (napr. kapitola 4. Informácie), jednoznačne k téme. Radím každému. Aj keď matematika je ťažké pre vás, prečítajte si riadok, preskočte matematiku a lovte užitočné obilniny ...

14. (dodatok zo dňa 15.1.2017), kapitola z knihy Tonyho Crillyho. 50 nápadov, o ktorých by ste mali vedieť. Matematika.

Nositeľ Nobelovej ceny za fyziku Richard Feynman, keď hovoril o obzvlášť egoistickom filozofovi, raz povedal: „Nedráždi ma filozofia ako veda, ale pompéznosť, ktorá sa okolo nej vytvorila. Keby sa tak filozofi dokázali smiať sami sebe! Keby tak mohli povedať: "Ja hovorím, že je to takto, ale von Leipzig si myslel, že je to inak, a tiež o tom niečo vie." Keby si aspoň spomenuli objasniť, že je to len ich .

Nech sú známe ich pravdepodobnosti a zodpovedajúce podmienené pravdepodobnosti. Potom je pravdepodobnosť výskytu udalosti:

Tento vzorec sa nazýva vzorce celkovej pravdepodobnosti. V učebniciach je formulovaný teorémou, ktorej dôkaz je elementárny: podľa algebra udalostí, (udalosť sa stala a alebo sa stala udalosť a po nej prišla udalosť alebo sa stala udalosť a po nej prišla udalosť alebo …. alebo sa stala udalosť a sledovaná udalosť). Keďže hypotézy sú nezlučiteľné, a udalosť je závislá, potom podľa sčítacia veta pre pravdepodobnosti nezlučiteľných udalostí (Prvý krok) a teorém o násobení pravdepodobností závislých udalostí (druhý krok):

Pravdepodobne mnohí očakávajú obsah prvého príkladu =)

Kamkoľvek pľuješ - všade urna:

Úloha 1

Sú tam tri rovnaké urny. Prvá urna obsahuje 4 biele a 7 čiernych loptičiek, druhá urna obsahuje iba biele loptičky a tretia urna obsahuje iba čierne loptičky. Náhodne sa vyberie jedna urna a náhodne sa z nej vyžrebuje loptička. Aká je pravdepodobnosť, že táto guľa je čierna?

Riešenie: zvážte udalosť - z náhodne vybranej urny sa vyžrebuje čierna guľa. Táto udalosť môže nastať v dôsledku implementácie jednej z nasledujúcich hypotéz:
– vyberie sa 1. urna;
– vyberie sa 2. urna;
– vyberie sa 3. urna.

Keďže urna sa vyberá náhodne, výber ktorejkoľvek z troch urien rovnako možné, teda:

Všimnite si, že sa vytvárajú vyššie uvedené hypotézy celá skupina podujatí, teda podľa podmienky sa čierna guľa môže objaviť len z týchto urien a napríklad nelietať z biliardového stola. Urobme jednoduchú priebežnú kontrolu:
Dobre, poďme ďalej:

Prvá urna obsahuje 4 biele + 7 čiernych = 11 loptičiek, každá klasická definícia:
je pravdepodobnosť vytiahnutia čiernej gule poskytnutéže sa vyberie 1. urna.

Druhá urna obsahuje len biele gule, takže ak sa vyberie vzhľad čiernej gule sa stáva nemožné: .

A nakoniec, v tretej urne sú iba čierne gule, čo znamená, že zodpovedajúce podmienená pravdepodobnosť extrakcia čiernej gule bude (udalosť je istá).



je pravdepodobnosť, že z náhodne vybranej urny bude vyžrebovaná čierna guľa.

Odpoveď:

Analyzovaný príklad opäť naznačuje, aké dôležité je ROZUMIEŤ STAVU. Zoberme si rovnaké problémy s urnami a loptičkami - s ich vonkajšou podobnosťou môžu byť spôsoby riešenia úplne odlišné: niekde sa vyžaduje iba klasická definícia pravdepodobnosti, niekde udalosti nezávislý, niekde závislý, a niekde sa bavíme o hypotézach. Zároveň neexistuje jasné formálne kritérium pre výber cesty riešenia - takmer vždy si to musíte premyslieť. Ako zlepšiť svoje zručnosti? Riešime, riešime a ešte raz riešime!

Úloha 2

Na strelnici je 5 rôznych pušiek. Pravdepodobnosť zasiahnutia cieľa pre daného strelca je rovná 0,5; 0,55; 0,7; 0,75 a 0,4. Aká je pravdepodobnosť zasiahnutia cieľa, ak strelec vystrelí jeden výstrel z náhodne vybranej pušky?

Krátke riešenie a odpoveď na konci hodiny.

Vo väčšine tematických problémov nie sú hypotézy, samozrejme, rovnako pravdepodobné:

Úloha 3

V pyramíde je 5 pušiek, z ktorých tri sú vybavené optickým zameriavačom. Pravdepodobnosť, že strelec zasiahne cieľ pri streľbe z pušky s teleskopickým zameriavačom je 0,95; pre pušku bez teleskopického zameriavača je táto pravdepodobnosť 0,7. Nájdite pravdepodobnosť, že cieľ bude zasiahnutý, ak strelec vystrelí jeden výstrel z náhodne vybratej pušky.

Riešenie: v tomto probléme je počet pušiek úplne rovnaký ako v predchádzajúcom, existujú však iba dve hypotézy:
- strelec si vyberie pušku s optickým zameriavačom;
- strelec si vyberie pušku bez teleskopického zameriavača.
Autor: klasická definícia pravdepodobnosti: .
ovládanie:

Zvážte udalosť: - strelec zasiahne cieľ náhodne vybranou puškou.
Podľa podmienok: .

Podľa vzorca celkovej pravdepodobnosti:

Odpoveď: 0,85

V praxi je celkom prijateľný skrátený spôsob navrhovania úlohy, ktorý tiež poznáte:

Riešenie: podľa klasickej definície: sú pravdepodobnosti výberu pušky s a bez optického zameriavača, resp.

Podľa podmienok, – pravdepodobnosť zasiahnutia cieľa príslušnými typmi pušiek.

Podľa vzorca celkovej pravdepodobnosti:
je pravdepodobnosť, že strelec zasiahne cieľ náhodne vybranou puškou.

Odpoveď: 0,85

Nasledujúca úloha pre nezávislé riešenie:

Úloha 4

Motor pracuje v troch režimoch: normálny, nútený a voľnobeh. V nečinnom režime je pravdepodobnosť jeho zlyhania 0,05, v normálnom režime - 0,1 a v nútenom režime - 0,7. 70 % času beží motor v normálnom režime a 20 % v nútenom režime. Aká je pravdepodobnosť poruchy motora počas prevádzky?

Pre každý prípad mi dovoľte pripomenúť - na získanie pravdepodobnosti je potrebné percentá vydeliť 100. Buďte veľmi opatrní! Podľa mojich pozorovaní sa podmienky úloh pre vzorec celkovej pravdepodobnosti často pokúšajú zamieňať; a konkrétne som si vybral takýto príklad. Poviem vám tajomstvo - skoro som sa poplietla =)

Riešenie na konci hodiny (sformulované v skratke)

Problémy pre Bayesove vzorce

Materiál úzko súvisí s obsahom predchádzajúceho odseku. Nech sa udalosť stane ako výsledok implementácie jednej z hypotéz . Ako určiť pravdepodobnosť, že sa konkrétna hypotéza uskutočnila?

Za predpokladu tej udalosti už sa stalo, pravdepodobnosti hypotéz precenil podľa vzorcov, ktoré dostali meno anglického kňaza Thomasa Bayesa:


- pravdepodobnosť, že sa hypotéza uskutočnila;
- pravdepodobnosť, že sa hypotéza uskutočnila;

je pravdepodobnosť, že hypotéza bola pravdivá.

Na prvý pohľad to vyzerá ako úplná absurdita – načo prepočítavať pravdepodobnosti hypotéz, ak sú už známe? Ale v skutočnosti je rozdiel:

- to a priori(odhadom predtým testy) pravdepodobnosti.

- to a posteriori(odhadom po testy) pravdepodobnosti rovnakých hypotéz, prepočítané v súvislosti s „novoobjavenými okolnosťami“ – s prihliadnutím na skutočnosť, že príp. Stalo.

Pozrime sa na tento rozdiel na konkrétnom príklade:

Úloha 5

Do skladu boli prijaté 2 šarže produktov: prvá - 4000 kusov, druhá - 6000 kusov. Priemerné percento neštandardných produktov v prvej dávke je 20% a v druhej - 10%. Náhodne vybratý produkt zo skladu sa ukázal ako štandardný. Nájdite pravdepodobnosť, že je: a) z prvej várky, b) z druhej várky.

Prvá časť riešenia spočíva v použití vzorca celkovej pravdepodobnosti. Inými slovami, výpočty sa vykonávajú za predpokladu, že test ešte nevyrobené a udalosť "produkt sa ukázal ako štandardný" kým to nepríde.

Uvažujme o dvoch hypotézach:
- náhodne vybratý výrobok bude z 1. šarže;
- náhodne vybraný výrobok bude z 2. šarže.

Celkom: 4000 + 6000 = 10000 položiek na sklade. Podľa klasickej definície:
.

ovládanie:

Zvážte závislú udalosť: – položka náhodne vybratá zo skladu budeštandardná.

V prvej várke 100 % - 20 % = 80 % štandardných produktov, teda: poskytnutéže patrí 1. strane.

Podobne v druhej várke 100 % - 10 % = 90 % štandardných produktov a je pravdepodobnosť, že náhodne vybraná položka na sklade bude štandardnou položkou poskytnutéže patrí 2. strane.

Podľa vzorca celkovej pravdepodobnosti:
je pravdepodobnosť, že produkt vybraný náhodne zo skladu bude štandardným produktom.

Druhá časť. Predpokladajme, že náhodne vybratý produkt zo skladu sa ukázal ako štandardný. Táto fráza je priamo napísaná v podmienke a uvádza skutočnosť, že udalosť Stalo.

Podľa Bayesových vzorcov:

a) - pravdepodobnosť, že vybraný štandardný výrobok patrí do 1. šarže;

b) - pravdepodobnosť, že vybraný štandardný výrobok patrí do 2. šarže.

Po precenenie hypotézy sa samozrejme stále tvoria celá skupina:
(skúška ;-))

Odpoveď:

Pochopiť zmysel prehodnocovania hypotéz nám pomôže Ivan Vasilievič, ktorý opäť zmenil povolanie a stal sa riaditeľom závodu. Vie, že dnes 1. obchod expedoval do skladu 4000 položiek a 2. obchod - 6000 produktov, a príde sa o tom presvedčiť. Predpokladajme, že všetky produkty sú rovnakého typu a sú v rovnakej nádobe. Prirodzene, Ivan Vasiljevič už predtým počítal, že výrobok, ktorý teraz odoberie na overenie, bude s najväčšou pravdepodobnosťou vyrábať 1. dielňa a pravdepodobne aj druhá. Keď sa však vybraná položka ukáže ako štandardná, zvolá: „Aká skvelá skrutka! - vydala to skôr 2. dielňa. Pravdepodobnosť druhej hypotézy je teda nadhodnotená k lepšiemu a pravdepodobnosť prvej hypotézy je podhodnotená: . A toto preceňovanie nie je bezdôvodné – veď 2. dielňa nielenže vyrobila viac produktov, ale aj funguje 2-krát lepšie!

Hovoríte si, čistý subjektivizmus? Čiastočne - áno, navyše tlmočil sám Bayes a posteriori pravdepodobnosti ako úroveň dôvery. Nie všetko je však také jednoduché – v Bayesovskom prístupe je objektívne zrno. Koniec koncov, pravdepodobnosť, že produkt bude štandardný (0,8 a 0,9 pre 1. a 2. obchod, v tomto poradí) to predbežné(a priori) a stredná odhady. Ale filozoficky povedané, všetko plynie, všetko sa mení, vrátane pravdepodobností. Je dosť možné, že v čase štúdiaúspešnejší 2. obchod zvýšil percento štandardných produktov (a/alebo 1. obchod znížený) a ak skontrolujete viac alebo všetkých 10 tisíc položiek na sklade, potom budú nadhodnotené hodnoty oveľa bližšie k pravde.

Mimochodom, ak Ivan Vasilyevič vytiahne neštandardnú časť, potom naopak - bude „podozrievať“ prvý obchod viac a menej - druhý. Navrhujem, aby ste si to overili sami:

Úloha 6

Do skladu boli prijaté 2 šarže produktov: prvá - 4000 kusov, druhá - 6000 kusov. Priemerné percento neštandardných produktov v prvej dávke je 20%, v druhej - 10%. Ukázalo sa, že náhodne vybratý výrobok zo skladu bol nieštandardná. Nájdite pravdepodobnosť, že je: a) z prvej várky, b) z druhej várky.

Podmienka bude odlíšená dvoma písmenami, ktoré som zvýraznil tučným písmom. Problém je možné vyriešiť od začiatku alebo môžete použiť výsledky predchádzajúcich výpočtov. Vo vzorke som realizoval kompletné riešenie, ale aby som sa vyhol formálnemu prekrytiu s úlohou č. 5, event. „Náhodne vybratý produkt zo skladu bude neštandardný“ označené .

Bayesovskú schému prehodnocovania pravdepodobností nájdeme všade a tiež ju aktívne využívajú rôzne druhy podvodníkov. Zoberme si trojpísmenovú akciovú spoločnosť, ktorá sa stala familiárnou, ktorá láka vklady od obyvateľov, údajne ich niekde investuje, pravidelne vypláca dividendy atď. Čo sa deje? Deň za dňom, mesiac za mesiacom plynie a stále viac nových faktov, sprostredkovaných reklamou a ústnym podaním, len zvyšuje úroveň dôvery vo finančnú pyramídu. (zadné Bayesovské prehodnotenie v dôsledku minulých udalostí!). To znamená, že v očiach vkladateľov neustále rastie pravdepodobnosť, že "toto je seriózna kancelária"; kým pravdepodobnosť opačnej hypotézy („sú to obyčajní podvodníci“), samozrejme, klesá a klesá. Ostatné je myslím jasné. Je pozoruhodné, že získaná povesť dáva organizátorom čas úspešne sa skryť pred Ivanom Vasilyevičom, ktorý zostal nielen bez dávky skrutiek, ale aj bez nohavíc.

K nemenej zaujímavým príkladom sa vrátime o niečo neskôr, no zatiaľ je v poradí azda najbežnejší prípad s tromi hypotézami:

Úloha 7

Elektrické lampy sa vyrábajú v troch továrňach. Prvý závod vyrába 30% z celkového počtu lámp, 2. - 55% a 3. - zvyšok. Výrobky 1. závodu obsahujú 1% chybných lámp, 2. - 1,5%, 3. - 2%. Obchod dostáva produkty zo všetkých troch tovární. Lampa, ktorú som si kúpil, bola chybná. Aká je pravdepodobnosť, že ho vyrobil závod 2?

Všimnite si, že v problémoch na Bayesových vzorcoch v podmienke nevyhnutne niektoré čo sa stalo udalosť, v tomto prípade kúpa lampy.

Udalostí pribudlo a Riešenie je pohodlnejšie usporiadať v "rýchlom" štýle.

Algoritmus je úplne rovnaký: v prvom kroku zistíme pravdepodobnosť, že kúpená lampa bude bude defektný.

Pomocou počiatočných údajov preložíme percentá na pravdepodobnosti:
sú pravdepodobnosti, že lampu vyrába 1., 2. a 3. závod.
ovládanie:

Podobne: - pravdepodobnosti výroby chybnej žiarovky pre príslušné továrne.

Podľa vzorca celkovej pravdepodobnosti:

- pravdepodobnosť, že zakúpená lampa bude chybná.

Krok dva. Nechajte zakúpenú lampu chybnú (udalosť sa stala)

Podľa Bayesovho vzorca:
- pravdepodobnosť, že zakúpené chybné svietidlo vyrobila druhá továreň

Odpoveď:

Prečo sa počiatočná pravdepodobnosť 2. hypotézy po prehodnotení zvýšila? Koniec koncov, druhý závod vyrába lampy priemernej kvality (prvý je lepší, tretí je horší). Tak prečo sa zvýšil a posteriori pravdepodobnosť, že vadná lampa je z 2. továrne? To už nie je spôsobené „reputáciou“, ale veľkosťou. Keďže závod číslo 2 vyrobil najväčší počet lámp, vyčítajú mu to (aspoň subjektívne): „S najväčšou pravdepodobnosťou pochádza táto chybná lampa odtiaľ“.

Je zaujímavé poznamenať, že pravdepodobnosti 1. a 3. hypotézy boli v očakávaných smeroch nadhodnotené a zhodovali sa:

ovládanie: , ktorá mala byť overená.

Mimochodom, o podceňovaní a preceňovaní:

Úloha 8

V študentskej skupine majú 3 osoby vysokú úroveň zaškolenia, 19 ľudí priemernú úroveň a 3 osoby nízku úroveň. Pravdepodobnosť úspešného absolvovania skúšky je u týchto študentov: 0,95; 0,7 a 0,4. Je známe, že nejaký študent skúšku zložil. Aká je pravdepodobnosť, že:

a) bol veľmi dobre pripravený;
b) bol primerane pripravený;
c) bol zle pripravený.

Vykonajte výpočty a analyzujte výsledky prehodnotenia hypotéz.

Úloha je blízka realite a je prijateľná najmä pre skupinu študentov externého štúdia, kde učiteľ prakticky nepozná schopnosti toho či onoho študenta. V tomto prípade môže výsledok spôsobiť skôr neočakávané následky. (najmä na skúšky v 1. semestri). Ak má zle pripravený študent to šťastie, že dostane lístok, učiteľ ho pravdepodobne bude považovať za dobrého študenta alebo dokonca za silného študenta, čo v budúcnosti prinesie dobré dividendy. (samozrejme, musíte „zdvihnúť latku“ a zachovať si svoj imidž). Ak sa študent učil, napchával sa, opakoval 7 dní a 7 nocí, no mal jednoducho smolu, tak sa ďalšie udalosti môžu vyvinúť tým najhorším možným spôsobom – s početnými opakovaniami a balansovaním na hranici odchodu.

Netreba dodávať, že povesť je najdôležitejší kapitál, nie je náhoda, že mnohé korporácie nesú mená svojich otcov zakladateľov, ktorí viedli biznis pred 100-200 rokmi a preslávili sa svojou bezchybnou povesťou.

Áno, Bayesovský prístup je do určitej miery subjektívny, ale ... tak to v živote chodí!

Skonsolidujme materiál s konečným priemyselným príkladom, v ktorom budem hovoriť o technických jemnostiach riešenia, s ktorými sa ešte nestretli:

Úloha 9

Tri dielne závodu vyrábajú diely rovnakého typu, ktoré sa montujú do spoločného kontajnera. Je známe, že prvý obchod vyrába 2-krát viac dielov ako druhý a 4-krát viac ako tretí obchod. V prvej dielni je chyba 12%, v druhej - 8%, v tretej - 4%. Na kontrolu sa odoberie jedna časť z nádoby. Aká je pravdepodobnosť, že bude vadný? Aká je pravdepodobnosť, že vyťažený chybný diel vyrobila 3. dielňa?

Taki Ivan Vasilievič je opäť na koni =) Film musí mať šťastný koniec =)

Riešenie: na rozdiel od úloh č. 5-8 je tu vyslovene položená otázka, ktorá je riešená pomocou vzorca celkovej pravdepodobnosti. Ale na druhej strane, podmienka je trochu „zašifrovaná“ a školská zručnosť skladať najjednoduchšie rovnice nám pomôže vyriešiť tento rébus. Pre "x" je vhodné vziať najmenšiu hodnotu:

Nech je podiel dielov vyrobených v tretej dielni.

Prvá dielňa podľa podmienky vyrába 4x viac ako tretia dielňa, takže podiel 1. dielne je .

Navyše, prvá dielňa vyrába 2-krát viac produktov ako druhá dielňa, čo znamená, že podiel druhej dielne: .

Zostavme a vyriešme rovnicu:

Teda: - pravdepodobnosti, že časť vybratú z kontajnera uvoľnila 1., 2. a 3. dielňa, resp.

Ovládanie: . Okrem toho nebude zbytočné znova sa pozrieť na frázu „Je známe, že prvá dielňa vyrába 2-krát viac produktov ako druhá dielňa a 4-krát viac ako tretia dielňa“ a uistite sa, že získané pravdepodobnosti skutočne zodpovedajú tejto podmienke.

Za "X" bolo spočiatku možné zobrať podiel 1. alebo podiel 2. obchodu - pravdepodobnosti vyjdú rovnako. Ale tak či onak, najťažší úsek prešiel a riešenie je na dobrej ceste:

Z podmienky zistíme:
- pravdepodobnosť výroby chybného dielu pre príslušné dielne.

Podľa vzorca celkovej pravdepodobnosti:
je pravdepodobnosť, že časť náhodne extrahovaná z kontajnera bude neštandardná.

Otázka druhá: aká je pravdepodobnosť, že vyťažený chybný diel vyrobil 3. obchod? Táto otázka predpokladá, že diel už bol odstránený a zistilo sa, že je chybný. Prehodnotíme hypotézu pomocou Bayesovho vzorca:
je požadovaná pravdepodobnosť. Celkom očakávané – veď tretia dielňa produkuje nielen najmenší podiel dielov, ale vedie aj v kvalite!

V tomto prípade som musel zjednodušiť štvorposchodový zlomok, čo sa pri problémoch na Bayesových vzorcoch musí robiť pomerne často. Ale pre túto lekciu som akosi náhodou zobral príklady, v ktorých sa mnohé výpočty dajú robiť bez obyčajných zlomkov.

Keďže v podmienke nie sú žiadne body „a“ ​​a „be“, je lepšie uviesť odpoveď s textovými komentármi:

Odpoveď: - pravdepodobnosť, že časť vybratá z kontajnera bude chybná; - pravdepodobnosť, že vytiahnutý chybný diel uvoľnila 3. dielňa.

Ako vidíte, problémy vo vzorci celkovej pravdepodobnosti a Bayesových vzorcoch sú pomerne jednoduché a pravdepodobne z tohto dôvodu sa tak často snažia skomplikovať stav, ktorý som už spomenul na začiatku článku.

Ďalšie príklady sú v súbore s hotové riešenia pre F.P.V. a Bayesove vzorce, navyše sa zrejme nájdu takí, ktorí sa chcú s touto témou hlbšie oboznámiť v iných zdrojoch. A téma je naozaj veľmi zaujímavá - čo stojí za to sám Bayesov paradox, ktorý zdôvodňuje každodennú radu, že ak je človeku diagnostikované zriedkavé ochorenie, má zmysel, aby mu urobil druhé a dokonca aj dve opakované nezávislé vyšetrenia. Zdalo by sa, že to robia výlučne zo zúfalstva... - ale nie! Nehovorme však o smutných veciach.


je pravdepodobnosť, že náhodne vybraný študent skúšku zloží.
Nechajte študenta absolvovať skúšku. Podľa Bayesových vzorcov:
a) - pravdepodobnosť, že študent, ktorý zložil skúšku, bol veľmi dobre pripravený. Objektívna počiatočná pravdepodobnosť je nadhodnotená, keďže takmer vždy má nejaký „priemer“ šťastie na otázky a odpovedá veľmi silno, čo vyvoláva mylný dojem bezchybnej prípravy.
b) je pravdepodobnosť, že študent, ktorý zložil skúšku, bol primerane pripravený. Počiatočná pravdepodobnosť sa ukazuje ako mierne nadhodnotená, pretože študentov s priemernou úrovňou prípravy je väčšinou väčšina, navyše sem učiteľ zaradí neúspešne zodpovedané „skvelí študenti“ a občas slabo prospievajúceho študenta, ktorý mal veľké šťastie na lístok.
v) - pravdepodobnosť, že študent, ktorý zložil skúšku, bol zle pripravený. Pôvodná pravdepodobnosť bola nadhodnotená k horšiemu. Niet sa čomu čudovať.
Vyšetrenie:
Odpoveď :

Formulujte a dokážte vzorec pre celkovú pravdepodobnosť. Uveďte príklad jeho aplikácie.

Ak sú udalosti H 1, H 2, ..., H n párovo nekompatibilné a pri každom teste nevyhnutne nastane aspoň jedna z týchto udalostí, potom pre každú udalosť A platí rovnosť:

P(A)= P H1 (A)P(H 1)+ P H2 (A)P(H 2)+…+ P Hn (A)P(H n) – vzorec celkovej pravdepodobnosti. V tomto prípade sa H 1, H 2, …, Hn nazývajú hypotézy.

dôkaz: Udalosť A sa delí na varianty: AH 1 , AH 2 , …, AH n . (A prichádza spolu s H 1 atď.) Inými slovami, máme A \u003d AH 1 + AH 2 + ... + AH n. Pretože H 1 , H 2 , …, Hn sú párovo nekompatibilné, udalosti AH 1 , AH 2, …, AH n sú tiež nekompatibilné. Použitím pravidla sčítania nájdeme: P (A) \u003d P (AH 1) + P (AH 2) + ... + P (AH n). Nahradením každého člena P(AH i) na pravej strane súčinom P Hi (A)P(H i) získame požadovanú rovnosť.

Príklad:

Povedzme, že máme dve sady častí. Pravdepodobnosť, že časť prvého súboru je štandardná, je 0,8 a druhá je 0,9. Nájdite pravdepodobnosť, že náhodne vybratá časť je štandardná.

P(A) \u003d 0,5 * 0,8 + 0,5 * 0,9 \u003d 0,85.

Formulujte a dokážte Bayesov vzorec. Uveďte príklad jeho aplikácie.

Bayesov vzorec:

Umožňuje vám nadhodnotiť pravdepodobnosti hypotéz po tom, čo sa výsledok testu stane známym, v dôsledku čoho sa objavila udalosť A.

dôkaz: Nech udalosť A môže nastať za podmienky výskytu jedného z nezlučiteľných javov H 1 , H 2 , …, H n , tvoriacich kompletnú skupinu. Keďže nie je vopred známe, ktorá z týchto udalostí nastane, nazývajú sa hypotézy.

Pravdepodobnosť výskytu udalosti A je určená vzorcom celkovej pravdepodobnosti:

P(A)= PH1 (A)P(H 1)+ PH2 (A)P(H 2)+…+ PHn (A)P(H n) (1)

Predpokladajme, že bol vykonaný test, v dôsledku ktorého nastala udalosť A. Určme, ako sa zmenili pravdepodobnosti hypotéz v dôsledku skutočnosti, že udalosť A už nastala. Inými slovami, budeme hľadať podmienené pravdepodobnosti

PA (H1), PA (H2), ..., PA (Hn).

Podľa vety o násobení máme:

P (AH i) \u003d P (A) P A (Hi) \u003d P (H i) P Hi (A)

Nahradime tu P(A) vzorcom (1), dostaneme

Príklad:

Existujú tri rovnaké krabice. V prvom boxe je n=12 bielych loptičiek, v druhom boxe je m=4 bielych a n-m=8 čiernych loptičiek, v treťom boxe je n=12 čiernych loptičiek. Z náhodne vybratého boxu sa vyžrebuje biela guľa. Nájdite pravdepodobnosť P, že lopta je vytiahnutá z druhého poľa.

Riešenie.

4) Odvoďte vzorec pre pravdepodobnosťkúspech v seriálintesty podľa Bernoulliho schémy.

Vyšetrujeme prípad, kedy n identické a nezávislé experimenty, z ktorých každý má len 2 výsledky ( A;). Tie. niektoré skúsenosti sa opakujú nčasy a pri každej skúsenosti nejaká udalosť A sa môže objaviť s pravdepodobnosťou P(A)=q alebo sa s pravdepodobnosťou neobjaví P()=q-l=p .

Priestor elementárnych udalostí každej testovacej série obsahuje body alebo postupnosti symbolov A a . Takýto pravdepodobnostný priestor sa nazýva Bernoulliho schéma. Úlohou je, pre toto k nájsť pravdepodobnosť, že n- opakované opakovanie zážitkovej udalosti A príde k raz.

Pre lepšiu prehľadnosť sa dohodnime na každom výskyte udalosti A považovaný za úspech A - ako zlyhanie. Naším cieľom je nájsť pravdepodobnosť, že n presne experimentuje k bude úspešný; Označme túto udalosť dočasne podľa b.

Udalosť V reprezentovaný ako súčet série udalostí - možností udalostí V. Ak chcete opraviť určitý variant, musíte uviesť počet experimentov, ktoré sa skončili úspechom. Jednou z možností je napríklad

. Počet všetkých možností je samozrejme , a pravdepodobnosť každej možnosti je vzhľadom na nezávislosť experimentov . Preto pravdepodobnosť udalosti V rovná sa . Na zdôraznenie závislosti výsledného výrazu na n a k, označme to . takze .

5) Pomocou integrálneho približného Laplaceovho vzorca odvodzujte vzorec na odhad odchýlky relatívnej frekvencie udalosti A od pravdepodobnosti p výskytu udalosti A v jednom experimente.

V podmienkach Bernoulliho schémy s danými hodnotami n a p pre dané e>0 odhadujeme pravdepodobnosť udalosti , kde k je počet úspechov v n experimentoch. Táto nerovnosť je ekvivalentná |k-np|£en, t.j. -sk £ k-np £ en alebo np-sk £ k £ np+sk. Hovoríme teda o získaní odhadu pravdepodobnosti udalosti k 1 £ k £ k 2, kde k 1 = np-en, k 2 = np+en. Použitím integrálneho približného Laplaceovho vzorca dostaneme: P( » . Ak vezmeme do úvahy nepárnosť Laplaceovej funkcie, dostaneme približnú rovnosť P( » 2Ф .

Poznámka : pretože pomocou podmienky n=1, potom dosadíme 1 za n a dostaneme konečnú odpoveď.

6) Nechajte X je diskrétna náhodná premenná, ktorá má iba nezáporné hodnoty a má matematické očakávania m. Dokáž to P(X≥ 4) ≤ m/ 4 .

m= (keďže 1. člen je kladný, potom ak sa odstráni, bude menej) ³ (nahradiť a o 4, bude to len menej) ³ = = 4x P(X³4). Odtiaľ P(X≥ 4) ≤ m/ 4 .

(Namiesto 4 môže byť ľubovoľné číslo).

7) Dokážte, že ak X a Y sú nezávislé diskrétne náhodné premenné, ktoré nadobúdajú konečný súbor hodnôt M(XY)=M(X)M(Y)

x 1 x2
p1 p2

zavolal na číslo M(XY)= x 1 p 1 + x 2 p 2 + ...

Ak náhodné premenné X a Y sú nezávislé, potom sa matematické očakávanie ich súčinu rovná súčinu ich matematických očakávaní (teorém o násobení matematických očakávaní).

dôkaz: Možné hodnoty X označovať x1, x2,…, možné hodnoty Y - y 1 , y 2, ... a pij =P(X=xi, Y=yj). XY M(XY)= Vzhľadom na nezávislosť veličín X a Y máme: P(X= xi, Y=yj)= P(X=xi) P(Y=yj). Označenie P(X=xi)=ri, P(Y=yj)=sj, túto rovnosť prepíšeme do tvaru p ij =r i s j

Touto cestou, M(XY)= = . Transformáciou výslednej rovnosti odvodíme: M(XY)=()() = M(X)M(Y), Q.E.D.

8) Dokážte, že ak X a Y sú diskrétne náhodné premenné, ktoré nadobúdajú konečný súbor hodnôt M(X+Y) = M(X) +M(Y).

Matematické očakávanie diskrétnej náhodnej premennej so zákonom o rozdelení

x 1 x2
p1 p2

zavolal na číslo M(XY)= x 1 p 1 + x 2 p 2 + ...

Matematické očakávanie súčtu dvoch náhodných premenných sa rovná súčtu matematických očakávaní členov: M(X+Y)= M(X)+M(Y).

dôkaz: Možné hodnoty X označovať x1, x2,…, možné hodnoty Y - y 1 , y 2, ... a pij =P(X=xi, Y=yj). Zákon distribúcie veľkosti X + Y budú vyjadrené v príslušnej tabuľke. M(X+Y)= .Tento vzorec možno prepísať takto: M(X+Y)= .Prvý súčet pravej strany môže byť reprezentovaný ako . Výraz je pravdepodobnosť, že nastane niektorá z udalostí (X=x i , Y=y 1), (X=x i , Y=y 2), … Preto sa tento výraz rovná P(X=x i). Odtiaľ . podobne, . Výsledkom je: M(X+Y)= M(X)+M(Y), čo sa malo dokázať.

9) Nechajte X je diskrétna náhodná premenná rozdelená podľa zákona binomického rozdelenia s parametrami n a R. Dokáž to M(X) = np, D(X)=np(1-p).

Nech sa vyrába n nezávislé pokusy, v každom z ktorých sa udalosť A môže vyskytnúť s pravdepodobnosťou R, teda pravdepodobnosť opačnej udalosti Ā rovná sa q = 1-p. Považujte sl. hodnotu X- počet výskytov udalosti A v n experimenty. Predstavme si X ako súčet indikátorov udalosti A pre každý pokus: X \u003d X 1 + X 2 + ... + X n. Teraz to dokážme M(Xi)=p, D(Xi)=np. K tomu zvážte distribučný zákon cl. hodnoty, čo vyzerá takto:

X
R R q

To je zrejmé M(X) = p, náhodná premenná X 2 má teda rovnaký distribučný zákon D (X) \u003d M (X 2) -M 2 (X) \u003d p-p 2 \u003d p (1-p) \u003d pq. Touto cestou, M(Xi)=p, D(Xi)=pq. Podľa vety o sčítaní matematických očakávaní M(X)=M(Xi)+..+M(Xn)=np. Keďže náhodné premenné Х i sú nezávislé, potom sa odchýlky tiež sčítajú: D(X)=D(Xi)+...+D(Xn)=npq=np(l-p).

10) Nechajte X je diskrétna náhodná premenná rozdelená podľa Poissonovho zákona s parametrom λ. Dokáž to M(X) = λ .

Poissonov zákon je daný tabuľkou:

Preto máme:

Parameter λ, ktorý charakterizuje dané Poissonovo rozdelenie, teda nie je nič iné ako matematické očakávanie hodnoty X.

11) Nech X je diskrétna náhodná premenná rozdelená podľa geometrického zákona s parametrom p. Dokážte, že M (X) = .

Zákon geometrického rozdelenia je spojený so sekvenciou Bernoulliho pokusov až po 1. úspešnú udalosť A. Pravdepodobnosť výskytu udalosti A v jednom pokuse sa rovná p, opačná udalosť je q = 1-p. Distribučný zákon náhodnej premennej X - počet pokusov má tvar:

X n
R R pq pq n-1

Rad zapísaný v zátvorkách sa získa diferenciáciou geometrickej postupnosti člen po členoch

Preto, .

12) Dokážte, že korelačný koeficient náhodných premenných X a Y spĺňa podmienku .

Definícia: Korelačný koeficient dvoch náhodných premenných je pomer ich kovariancie k súčinu štandardných odchýlok týchto premenných: . .

dôkaz: Uvažujme náhodnú premennú Z =. Vypočítajme jeho rozptyl. Keďže ľavá strana je nezáporná, pravá strana je nezáporná. Preto , |ρ|≤1.

13) Ako sa vypočíta rozptyl v prípade spojitého rozdelenia s hustotou f(X)? Dokážte to pre náhodnú premennú X s hustotou disperzia D(X) neexistuje a matematické očakávanie M(X) existuje.

Rozptyl absolútne spojitej náhodnej premennej X s funkciou hustoty f(x) a matematickým očakávaním m = M(X) je určený rovnakou rovnosťou ako pre diskrétnu premennú

.

V prípade, že absolútne spojitá náhodná premenná X je sústredená na intervale,

∞ - integrál diverguje, preto disperzia neexistuje.

14) Dokážte, že pre normálnu náhodnú premennú X s funkciou hustoty rozdelenia matematické očakávanie М(Х) = μ.

Dokážme, že μ je matematické očakávanie.

Podľa definície matematického očakávania spojitej r.v.

Predstavme si novú premennú . Odtiaľ. Ak vezmeme do úvahy, že nové limity integrácie sa rovnajú starým, získame

Prvý z členov sa rovná nule kvôli nepárnosti integrandu. Druhým z pojmov je μ (Poissonov integrál ).

takze M(X) = μ, t.j. matematické očakávanie normálneho rozdelenia sa rovná parametru μ.

15) Dokážte, že pre normálnu náhodnú premennú X s funkciou hustoty rozdelenia disperzia D(X) = σ2.

Vzorec popisuje hustotu normálneho rozdelenia pravdepodobnosti spojitej r.v.

Dokážme, že ide o smerodajnú odchýlku normálneho rozdelenia. Predstavme si novú premennú z=(х-μ)/. Odtiaľ . Berúc do úvahy, že nové limity integrácie sa rovnajú starým, dostaneme Integrovanie podľa častí, nastavenie u=z, nájdeme Preto, .Takže smerodajná odchýlka normálneho rozdelenia sa rovná parametru .

16) Dokážte, že pre spojitú náhodnú premennú distribuovanú podľa exponenciálneho zákona s parametrom , je matematické očakávanie .

Hovorí sa, že náhodná premenná X, ktorá nadobúda iba nezáporné hodnoty, je rozdelená podľa exponenciálneho zákona, ak pre nejaký kladný parameter λ>0 má funkcia hustoty tvar:

Na nájdenie matematického očakávania použijeme vzorec

Bayesov vzorec

Bayesova veta- jedna z hlavných teorémov elementárnej teórie pravdepodobnosti, ktorá určuje pravdepodobnosť udalosti vyskytujúcej sa za podmienok, keď sú na základe pozorovaní známe len niektoré čiastkové informácie o udalostiach. Podľa Bayesovho vzorca je možné presnejšie prepočítať pravdepodobnosť s prihliadnutím na predtým známe informácie aj údaje z nových pozorovaní.

"Fyzický význam" a terminológia

Bayesov vzorec vám umožňuje „preusporiadať príčinu a následok“: vzhľadom na známu skutočnosť udalosti vypočítajte pravdepodobnosť, že bola spôsobená danou príčinou.

Udalosti odrážajúce pôsobenie „príčin“ sa v tomto prípade zvyčajne nazývajú hypotéz, pretože oni sú údajný udalosti, ktoré k tomu viedli. Bezpodmienečná pravdepodobnosť platnosti hypotézy sa nazýva a priori(Aká je pravdepodobná príčina? všeobecne), a podmienečné – berúc do úvahy skutočnosť udalosti – a posteriori(Aká je pravdepodobná príčina? sa ukázalo, že berie do úvahy údaje o udalosti).

Dôsledok

Dôležitým dôsledkom Bayesovho vzorca je vzorec pre celkovú pravdepodobnosť udalosti v závislosti od niekoľko nekonzistentné hypotézy ( a len od nich!).

- pravdepodobnosť výskytu udalosti B v závislosti od množstva hypotéz A i ak sú známe stupne spoľahlivosti týchto hypotéz (napríklad merané experimentálne);

Odvodenie vzorca

Ak udalosť závisí len od príčin A i, tak ak sa to stalo, znamená to, že niektorý z dôvodov sa nutne stal, t.j.

Podľa Bayesovho vzorca

prevod P(B) vpravo, získame požadovaný výraz.

Metóda filtrovania spamu

Metóda založená na Bayesovej vete bola úspešne použitá pri filtrovaní spamu.

Popis

Pri trénovaní filtra sa pre každé slovo vyskytujúce sa v písmenách vypočíta a uloží jeho „váha“ - pravdepodobnosť, že písmeno s týmto slovom je spam (v najjednoduchšom prípade podľa klasickej definície pravdepodobnosti: „vyskytuje sa v spame / vzhľad všetkého“).

Pri kontrole novoprijatého listu sa pravdepodobnosť, že ide o spam, vypočíta podľa vyššie uvedeného vzorca pre súbor hypotéz. V tomto prípade sú „hypotézy“ slová a pre každé slovo „spoľahlivosť hypotézy“ - % tohto slova v písmene a „závislosť udalosti od hypotézy“ P(B | A i) - predtým vypočítaná "váha" slova. To znamená, že „váha“ písmena v tomto prípade nie je nič iné ako priemerná „váha“ všetkých jeho slov.

List je klasifikovaný ako "spam" alebo "non-spam" podľa toho, či jeho "váha" presahuje určitú hranicu nastavenú používateľom (zvyčajne zaberá 60-80%). Po rozhodnutí o písmene sa v databáze aktualizujú „váhy“ slov, ktoré obsahuje.

Charakteristický

Táto metóda je jednoduchá (algoritmy sú elementárne), pohodlná (umožní vám zaobísť sa bez „čiernych zoznamov“ a podobných umelých trikov), účinná (po natrénovaní na dostatočne veľkej vzorke odreže až 95 – 97 % spamu a v prípade akýchkoľvek chýb môže byť ďalej trénovaný). Vo všeobecnosti existujú všetky náznaky jeho širokého používania, čo sa v praxi deje - takmer všetky moderné spamové filtre sú postavené na jeho základe.

Metóda má však aj zásadnú nevýhodu: je na základe predpokladu, čo niektoré slová sú bežnejšie v spame, zatiaľ čo iné sú bežnejšie v bežných e-mailoch a je neefektívny, ak je tento predpoklad nepravdivý. Ako však ukazuje prax, ani človek nie je schopný určiť takýto spam "od oka" - až po prečítaní listu a pochopení jeho významu.

Ďalšia, nie zásadná, nevýhoda spojená s implementáciou – metóda pracuje len s textom. Spameri, ktorí o tomto obmedzení vedeli, začali do obrázka vkladať reklamné informácie, pričom text v liste buď chýba, alebo nedáva zmysel. Proti tomu treba použiť buď nástroje na rozpoznávanie textu ("drahý" postup, ktorý sa používa len v nevyhnutných prípadoch), alebo staré metódy filtrovania - "čierne listiny" a regulárne výrazy (keďže takéto písmená majú často stereotypnú formu).

pozri tiež

Poznámky

Odkazy

Literatúra

  • Byrd Kiwi. Bayesova veta. // Časopis Computerra, 24. august 2001
  • Paul Graham. Plán pre spam. // Osobná stránka Paula Grahama.

Nadácia Wikimedia. 2010.

Pozrite sa, čo je "Bayesov vzorec" v iných slovníkoch:

    Vzorec, ktorý vyzerá takto: kde a1, A2, ..., An sú nezlučiteľné udalosti, Všeobecná schéma na aplikáciu F. v. napr.: ak udalosť B môže nastať v dekomp. podmienky, za ktorých sa vytvorí n hypotéz A1, A2, ..., An s pravdepodobnosťami P (A1), ... známymi pred experimentom, ... ... Geologická encyklopédia

    Umožňuje vypočítať pravdepodobnosť udalosti záujmu prostredníctvom podmienených pravdepodobností tejto udalosti za predpokladu určitých hypotéz, ako aj pravdepodobnosti týchto hypotéz. Formulácia Nech je daný priestor pravdepodobnosti a úplná skupina v pároch ... ... Wikipedia

    Umožňuje vypočítať pravdepodobnosť udalosti záujmu prostredníctvom podmienených pravdepodobností tejto udalosti za predpokladu určitých hypotéz, ako aj pravdepodobnosti týchto hypotéz. Formulácia Nech je daný priestor pravdepodobnosti a úplná skupina udalostí, ako ... ... Wikipedia

    - (alebo Bayesov vzorec) je jednou z hlavných teorémov teórie pravdepodobnosti, ktorá umožňuje určiť pravdepodobnosť, že udalosť (hypotéza) nastala za prítomnosti iba nepriamych dôkazov (údajov), ktoré môžu byť nepresné ... Wikipedia

    Bayesova veta je jednou z hlavných teorémov elementárnej teórie pravdepodobnosti, ktorá určuje pravdepodobnosť udalosti, ktorá nastane za podmienok, keď sú na základe pozorovaní známe len niektoré čiastkové informácie o udalostiach. Podľa Bayesovho vzorca môžete ... ... Wikipedia

    Bayes, Thomas Thomas Bayes Reverend Thomas Bayes Dátum narodenia: 1702 (1702) Miesto narodenia ... Wikipedia

    Thomas Bayes Reverend Thomas Bayes Dátum narodenia: 1702 (1702) Miesto narodenia: Londýn ... Wikipedia

    Bayesovská inferencia je jednou z metód štatistickej inferencie, v ktorej sa Bayesov vzorec používa na spresnenie pravdepodobnostných odhadov pravdivosti hypotéz, keď prídu dôkazy. Použitie Bayesovskej aktualizácie je obzvlášť dôležité v ... ... Wikipédii

    Chceli by ste vylepšiť tento článok?: Nájdite a poskytnite poznámky pod čiarou pre odkazy na dôveryhodné zdroje, ktoré potvrdzujú to, čo bolo napísané. Uveďte poznámky pod čiarou a uveďte presnejšie zdroje. Pere ... Wikipedia

    Zradia sa väzni navzájom, sledujúc svoje sebecké záujmy, alebo budú mlčať, čím sa skráti celkový čas? Prisoner's dilemma (angl. Prisoner's dilemma, názov „dilema“ sa používa menej ... Wikipedia

knihy

  • Teória pravdepodobnosti a matematická štatistika v problémoch: Viac ako 360 problémov a cvičení, Borzykh D. Navrhovaný manuál obsahuje problémy rôznych úrovní zložitosti. Hlavný dôraz sa však kladie na úlohy strednej zložitosti. Toto sa robí zámerne s cieľom povzbudiť študentov, aby…

Pri odvodzovaní vzorca celkovej pravdepodobnosti sa predpokladalo, že udalosť A, ktorej pravdepodobnosť mala byť určená, sa mohla stať jednej z udalostí H 1 , N 2 , ... , H n, ktoré tvoria ucelenú skupinu párovo nekompatibilných udalostí. Pravdepodobnosti týchto udalostí (hypotézy) boli vopred známe. Predpokladajme, že bol vykonaný experiment, v dôsledku ktorého došlo k udalosti A Prišiel. Tieto dodatočné informácie nám umožňujú prehodnotiť pravdepodobnosti hypotéz Ahoj , s vypočítaným P(Hj/A).

alebo pomocou vzorca celkovej pravdepodobnosti dostaneme

Tento vzorec sa nazýva Bayesov vzorec alebo hypotéza. Bayesov vzorec vám umožňuje „revidovať“ pravdepodobnosti hypotéz po tom, čo bude známy výsledok experimentu, v dôsledku ktorého sa udalosť objavila. A.

Pravdepodobnosti Р(Н i) sú apriórne pravdepodobnosti hypotéz (boli vypočítané pred experimentom). Pravdepodobnosti P(H i /A) sú aposteriórne pravdepodobnosti hypotéz (sú vypočítané po experimente). Bayesov vzorec vám umožňuje vypočítať zadné pravdepodobnosti z ich predchádzajúcich pravdepodobností a z podmienených pravdepodobností udalosti. A.

Príklad. Je známe, že 5 % všetkých mužov a 0,25 % všetkých žien je farboslepých. Náhodne vybraná osoba podľa čísla zdravotného preukazu trpí farbosleposťou. Aká je pravdepodobnosť, že ide o muža?

Riešenie. Udalosť A Osoba je farboslepá. Priestor elementárnych dejov pre experiment - osoba je vybraná podľa čísla zdravotnej karty - Ω = ( H 1 , N 2 ) pozostáva z 2 udalostí:

H 1 - je vybraný muž,

H 2 - vyberie sa žena.

Tieto udalosti možno zvoliť ako hypotézy.

Podľa stavu problému (náhodný výber) sú pravdepodobnosti týchto udalostí rovnaké a rovnaké P(H 1 ) = 0.5; P(H 2 ) = 0.5.

V tomto prípade sú podmienené pravdepodobnosti, že osoba trpí farbosleposťou, rovnaké:

P(A/N 1 ) = 0.05 = 1/20; P(A/N 2 ) = 0.0025 = 1/400.

Keďže je známe, že vybraná osoba je farboslepá, t. j. udalosť nastala, na prehodnotenie prvej hypotézy použijeme Bayesov vzorec:

Príklad. Existujú tri rovnaké krabice. Prvý box obsahuje 20 bielych guľôčok, druhý box obsahuje 10 bielych a 10 čiernych guľôčok a tretí box obsahuje 20 čiernych guľôčok. Z náhodne vybratého boxu sa vyžrebuje biela guľa. Vypočítajte pravdepodobnosť, že loptičku vytiahnete z prvého políčka.

Riešenie. Označiť podľa A udalosť - vzhľad bielej gule. O výbere krabice možno urobiť tri predpoklady (hypotézy): H 1 ,H 2 , H 3 - výber prvého, druhého a tretieho políčka.

Keďže výber ktoréhokoľvek z políčok je rovnako možný, pravdepodobnosti hypotéz sú rovnaké:

P(H 1 ) = P (H 2 ) = P (H 3 )= 1/3.

Podľa stavu problému pravdepodobnosť vytiahnutia bielej gule z prvého poľa

Pravdepodobnosť vytiahnutia bielej gule z druhého poľa



Pravdepodobnosť vytiahnutia bielej gule z tretieho poľa

Požadovanú pravdepodobnosť nájdeme pomocou Bayesovho vzorca:

Opakovanie testov. Bernoulliho vzorec.

Existuje n pokusov, v každom z nich udalosť A môže alebo nemusí nastať a pravdepodobnosť udalosti A v každom jednotlivom pokuse je konštantná, t.j. nemení zo skúsenosti na skúsenosť. Už vieme, ako zistiť pravdepodobnosť udalosti A v jednom experimente.

Osobitne zaujímavá je pravdepodobnosť výskytu určitého počtu (m-krát) udalosti A v n experimentoch. takéto problémy sa dajú ľahko vyriešiť, ak sú testy nezávislé.

Def. Niekoľko testov je tzv nezávislý vo vzťahu k udalosti A ak pravdepodobnosť udalosti A v každom z nich nezávisí od výsledkov iných experimentov.

Pravdepodobnosť P n (m) výskytu javu A presne m-krát (nevýskyt n-m-krát, udalosť ) v týchto n pokusoch. Udalosť A sa objavuje v rôznych sekvenciách m-krát).

- Bernoulliho vzorec.

Nasledujúce vzorce sú zrejmé:

P n (m menej k-krát v n pokusoch.

P n (m>k) = P n (k+1) + P n (k+2) +…+ P n (n) - pravdepodobnosť výskytu udalosti A viac k-krát v n pokusoch.