Trend dan trend fesyen.  Aksesori, kasut, kecantikan, gaya rambut

Trend dan trend fesyen. Aksesori, kasut, kecantikan, gaya rambut

» Formula kebarangkalian Jumlah Bayes. Penjelasan ringkas tentang teorem Bayes

Formula kebarangkalian Jumlah Bayes. Penjelasan ringkas tentang teorem Bayes

Siapa Bayes? dan apa kaitannya dengan pengurusan? - soalan yang benar-benar adil mungkin menyusul. Buat masa ini, ambil kata saya: ini sangat penting!.. dan menarik (sekurang-kurangnya kepada saya).

Apakah paradigma di mana kebanyakan pengurus beroperasi: Jika saya memerhati sesuatu, apakah kesimpulan yang boleh saya buat daripadanya? Apa yang Bayes ajar: apa yang mesti ada untuk saya memerhati sesuatu ini? Beginilah cara semua sains berkembang, dan dia menulis tentang ini (saya petik dari ingatan): seseorang yang tidak mempunyai teori dalam kepalanya akan menjauhkan diri dari satu idea ke idea lain di bawah pengaruh pelbagai peristiwa (pemerhatian). Ia bukan untuk apa-apa yang mereka katakan: tidak ada yang lebih praktikal daripada teori yang baik.

Contoh dari amalan. Orang bawahan saya membuat kesilapan, dan rakan sekerja saya (ketua jabatan lain) mengatakan bahawa adalah perlu untuk memberi pengaruh pengurusan terhadap pekerja yang cuai (dengan kata lain, menghukum/memarahi). Dan saya tahu bahawa pekerja ini melakukan 4–5 ribu jenis operasi yang sama setiap bulan, dan pada masa ini tidak membuat lebih daripada 10 kesilapan. Adakah anda merasakan perbezaan paradigma? Rakan sekerja saya bertindak balas terhadap pemerhatian, dan saya mempunyai pengetahuan priori bahawa pekerja melakukan beberapa kesilapan, jadi satu lagi tidak menjejaskan pengetahuan ini ... Sekarang, jika pada akhir bulan ternyata ada, sebagai contoh, 15 kesilapan sedemikian!.. Ini sudah menjadi alasan untuk mengkaji sebab-sebab ketidakpatuhan piawaian.

Yakin dengan kepentingan pendekatan Bayesian? Tertarik? Harap begitu". Dan kini lalat dalam salap. Malangnya, idea Bayesian jarang diberikan dengan segera. Saya terus terang tidak bernasib baik, kerana saya mengenali idea-idea ini melalui kesusasteraan popular, selepas membaca banyak soalan yang tinggal. Semasa merancang untuk menulis nota, saya mengumpul semua yang saya ambil nota tentang Bayes sebelum ini, dan juga mengkaji apa yang ditulis di Internet. Saya sampaikan kepada anda tekaan terbaik saya mengenai topik ini. Pengenalan kepada Kebarangkalian Bayesian.

Terbitan teorem Bayes

Pertimbangkan percubaan berikut: kami menamakan sebarang nombor yang terletak pada segmen dan merekodkan apabila nombor ini, contohnya, antara 0.1 dan 0.4 (Rajah 1a). Kebarangkalian peristiwa ini adalah sama dengan nisbah panjang segmen kepada jumlah panjang segmen, dengan syarat penampilan nombor pada segmen sama-sama berkemungkinan. Secara matematik ini boleh ditulis hlm(0,1 <= x <= 0,4) = 0,3, или кратко R(X) = 0.3, di mana R- kebarangkalian, X– pembolehubah rawak dalam julat, X– pembolehubah rawak dalam julat . Iaitu, kebarangkalian untuk memukul segmen ialah 30%.

nasi. 1. Tafsiran grafik kebarangkalian

Sekarang pertimbangkan kuasa dua x (Rajah 1b). Katakan kita perlu menamakan pasangan nombor ( x, y), setiap satunya lebih besar daripada sifar dan kurang daripada satu. Kebarangkalian itu x(nombor pertama) akan berada di dalam segmen (kawasan biru 1), sama dengan nisbah luas kawasan biru kepada luas keseluruhan persegi, iaitu (0.4 – 0.1) * (1 – 0 ) / (1 * 1) = 0, 3, iaitu 30% yang sama. Kebarangkalian itu y terletak di dalam segmen (kawasan hijau 2) adalah sama dengan nisbah luas kawasan hijau dengan luas keseluruhan persegi hlm(0,5 <= y <= 0,7) = 0,2, или кратко R(Y) = 0,2.

Apa yang boleh anda pelajari tentang nilai pada masa yang sama? x Dan y. Sebagai contoh, apakah kebarangkalian bahawa pada masa yang sama x Dan y berada dalam segmen yang diberikan sepadan? Untuk melakukan ini, anda perlu mengira nisbah kawasan kawasan 3 (persimpangan jalur hijau dan biru) dengan luas keseluruhan persegi: hlm(X, Y) = (0,4 – 0,1) * (0,7 – 0,5) / (1 * 1) = 0,06.

Sekarang katakan kita ingin tahu apakah kebarangkalian itu y berada dalam selang jika x sudah berada dalam julat . Iaitu, sebenarnya, kita mempunyai penapis dan apabila kita memanggil pasangan ( x, y), maka kami segera membuang pasangan yang tidak memenuhi syarat untuk mencari x dalam selang waktu tertentu, dan kemudian daripada pasangan yang ditapis kita mengira pasangan yang mana y memenuhi keadaan kami dan menganggap kebarangkalian sebagai nisbah bilangan pasangan yang y terletak pada segmen di atas kepada jumlah pasangan yang ditapis (iaitu, yang x terletak pada segmen). Kita boleh menulis kebarangkalian ini sebagai hlm(Y|X di X memukul jarak jauh." Jelas sekali, kebarangkalian ini adalah sama dengan nisbah luas kawasan 3 dengan luas kawasan biru 1. Luas kawasan 3 ialah (0.4 – 0.1) * (0.7 – 0.5) = 0.06, dan luas kawasan biru 1 ( 0.4 – 0.1) * (1 – 0) = 0.3, maka nisbahnya ialah 0.06 / 0.3 = 0.2. Dalam erti kata lain, kebarangkalian mencari y pada segmen dengan syarat itu x tergolong dalam segmen hlm(Y|X) = 0,2.

Dalam perenggan sebelumnya kami sebenarnya merumuskan identiti: hlm(Y|X) = hlm(X, Y) / p( X). Ia berbunyi: “kebarangkalian untuk memukul di dalam julat , dengan syarat itu X memukul julat, sama dengan nisbah kebarangkalian pukulan serentak X ke dalam julat dan di kepada julat, kepada kebarangkalian untuk memukul X ke dalam julat."

Dengan analogi, pertimbangkan kebarangkalian hlm(X|Y). Kami memanggil pasangan ( x, y) dan tapis yang mana y terletak di antara 0.5 dan 0.7, maka kebarangkalian itu x adalah dalam selang yang disediakan itu y tergolong dalam segmen adalah sama dengan nisbah kawasan wilayah 3 dengan luas kawasan hijau 2: hlm(X|Y) = hlm(X, Y) / hlm(Y).

Perhatikan bahawa kebarangkalian hlm(X, Y) Dan hlm(Y, X) adalah sama, dan kedua-duanya adalah sama dengan nisbah luas zon 3 dengan luas seluruh persegi, tetapi kebarangkalian hlm(Y|X) Dan hlm(X|Y) tidak sama; manakala kebarangkalian hlm(Y|X) adalah sama dengan nisbah kawasan wilayah 3 kepada wilayah 1, dan hlm(X|Y) – wilayah 3 hingga wilayah 2. Perhatikan juga bahawa hlm(X, Y) sering dilambangkan sebagai hlm(X&Y).

Jadi kami memperkenalkan dua definisi: hlm(Y|X) = hlm(X, Y) / p( X) Dan hlm(X|Y) = hlm(X, Y) / hlm(Y)

Mari kita tulis semula persamaan ini dalam bentuk: hlm(X, Y) = hlm(Y|X) * p( X) Dan hlm(X, Y) = hlm(X|Y) * hlm(Y)

Oleh kerana bahagian kiri adalah sama, bahagian kanan adalah sama: hlm(Y|X) * p( X) = hlm(X|Y) * hlm(Y)

Atau kita boleh menulis semula kesamaan terakhir sebagai:

Ini adalah teorem Bayes!

Adakah transformasi mudah (hampir tautologi) itu benar-benar menimbulkan teorem yang hebat!? Jangan tergesa-gesa membuat kesimpulan. Mari kita bercakap lagi tentang apa yang kita dapat. Terdapat kebarangkalian awal (a priori) tertentu R(X), bahawa pembolehubah rawak X diedarkan secara seragam pada segmen berada dalam julat X. Satu peristiwa berlaku Y, akibatnya kami menerima kebarangkalian posterior pembolehubah rawak yang sama X: R(X|Y), dan kebarangkalian ini berbeza daripada R(X) mengikut pekali. Peristiwa Y dipanggil bukti, lebih kurang mengesahkan atau menyangkal X. Pekali ini kadangkala dipanggil kuasa bukti. Lebih kukuh bukti, lebih fakta memerhati Y mengubah kebarangkalian terdahulu, lebih banyak kebarangkalian posterior berbeza daripada sebelumnya. Jika bukti lemah, kebarangkalian posterior hampir sama dengan yang terdahulu.

Formula Bayes untuk pembolehubah rawak diskret

Dalam bahagian sebelumnya, kami memperoleh formula Bayes untuk pembolehubah rawak berterusan x dan y yang ditakrifkan pada selang. Mari kita pertimbangkan contoh dengan pembolehubah rawak diskret, setiap satu mengambil dua nilai yang mungkin. Semasa pemeriksaan perubatan rutin, didapati bahawa pada usia empat puluh, 1% wanita mengalami kanser payudara. 80% wanita yang menghidap kanser menerima keputusan mamogram yang positif. 9.6% wanita yang sihat juga menerima keputusan mamogram yang positif. Semasa peperiksaan, seorang wanita dalam kumpulan umur ini menerima keputusan mamografi yang positif. Apakah kemungkinan dia benar-benar menghidap kanser payudara?

Garis penaakulan/pengiraan adalah seperti berikut. Daripada 1% pesakit kanser, mamografi akan memberikan 80% keputusan positif = 1% * 80% = 0.8%. Daripada 99% wanita yang sihat, mamografi akan memberikan 9.6% keputusan positif = 99% * 9.6% = 9.504%. Sebanyak 10.304% (9.504% + 0.8%) dengan keputusan mamografi positif, hanya 0.8% yang sakit, dan 9.504% selebihnya sihat. Oleh itu, kebarangkalian bahawa seorang wanita dengan mamogram positif mempunyai kanser ialah 0.8% / 10.304% = 7.764%. Adakah anda fikir 80% atau lebih?

Dalam contoh kami, formula Bayes mengambil bentuk berikut:

Mari kita bercakap tentang makna "fizikal" formula ini sekali lagi. X– pembolehubah rawak (diagnosis), mengambil nilai: X 1- sakit dan X 2– sihat; Y– pembolehubah rawak (hasil pengukuran – mamografi), mengambil nilai: Y 1- keputusan positif dan Y2- keputusan negatif; p(X 1)– kebarangkalian sakit sebelum mamografi (kebarangkalian priori) bersamaan dengan 1%; R(Y 1 |X 1 ) – kebarangkalian keputusan positif jika pesakit sakit (kebarangkalian bersyarat, kerana ia mesti dinyatakan dalam syarat tugas), sama dengan 80%; R(Y 1 |X 2 ) – kebarangkalian keputusan positif jika pesakit sihat (juga kebarangkalian bersyarat) ialah 9.6%; p(X 2)– kebarangkalian bahawa pesakit sihat sebelum mamografi (kebarangkalian priori) ialah 99%; p(X 1|Y 1 ) – kebarangkalian pesakit itu sakit, diberi keputusan mamografi positif (kebarangkalian posterior).

Ia boleh dilihat bahawa kebarangkalian posterior (apa yang kita cari) adalah berkadar dengan kebarangkalian terdahulu (awal) dengan pekali lebih kompleks sedikit. . Biar saya tekankan sekali lagi. Pada pendapat saya, ini adalah aspek asas pendekatan Bayesian. Pengukuran ( Y) menambah sejumlah maklumat kepada perkara yang pada mulanya tersedia (a priori), yang menjelaskan pengetahuan kami tentang objek tersebut.

Contoh

Untuk menyatukan bahan yang telah anda bincangkan, cuba selesaikan beberapa masalah.

Contoh 1. Terdapat 3 tempayan; pada yang pertama terdapat 3 bola putih dan 1 hitam; dalam kedua - 2 bola putih dan 3 hitam; dalam ketiga - 3 bola putih. Seseorang menghampiri salah satu tempayan secara rawak dan mengeluarkan 1 bola daripadanya. Bola ini ternyata berwarna putih. Cari kebarangkalian posterior bahawa bola itu diambil dari urn 1, 2, 3.

Penyelesaian. Kami mempunyai tiga hipotesis: H 1 = (urn pertama dipilih), H 2 = (urn kedua dipilih), H 3 = (urn ketiga dipilih). Oleh kerana urn dipilih secara rawak, kebarangkalian a priori bagi hipotesis adalah sama: P(H 1) = P(H 2) = P(H 3) = 1/3.

Hasil daripada eksperimen, peristiwa A = muncul (bola putih diambil dari urn yang dipilih). Kebarangkalian bersyarat bagi peristiwa A di bawah hipotesis H 1, H 2, H 3: P(A|H 1) = 3/4, P(A|H 2) = 2/5, P(A|H 3) = 1. Sebagai contoh, kesamaan pertama berbunyi seperti ini: "kebarangkalian untuk melukis bola putih jika guci pertama dipilih ialah 3/4 (kerana terdapat 4 bola dalam guci pertama, dan 3 daripadanya berwarna putih)."

Dengan menggunakan formula Bayes, kita dapati kebarangkalian posterior hipotesis:

Oleh itu, berdasarkan maklumat tentang kejadian A, kebarangkalian hipotesis berubah: hipotesis H 3 menjadi paling berkemungkinan, hipotesis H 2 menjadi paling kecil kemungkinannya.

Contoh 2. Dua penembak secara bebas menembak pada sasaran yang sama, masing-masing melepaskan satu pukulan. Kebarangkalian untuk mencapai sasaran untuk penembak pertama ialah 0.8, untuk yang kedua - 0.4. Selepas menembak, satu lubang ditemui pada sasaran. Cari kebarangkalian bahawa lubang ini adalah milik penembak pertama (Hasilnya (kedua-dua lubang bertepatan) dibuang sebagai tidak mungkin diabaikan).

Penyelesaian. Sebelum percubaan, hipotesis berikut adalah mungkin: H 1 = (anak panah pertama atau kedua tidak akan terkena), H 2 = (kedua-dua anak panah akan terkena), H 3 - (penembak pertama akan terkena, tetapi yang kedua tidak ), H 4 = (penembak pertama tidak akan memukul, dan yang kedua akan memukul). Kebarangkalian hipotesis terdahulu:

P(H 1) = 0.2*0.6 = 0.12; P(H2) = 0.8*0.4 = 0.32; P (H 3) = 0.8 * 0.6 = 0.48; P(H 4) = 0.2*0.4 = 0.08.

Kebarangkalian bersyarat bagi peristiwa yang diperhatikan A = (terdapat satu lubang dalam sasaran) di bawah hipotesis ini adalah sama: P(A|H 1) = P(A|H 2) = 0; P(A|H 3) = P(A|H 4) = 1

Selepas eksperimen, hipotesis H 1 dan H 2 menjadi mustahil, dan kebarangkalian posterior hipotesis H 3 dan H 4 mengikut formula Bayes ialah:

Bayes terhadap spam

Formula Bayes telah menemui aplikasi luas dalam pembangunan penapis spam. Katakan anda ingin melatih komputer untuk menentukan e-mel yang spam. Kami akan meneruskan daripada kamus dan frasa menggunakan anggaran Bayesian. Mari kita buat ruang hipotesis dahulu. Marilah kita mempunyai dua hipotesis mengenai mana-mana huruf: H A ialah spam, H B bukan spam, tetapi surat biasa yang diperlukan.

Mula-mula, mari kita "latih" sistem anti-spam masa depan kita. Mari kita ambil semua huruf yang kita ada dan bahagikannya kepada dua "timbunan" 10 huruf setiap satu. Mari letakkan e-mel spam dalam satu dan panggil ia timbunan H A, dalam satu lagi kami akan letakkan surat-menyurat yang diperlukan dan panggil timbunan H B. Sekarang mari kita lihat: apakah perkataan dan frasa yang terdapat dalam spam dan surat yang diperlukan dan dengan kekerapan yang berapa? Kami akan memanggil perkataan dan frasa ini sebagai bukti dan menandakannya E 1 , E 2 ... Ternyata perkataan yang biasa digunakan (contohnya, perkataan "seperti", "anda") dalam timbunan H A dan H B berlaku dengan kira-kira kekerapan yang sama. Oleh itu, kehadiran perkataan-perkataan ini dalam surat tidak memberitahu kita tentang timbunan mana yang akan diberikan (bukti yang lemah). Mari kita berikan perkataan ini skor kebarangkalian "spam" neutral, katakan 0.5.

Biarkan frasa "bahasa Inggeris pertuturan" muncul dalam 10 huruf sahaja dan lebih kerap dalam huruf spam (contohnya, dalam 7 huruf spam daripada semua 10) berbanding huruf yang diperlukan (dalam 3 daripada 10). Mari berikan frasa ini penilaian yang lebih tinggi untuk spam: 7/10 dan penilaian yang lebih rendah untuk e-mel biasa: 3/10. Sebaliknya, ternyata perkataan "buddy" lebih kerap muncul dalam huruf biasa (6 daripada 10). Dan kemudian kami menerima surat pendek: "Kawan saya! Bagaimanakah pertuturan bahasa Inggeris anda?”. Mari cuba menilai "kespaman"nya. Kami akan memberikan anggaran am P(H A), P(H B) bagi huruf yang dimiliki oleh setiap timbunan menggunakan formula Bayes yang agak dipermudahkan dan anggaran anggaran kami:

P(H A) = A/(A+B), di mana A = p a1 *p a2 *…*p an , B = p b1 *p b2 *…*p b n = (1 – p a1)*(1 – p a2)*… *(1 – p an).

Jadual 1. Anggaran penulisan Bayes yang dipermudahkan (dan tidak lengkap).

Oleh itu, surat hipotesis kami menerima kebarangkalian skor kepunyaan dengan penekanan pada "spam". Bolehkah kita membuat keputusan untuk membuang surat itu ke dalam salah satu timbunan? Mari kita tetapkan ambang keputusan:

  • Kami akan menganggap bahawa huruf itu tergolong dalam timbunan H i jika P(H i) ≥ T.
  • Satu huruf tidak tergolong dalam timbunan jika P(H i) ≤ L.
  • Jika L ≤ P(H i) ≤ T, maka tiada keputusan boleh dibuat.

Anda boleh mengambil T = 0.95 dan L = 0.05. Sejak untuk surat berkenaan dan 0.05< P(H A) < 0,95, и 0,05 < P(H В) < 0,95, то мы не сможем принять решение, куда отнести данное письмо: к спаму (H A) или к нужным письмам (H B). Можно ли улучшить оценку, используя больше информации?

ya. Mari kita mengira skor untuk setiap bukti dengan cara yang berbeza, seperti yang dicadangkan oleh Bayes. Biarkan:

F a ialah jumlah bilangan e-mel spam;

F ai ialah bilangan huruf dengan sijil i dalam timbunan spam;

F b ialah jumlah bilangan huruf yang diperlukan;

F bi ialah bilangan huruf dengan sijil i dalam sekumpulan surat yang perlu (berkaitan).

Kemudian: p ai = F ai /F a, p bi = F bi /F b. P(H A) = A/(A+B), P(H B) = B/(A+B), di mana A = p a1 *p a2 *…*p an , B = p b1 *p b2 *…*p b n

Sila ambil perhatian bahawa penilaian perkataan bukti p ai dan p bi telah menjadi objektif dan boleh dikira tanpa campur tangan manusia.

Jadual 2. Anggaran Bayes yang lebih tepat (tetapi tidak lengkap) berdasarkan ciri yang tersedia daripada surat

Kami menerima keputusan yang sangat pasti - dengan kelebihan yang besar, huruf itu boleh diklasifikasikan sebagai huruf yang dikehendaki, kerana P(H B) = 0.997 > T = 0.95. Mengapa keputusan berubah? Kerana kami menggunakan lebih banyak maklumat - kami mengambil kira bilangan huruf dalam setiap longgokan dan, dengan cara itu, menentukan anggaran p ai dan p bi dengan lebih tepat. Mereka ditentukan seperti yang dilakukan oleh Bayes sendiri, dengan mengira kebarangkalian bersyarat. Dalam erti kata lain, p a3 ialah kebarangkalian perkataan "buddy" muncul dalam surat, dengan syarat surat ini sudah tergolong dalam timbunan spam H A . Keputusannya tidak lama lagi - nampaknya kita boleh membuat keputusan dengan lebih pasti.

Bayes terhadap penipuan korporat

Aplikasi menarik pendekatan Bayesian telah diterangkan oleh MAGNUS8.

Projek semasa saya (IS untuk mengesan penipuan di perusahaan pembuatan) menggunakan formula Bayes untuk menentukan kebarangkalian penipuan (penipuan) dengan kehadiran/ketiadaan beberapa fakta yang secara tidak langsung memberi keterangan memihak kepada hipotesis tentang kemungkinan melakukan penipuan. Algoritma adalah pembelajaran kendiri (dengan maklum balas), i.e. mengira semula pekalinya (kebarangkalian bersyarat) selepas pengesahan sebenar atau bukan pengesahan penipuan semasa pemeriksaan oleh perkhidmatan keselamatan ekonomi.

Mungkin patut dikatakan bahawa kaedah sedemikian apabila mereka bentuk algoritma memerlukan budaya matematik pembangun yang agak tinggi, kerana ralat yang sedikit dalam terbitan dan/atau pelaksanaan formula pengiraan akan membatalkan dan mendiskreditkan keseluruhan kaedah. Kaedah kebarangkalian sangat terdedah kepada ini, kerana pemikiran manusia tidak disesuaikan untuk bekerja dengan kategori kebarangkalian dan, oleh itu, tidak ada "keterlihatan" dan pemahaman tentang "makna fizikal" parameter kebarangkalian pertengahan dan akhir. Pemahaman ini wujud hanya untuk konsep asas teori kebarangkalian, dan kemudian anda hanya perlu berhati-hati menggabungkan dan memperoleh perkara yang kompleks mengikut undang-undang teori kebarangkalian - akal tidak lagi membantu untuk objek komposit. Ini, khususnya, dikaitkan dengan pertempuran metodologi yang agak serius yang berlaku di halaman buku moden mengenai falsafah kebarangkalian, serta sejumlah besar sophisms, paradoks dan teka-teki yang ingin tahu mengenai topik ini.

Satu lagi nuansa yang saya terpaksa hadapi ialah, malangnya, hampir semua perkara yang lebih kurang BERGUNA DALAM PRAKTIS mengenai topik ini ditulis dalam bahasa Inggeris. Dalam sumber bahasa Rusia hanya terdapat teori yang terkenal dengan contoh demonstrasi hanya untuk kes yang paling primitif.

Saya bersetuju sepenuhnya dengan teguran terakhir. Contohnya, Google, apabila cuba mencari sesuatu seperti "buku Bayesian Probability," tidak menghasilkan apa-apa yang boleh difahami. Benar, dia melaporkan bahawa buku dengan statistik Bayesian telah diharamkan di China. (Profesor statistik Andrew Gelman melaporkan di blog Universiti Columbia bahawa bukunya, Analisis Data dengan Regresi dan Model Berbilang Peringkat/Hierarki, diharamkan daripada diterbitkan di China. Penerbit di sana melaporkan bahawa "buku itu tidak diluluskan oleh pihak berkuasa kerana pelbagai sensitif politik bahan dalam teks.") Saya tertanya-tanya adakah sebab yang sama menyebabkan kekurangan buku tentang kebarangkalian Bayesian di Rusia?

Konservatisme dalam pemprosesan maklumat manusia

Kebarangkalian menentukan tahap ketidakpastian. Kebarangkalian, kedua-duanya mengikut Bayes dan intuisi kita, hanyalah nombor antara sifar dan yang mewakili tahap di mana seseorang yang agak ideal mempercayai pernyataan itu adalah benar. Sebab seseorang agak diidealkan ialah jumlah kebarangkaliannya untuk dua peristiwa yang saling eksklusif mestilah sama dengan kebarangkaliannya untuk sama ada peristiwa itu berlaku. Sifat aditiviti mempunyai akibat sedemikian sehingga hanya sedikit orang yang dapat memenuhi kesemuanya.

Teorem Bayes adalah akibat remeh sifat ketambahan, tidak dapat dipertikaikan dan dipersetujui oleh semua kebarangkalian, Bayesian dan sebaliknya. Salah satu cara untuk menulis ini adalah seperti berikut. Jika P(H A |D) ialah kebarangkalian seterusnya bahawa hipotesis A adalah selepas nilai D yang diberi diperhatikan, P(H A) ialah kebarangkalian terdahulunya sebelum nilai D yang diberi diperhatikan, P(D|H A ) ialah kebarangkalian bahawa a nilai D yang diberi akan diperhatikan jika H A adalah benar, dan P(D) ialah kebarangkalian tanpa syarat bagi nilai D yang diberikan, maka

(1) P(H A |D) = P(D|H A) * P(H A) / P(D)

P(D) paling baik dianggap sebagai pemalar normalisasi, menyebabkan kebarangkalian posterior menambah kepada kesatuan ke atas set lengkap hipotesis saling eksklusif yang sedang dipertimbangkan. Jika perlu dikira, boleh jadi seperti ini:

Tetapi lebih kerap P(D) dihapuskan daripada dikira. Cara mudah untuk menghapuskan ini adalah dengan mengubah teorem Bayes ke dalam bentuk nisbah kemungkinan-kemungkinan.

Pertimbangkan hipotesis lain, H B , yang saling eksklusif dengan H A , dan ubah fikiran anda tentangnya berdasarkan kuantiti yang sama yang mengubah fikiran anda tentang H A teorem Bayes mengatakan bahawa

(2) P(H B |D) = P(D|H B) * P(H B) / P(D)

Sekarang mari kita bahagikan Persamaan 1 dengan Persamaan 2; hasilnya akan menjadi seperti ini:

di mana Ω 1 ialah kemungkinan posterior memihak kepada H A hingga H B , Ω 0 ialah peluang terdahulu, dan L ialah kuantiti yang biasa kepada ahli statistik sebagai nisbah kebarangkalian. Persamaan 3 ialah versi teorem Bayes yang sama seperti Persamaan 1, dan selalunya lebih berguna terutamanya untuk eksperimen yang melibatkan hipotesis. Bayesians berpendapat bahawa teorem Bayes adalah peraturan optimum secara rasmi tentang cara menyemak semula pendapat berdasarkan bukti baru.

Kami berminat untuk membandingkan tingkah laku ideal yang ditakrifkan oleh teorem Bayes dengan tingkah laku sebenar orang. Untuk memberi anda sedikit idea tentang maksud ini, mari cuba percubaan dengan anda sebagai subjek ujian. Beg ini mengandungi 1000 cip poker. Saya mempunyai dua beg sedemikian, satu mengandungi 700 merah dan 300 cip biru, dan satu lagi mengandungi 300 merah dan 700 biru. Saya membaling syiling untuk menentukan yang mana satu untuk digunakan. Jadi, jika pendapat kami adalah sama, kebarangkalian semasa anda untuk mendapatkan beg yang mengandungi lebih banyak cip merah ialah 0.5. Sekarang, anda membuat sampel rawak dengan pulangan selepas setiap cip. Dalam 12 cip anda mendapat 8 merah dan 4 biru. Sekarang, berdasarkan semua yang anda ketahui, apakah kebarangkalian untuk mendaratkan beg dengan warna merah terbanyak? Adalah jelas bahawa ia lebih tinggi daripada 0.5. Tolong jangan teruskan membaca sehingga anda mencatat markah anda.

Jika anda seperti pengambil ujian biasa, markah anda jatuh dalam julat 0.7 hingga 0.8. Sekiranya kita melakukan pengiraan yang sepadan, bagaimanapun, jawapannya ialah 0.97. Ia sememangnya sangat jarang bagi seseorang yang sebelum ini tidak ditunjukkan pengaruh konservatisme untuk mencapai anggaran yang begitu tinggi, walaupun dia biasa dengan teorem Bayes.

Jika bahagian cip merah dalam beg itu ialah R, maka kebarangkalian untuk menerima r kerepek merah dan ( n –r) biru masuk n sampel dengan pulangan - p r (1–p)n–r. Jadi, dalam percubaan biasa dengan beg dan cip poker, jika NA bermakna bahagian cip merah ialah p A Dan NB– bermakna bahagian itu adalah RB, maka nisbah kebarangkalian:

Apabila menggunakan formula Bayes, seseorang perlu mempertimbangkan hanya kebarangkalian pemerhatian sebenar, dan bukan kebarangkalian pemerhatian lain yang mungkin dia buat tetapi tidak. Prinsip ini mempunyai implikasi yang luas untuk semua aplikasi statistik dan bukan statistik bagi teorem Bayes; ia adalah alat teknikal yang paling penting untuk penaakulan Bayesian.

Revolusi Bayesian

Rakan dan rakan sekerja anda bercakap tentang sesuatu yang dipanggil "Teorem Bayes" atau "Peraturan Bayes" atau sesuatu yang dipanggil Penaakulan Bayesian. Mereka sangat berminat dengan ini, jadi anda pergi ke dalam talian dan mencari halaman tentang teorem Bayes dan... Ia adalah persamaan. Dan itu sahaja... Mengapakah konsep matematik menimbulkan keghairahan dalam minda? Apakah jenis "revolusi Bayesian" yang berlaku di kalangan saintis, dan dikatakan bahawa pendekatan eksperimen itu sendiri boleh digambarkan sebagai kes istimewanya? Apakah rahsia yang diketahui oleh Bayesian? Apakah jenis cahaya yang mereka lihat?

Revolusi Bayesian dalam sains tidak berlaku kerana semakin ramai saintis kognitif tiba-tiba mula menyedari bahawa fenomena mental mempunyai struktur Bayesian; bukan kerana saintis dalam setiap bidang telah mula menggunakan kaedah Bayesian; tetapi kerana sains itu sendiri adalah kes khas teorem Bayes; bukti eksperimen ialah bukti Bayesian. Revolusioner Bayesian berpendapat bahawa apabila anda melakukan eksperimen dan mendapatkan bukti yang "mengesahkan" atau "menyangkal" teori anda, pengesahan atau penolakan itu berlaku mengikut peraturan Bayesian. Sebagai contoh, anda mesti mempertimbangkan bukan sahaja bahawa teori anda boleh menerangkan fenomena, tetapi juga terdapat penjelasan lain yang mungkin juga boleh meramalkan fenomena tersebut.

Sebelum ini, falsafah sains yang paling popular ialah falsafah lama, yang digantikan oleh revolusi Bayesian. Idea Karl Popper bahawa teori boleh dipalsukan sepenuhnya tetapi tidak pernah disahkan sepenuhnya ialah satu lagi kes khas peraturan Bayesian; jika p(X|A) ≈ 1 – jika teori membuat ramalan yang betul, maka pemerhatian ~X memalsukan A dengan sangat kuat, sebaliknya, jika p(X|A) ≈ 1 dan kita memerhati X, ini tidak mengesahkan dengan kuat. teori; mungkin beberapa keadaan B lain mungkin, sehingga p(X|B) ≈ 1, dan di mana pemerhatian X tidak memberi keterangan memihak kepada A tetapi memberi keterangan memihak kepada B. Untuk pemerhatian X untuk mengesahkan A dengan pasti, kita akan mempunyai untuk tidak mengetahui bahawa p(X|A) ≈ 1 dan bahawa p(X|~A) ≈ 0, yang tidak dapat kita ketahui kerana kita tidak boleh mempertimbangkan semua penjelasan alternatif yang mungkin. Sebagai contoh, apabila teori relativiti am Einstein mengatasi teori graviti Newton yang disokong dengan baik, ia menjadikan semua ramalan teori Newton sebagai kes khas ramalan Einstein.

Dengan cara yang sama, dakwaan Popper bahawa idea mesti boleh dipalsukan boleh ditafsirkan sebagai manifestasi peraturan pemuliharaan kebarangkalian Bayesian; jika keputusan X adalah bukti positif untuk teori, maka keputusan ~X mesti menyangkal teori itu sedikit sebanyak. Jika anda cuba mentafsir kedua-dua X dan ~X sebagai "mengesahkan" teori tersebut, peraturan Bayesian mengatakan ia adalah mustahil! Untuk meningkatkan kebarangkalian sesuatu teori, anda mesti tertakluk kepada ujian yang berpotensi mengurangkan kemungkinannya; Ini bukan sahaja peraturan untuk mengenal pasti penipu dalam sains, tetapi akibat daripada teorem kebarangkalian Bayesian. Sebaliknya, idea Popper bahawa hanya pemalsuan diperlukan dan tiada pengesahan diperlukan adalah tidak betul. Teorem Bayes menunjukkan bahawa pemalsuan adalah bukti yang sangat kuat berbanding dengan pengesahan, tetapi pemalsuan masih bersifat probabilistik; ia tidak dikawal oleh peraturan asas yang berbeza dan tidak berbeza dengan cara ini daripada pengesahan, seperti yang didakwa Popper.

Oleh itu, kami mendapati bahawa banyak fenomena dalam sains kognitif, ditambah dengan kaedah statistik yang digunakan oleh saintis, ditambah dengan kaedah saintifik itu sendiri, adalah semua kes khas teorem Bayes. Ini adalah revolusi Bayesian.

Selamat datang ke Konspirasi Bayesian!

Sastera tentang kebarangkalian Bayesian

2. Banyak aplikasi Bayes yang berbeza diterangkan oleh pemenang Nobel dalam bidang ekonomi Kahneman (dan rakan-rakannya) dalam sebuah buku yang menarik. Dalam ringkasan ringkas saya tentang buku yang sangat besar ini sahaja, saya mengira 27 sebutan nama seorang menteri Presbyterian. Formula minimum. (.. Saya sangat menyukainya. Benar, ia agak rumit, terdapat banyak matematik (dan di manakah kita akan berada tanpanya), tetapi bab individu (contohnya, Bab 4. Maklumat) jelas mengenai topik. Saya mengesyorkannya kepada semua orang Walaupun matematik sukar untuk anda, baca setiap baris lain, langkau matematik dan pancing untuk mendapatkan butiran yang berguna...

14. (tambahan bertarikh 15 Januari 2017), bab daripada buku oleh Tony Crilly. 50 idea yang perlu anda ketahui. Matematik.

Ahli fizik pemenang Hadiah Nobel Richard Feynman, bercakap tentang seorang ahli falsafah yang sangat mementingkan diri sendiri, pernah berkata: “Apa yang mengganggu saya bukanlah falsafah sebagai sains, tetapi keangkuhan yang dicipta di sekelilingnya. Kalaulah ahli falsafah boleh ketawa sendiri! Sekiranya mereka boleh berkata: "Saya katakan ia seperti ini, tetapi Von Leipzig fikir ia berbeza, dan dia juga tahu sesuatu mengenainya." Sekiranya mereka ingat untuk menjelaskan bahawa itu hanya milik mereka .

Biarkan kebarangkalian mereka dan kebarangkalian bersyarat yang sepadan diketahui. Maka kebarangkalian kejadian itu berlaku ialah:

Formula ini dipanggil jumlah formula kebarangkalian. Dalam buku teks ia dirumuskan sebagai teorem, buktinya adalah asas: mengikut algebra peristiwa, (sesuatu peristiwa berlaku Dan atau satu peristiwa berlaku Dan selepas ia datang satu acara atau satu peristiwa berlaku Dan selepas ia datang satu acara atau …. atau satu peristiwa berlaku Dan selepas ia datang satu peristiwa). Sejak hipotesis adalah tidak serasi, dan peristiwa itu bergantung, kemudian mengikut teorem penambahan kebarangkalian kejadian tidak serasi (langkah pertama) Dan teorem pendaraban kebarangkalian peristiwa bersandar (langkah kedua):

Ramai orang mungkin menjangkakan kandungan contoh pertama =)

Di mana sahaja anda meludah, ada tempayan:

Masalah 1

Terdapat tiga tempayan yang sama. Guci pertama mengandungi 4 bola putih dan 7 bola hitam, yang kedua mengandungi hanya bola putih, dan yang ketiga hanya mengandungi bola hitam. Satu guci dipilih secara rawak dan sebiji bola diambil daripadanya secara rawak. Apakah kebarangkalian bahawa bola ini berwarna hitam?

Penyelesaian: pertimbangkan acara itu - bola hitam akan diambil dari urn yang dipilih secara rawak. Peristiwa ini boleh berlaku akibat salah satu daripada hipotesis berikut:
– urn pertama akan dipilih;
– urn ke-2 akan dipilih;
– urn ke-3 akan dipilih.

Oleh kerana urn dipilih secara rawak, pilihan mana-mana tiga urn sama-sama mungkin, oleh itu:

Sila ambil perhatian bahawa hipotesis di atas terbentuk kumpulan penuh acara, iaitu, mengikut syarat, bola hitam hanya boleh muncul dari guci ini, dan, sebagai contoh, tidak boleh datang dari meja biliard. Mari kita lakukan pemeriksaan perantaraan yang mudah:
, OK, mari teruskan:

Guci pertama mengandungi 4 putih + 7 hitam = 11 bola, setiap satu definisi klasik:
– kebarangkalian melukis bola hitam memandangkan itu, bahawa urn pertama akan dipilih.

Guci kedua mengandungi hanya bola putih, jadi jika dipilih rupa bebola hitam menjadi mustahil: .

Dan akhirnya, guci ketiga hanya mengandungi bola hitam, yang bermaksud sepadan kebarangkalian bersyarat mengekstrak bola hitam akan (acara itu boleh dipercayai).



– kebarangkalian bahawa sebiji bola hitam akan diambil dari urn yang dipilih secara rawak.

Jawab:

Contoh yang dianalisis sekali lagi menunjukkan betapa pentingnya untuk menyelidiki KEADAAN. Mari kita ambil masalah yang sama dengan guci dan bola - walaupun persamaan luarannya, kaedah penyelesaian boleh berbeza sama sekali: di suatu tempat anda hanya perlu menggunakan takrifan klasik kebarangkalian, sesuatu tempat acara bebas, di suatu tempat bergantung, dan di suatu tempat kita bercakap tentang hipotesis. Pada masa yang sama, tidak ada kriteria formal yang jelas untuk memilih penyelesaian - anda hampir selalu perlu memikirkannya. Bagaimana untuk meningkatkan kemahiran anda? Kita tentukan, kita tentukan dan kita tentukan lagi!

Masalah 2

Jarak tembak mempunyai 5 senapang dengan ketepatan yang berbeza-beza. Kebarangkalian untuk mencapai sasaran untuk penembak yang diberikan masing-masing bersamaan dengan 0.5; 0.55; 0.7; 0.75 dan 0.4. Apakah kebarangkalian untuk mengenai sasaran jika penembak melepaskan satu das tembakan daripada senapang yang dipilih secara rawak?

Penyelesaian ringkas dan jawapan pada akhir pelajaran.

Dalam kebanyakan masalah tematik, hipotesis, sudah tentu, tidak berkemungkinan sama:

Masalah 3

Terdapat 5 senapang di dalam piramid, tiga daripadanya dilengkapi dengan penglihatan optik. Kebarangkalian bahawa penembak akan mengenai sasaran apabila menembak senapang dengan penglihatan teleskopik ialah 0.95; untuk senapang tanpa penglihatan optik, kebarangkalian ini ialah 0.7. Cari kebarangkalian bahawa sasaran akan dipukul jika penembak melepaskan satu das tembakan daripada senapang yang diambil secara rawak.

Penyelesaian: dalam masalah ini bilangan senapang adalah sama seperti yang sebelumnya, tetapi hanya terdapat dua hipotesis:
– penembak akan memilih senapang dengan penglihatan optik;
– penembak akan memilih senapang tanpa penglihatan optik.
Oleh takrifan klasik kebarangkalian: .
Kawalan:

Pertimbangkan peristiwa: – seorang penembak mengenai sasaran dengan senapang yang diambil secara rawak.
Mengikut syarat: .

Mengikut jumlah formula kebarangkalian:

Jawab: 0,85

Dalam amalan, cara yang dipendekkan untuk memformat tugas, yang anda juga biasa, agak boleh diterima:

Penyelesaian: mengikut definisi klasik: – kebarangkalian untuk memilih senapang dengan penglihatan optik dan tanpa penglihatan optik, masing-masing.

Dengan syarat, – kebarangkalian mengenai sasaran daripada jenis senapang yang sepadan.

Mengikut jumlah formula kebarangkalian:
– kebarangkalian bahawa seorang penembak akan mengenai sasaran dengan senapang yang dipilih secara rawak.

Jawab: 0,85

Tugas berikut adalah untuk anda selesaikan sendiri:

Masalah 4

Enjin beroperasi dalam tiga mod: normal, terpaksa dan melahu. Dalam mod melahu, kebarangkalian kegagalannya ialah 0.05, dalam mod operasi biasa - 0.1, dan dalam mod paksa - 0.7. 70% daripada masa enjin beroperasi dalam mod biasa, dan 20% dalam mod paksa. Apakah kebarangkalian kegagalan enjin semasa operasi?

Untuk berjaga-jaga, izinkan saya mengingatkan anda bahawa untuk mendapatkan nilai kebarangkalian, peratusan mesti dibahagikan dengan 100. Berhati-hatilah! Menurut pemerhatian saya, orang sering cuba mengelirukan keadaan masalah yang melibatkan formula kebarangkalian jumlah; dan saya secara khusus memilih contoh ini. Saya akan memberitahu anda satu rahsia - saya sendiri hampir keliru =)

Penyelesaian pada akhir pelajaran (diformat dengan cara yang singkat)

Masalah menggunakan formula Bayes

Bahan tersebut berkait rapat dengan isi perenggan sebelumnya. Biarkan peristiwa itu berlaku hasil daripada pelaksanaan salah satu hipotesis . Bagaimana untuk menentukan kebarangkalian bahawa hipotesis tertentu berlaku?

Memandangkan itu peristiwa itu telah pun berlaku, kebarangkalian hipotesis berlebihan mengikut formula yang menerima nama paderi Inggeris Thomas Bayes:


– kebarangkalian bahawa hipotesis berlaku;
– kebarangkalian bahawa hipotesis berlaku;

– kebarangkalian bahawa hipotesis berlaku.

Pada pandangan pertama, ia kelihatan tidak masuk akal - mengapa mengira semula kebarangkalian hipotesis jika ia sudah diketahui? Tetapi sebenarnya terdapat perbezaan:

- Ini a priori(anggaran sebelum ini ujian) kebarangkalian.

- Ini posterior(anggaran selepas ujian) kebarangkalian hipotesis yang sama, dikira semula berkaitan dengan "keadaan yang baru ditemui" - dengan mengambil kira fakta bahawa peristiwa itu pasti berlaku.

Mari lihat perbezaan ini dengan contoh khusus:

Masalah 5

2 kumpulan produk tiba di gudang: yang pertama - 4000 keping, yang kedua - 6000 keping. Purata peratusan produk bukan standard dalam kumpulan pertama ialah 20%, dan dalam kedua - 10%. Produk yang diambil secara rawak dari gudang ternyata standard. Cari kebarangkalian bahawa ia adalah: a) daripada kumpulan pertama, b) daripada kumpulan kedua.

Bahagian pertama penyelesaian terdiri daripada menggunakan formula kebarangkalian jumlah. Dalam erti kata lain, pengiraan dijalankan di bawah andaian bahawa ujian belum dihasilkan dan acara "produk ternyata standard" belum lagi.

Mari kita pertimbangkan dua hipotesis:
– produk yang diambil secara rawak adalah daripada kumpulan pertama;
– produk yang diambil secara rawak adalah dari kumpulan ke-2.

Jumlah: 4000 + 6000 = 10000 item dalam stok. Mengikut definisi klasik:
.

Kawalan:

Mari kita pertimbangkan peristiwa bergantung: – produk yang diambil secara rawak dari gudang kehendak standard.

Dalam kumpulan pertama 100% – 20% = 80% produk standard, oleh itu: memandangkan itu bahawa ia milik pihak pertama.

Begitu juga, dalam kumpulan kedua 100% - 10% = 90% produk standard dan – kebarangkalian bahawa produk yang diambil secara rawak dari gudang adalah standard memandangkan itu bahawa ia milik pihak ke-2.

Mengikut jumlah formula kebarangkalian:
– kebarangkalian bahawa produk yang diambil secara rawak dari gudang adalah standard.

Bahagian kedua. Biarkan produk yang diambil secara rawak dari gudang menjadi standard. Frasa ini secara langsung dinyatakan dalam keadaan, dan ia menyatakan fakta bahawa peristiwa itu berlaku.

Mengikut formula Bayes:

a) ialah kebarangkalian bahawa produk standard yang dipilih tergolong dalam kumpulan pertama;

b) ialah kebarangkalian bahawa produk standard yang dipilih tergolong dalam kumpulan ke-2.

Selepas penilaian semula hipotesis, sudah tentu, masih terbentuk kumpulan penuh:
(peperiksaan;-))

Jawab:

Ivan Vasilyevich, yang sekali lagi menukar profesionnya dan menjadi pengarah kilang itu, akan membantu kita memahami maksud penilaian semula hipotesis. Dia tahu bahawa hari ini bengkel pertama menghantar 4,000 produk ke gudang, dan bengkel kedua - 6,000 produk, dan datang untuk memastikan perkara ini. Mari kita andaikan bahawa semua produk adalah daripada jenis yang sama dan berada dalam bekas yang sama. Sememangnya, Ivan Vasilyevich terlebih dahulu mengira bahawa produk yang dia akan keluarkan sekarang untuk pemeriksaan kemungkinan besar akan dihasilkan oleh bengkel pertama dan kemungkinan besar oleh yang kedua. Tetapi selepas produk yang dipilih menjadi standard, dia berseru: "Betapa hebatnya bolt! "Ia agak dikeluarkan oleh bengkel ke-2." Oleh itu, kebarangkalian hipotesis kedua dianggarkan terlalu tinggi untuk lebih baik, dan kebarangkalian hipotesis pertama diremehkan: . Dan penilaian semula ini bukan tidak berasas - lagipun, bengkel ke-2 bukan sahaja menghasilkan lebih banyak produk, tetapi juga berfungsi 2 kali lebih baik!

Subjektivisme tulen, anda katakan? Sebahagiannya - ya, lebih-lebih lagi, Bayes sendiri menafsirkannya posterior kebarangkalian sebagai tahap kepercayaan. Walau bagaimanapun, tidak semuanya begitu mudah - terdapat juga butiran objektif dalam pendekatan Bayesian. Lagipun, kemungkinan produk itu akan menjadi standard (0.8 dan 0.9 untuk bengkel pertama dan kedua, masing-masing) ini pendahuluan(a priori) dan purata penilaian. Tetapi, bercakap secara falsafah, semuanya mengalir, semuanya berubah, termasuk kebarangkalian. Ia agak mustahil pada masa kajian bengkel ke-2 yang lebih berjaya meningkatkan peratusan pengeluaran produk standard (dan/atau bengkel pertama dikurangkan), dan jika anda menyemak jumlah yang lebih besar atau semua 10 ribu produk di gudang, maka nilai yang dianggarkan terlalu tinggi akan menjadi lebih dekat dengan kebenaran.

Ngomong-ngomong, jika Ivan Vasilyevich mengekstrak bahagian yang tidak standard, maka sebaliknya, dia akan lebih "mencurigai" bengkel pertama dan kurang yang kedua. Saya cadangkan anda menyemak ini sendiri:

Masalah 6

2 kumpulan produk tiba di gudang: yang pertama - 4000 keping, yang kedua - 6000 keping. Purata peratusan produk bukan standard dalam kumpulan pertama ialah 20%, dalam kedua - 10%. Produk yang diambil dari gudang secara rawak ternyata tidak standard. Cari kebarangkalian bahawa ia adalah: a) daripada kumpulan pertama, b) daripada kumpulan kedua.

Keadaan ini dibezakan oleh dua huruf, yang telah saya serlahkan dalam huruf tebal. Masalahnya boleh diselesaikan dari awal, atau menggunakan hasil pengiraan sebelumnya. Dalam sampel, saya menjalankan penyelesaian lengkap, tetapi untuk mengelakkan sebarang pertindihan formal dengan Masalah No. 5, acara itu "produk yang diambil secara rawak dari gudang akan menjadi tidak standard" ditunjukkan oleh .

Skim Bayesian untuk menganggar semula kebarangkalian terdapat di mana-mana, dan ia juga dieksploitasi secara aktif oleh pelbagai jenis penipu. Mari kita pertimbangkan syarikat saham bersama tiga huruf yang telah menjadi nama isi rumah, yang menarik deposit daripada orang ramai, kononnya melaburkannya di suatu tempat, kerap membayar dividen, dsb. Apa yang sedang berlaku? Hari demi hari, bulan demi bulan berlalu, dan semakin banyak fakta baru, disampaikan melalui pengiklanan dan mulut ke mulut, hanya meningkatkan tahap kepercayaan terhadap piramid kewangan (anggaran semula Bayesian posteriori kerana peristiwa lalu!). Iaitu, di mata pelabur terdapat peningkatan yang berterusan dalam kemungkinan itu “ini adalah pejabat yang serius”; manakala kebarangkalian hipotesis yang bertentangan (“ini hanyalah lebih banyak penipu”), sudah tentu, berkurangan dan berkurangan. Saya rasa apa yang berikut adalah jelas. Perlu diperhatikan bahawa reputasi yang diperoleh memberi masa kepada penganjur untuk berjaya bersembunyi dari Ivan Vasilyevich, yang ditinggalkan bukan sahaja tanpa sekumpulan bolt, tetapi juga tanpa seluar.

Kami akan kembali kepada contoh yang sama menarik sedikit kemudian, tetapi buat masa ini langkah seterusnya mungkin merupakan kes yang paling biasa dengan tiga hipotesis:

Masalah 7

Lampu elektrik dihasilkan di tiga kilang. Kilang pertama menghasilkan 30% daripada jumlah lampu, yang ke-2 - 55%, dan yang ke-3 - selebihnya. Produk kilang pertama mengandungi 1% daripada lampu yang rosak, ke-2 - 1.5%, ke-3 - 2%. Kedai ini menerima produk dari ketiga-tiga kilang. Lampu yang dibeli ternyata rosak. Apakah kebarangkalian ia dihasilkan oleh tumbuhan 2?

Ambil perhatian bahawa dalam masalah pada formula Bayes dalam keadaan semestinya ada yang pasti apa yang berlaku acara, dalam kes ini pembelian lampu.

Peristiwa telah meningkat, dan penyelesaian Lebih mudah untuk mengaturnya dalam gaya "cepat".

Algoritmanya adalah sama: dalam langkah pertama kita dapati kebarangkalian bahawa lampu yang dibeli adalah Kesudahannya rosak.

Menggunakan data awal, kami menukar peratusan kepada kebarangkalian:
– kebarangkalian bahawa lampu itu dihasilkan oleh kilang ke-1, ke-2 dan ke-3, masing-masing.
Kawalan:

Begitu juga: – kebarangkalian menghasilkan lampu yang rosak untuk kilang yang sepadan.

Mengikut jumlah formula kebarangkalian:

– kebarangkalian lampu yang dibeli akan rosak.

Langkah kedua. Biarkan lampu yang dibeli rosak (peristiwa berlaku)

Mengikut formula Bayes:
– kebarangkalian bahawa lampu rosak yang dibeli telah dihasilkan oleh kilang kedua

Jawab:

Mengapakah kebarangkalian awal hipotesis ke-2 meningkat selepas penilaian semula? Lagipun, kilang kedua menghasilkan lampu kualiti purata (yang pertama lebih baik, yang ketiga lebih buruk). Jadi mengapa ia meningkat posterior Adakah mungkin lampu yang rosak itu dari loji ke-2? Ini tidak lagi dijelaskan oleh "reputasi", tetapi dengan saiz. Memandangkan loji No. 2 menghasilkan bilangan lampu terbesar, mereka menyalahkannya (sekurang-kurangnya secara subjektif): "kemungkinan besar, lampu yang rosak ini berasal dari sana".

Adalah menarik untuk diperhatikan bahawa kebarangkalian hipotesis pertama dan ketiga telah dianggarkan terlalu tinggi dalam arah yang dijangkakan dan menjadi sama:

Kawalan: , yang merupakan perkara yang perlu disemak.

Ngomong-ngomong, mengenai anggaran yang dipandang remeh dan terlalu tinggi:

Masalah 8

Dalam kumpulan pelajar, 3 orang mempunyai tahap latihan yang tinggi, 19 orang mempunyai tahap sederhana dan 3 orang mempunyai tahap yang rendah. Kebarangkalian untuk berjaya lulus peperiksaan bagi pelajar ini masing-masing sama dengan: 0.95; 0.7 dan 0.4. Difahamkan ada pelajar yang lulus peperiksaan. Apakah kebarangkalian bahawa:

a) dia telah bersedia dengan sangat baik;
b) disediakan secara sederhana;
c) kurang bersedia.

Lakukan pengiraan dan analisis hasil penilaian semula hipotesis.

Tugas itu hampir dengan realiti dan sangat munasabah untuk sekumpulan pelajar separuh masa, di mana guru hampir tidak mempunyai pengetahuan tentang kebolehan pelajar tertentu. Dalam kes ini, hasilnya boleh menyebabkan akibat yang tidak dijangka. (terutama untuk peperiksaan pada semester 1). Sekiranya pelajar yang kurang bersedia bernasib baik untuk mendapatkan tiket, maka guru mungkin menganggapnya sebagai pelajar yang baik atau pelajar yang kuat, yang akan membawa dividen yang baik pada masa hadapan (sudah tentu, anda perlu "menaikkan bar" dan mengekalkan imej anda). Jika pelajar belajar, bersesak-sesak, dan mengulangi selama 7 hari 7 malam, tetapi hanya tidak bernasib baik, maka peristiwa selanjutnya boleh berkembang dengan cara yang paling teruk - dengan banyak ulangan dan mengimbangi di ambang penyingkiran.

Tidak perlu dikatakan, reputasi adalah modal yang paling penting; bukan kebetulan bahawa banyak syarikat menyandang nama bapa pengasas mereka, yang memimpin perniagaan 100-200 tahun lalu dan menjadi terkenal dengan reputasi mereka yang sempurna.

Ya, pendekatan Bayesian pada tahap tertentu subjektif, tetapi... begitulah cara kehidupan berfungsi!

Mari kita satukan bahan dengan contoh industri terakhir, di mana saya akan bercakap tentang selok-belok teknikal penyelesaian yang tidak diketahui sehingga kini:

Masalah 9

Tiga bengkel kilang menghasilkan jenis bahagian yang sama, yang dihantar ke bekas biasa untuk pemasangan. Adalah diketahui bahawa bengkel pertama menghasilkan 2 kali lebih banyak bahagian daripada bengkel kedua, dan 4 kali lebih banyak daripada bengkel ketiga. Dalam bengkel pertama kadar kecacatan ialah 12%, di kedua - 8%, di ketiga - 4%. Untuk kawalan, satu bahagian diambil dari bekas. Apakah kebarangkalian ia akan rosak? Apakah kebarangkalian bahawa bahagian rosak yang diekstrak telah dihasilkan oleh bengkel ke-3?

Ivan Vasilyevich naik kuda lagi =) Filem ini pasti mempunyai pengakhiran yang bahagia =)

Penyelesaian: tidak seperti Masalah No. 5-8, di sini soalan ditanya dengan jelas, yang diselesaikan menggunakan formula jumlah kebarangkalian. Tetapi sebaliknya, keadaannya sedikit "disulitkan", dan kemahiran sekolah mengarang persamaan mudah akan membantu kami menyelesaikan teka-teki ini. Adalah mudah untuk mengambil nilai terkecil sebagai "x":

Jadilah bahagian bahagian yang dihasilkan oleh bengkel ketiga.

Mengikut syarat, bengkel pertama menghasilkan 4 kali ganda lebih banyak daripada bengkel ketiga, jadi bahagian bengkel pertama adalah .

Di samping itu, bengkel pertama menghasilkan 2 kali lebih banyak produk daripada bengkel kedua, yang bermaksud bahagian kedua: .

Mari buat dan selesaikan persamaan:

Oleh itu: – kebarangkalian bahawa bahagian yang dikeluarkan dari bekas dihasilkan oleh bengkel pertama, kedua dan ketiga, masing-masing.

Kawalan: . Di samping itu, tidak ada salahnya untuk melihat frasa itu lagi “Adalah diketahui bahawa bengkel pertama menghasilkan produk 2 kali lebih banyak daripada bengkel kedua dan 4 kali lebih banyak daripada bengkel ketiga.” dan pastikan bahawa nilai kebarangkalian yang diperolehi benar-benar sepadan dengan keadaan ini.

Pada mulanya, seseorang boleh mengambil bahagian pertama atau bahagian bengkel kedua sebagai "X" - kebarangkalian adalah sama. Tetapi, satu cara atau yang lain, bahagian yang paling sukar telah dilalui, dan penyelesaiannya berada di landasan yang betul:

Daripada keadaan yang kita dapati:
– kebarangkalian menghasilkan bahagian yang rosak untuk bengkel yang sepadan.

Mengikut jumlah formula kebarangkalian:
– kemungkinan bahagian yang dikeluarkan secara rawak daripada bekas akan menjadi tidak standard.

Soalan dua: apakah kebarangkalian bahawa bahagian rosak yang diekstrak telah dihasilkan oleh bengkel ke-3? Soalan ini mengandaikan bahawa bahagian itu telah dikeluarkan dan ia ternyata rosak. Kami menilai semula hipotesis menggunakan formula Bayes:
– kebarangkalian yang diingini. Dijangka sepenuhnya - selepas semua, bengkel ketiga bukan sahaja menghasilkan bahagian terkecil bahagian, tetapi juga memimpin dalam kualiti!

Dalam kes ini ia adalah perlu permudahkan pecahan empat tingkat, yang anda perlu lakukan agak kerap dalam masalah menggunakan formula Bayes. Tetapi untuk pelajaran ini, saya entah bagaimana memilih contoh secara rawak di mana banyak pengiraan boleh dilakukan tanpa pecahan biasa.

Oleh kerana syarat tidak mengandungi titik "a" dan "be", maka adalah lebih baik untuk memberikan jawapan dengan ulasan teks:

Jawab: – kebarangkalian bahawa bahagian yang dikeluarkan dari bekas akan rosak; – kebarangkalian bahawa bahagian rosak yang diekstrak telah dihasilkan oleh bengkel ke-3.

Seperti yang anda lihat, masalah dengan jumlah formula kebarangkalian dan formula Bayes agak mudah, dan, mungkin atas sebab ini, mereka sering cuba merumitkan keadaan, yang telah saya nyatakan pada permulaan artikel.

Contoh tambahan terdapat dalam fail dengan penyelesaian sedia untuk F.P.V. dan formula Bayes, di samping itu, mungkin akan ada mereka yang ingin mengenali topik ini dengan lebih mendalam dalam sumber lain. Dan topik itu benar-benar sangat menarik - apakah nilainya? Paradoks Bayes, yang mewajarkan nasihat setiap hari bahawa jika seseorang didiagnosis dengan penyakit yang jarang berlaku, maka masuk akal untuk dia menjalankan pemeriksaan bebas ulangan atau dua ulangan. Nampaknya mereka melakukan ini semata-mata kerana terdesak... - tetapi tidak! Tetapi jangan bercakap tentang perkara yang menyedihkan.


ialah kebarangkalian bahawa pelajar yang dipilih secara rawak akan lulus peperiksaan.
Biarkan pelajar itu lulus peperiksaan. Mengikut formula Bayes:
A) – kebarangkalian bahawa pelajar yang lulus peperiksaan itu sangat bersedia. Kebarangkalian awal objektif ternyata terlalu tinggi, kerana hampir selalu beberapa pelajar "purata" bernasib baik dengan soalan dan jawapan dengan sangat kuat, yang memberikan gambaran yang salah tentang penyediaan yang sempurna.
b) – kebarangkalian bahawa pelajar yang lulus peperiksaan secara purata bersedia. Kebarangkalian awal ternyata agak terlalu tinggi, kerana pelajar dengan tahap persediaan yang sederhana biasanya majoriti, di samping itu, di sini guru akan memasukkan pelajar "cemerlang" yang menjawab tidak berjaya, dan kadang-kadang pelajar berprestasi rendah yang sangat bertuah dengan tiket.
V) – kemungkinan pelajar yang mengambil peperiksaan kurang bersedia. Kebarangkalian awal telah dianggarkan terlalu tinggi menjadi lebih teruk. Tidak menghairankan.
Peperiksaan:
Jawab :

Rumus dan buktikan formula untuk jumlah kebarangkalian. Berikan contoh aplikasinya.

Jika peristiwa H 1, H 2, ..., H n tidak serasi berpasangan dan sekurang-kurangnya satu daripada peristiwa ini semestinya berlaku semasa setiap ujian, maka untuk sebarang peristiwa A persamaan berikut berlaku:

P(A)= P H1 (A)P(H 1)+ P H2 (A)P(H 2)+…+ P Hn (A)P(H n) – jumlah formula kebarangkalian. Dalam kes ini, H 1, H 2, …, H n dipanggil hipotesis.

Bukti: Peristiwa A dipecahkan kepada pilihan: AH 1, AH 2, ..., AH n. (A datang bersama H 1, dsb.) Dengan kata lain, kita mempunyai A = AH 1 + AH 2 +…+ AH n. Oleh kerana H 1 , H 2 , …, H n tidak serasi berpasangan, peristiwa AH 1 , AH 2 , …, AH n juga tidak serasi. Menggunakan peraturan penambahan, kita dapati: P(A)= P(AH 1)+ P(AH 2)+…+ P(AH n). Menggantikan setiap sebutan P(AH i) di sebelah kanan dengan hasil P Hi (A)P(H i), kita memperoleh kesamaan yang diperlukan.

Contoh:

Katakan kita mempunyai dua set bahagian. Kebarangkalian bahawa bahagian set pertama adalah standard ialah 0.8, dan yang kedua ialah 0.9. Mari kita cari kebarangkalian bahawa bahagian yang diambil secara rawak adalah piawai.

P(A) = 0.5*0.8 + 0.5*0.9 = 0.85.

Rumus dan buktikan formula Bayes. Berikan contoh aplikasinya.

Formula Bayes:

Ia membolehkan anda menganggar semula kebarangkalian hipotesis selepas keputusan ujian yang menyebabkan peristiwa A diketahui.

Bukti: Biarkan peristiwa A berlaku tertakluk kepada berlakunya salah satu peristiwa tidak serasi H 1 , H 2 , …, H n , membentuk kumpulan lengkap. Oleh kerana tidak diketahui terlebih dahulu yang mana antara peristiwa ini akan berlaku, ia dipanggil hipotesis.

Kebarangkalian kejadian A ditentukan oleh jumlah formula kebarangkalian:

P(A)= P H1 (A)P(H 1)+ P H2 (A)P(H 2)+…+ P Hn (A)P(H n) (1)

Mari kita andaikan bahawa ujian telah dijalankan, akibat daripada peristiwa A yang muncul Mari kita tentukan bagaimana kebarangkalian hipotesis telah berubah disebabkan oleh fakta bahawa peristiwa A telah berlaku. Dalam erti kata lain, kita akan mencari kebarangkalian bersyarat

P A (H 1), P A (H 2), ..., P A (H n).

Dengan teorem pendaraban kita ada:

P(AH i) = P(A) P A (H i) = P(H i)P Hi (A)

Mari kita gantikan P(A) di sini mengikut formula (1), kita perolehi

Contoh:

Terdapat tiga kotak yang kelihatan sama. Dalam kotak pertama terdapat n=12 bola putih, dalam kedua terdapat m=4 bola putih dan n-m=8 bola hitam, dalam yang ketiga terdapat n=12 bola hitam. Sebiji bola putih diambil dari kotak yang dipilih secara rawak. Cari kebarangkalian P bahawa bola itu ditarik dari kotak kedua.

Penyelesaian.

4) Terbitkan formula untuk kebarangkaliankkejayaan dalam siri ininujian mengikut skema Bernoulli.

Mari kita periksa kes apabila ia dihasilkan n eksperimen yang sama dan bebas, setiap satunya hanya mempunyai 2 hasil ( A;). Itu. beberapa pengalaman berulang n kali, dan dalam setiap eksperimen beberapa peristiwa A mungkin muncul dengan kebarangkalian P(A)=q atau tidak muncul dengan kebarangkalian P()=q-1=p .

Ruang peristiwa asas setiap siri ujian mengandungi titik atau urutan simbol A Dan . Ruang kebarangkalian sedemikian dipanggil skema Bernoulli. Tugasnya adalah untuk memastikan bahawa untuk sesuatu yang diberikan k cari kebarangkalian bahawa n- pengulangan berbilang peristiwa eksperimen A akan datang k sekali.

Untuk lebih jelas, mari kita bersetuju pada setiap kejadian sesuatu peristiwa A anggap sebagai kejayaan, bukan kemajuan A - seperti kegagalan. Matlamat kami adalah untuk mencari kebarangkalian itu n eksperimen dengan tepat k akan berjaya; marilah kita nyatakan peristiwa ini buat sementara waktu dengan B.

Peristiwa DALAM dibentangkan sebagai jumlah siri acara - pilihan acara DALAM. Untuk merekodkan pilihan tertentu, anda perlu menunjukkan bilangan percubaan tersebut yang berakhir dengan kejayaan. Sebagai contoh, salah satu pilihan yang mungkin adalah

. Bilangan semua pilihan jelas sama dengan , dan kebarangkalian setiap pilihan disebabkan oleh kebebasan eksperimen adalah sama dengan . Oleh itu kebarangkalian kejadian itu DALAM sama dengan . Untuk menekankan pergantungan ungkapan yang terhasil pada n Dan k, mari kita nyatakan . Jadi, .

5) Menggunakan formula anggaran Laplace kamiran, terbitkan formula untuk menganggar sisihan kekerapan relatif kejadian A daripada kebarangkalian p kejadian A dalam satu eksperimen.

Di bawah syarat skema Bernoulli dengan nilai n dan p yang diberikan untuk e>0 tertentu, kami menganggarkan kebarangkalian kejadian , dengan k ialah bilangan kejayaan dalam n eksperimen. Ketaksamaan ini bersamaan dengan |k-np|£en, i.e. -en £ k-np £ en atau np-en £ k £ np+en. Oleh itu, kita bercakap tentang mendapatkan anggaran untuk kebarangkalian peristiwa k 1 £ k £ k 2 , di mana k 1 = np-en, k 2 = np+en. Menggunakan formula anggaran Laplace kamiran, kami memperoleh: P( » Dengan mengambil kira keganjilan fungsi Laplace, kami memperoleh kesamaan anggaran P( » 2Ф.

Catatan : sebab dengan syarat n=1, maka kita gantikan satu daripada n dan dapatkan jawapan akhir.

6) Biarkan X– pembolehubah rawak diskret yang hanya mengambil nilai bukan negatif dan mempunyai jangkaan matematik m. Buktikan itu P(X≥ 4) ≤ m/ 4 .

m= (memandangkan sebutan pertama adalah positif, maka jika anda mengeluarkannya, ia akan menjadi kurang) ³ (ganti a sebanyak 4, ia hanya akan kurang) ³ = =4× P(X³4). Dari sini P(X≥ 4) ≤ m/ 4 .

(Daripada 4 boleh ada sebarang nombor).

7) Buktikan bahawa jika X Dan Y ialah pembolehubah rawak diskret bebas yang mengambil set nilai terhingga, kemudian M(XY)=M(X)M(Y)

x 1 x 2
p 1 p 2

nombor yang dipanggil M(XY)= x 1 p 1 + x 2 p 2 + …

Jika pembolehubah rawak X Dan Y adalah bebas, maka jangkaan matematik produk mereka adalah sama dengan hasil jangkaan matematik mereka (teorem pendaraban jangkaan matematik).

Bukti: Nilai yang mungkin X mari kita nyatakan x 1 , x 2, …, nilai yang mungkin Y - y 1 , y 2, … A p ij =P(X=x i , Y=y j). XY M(XY)= Disebabkan oleh kebebasan kuantiti X Dan Y kami ada: P(X= x i , Y=y j)= P(X=x i) P(Y=y j). Setelah ditetapkan P(X=x i)=r i , P(Y=y j)=s j, kami menulis semula kesaksamaan ini dalam bentuk p ij =r i s j

Oleh itu, M(XY)= = . Mengubah kesaksamaan yang terhasil, kami memperoleh: M(XY)=()() = M(X)M(Y), Q.E.D.

8) Buktikan bahawa jika X Dan Y ialah pembolehubah rawak diskret yang mengambil set nilai terhingga, kemudian M(X+Y) = M(X) +M(Y).

Jangkaan matematik pembolehubah rawak diskret dengan hukum taburan

x 1 x 2
p 1 p 2

nombor yang dipanggil M(XY)= x 1 p 1 + x 2 p 2 + …

Jangkaan matematik hasil tambah dua pembolehubah rawak adalah sama dengan jumlah jangkaan matematik bagi sebutan: M(X+Y)= M(X)+M(Y).

Bukti: Nilai yang mungkin X mari kita nyatakan x 1 , x 2, …, nilai yang mungkin Y - y 1 , y 2, … A p ij =P(X=x i , Y=y j). Hukum taburan magnitud X+Y akan dinyatakan dalam jadual yang sepadan. M(X+Y)= .Formula ini boleh ditulis semula seperti berikut: M(X+Y)= .Jumlah pertama bahagian kanan boleh diwakili sebagai . Ungkapan ialah kebarangkalian bahawa mana-mana peristiwa akan berlaku (X=x i, Y=y 1), (X=x i, Y=y 2), ... Oleh itu, ungkapan ini adalah sama dengan P(X=x i) . Dari sini . Begitu juga, . Akibatnya, kita mempunyai: M(X+Y)= M(X)+M(Y), iaitu apa yang perlu dibuktikan.

9) Biarkan X– pembolehubah rawak diskret diedarkan mengikut undang-undang taburan binomial dengan parameter n Dan R. Buktikan itu M(X)=nр, D(X)=nр(1-р).

Biar terhasil n percubaan bebas, dalam setiap kejadian A boleh berlaku dengan kebarangkalian R, jadi kebarangkalian kejadian yang bertentangan Ā sama dengan q=1-p. Mari kita pertimbangkan perkara berikut. saiz X– bilangan kejadian peristiwa A V n eksperimen. Mari bayangkan X sebagai jumlah penunjuk peristiwa A untuk setiap percubaan: X=X 1 +X 2 +…+X n. Sekarang mari kita buktikan M(X i)=p, D(X i)=np. Untuk melakukan ini, pertimbangkan undang-undang pengedaran sl. kuantiti, yang kelihatan seperti:

X
R R q

Ia adalah jelas bahawa M(X)=p, pembolehubah rawak X 2 mempunyai hukum taburan yang sama, oleh itu D(X)=M(X 2)-M 2 (X)=р-р 2 =р(1-р)=рq. Oleh itu, M(X i)=p, D(Х i)=pq. Mengikut teorem penambahan jangkaan matematik M(X)=M(X 1)+..+M(X n)=nр. Sejak pembolehubah rawak Xi adalah bebas, maka varians juga ditambah: D(X)=D(X 1)+…+D(X n)=npq=np(1-p).

10) Biarkan X– pembolehubah rawak diskret diedarkan mengikut hukum Poisson dengan parameter λ. Buktikan itu M(X) = λ .

Hukum Poisson diberikan oleh jadual:

Dari sini kita ada:

Oleh itu, parameter λ, yang mencirikan taburan Poisson ini, tidak lebih daripada jangkaan matematik bagi nilai X.

11) Biarkan X ialah pembolehubah rawak diskret yang diedarkan mengikut hukum geometri dengan parameter p. Buktikan bahawa M (X) = .

Hukum taburan geometri dikaitkan dengan jujukan percubaan Bernoulli sehingga peristiwa pertama berjaya A. Kebarangkalian kejadian A dalam satu percubaan ialah p, peristiwa bertentangan q = 1-p. Hukum taburan pembolehubah rawak X - bilangan ujian - mempunyai bentuk:

X n
R R pq pq n-1

Siri yang ditulis dalam kurungan diperoleh melalui pembezaan sebutan demi sebutan bagi janjang geometri

Oleh itu, .

12) Buktikan bahawa pekali korelasi pembolehubah rawak X dan Y memenuhi syarat.

Definisi: Pekali korelasi dua pembolehubah rawak ialah nisbah kovarians mereka kepada hasil sisihan piawai pembolehubah ini: . .

Bukti: Mari kita pertimbangkan pembolehubah rawak Z = . Mari kita hitung variansnya. Oleh kerana bahagian kiri bukan negatif, bahagian kanan bukan negatif. Oleh itu, , |ρ|≤1.

13) Bagaimanakah varians dikira dalam kes taburan berterusan dengan ketumpatan f(x)? Buktikan bahawa untuk pembolehubah rawak X dengan kepadatan penyebaran D(X) tidak wujud, dan jangkaan matematik M(X) wujud.

Varians pembolehubah rawak berterusan X dengan fungsi ketumpatan f(x) dan jangkaan matematik m = M(X) ditentukan oleh kesamaan yang sama seperti pembolehubah diskret

.

Dalam kes apabila pembolehubah rawak berterusan X tertumpu pada selang,

∞ - kamiran mencapah, oleh itu, serakan tidak wujud.

14) Buktikan bahawa bagi pembolehubah rawak normal X dengan fungsi ketumpatan taburan jangkaan matematik M(X) = μ.

Mari kita buktikan bahawa μ ialah jangkaan matematik.

Untuk menentukan jangkaan matematik bagi r.v. berterusan,

Mari perkenalkan pembolehubah baharu . Dari sini. Dengan mengambil kira bahawa had integrasi baharu adalah sama dengan had lama, kami memperoleh

Istilah pertama adalah sama dengan sifar disebabkan oleh keganjilan fungsi integrand. Istilah kedua adalah sama dengan μ (Poisson integral ).

Jadi, M(X)=μ, iaitu jangkaan matematik bagi taburan normal adalah sama dengan parameter μ.

15) Buktikan bahawa bagi pembolehubah rawak normal X dengan fungsi ketumpatan taburan dyspresia D(X) = σ 2 .

Formula menerangkan ketumpatan taburan kebarangkalian normal pembolehubah rawak berterusan.

Mari kita buktikan bahawa adalah sisihan piawai bagi taburan normal. Mari perkenalkan pembolehubah baharu z=(x-μ)/ . Dari sini . Dengan mengambil kira bahawa had penyepaduan baharu adalah sama dengan yang lama, kami memperoleh Penyepaduan mengikut bahagian, meletakkan u=z, kita dapati Oleh itu, .Jadi, sisihan piawai taburan normal adalah sama dengan parameter.

16) Buktikan bahawa untuk pembolehubah rawak berterusan yang diedarkan mengikut hukum eksponen dengan parameter , jangkaan matematik ialah .

Pembolehubah rawak X, hanya mengambil nilai bukan negatif, dikatakan diedarkan mengikut hukum eksponen jika untuk beberapa parameter positif λ>0 fungsi ketumpatan mempunyai bentuk:

Untuk mencari jangkaan matematik, kami menggunakan formula

Formula Bayes

Teorem Bayes- salah satu teorem utama teori kebarangkalian asas, yang menentukan kebarangkalian sesuatu peristiwa berlaku dalam keadaan di mana hanya beberapa maklumat separa tentang peristiwa diketahui berdasarkan pemerhatian. Menggunakan formula Bayes, adalah mungkin untuk mengira semula kebarangkalian dengan lebih tepat, dengan mengambil kira kedua-dua maklumat yang diketahui sebelum ini dan data daripada pemerhatian baharu.

"Maksud fizikal" dan istilah

Formula Bayes membolehkan anda "mengatur semula sebab dan akibat": memandangkan fakta yang diketahui tentang sesuatu peristiwa, hitung kebarangkalian ia disebabkan oleh sebab tertentu.

Peristiwa yang mencerminkan tindakan "sebab" dalam kes ini biasanya dipanggil hipotesis, kerana mereka didakwa peristiwa yang membawa kepada ini. Kebarangkalian tanpa syarat hipotesis itu benar dipanggil a priori(berapa kemungkinan sebabnya sama sekali), dan bersyarat - mengambil kira fakta kejadian - posterior(berapa kemungkinan sebabnya ternyata mengambil kira data acara).

Akibat

Akibat penting formula Bayes ialah formula untuk jumlah kebarangkalian sesuatu peristiwa bergantung pada beberapa hipotesis yang tidak konsisten ( dan hanya dari mereka!).

- kebarangkalian sesuatu kejadian berlaku B, bergantung kepada beberapa hipotesis A i, jika tahap kebolehpercayaan hipotesis ini diketahui (contohnya, diukur secara eksperimen);

Terbitan formula

Jika sesuatu kejadian hanya bergantung kepada punca A i, maka jika ia berlaku, bermakna salah satu sebab pasti berlaku, i.e.

Mengikut formula Bayes

Secara pemindahan P(B) ke kanan kita memperoleh ungkapan yang diingini.

Kaedah penapisan spam

Kaedah berdasarkan teorem Bayes telah menemui aplikasi yang berjaya dalam penapisan spam.

Penerangan

Apabila melatih penapis, untuk setiap perkataan yang ditemui dalam huruf, "berat"nya dikira dan disimpan - kebarangkalian bahawa huruf dengan perkataan ini adalah spam (dalam kes paling mudah - mengikut definisi klasik kebarangkalian: "kemunculan dalam spam / penampilan secara keseluruhan”).

Apabila menyemak surat yang baru tiba, kebarangkalian bahawa ia adalah spam dikira menggunakan formula di atas untuk pelbagai hipotesis. Dalam kes ini, "hipotesis" ialah perkataan, dan untuk setiap perkataan, "kebolehpercayaan hipotesis" ialah % perkataan ini dalam surat, dan "pergantungan peristiwa pada hipotesis" P(B | A i) - "berat" perkataan yang dikira sebelumnya. Iaitu, "berat" surat dalam kes ini tidak lebih daripada purata "berat" semua perkataannya.

Surat diklasifikasikan sebagai "spam" atau "bukan spam" berdasarkan sama ada "berat" surat itu melebihi tahap tertentu yang ditentukan oleh pengguna (biasanya 60-80%). Selepas keputusan dibuat ke atas surat, "berat" untuk perkataan yang disertakan di dalamnya dikemas kini dalam pangkalan data.

Ciri

Kaedah ini mudah (algoritma adalah asas), mudah (membolehkan anda melakukan tanpa "senarai hitam" dan teknik buatan yang serupa), berkesan (selepas latihan pada sampel yang cukup besar, ia memotong sehingga 95-97% spam, dan sekiranya terdapat sebarang kesilapan ia boleh dilatih semula). Secara umum, terdapat semua petunjuk untuk penggunaannya yang meluas, yang berlaku dalam amalan - hampir semua penapis spam moden dibina berdasarkannya.

Walau bagaimanapun, kaedah ini juga mempunyai kelemahan asas: ia berdasarkan andaian, Apa sesetengah perkataan lebih biasa dalam spam, manakala yang lain lebih biasa dalam e-mel biasa, dan tidak berkesan jika andaian ini tidak betul. Walau bagaimanapun, seperti yang ditunjukkan oleh amalan, walaupun seseorang tidak dapat mengesan spam tersebut "dengan mata" - hanya dengan membaca surat dan memahami maksudnya.

Satu lagi, bukan asas, kelemahan yang berkaitan dengan pelaksanaan ialah kaedah itu hanya berfungsi dengan teks. Mengetahui had ini, spammer mula memasukkan maklumat pengiklanan ke dalam gambar, tetapi teks dalam surat itu sama ada hilang atau tidak bermakna. Untuk mengatasinya, anda perlu menggunakan sama ada alat pengecaman teks (prosedur "mahal", digunakan hanya apabila benar-benar perlu), atau kaedah penapisan lama - "senarai hitam" dan ungkapan biasa (kerana huruf sedemikian sering mempunyai bentuk stereotaip).

lihat juga

Nota

Pautan

kesusasteraan

  • Burung Kiwi. Teorem Reverend Bayes. // Majalah Computerra, 24 Ogos 2001.
  • Paul Graham. Pelan untuk spam (Bahasa Inggeris). // Laman web peribadi Paul Graham.

Yayasan Wikimedia. 2010.

Lihat apa "Formula Bayes" dalam kamus lain:

    Formula yang mempunyai bentuk: di mana a1, A2,..., An adalah peristiwa yang tidak serasi, Skim am penggunaan f.v. g.: jika peristiwa B boleh berlaku dalam berbeza. keadaan yang mana n hipotesis A1, A2, ..., An dibuat dengan kebarangkalian P(A1), ... diketahui sebelum eksperimen. Ensiklopedia geologi

    Membolehkan anda mengira kebarangkalian peristiwa menarik melalui kebarangkalian bersyarat bagi peristiwa ini di bawah andaian hipotesis tertentu, serta kebarangkalian hipotesis ini. Rumusan Biarkan ruang kebarangkalian diberikan, dan kumpulan lengkap secara berpasangan... ... Wikipedia

    Membolehkan anda mengira kebarangkalian peristiwa menarik melalui kebarangkalian bersyarat bagi peristiwa ini di bawah andaian hipotesis tertentu, serta kebarangkalian hipotesis ini. Rumusan Biarkan ruang kebarangkalian diberikan, dan kumpulan lengkap peristiwa seperti... ... Wikipedia

    - (atau formula Bayes) ialah salah satu teorem utama teori kebarangkalian, yang membolehkan anda menentukan kebarangkalian bahawa beberapa peristiwa (hipotesis) telah berlaku dengan kehadiran hanya bukti tidak langsung (data), yang mungkin tidak tepat... Wikipedia

    Teorem Bayes ialah salah satu teorem utama teori kebarangkalian asas, yang menentukan kebarangkalian sesuatu peristiwa berlaku dalam keadaan di mana hanya sebahagian maklumat tentang peristiwa diketahui berdasarkan pemerhatian. Menggunakan formula Bayes anda boleh... ... Wikipedia

    Bayes, Thomas Thomas Bayes Pendeta Thomas Bayes Tarikh lahir: 1702 (1702) Tempat lahir ... Wikipedia

    Thomas Bayes Pendeta Thomas Bayes Tarikh lahir: 1702 Tempat lahir: London ... Wikipedia

    Inferens Bayesian ialah salah satu kaedah inferens statistik di mana formula Bayes digunakan untuk memperhalusi anggaran kebarangkalian kebenaran hipotesis apabila bukti diterima. Penggunaan pengemaskinian Bayesian amat penting dalam... ... Wikipedia

    Untuk menambah baik artikel ini, adakah wajar?: Cari dan susun dalam bentuk pautan nota kaki kepada sumber berwibawa yang mengesahkan apa yang telah ditulis. Selepas menambah nota kaki, berikan petunjuk sumber yang lebih tepat. Pere... Wikipedia

    Adakah banduan akan mengkhianati satu sama lain, mengikut kepentingan diri mereka, atau adakah mereka akan berdiam diri, dengan itu meminimumkan hukuman keseluruhan? Dilema tahanan (Bahasa Inggeris: Prisoner's dilemma, kurang biasa digunakan ialah nama “dilemma ... Wikipedia

Buku

  • Teori kebarangkalian dan statistik matematik dalam masalah: Lebih daripada 360 masalah dan latihan, Borzykh D.. Manual yang dicadangkan mengandungi masalah pelbagai tahap kerumitan. Walau bagaimanapun, penekanan utama adalah pada tugas kerumitan sederhana. Ini dilakukan dengan sengaja untuk menggalakkan pelajar ...

Apabila memperoleh jumlah formula kebarangkalian, diandaikan bahawa peristiwa itu A, kebarangkalian yang perlu ditentukan, boleh berlaku kepada salah satu peristiwa N 1 , N 2 , ... , N n, membentuk kumpulan lengkap acara tidak serasi berpasangan. Lebih-lebih lagi, kebarangkalian kejadian ini (hipotesis) diketahui lebih awal. Mari kita anggap bahawa satu eksperimen telah dijalankan, akibatnya peristiwa itu A ia telah tiba. Maklumat tambahan ini membolehkan kami menilai semula kebarangkalian hipotesis. N i, setelah dikira P(H i /A).

atau, menggunakan jumlah formula kebarangkalian, kita dapat

Formula ini dipanggil formula Bayes atau teorem hipotesis. Formula Bayes membolehkan anda "menyemak" kebarangkalian hipotesis selepas keputusan eksperimen yang menyebabkan peristiwa itu diketahui A.

Kebarangkalian Р(Н i)− ini adalah kebarangkalian a priori bagi hipotesis (ia dikira sebelum eksperimen). Kebarangkalian P(H i /A)− ini adalah kebarangkalian posterior hipotesis (ia dikira selepas eksperimen). Formula Bayes membolehkan anda mengira kebarangkalian posterior daripada kebarangkalian terdahulunya dan daripada kebarangkalian bersyarat sesuatu peristiwa A.

Contoh. Adalah diketahui bahawa 5% daripada semua lelaki dan 0.25% daripada semua wanita adalah buta warna. Seseorang yang dipilih secara rawak berdasarkan nombor kad perubatan mereka mengalami rabun warna. Apakah kebarangkalian bahawa ia adalah seorang lelaki?

Penyelesaian. Peristiwa A– seseorang mengalami rabun warna. Ruang peristiwa asas untuk eksperimen - seseorang dipilih mengikut nombor kad perubatan - Ω = ( N 1 , N 2 ) terdiri daripada 2 acara:

N 1 - seorang lelaki dipilih,

N 2 - seorang wanita dipilih.

Peristiwa ini boleh dipilih sebagai hipotesis.

Mengikut keadaan masalah (pilihan rawak), kebarangkalian kejadian ini adalah sama dan sama P(N 1 ) = 0.5; P(N 2 ) = 0.5.

Dalam kes ini, kebarangkalian bersyarat bahawa seseorang mengalami buta warna adalah sama, masing-masing:

R(A/N 1 ) = 0.05 = 1/20; R(A/N 2 ) = 0.0025 = 1/400.

Memandangkan diketahui bahawa orang yang dipilih buta warna, iaitu peristiwa itu berlaku, kami menggunakan formula Bayes untuk menilai semula hipotesis pertama:

Contoh. Terdapat tiga kotak yang kelihatan sama. Kotak pertama mengandungi 20 bola putih, kotak kedua mengandungi 10 bola putih dan 10 bola hitam, dan kotak ketiga mengandungi 20 bola hitam. Sebiji bola putih diambil dari kotak yang dipilih secara rawak. Hitung kebarangkalian bahawa bola itu ditarik dari kotak pertama.

Penyelesaian. Mari kita nyatakan dengan A acara - rupa bola putih. Tiga andaian (hipotesis) boleh dibuat tentang pilihan kotak: N 1 ,N 2 , N 3 – pemilihan kotak pertama, kedua dan ketiga, masing-masing.

Oleh kerana pilihan mana-mana kotak adalah sama mungkin, kebarangkalian hipotesis adalah sama:

P(N 1 )=P(N 2 )=P(N 3 )= 1/3.

Mengikut masalah, kebarangkalian untuk menarik bola putih dari kotak pertama ialah

Kebarangkalian menarik bola putih dari kotak kedua



Kebarangkalian menarik bola putih dari kotak ketiga

Kami mencari kebarangkalian yang diingini menggunakan formula Bayes:

Pengulangan ujian. Formula Bernoulli.

N percubaan dijalankan, dalam setiap kejadian A mungkin berlaku atau tidak, dan kebarangkalian kejadian A dalam setiap percubaan individu adalah malar, i.e. tidak berubah dari pengalaman ke pengalaman. Kita sudah tahu bagaimana untuk mencari kebarangkalian peristiwa A dalam satu eksperimen.

Kepentingan tertentu ialah kebarangkalian berlakunya bilangan kali tertentu (m kali) peristiwa A dalam n eksperimen. Masalah sedemikian boleh diselesaikan dengan mudah jika ujian adalah bebas.

Def. Beberapa ujian dipanggil bebas berkenaan dengan peristiwa A , jika kebarangkalian kejadian A dalam setiap satu daripadanya tidak bergantung kepada hasil eksperimen lain.

Kebarangkalian P n (m) kejadian A tepat m kali (bukan kejadian n-m kali, peristiwa ) dalam n percubaan ini. Peristiwa A muncul dalam urutan yang sangat berbeza m kali).

- Formula Bernoulli.

Formula berikut adalah jelas:

Р n (m kurang k kali dalam n percubaan.

P n (m>k) = P n (k+1) + P n (k+2) +…+ P n (n) - kebarangkalian berlakunya peristiwa A lebih k kali dalam n percubaan.