Ang distribution function ng isang random variable at ang mga katangian nito.
function ng pamamahagi Ang random variable X ay tinatawag na function F(X), na nagpapahayag para sa bawat x ng probabilidad na ang random variable X ay kumukuha ng value na mas mababa sa x: F(x)=P(X
Function F(x) minsan tinatawag integral function pamamahagi o integral na batas sa pamamahagi.
Mga katangian ng pagpapaandar ng pamamahagi:
1. Ang distribution function ng isang random variable ay isang non-negative na function na nakapaloob sa pagitan ng zero at isa:
0 ≤ F(x) ≤ 1.
2. Ang distribution function ng isang random variable ay isang non-decreasing function sa whole number axis.
3. Sa minus infinity, ang distribution function ay katumbas ng zero, at plus infinity ito ay katumbas ng isa, i.e.: F(-∞)= , F(+∞)= .
4. Ang posibilidad ng isang random na variable na bumabagsak sa pagitan [x1,x2) (kabilang ang x1) ay katumbas ng pagtaas ng function ng pamamahagi nito sa interval na ito, i.e. P(x 1 ≤ X< х 2) = F(x 2) - F(x 1).
Markov at Chebyshev hindi pagkakapantay-pantay
Hindi pagkakapantay-pantay ni Markov
Teorama: Kung ang isang random na variable X ay tumatagal lamang ng mga hindi negatibong halaga at may inaasahan sa matematika, kung gayon para sa anumang positibong numero A ang pagkakapantay-pantay ay totoo: P(x>A) ≤ .
Dahil ang mga kaganapan X > A at X ≤ A ay magkasalungat, pinapalitan ang P(X > A) ipinapahayag namin ang 1 - P (X ≤ A), dumating kami sa isa pang anyo ng hindi pagkakapantay-pantay ni Markov: P(X ≥ A) ≥1 - .
Ang hindi pagkakapantay-pantay ni Markov k ay naaangkop sa anumang hindi negatibong random na variable.
Ang hindi pagkakapantay-pantay ni Chebyshev
Teorama: Para sa anumang random na variable na may mathematical na inaasahan at pagkakaiba, ang hindi pagkakapantay-pantay ni Chebyshev ay totoo:
P (|X - a| > ε) ≤ D(X) / ε 2 o P (|X - a| ≤ ε) ≥ 1 - DX / ε 2, kung saan ang isang \u003d M (X), ε>0.
Ang batas ng malalaking numero "sa anyo" ng teorama ni Chebyshev.
Ang teorama ni Chebyshev: Kung ang mga pagkakaiba n mga independiyenteng random na variable X1, X2,…. X n ay limitado ng parehong pare-pareho, pagkatapos ay may walang limitasyong pagtaas sa bilang n ang arithmetic mean ng mga random na variable ay nagtatagpo sa probabilidad sa arithmetic mean ng kanilang mga inaasahan sa matematika a 1 ,a 2 ....,a n , ibig sabihin. .
Ang kahulugan ng batas ng malalaking numero ay ang average na mga halaga ng mga random na variable ay may posibilidad sa kanilang inaasahan sa matematika kapag n→ ∞ sa posibilidad. Ang paglihis ng ibig sabihin ng mga halaga mula sa inaasahan sa matematika ay nagiging arbitraryong maliit na may posibilidad na malapit sa isa kung sapat na malaki ang n. Sa madaling salita, ang posibilidad ng anumang paglihis ng mga paraan mula sa a arbitraryong maliit na may paglaki n.
30. Ang teorama ni Bernoulli.
Ang teorama ni Bernoulli: Dalas ng kaganapan sa n paulit-ulit na mga independiyenteng pagsubok, kung saan maaari itong mangyari na may parehong probabilidad p, na may walang limitasyong pagtaas sa bilang n magtagpo sa probabilidad sa probabilidad p ng kaganapang ito sa isang hiwalay na pagsubok: \
Ang theorem ni Bernoulli ay bunga ng theorem ni Chebyshev, dahil ang dalas ng isang kaganapan ay maaaring katawanin bilang arithmetic mean ng n independiyenteng alternatibong random variable na may parehong batas sa pamamahagi.
18. Mathematical na inaasahan ng isang discrete at tuloy-tuloy na random variable at ang kanilang mga katangian.
inaasahan sa matematika ay ang kabuuan ng mga produkto ng lahat ng mga halaga nito at ang kanilang mga katumbas na probabilidad
Para sa isang discrete random variable:
Para sa tuluy-tuloy na random na variable:
Mga katangian ng inaasahan sa matematika:
1. Ang mathematical na inaasahan ng isang pare-parehong halaga ay katumbas ng pare-pareho mismo: M(S)=S
2. Ang pare-parehong kadahilanan ay maaaring alisin sa pag-sign ng inaasahan, i.e. M(kX)=kM(X).
3. Ang mathematical expectation ng algebraic sum ng isang finite number of random variables ay katumbas ng parehong sum ng kanilang mathematical expectations, i.e. M(X±Y)=M(X)±M(Y).
4. Ang mathematical na inaasahan ng produkto ng isang may hangganang bilang ng mga independent random variable ay katumbas ng produkto ng kanilang mga mathematical na inaasahan: M(XY)=M(X)*M(Y).
5. Kung ang lahat ng mga halaga ng isang random na variable ay nadagdagan (nababawasan) ng isang pare-parehong C, kung gayon ang matematikal na inaasahan ng random na variable na ito ay tataas (bumababa) ng parehong pare-parehong C: M(X±C)=M(X)±C.
6. Ang mathematical expectation ng deviation ng random variable mula sa mathematical expectation nito ay zero: M=0.
LECTURE 5 Pag-uulit ng nakaraanAno ang sikreto ng mga matagumpay na nagbebenta? Kung pinapanood mo ang pinakamahusay na mga salespeople ng anumang kumpanya, mapapansin mo na mayroon silang isang bagay na karaniwan. Ang bawat isa sa kanila ay nakakatugon sa mas maraming tao at gumagawa ng mas maraming presentasyon kaysa sa hindi gaanong matagumpay na mga tindero. Nauunawaan ng mga taong ito na ang mga benta ay isang laro ng numero, at kapag mas maraming tao ang kanilang sinasabi tungkol sa kanilang mga produkto o serbisyo, mas maraming deal ang kanilang isinasara - iyon lang. Nauunawaan nila na kung nakikipag-usap sila hindi lamang sa iilan na tiyak na nagsasabi ng oo sa kanila, kundi pati na rin sa mga taong ang interes sa kanilang panukala ay hindi masyadong malaki, kung gayon ang batas ng mga average ay gagana sa kanilang pabor.
Ang iyong mga kita ay depende sa bilang ng mga benta, ngunit sa parehong oras, sila ay direktang proporsyonal sa bilang ng mga pagtatanghal na iyong gagawin. Kapag naunawaan mo at sinimulang isabuhay ang batas ng mga average, ang pagkabalisa na nauugnay sa pagsisimula ng isang bagong negosyo o pagtatrabaho sa isang bagong larangan ay magsisimulang mabawasan. At bilang isang resulta, ang isang pakiramdam ng kontrol at kumpiyansa sa kanilang kakayahang kumita ay magsisimulang lumago. Kung gagawa ka lang ng mga presentasyon at hahasa ang iyong mga kasanayan sa proseso, magkakaroon ng mga deal.
Sa halip na isipin ang tungkol sa bilang ng mga deal, isipin ang tungkol sa bilang ng mga presentasyon. Walang saysay na gumising sa umaga o umuwi sa gabi at magsimulang mag-isip kung sino ang bibili ng iyong produkto. Sa halip, pinakamahusay na planuhin bawat araw kung gaano karaming mga tawag ang kailangan mong gawin. At pagkatapos, kahit na ano - gawin ang lahat ng mga tawag na iyon! Ang diskarte na ito ay gagawing mas madali ang iyong trabaho - dahil ito ay isang simple at tiyak na layunin. Kung alam mo na mayroon kang isang napaka-tiyak at maaabot na layunin sa harap mo, magiging mas madali para sa iyo na gawin ang nakaplanong bilang ng mga tawag. Kung maririnig mo ang "oo" ng ilang beses sa prosesong ito, mas mabuti!
At kung "hindi", kung gayon sa gabi ay madarama mo na tapat mong ginawa ang lahat ng iyong makakaya, at hindi ka pahihirapan ng mga pag-iisip tungkol sa kung gaano karaming pera ang iyong kinita, o kung gaano karaming mga kasosyo ang iyong nakuha sa isang araw.
Sabihin nating sa iyong kumpanya o sa iyong negosyo, ang karaniwang salesperson ay nagsasara ng isang deal sa bawat apat na presentasyon. Ngayon isipin na gumuhit ka ng mga card mula sa isang deck. Ang bawat card ng tatlong suit - spade, diamante at club - ay isang presentasyon kung saan propesyonal kang nagpapakita ng produkto, serbisyo o pagkakataon. Ginagawa mo ito sa abot ng iyong makakaya, ngunit hindi mo pa rin isinasara ang deal. At ang bawat heart card ay isang deal na nagbibigay-daan sa iyong makakuha ng pera o makakuha ng bagong kasama.
Sa ganoong sitwasyon, hindi mo ba gustong gumuhit ng maraming card mula sa deck hangga't maaari? Ipagpalagay na inaalok kang gumuhit ng maraming card hangga't gusto mo, habang binabayaran ka o nagmumungkahi ng bagong kasama sa tuwing gumuhit ka ng heart card. Magsisimula kang gumuhit ng mga card nang masigasig, halos hindi napapansin kung ano ang angkop sa card na kakalabas lang.
Alam mo na mayroong labintatlong puso sa isang deck ng limampu't dalawang baraha. At sa dalawang deck - dalawampu't anim na card ng puso, at iba pa. Mabibigo ka ba sa pamamagitan ng pagguhit ng mga pala, diamante o club? Syempre hindi! Iisipin mo lang na ang bawat ganitong "miss" ay naglalapit sa iyo - sa ano? Sa card of hearts!
Pero alam mo kung ano? Nabigyan ka na ng alok na ito. Ikaw ay nasa isang natatanging posisyon upang kumita ng mas maraming hangga't gusto mo at gumuhit ng maraming card ng puso hangga't gusto mong iguhit sa iyong buhay. At kung ikaw ay "gumuhit ng mga card" nang buong taimtim, pagbutihin ang iyong mga kasanayan at magtiis ng kaunting spade, tamburin at mga club, kung gayon ikaw ay magiging isang mahusay na tindero at magtatagumpay.
Ang isa sa mga bagay na nagpapasaya sa pagbebenta ay na sa tuwing ka-shuffle mo ang deck, iba-iba ang pagba-shuffle ng mga card. Minsan ang lahat ng mga puso ay napupunta sa simula ng deck, at pagkatapos ng isang matagumpay na streak (kapag tila sa amin na hindi na kami mawawala!) Kami ay naghihintay para sa isang mahabang hilera ng mga card ng ibang suit. At sa isa pang pagkakataon, upang makarating sa unang puso, kailangan mong dumaan sa walang katapusang bilang ng mga pala, club at tamburin. At kung minsan ang mga card ng iba't ibang suit ay mahigpit na nahuhulog sa turn. Ngunit sa anumang kaso, sa bawat deck ng limampu't dalawang baraha, sa ilang pagkakasunud-sunod, palaging may labintatlong puso. Ilabas lang ang mga card hanggang sa makita mo ang mga ito.
Kung ang phenomenon ng sustainability daluyan nagaganap sa katotohanan, pagkatapos ay sa modelong matematika kung saan pinag-aaralan natin ang mga random na phenomena, dapat mayroong isang teorama na sumasalamin sa katotohanang ito.
Sa ilalim ng mga kondisyon ng teorama na ito, ipinakilala namin ang mga paghihigpit sa mga random na variable X 1 , X 2 , …, X n:
a) bawat random na variable Х i may mathematical expectation
M(Х i) = a;
b) ang pagkakaiba-iba ng bawat random na variable ay may hangganan, o maaari nating sabihin na ang mga pagkakaiba-iba ay bounded mula sa itaas ng parehong numero, halimbawa SA, ibig sabihin.
D(Х i) < C, i = 1, 2, …, n;
c) ang mga random na variable ay pairwise independent, ibig sabihin, alinman sa dalawa X i at Xj sa i¹ j malaya.
Tapos obviously
D(X 1 + X 2 + … + X n)=D(X 1) + D(X 2) + ... + D(X n).
Bumalangkas tayo ng batas ng malalaking numero sa anyo ng Chebyshev.
Ang teorama ni Chebyshev: na may walang limitasyong pagtaas sa bilang n mga independyenteng pagsusulit" ang arithmetic mean ng mga naobserbahang halaga ng isang random na variable ay nagtatagpo sa probabilidad sa kanyang inaasahan sa matematika ”, ibig sabihin, para sa anumang positibo ε
R(| –isang| < ε ) = 1. (4.1.1)
Ang kahulugan ng pagpapahayag "aritmetika ibig sabihin = nagtatagpo sa posibilidad sa isang" iyon ba ang posibilidad na ay mag-iiba nang kaunti sa a, lumalapit sa 1 nang walang katiyakan bilang numero n.
Patunay. Para sa isang may hangganang numero n mga independyenteng pagsusulit, inilalapat namin ang hindi pagkakapantay-pantay ng Chebyshev para sa isang random na variable = :
R(|–M()| < ε ) ≥ 1 – . (4.1.2)
Isinasaalang-alang ang mga paghihigpit a - b, kinakalkula namin M( ) at D( ):
M( ) = = = = = = a;
D( ) = = = = = = .
Pagpapalit M( ) at D( ) sa hindi pagkakapantay-pantay (4.1.2), nakukuha natin
R(| –isang| < ε )≥1 – .
Kung sa hindi pagkakapantay-pantay (4.1.2) kukuha tayo ng arbitraryong maliit ε >0 at n® ¥, pagkatapos makuha namin
na nagpapatunay sa Chebyshev theorem.
Isang mahalagang praktikal na konklusyon ang sumusunod mula sa itinuturing na teorama: may karapatan kaming palitan ang hindi kilalang halaga ng inaasahan sa matematika ng isang random na variable ng arithmetic mean na halaga na nakuha mula sa isang sapat na malaking bilang ng mga eksperimento. Kasabay nito, mas maraming mga eksperimento para sa pagkalkula, mas malamang (pagkakatiwalaan) maaari itong asahan na ang error na nauugnay sa pagpapalit na ito ( - a) ay hindi lalampas sa ibinigay na halaga ε .
Bilang karagdagan, ang iba pang mga praktikal na problema ay maaaring malutas. Halimbawa, ayon sa mga halaga ng posibilidad (kaasahan) R=R(| – isang|< ε ) at ang maximum na pinapayagang error ε tukuyin ang kinakailangang bilang ng mga eksperimento n; sa R at P tukuyin ε; sa ε at P matukoy ang posibilidad ng isang kaganapan | – isang |< ε.
espesyal na kaso. Hayaan sa n mga pagsubok na sinusunod n mga halaga ng isang random na variable x, pagkakaroon ng mathematical expectation M(X) at pagpapakalat D(X). Ang nakuha na mga halaga ay maaaring ituring bilang mga random na variable X 1 ,X 2 ,X 3 , ... ,X n,. Dapat itong maunawaan bilang mga sumusunod: isang serye ng P ang mga pagsusulit ay paulit-ulit na isinasagawa, kaya bilang isang resulta i ika na pagsubok, i= l, 2, 3, ..., P, sa bawat serye ng mga pagsubok ay lilitaw ang isa o isa pang halaga ng isang random na variable X, hindi alam nang maaga. Kaya naman, i-e halaga x i random variable na nakuha sa i ika test, random na nagbabago kung lilipat ka mula sa isang serye ng mga pagsubok patungo sa isa pa. Kaya bawat halaga x i maaaring ituring na random X i .
Ipagpalagay na ang mga pagsusulit ay nakakatugon sa mga sumusunod na kinakailangan:
1. Ang mga pagsusulit ay independyente. Nangangahulugan ito na ang mga resulta X 1 , X 2 ,
X 3 , ..., X n Ang mga pagsusulit ay mga independiyenteng random na variable.
2. Ang mga pagsusulit ay isinasagawa sa ilalim ng parehong mga kundisyon - nangangahulugan ito, mula sa punto ng view ng probability theory, na ang bawat isa sa mga random na variable X 1 ,X 2 ,X 3 , ... ,X n ay may parehong batas sa pamamahagi gaya ng orihinal na halaga X, Kaya naman M(X i) =M(X)at D(X i) = D(X), i = 1, 2, .... P.
Isinasaalang-alang ang mga kondisyon sa itaas, nakukuha namin
R(| –isang| < ε )≥1 – . (4.1.3)
Halimbawa 4.1.1. X ay katumbas ng 4. Ilang mga independiyenteng eksperimento ang kinakailangan upang may posibilidad na hindi bababa sa 0.9 ay maaaring asahan na ang arithmetic mean ng random variable na ito ay mag-iiba mula sa mathematical na inaasahan ng mas mababa sa 0.5?
Solusyon.Ayon sa kalagayan ng problema ε = 0,5; R(| – isang|< 0,5) ≥ 0.9. Paglalapat ng formula (4.1.3) para sa random variable X, nakukuha namin
P(|–M(X)| < ε ) ≥ 1 – .
Mula sa relasyon
1 – = 0,9
tukuyin
P= = = 160.
Sagot: kinakailangan na gumawa ng 160 independiyenteng mga eksperimento.
Ipagpalagay na ang ibig sabihin ng arithmetic karaniwang ipinamamahagi, nakukuha namin ang:
R(| – isang|< ε )= 2Φ () ≥ 0,9.
Mula sa kung saan, gamit ang talahanayan ng Laplace function, nakukuha namin ≥
≥
1.645, o ≥ 6.58 i.e. n ≥49.
Halimbawa 4.1.2. Pagkakaiba-iba ng isang random na variable X ay katumbas ng D( X) = 5. 100 independyenteng mga eksperimento ang isinagawa, ayon sa kung saan . Sa halip na ang hindi kilalang halaga ng inaasahan sa matematika a tinanggap . Tukuyin ang maximum na halaga ng error na pinapayagan sa kasong ito na may posibilidad na hindi bababa sa 0.8.
Solusyon. Ayon sa gawain n= 100, R(| –isang|< ε ) ≥0.8. Inilapat namin ang formula (4.1.3)
R(| –isang|< ε ) ≥1 – .
Mula sa relasyon
1 – = 0,8
tukuyin ε :
ε 2 = = = 0,25.
Kaya naman, ε = 0,5.
Sagot: maximum na halaga ng error ε = 0,5.
4.2. Batas ng malalaking numero sa anyong Bernoulli
Bagama't ang konsepto ng probabilidad ay ang batayan ng anumang statistical inference, maaari lamang nating matukoy sa ilang mga kaso ang posibilidad ng isang kaganapan nang direkta. Minsan ang probabilidad na ito ay maaaring itatag mula sa mga pagsasaalang-alang ng simetrya, pantay na pagkakataon, atbp., ngunit walang unibersal na paraan na magpapahintulot sa isa na ipahiwatig ang posibilidad nito para sa isang arbitrary na kaganapan. Ginagawang posible ng theorem ni Bernoulli na matantya ang probabilidad kung para sa kaganapang interesado sa atin A maaaring isagawa ang paulit-ulit na mga independyenteng pagsusulit. Hayaang gumawa P mga independiyenteng pagsusulit, sa bawat isa kung saan ang posibilidad ng paglitaw ng ilang kaganapan A pare-pareho at pantay R.
Ang teorama ni Bernoulli. Sa walang limitasyong pagtaas sa bilang ng mga independiyenteng pagsubok P relatibong dalas ng paglitaw ng isang pangyayari A nagtatagpo sa probabilidad sa probabilidad p paglitaw ng isang pangyayari A,T. e.
P(½ - p½≤ ε) = 1, (4.2.1)
saan ε ay isang arbitraryong maliit na positibong numero.
Para sa final n sa kondisyon na , ang hindi pagkakapantay-pantay ni Chebyshev para sa isang random na variable ay magkakaroon ng form:
P(| –p|< ε ) ≥ 1 – .(4.2.2)
Patunay. Inilapat namin ang Chebyshev theorem. Hayaan X i– bilang ng mga paglitaw ng kaganapan A v i ika na pagsubok, i= 1, 2, . . . , n. Ang bawat isa sa mga dami X i maaari lamang kumuha ng dalawang halaga:
X i= 1 (kaganapan A nangyari) na may posibilidad p,
X i= 0 (kaganapan A hindi nangyari) na may posibilidad q= 1–p.
Hayaan Y n= . Sum X 1 + X 2 + … + X n ay katumbas ng bilang m mga pangyayari A v n mga pagsubok (0 m n), ibig sabihin Y n= – relatibong dalas ng paglitaw ng kaganapan A v n mga pagsubok. Pag-asa at pagkakaiba sa matematika X i ay pantay ayon sa pagkakabanggit:
M( ) = 1∙p + 0∙q = p,
Halimbawa 4.2.1. Upang matukoy ang porsyento ng mga may sira na produkto, 1000 units ang nasubok ayon sa return sampling scheme. Ano ang posibilidad na ang ganap na halaga ng rate ng pagtanggi na tinutukoy ng sample na ito ay mag-iiba mula sa rate ng pagtanggi para sa buong batch ng hindi hihigit sa 0.01, kung alam na, sa karaniwan, mayroong 500 na may sira na mga item para sa bawat 10,000 mga item ?
Solusyon. Ayon sa kondisyon ng problema, ang bilang ng mga independiyenteng pagsubok n= 1000;
p= = 0,05; q= 1 – p= 0,95; ε = 0,01.
Paglalapat ng formula (4.2.2), nakukuha namin
P(| –p|< 0,01) ≥ 1 – = 1 – = 0,527.
Sagot: na may posibilidad na hindi bababa sa 0.527, maaaring asahan na ang sample fraction ng mga depekto (ang kamag-anak na dalas ng paglitaw ng mga depekto) ay mag-iiba mula sa bahagi ng mga depekto sa lahat ng mga produkto (mula sa posibilidad ng mga depekto) ng hindi hihigit sa 0.01 .
Halimbawa 4.2.2. Kapag nagtataktak ng mga bahagi, ang posibilidad ng kasal ay 0.05. Gaano karaming mga bahagi ang kailangang suriin upang may posibilidad na hindi bababa sa 0.95 maaari itong asahan na ang kamag-anak na dalas ng mga may sira na produkto ay mag-iiba mula sa posibilidad ng kasal ng mas mababa sa 0.01?
Solusyon. Ayon sa gawain R= 0,05; q= 0,95; ε = 0,01;
P(| – p|<0,01) ≥ 0,95.
Mula sa pagkakapantay-pantay 1 – = 0.95 mahanap n:
n= = =9500.
Sagot: 9500 item ang kailangang suriin.
Magkomento. Ang mga pagtatantya ng kinakailangang bilang ng mga obserbasyon na nakuha sa pamamagitan ng paglalapat ng teorama ni Bernoulli (o ni Chebyshev) ay labis na pinalaki. Mayroong mas tumpak na mga pagtatantya na iminungkahi nina Bernstein at Khinchin, ngunit nangangailangan ng mas kumplikadong kasangkapang pangmatematika. Upang maiwasan ang pagmamalabis ng mga pagtatantya, minsan ginagamit ang formula ng Laplace
P(| – p|< ε ) ≈ 2Φ .
Ang kawalan ng formula na ito ay ang kakulangan ng pagtatantya ng pinapayagang error.
Batas ng malalaking numero sa probability theory ay nagsasaad na ang empirical mean (arithmetic mean) ng isang sapat na malaking finite sample mula sa fixed distribution ay malapit sa theoretical mean (expectation) ng distribution na ito. Depende sa uri ng convergence, nakikilala ng isa ang mahinang batas ng malalaking numero, kapag may convergence sa probabilidad, at ang malakas na batas ng malalaking numero, kapag may convergence halos saanman.
Palaging may limitadong bilang ng mga pagsubok kung saan, sa anumang naibigay na posibilidad, mas mababa sa 1 ang relatibong dalas ng paglitaw ng ilang kaganapan ay mag-iiba nang kaunti sa posibilidad nito.
Ang pangkalahatang kahulugan ng batas ng malalaking numero: ang magkasanib na pagkilos ng isang malaking bilang ng magkapareho at independiyenteng random na mga kadahilanan ay humahantong sa isang resulta na, sa limitasyon, ay hindi nakasalalay sa pagkakataon.
Ang mga pamamaraan para sa pagtatantya ng probabilidad batay sa pagsusuri ng isang limitadong sample ay batay sa property na ito. Ang isang magandang halimbawa ay ang hula ng mga resulta ng halalan batay sa isang survey ng isang sample ng mga botante.
1 / 5
✪ Batas ng Malaking Bilang
✪ 07 - Teorya ng probabilidad. Batas ng Malaking Bilang
✪ 42 Batas ng Malaking Bilang
✪ 1 - Batas ng malalaking numero ni Chebyshev
✪ Baitang 11, aralin 25, Gaussian curve. Batas ng Malaking Bilang
Tingnan natin ang batas ng malalaking numero, na marahil ang pinaka-intuitive na batas sa matematika at teorya ng posibilidad. At dahil nalalapat ito sa napakaraming bagay, kung minsan ay ginagamit ito at hindi nauunawaan. Bigyan ko muna ito ng kahulugan para sa katumpakan, at pagkatapos ay pag-uusapan natin ang tungkol sa intuwisyon. Kunin natin ang isang random na variable, sabihin ang X. Sabihin nating alam natin ang mathematical expectation o populasyon nito. Sinasabi lang ng Law of Large Numbers na kung kukuha tayo ng halimbawa ng n-th na bilang ng mga obserbasyon ng isang random variable at average ang bilang ng lahat ng mga obserbasyon na iyon... Kunin natin ang isang variable. Tawagan natin itong X na may subscript n at gitling sa itaas. Ito ang arithmetic mean ng ika-n na bilang ng mga obserbasyon ng aming random variable. Narito ang aking unang obserbasyon. I do the experiment once and I make this observation, then I do it again and I make this observation, I do it again and I get this. Pinapatakbo ko ang eksperimentong ito ng n beses at pagkatapos ay hinahati sa bilang ng aking mga obserbasyon. Narito ang aking sample mean. Narito ang average ng lahat ng mga obserbasyon na ginawa ko. Sinasabi sa atin ng batas ng malalaking numero na ang aking sample mean ay lalapit sa mean ng random variable. O maaari ko ring isulat na ang aking sample na ibig sabihin ay lalapit sa ibig sabihin ng populasyon para sa ika-n bilang na pupunta sa infinity. Hindi ako gagawa ng malinaw na pagkakaiba sa pagitan ng "approximation" at "convergence", ngunit inaasahan kong maunawaan mo na kung kukuha ako ng isang medyo malaking sample dito, makukuha ko ang inaasahang halaga para sa populasyon sa kabuuan. Sa palagay ko naiintindihan ng karamihan sa inyo na kung gagawa ako ng sapat na mga pagsubok na may malaking sample ng mga halimbawa, sa kalaunan ay ibibigay sa akin ng mga pagsubok ang mga halagang inaasahan ko, na isinasaalang-alang ang inaasahan sa matematika, posibilidad at lahat ng iyon. Ngunit sa palagay ko ay madalas na hindi malinaw kung bakit ito nangyayari. At bago ko simulan ang pagpapaliwanag kung bakit ganito, hayaan mo akong magbigay sa iyo ng isang kongkretong halimbawa. Sinasabi sa atin ng batas ng malalaking numero na... Sabihin nating mayroon tayong random variable X. Ito ay katumbas ng bilang ng mga ulo sa 100 tosses ng tamang barya. Una sa lahat, alam natin ang mathematical expectation ng random variable na ito. Ito ang bilang ng mga coin tosses o pagsubok na pinarami ng posibilidad ng anumang pagsubok na magtagumpay. Kaya ito ay katumbas ng 50. Ibig sabihin, sinasabi ng batas ng malalaking numero na kung kukuha tayo ng sample, o kung average ko ang mga pagsubok na ito, nakukuha ko. .. Sa unang pagkakataon na gagawa ako ng pagsubok, nagpi-flip ako ng barya ng 100 beses, o kukuha ako ng isang kahon ng isang daang barya, inalog ito, at pagkatapos ay bilangin kung ilang ulo ang nakuha ko, at nakuha, sabihin nating, ang numerong 55. Ito ay magiging X1. Pagkatapos ay inalog ko muli ang kahon at nakuha ko ang numerong 65. Pagkatapos ay muli - at nakakuha ako ng 45. At ginagawa ko ito ng n beses, at pagkatapos ay hinahati ko ito sa bilang ng mga pagsubok. Sinasabi sa atin ng batas ng malalaking numero na ang average na ito (ang average ng lahat ng aking mga obserbasyon) ay magiging 50 habang ang n ay may posibilidad na infinity. Ngayon gusto kong pag-usapan nang kaunti kung bakit nangyayari ito. Maraming naniniwala na kung, pagkatapos ng 100 pagsubok, ang aking resulta ay higit sa karaniwan, kung gayon, ayon sa mga batas ng posibilidad, dapat akong magkaroon ng higit pa o mas kaunting mga ulo upang, kumbaga, mabayaran ang pagkakaiba. Hindi ito eksakto kung ano ang mangyayari. Ito ay madalas na tinutukoy bilang ang "pagkamali ng sugarol". Hayaan mong ipakita ko sa iyo ang pagkakaiba. Gagamitin ko ang sumusunod na halimbawa. Hayaan akong gumuhit ng isang graph. Palitan natin ang kulay. Ito ay n, ang aking x-axis ay n. Ito ang bilang ng mga pagsubok na aking tatakbo. At ang aking y-axis ang magiging sample mean. Alam natin na ang ibig sabihin ng arbitraryong variable na ito ay 50. Hayaan akong gumuhit nito. Ito ay 50. Bumalik tayo sa ating halimbawa. Kung ang n ay... Sa aking unang pagsusulit, nakakuha ako ng 55, na siyang aking average. Isa lang ang data entry point ko. Pagkatapos ng dalawang pagsubok, nakakuha ako ng 65. Kaya ang average ko ay magiging 65+55 na hinati ng 2. Iyon ay 60. At medyo tumaas ang average ko. Pagkatapos ay nakakuha ako ng 45, na nagpababa muli sa aking arithmetic mean. Hindi ako mag-plot ng 45 sa chart. Ngayon kailangan kong i-average ang lahat. Ano ang katumbas ng 45+65? Hayaan akong kalkulahin ang halagang ito upang kumatawan sa punto. Iyon ay 165 na hinati ng 3. Iyan ay 53. Hindi, 55. Kaya ang average ay bumaba muli sa 55. Maaari nating ipagpatuloy ang mga pagsubok na ito. Pagkatapos nating gumawa ng tatlong pagsubok at makabuo ng average na ito, iniisip ng maraming tao na gagawin ito ng mga diyos ng probabilidad upang mas kaunti ang ating makukuha sa hinaharap, na ang susunod na ilang pagsubok ay magiging mas mababa upang mabawasan ang average. Ngunit hindi ito palaging nangyayari. Sa hinaharap, ang posibilidad ay palaging nananatiling pareho. Ang posibilidad na ako ay gumulong ulo ay palaging 50%. Hindi sa una ay nakakakuha ako ng isang tiyak na bilang ng mga ulo, higit pa sa inaasahan ko, at pagkatapos ay biglang mahuhulog ang mga buntot. Ito ang "pagkakamali ng manlalaro". Kung makakakuha ka ng isang hindi katimbang na bilang ng mga ulo, hindi ito nangangahulugan na sa ilang mga punto ay magsisimula kang mahulog ng isang hindi katimbang na bilang ng mga buntot. Ito ay hindi ganap na totoo. Sinasabi sa atin ng batas ng malalaking numero na hindi ito mahalaga. Sabihin nating, pagkatapos ng tiyak na bilang ng mga pagsubok, ang iyong average... Ang posibilidad nito ay medyo maliit, ngunit, gayunpaman... Sabihin nating ang iyong average ay umabot sa markang ito - 70. Iniisip mo, "Wow, lumampas na kami sa inaasahan." Ngunit ang batas ng malalaking numero ay nagsasabi na wala itong pakialam kung gaano karaming mga pagsubok ang ating isinasagawa. Mayroon pa tayong walang katapusang bilang ng mga pagsubok sa hinaharap. Ang mathematical na inaasahan ng walang katapusang bilang ng mga pagsubok na ito, lalo na sa sitwasyong tulad nito, ay ang mga sumusunod. Kapag dumating ka sa isang may hangganang numero na nagpapahayag ng ilang malaking halaga, ang isang walang katapusang bilang na nagsasama-sama dito ay muling hahantong sa inaasahang halaga. Ito ay, siyempre, isang napakaluwag na interpretasyon, ngunit ito ang sinasabi sa atin ng batas ng malalaking numero. Ito ay mahalaga. Hindi niya sinasabi sa amin na kung kami ay makakakuha ng maraming mga ulo, kung gayon kahit papaano ang posibilidad na makakuha ng mga buntot ay tataas upang mabayaran. Sinasabi sa atin ng batas na ito na hindi mahalaga kung ano ang kahihinatnan ng may limitadong bilang ng mga pagsubok hangga't mayroon ka pa ring walang katapusang bilang ng mga pagsubok sa hinaharap. At kung gagawin mo nang sapat ang mga ito, babalik ka muli sa inaasahan. Ito ay isang mahalagang punto. Pag-isipan mo. Ngunit ito ay hindi ginagamit araw-araw sa pagsasanay sa mga lottery at casino, bagaman ito ay kilala na kung gumawa ka ng sapat na mga pagsubok... Maaari pa nga nating kalkulahin ito... ano ang posibilidad na tayo ay seryosong lumihis mula sa pamantayan? Ngunit ang mga casino at lottery ay gumagana araw-araw sa prinsipyo na kung kukuha ka ng sapat na mga tao, siyempre, sa maikling panahon, na may maliit na sample, pagkatapos ay ilang mga tao ang tatama sa dyekpot. Ngunit sa mahabang panahon, ang casino ay palaging makikinabang sa mga parameter ng mga laro na iniimbitahan ka nilang laruin. Ito ay isang mahalagang prinsipyo ng posibilidad na madaling maunawaan. Bagama't kung minsan, kapag ito ay pormal na ipinaliwanag sa iyo na may mga random na variable, ang lahat ay mukhang medyo nakakalito. Ang lahat ng sinasabi ng batas na ito ay ang mas maraming mga sample, mas ang arithmetic mean ng mga sample na iyon ay magsasama-sama patungo sa tunay na mean. At upang maging mas tiyak, ang arithmetic mean ng iyong sample ay magsasama-sama sa mathematical na inaasahan ng isang random variable. Iyon lang. See you sa susunod na video!
Ang mahinang batas ng malalaking numero ay tinatawag ding theorem ni Bernoulli, pagkatapos ni Jacob Bernoulli, na nagpatunay nito noong 1713.
Hayaang magkaroon ng walang katapusang sequence (magkakasunod na enumeration) ng magkakaparehong distributed at uncorrelated na random variable . Ibig sabihin, ang kanilang covariance c o v (X i , X j) = 0 , ∀ i ≠ j (\displaystyle \mathrm (cov) (X_(i),X_(j))=0,\;\forall i\not =j). Hayaan mong . Tukuyin sa pamamagitan ng sample mean ng una n (\displaystyle n) miyembro:
.
Pagkatapos X ¯ n → P μ (\displaystyle (\bar (X))_(n)\to ^(\!\!\!\!\!\!\mathbb (P) )\mu ).
Iyon ay, para sa bawat positibo ε (\displaystyle \varepsilon )
lim n → ∞ Pr (| X ¯ n − μ |< ε) = 1. {\displaystyle \lim _{n\to \infty }\Pr \!\left(\,|{\bar {X}}_{n}-\mu |<\varepsilon \,\right)=1.}Hayaang magkaroon ng isang walang katapusang pagkakasunud-sunod ng mga independiyenteng magkaparehong ipinamamahagi na mga random na variable ( X i ) i = 1 ∞ (\displaystyle \(X_(i)\)_(i=1)^(\infty )) tinukoy sa isang puwang ng posibilidad (Ω , F , P) (\displaystyle (\Omega ,(\mathcal (F)),\mathbb (P))). Hayaan E X i = μ , ∀ i ∈ N (\displaystyle \mathbb (E) X_(i)=\mu ,\;\forall i\in \mathbb (N) ). Tukuyin ng X¯n (\displaystyle (\bar(X))_(n)) sample mean ng una n (\displaystyle n) miyembro:
X ¯ n = 1 n ∑ i = 1 n X i , n ∈ N (\displaystyle (\bar (X))_(n)=(\frac (1)(n))\sum \limits _(i= 1)^(n)X_(i),\;n\in \mathbb (N) ).Pagkatapos X ¯ n → μ (\displaystyle (\bar (X))_(n)\to \mu ) halos palagi.
Pr (lim n → ∞ X ¯ n = μ) = 1. (\displaystyle \Pr \!\left(\lim _(n\to \infty )(\bar (X))_(n)=\mu \ kanan)=1.) .Tulad ng anumang batas sa matematika, ang batas ng malalaking numero ay maaari lamang ilapat sa totoong mundo sa ilalim ng mga kilalang pagpapalagay, na maaari lamang matugunan nang may tiyak na antas ng katumpakan. Kaya, halimbawa, ang mga kondisyon ng sunud-sunod na mga pagsubok ay madalas na hindi mapapanatili nang walang katiyakan at may ganap na katumpakan. Bilang karagdagan, ang batas ng malalaking numero ay nagsasalita lamang ng kawalan ng posibilidad makabuluhang paglihis ng mean na halaga mula sa inaasahan sa matematika.