Mga uso at uso sa fashion.  Mga accessories, sapatos, kagandahan, hairstyle

Mga uso at uso sa fashion. Mga accessories, sapatos, kagandahan, hairstyle

» Ang batas ng malalaking numero. Central limit theorem

Ang batas ng malalaking numero. Central limit theorem

Ang distribution function ng isang random variable at ang mga katangian nito.

function ng pamamahagi Ang random variable X ay tinatawag na function F(X), na nagpapahayag para sa bawat x ng probabilidad na ang random variable X ay kumukuha ng value na mas mababa sa x: F(x)=P(X

Function F(x) minsan tinatawag integral function pamamahagi o integral na batas sa pamamahagi.

Mga katangian ng pagpapaandar ng pamamahagi:

1. Ang distribution function ng isang random variable ay isang non-negative na function na nakapaloob sa pagitan ng zero at isa:

0 ≤ F(x) ≤ 1.

2. Ang distribution function ng isang random variable ay isang non-decreasing function sa whole number axis.

3. Sa minus infinity, ang distribution function ay katumbas ng zero, at plus infinity ito ay katumbas ng isa, i.e.: F(-∞)= , F(+∞)= .

4. Ang posibilidad ng isang random na variable na bumabagsak sa pagitan [x1,x2) (kabilang ang x1) ay katumbas ng pagtaas ng function ng pamamahagi nito sa interval na ito, i.e. P(x 1 ≤ X< х 2) = F(x 2) - F(x 1).


Markov at Chebyshev hindi pagkakapantay-pantay

Hindi pagkakapantay-pantay ni Markov

Teorama: Kung ang isang random na variable X ay tumatagal lamang ng mga hindi negatibong halaga at may inaasahan sa matematika, kung gayon para sa anumang positibong numero A ang pagkakapantay-pantay ay totoo: P(x>A) ≤ .

Dahil ang mga kaganapan X > A at X ≤ A ay magkasalungat, pinapalitan ang P(X > A) ipinapahayag namin ang 1 - P (X ≤ A), dumating kami sa isa pang anyo ng hindi pagkakapantay-pantay ni Markov: P(X ≥ A) ≥1 - .

Ang hindi pagkakapantay-pantay ni Markov k ay naaangkop sa anumang hindi negatibong random na variable.

Ang hindi pagkakapantay-pantay ni Chebyshev

Teorama: Para sa anumang random na variable na may mathematical na inaasahan at pagkakaiba, ang hindi pagkakapantay-pantay ni Chebyshev ay totoo:

P (|X - a| > ε) ≤ D(X) / ε 2 o P (|X - a| ≤ ε) ≥ 1 - DX / ε 2, kung saan ang isang \u003d M (X), ε>0.


Ang batas ng malalaking numero "sa anyo" ng teorama ni Chebyshev.

Ang teorama ni Chebyshev: Kung ang mga pagkakaiba n mga independiyenteng random na variable X1, X2,…. X n ay limitado ng parehong pare-pareho, pagkatapos ay may walang limitasyong pagtaas sa bilang n ang arithmetic mean ng mga random na variable ay nagtatagpo sa probabilidad sa arithmetic mean ng kanilang mga inaasahan sa matematika a 1 ,a 2 ....,a n , ibig sabihin. .

Ang kahulugan ng batas ng malalaking numero ay ang average na mga halaga ng mga random na variable ay may posibilidad sa kanilang inaasahan sa matematika kapag n→ ∞ sa posibilidad. Ang paglihis ng ibig sabihin ng mga halaga mula sa inaasahan sa matematika ay nagiging arbitraryong maliit na may posibilidad na malapit sa isa kung sapat na malaki ang n. Sa madaling salita, ang posibilidad ng anumang paglihis ng mga paraan mula sa a arbitraryong maliit na may paglaki n.



30. Ang teorama ni Bernoulli.

Ang teorama ni Bernoulli: Dalas ng kaganapan sa n paulit-ulit na mga independiyenteng pagsubok, kung saan maaari itong mangyari na may parehong probabilidad p, na may walang limitasyong pagtaas sa bilang n magtagpo sa probabilidad sa probabilidad p ng kaganapang ito sa isang hiwalay na pagsubok: \

Ang theorem ni Bernoulli ay bunga ng theorem ni Chebyshev, dahil ang dalas ng isang kaganapan ay maaaring katawanin bilang arithmetic mean ng n independiyenteng alternatibong random variable na may parehong batas sa pamamahagi.

18. Mathematical na inaasahan ng isang discrete at tuloy-tuloy na random variable at ang kanilang mga katangian.

inaasahan sa matematika ay ang kabuuan ng mga produkto ng lahat ng mga halaga nito at ang kanilang mga katumbas na probabilidad

Para sa isang discrete random variable:

Para sa tuluy-tuloy na random na variable:

Mga katangian ng inaasahan sa matematika:

1. Ang mathematical na inaasahan ng isang pare-parehong halaga ay katumbas ng pare-pareho mismo: M(S)=S

2. Ang pare-parehong kadahilanan ay maaaring alisin sa pag-sign ng inaasahan, i.e. M(kX)=kM(X).

3. Ang mathematical expectation ng algebraic sum ng isang finite number of random variables ay katumbas ng parehong sum ng kanilang mathematical expectations, i.e. M(X±Y)=M(X)±M(Y).

4. Ang mathematical na inaasahan ng produkto ng isang may hangganang bilang ng mga independent random variable ay katumbas ng produkto ng kanilang mga mathematical na inaasahan: M(XY)=M(X)*M(Y).

5. Kung ang lahat ng mga halaga ng isang random na variable ay nadagdagan (nababawasan) ng isang pare-parehong C, kung gayon ang matematikal na inaasahan ng random na variable na ito ay tataas (bumababa) ng parehong pare-parehong C: M(X±C)=M(X)±C.

6. Ang mathematical expectation ng deviation ng random variable mula sa mathematical expectation nito ay zero: M=0.

LECTURE 5

Pag-uulit ng nakaraan

Bahagi 1 - KABANATA 9. BATAS NG MALAKING BILANG. LIMITAHAN ANG MGA TEOREM

Sa isang istatistikal na kahulugan
probabilidad, ito ay itinuturing bilang ilan
ang bilang kung saan ang kamag-anak
ang dalas ng isang random na kaganapan. Sa
axiomatic na kahulugan ng probabilidad -
ito ay, sa katunayan, isang additive na sukatan ng set
kinalabasan na pinapaboran ang pagkakataon
kaganapan. Sa unang kaso, kami ay nakikitungo sa
empirical limit, sa pangalawa - may
ang teoretikal na konsepto ng sukat. Walang katulad
Malinaw na pareho silang tinutukoy
konsepto. Relasyon ng iba't ibang kahulugan
Ang mga probabilidad ay itinatag ng teorama ni Bernoulli,
na isang espesyal na kaso ng batas ng malaki
numero.

Sa pagtaas ng bilang ng mga pagsubok
ang binomial na batas ay may kaugaliang
normal na pamamahagi. Ito ay isang teorama
De Moivre-Laplace, na
espesyal na kaso ng gitnang limitasyon
theorems. Ang huli ay nagsasabi na ang function
pamamahagi ng kabuuan ng malaya
mga random na variable na may tumataas na bilang
ang mga termino ay karaniwang normal
batas.
Ang batas ng malalaking numero at ang sentral
ang limit theorem na nasa ilalim
mga istatistika ng matematika.

9.1. Ang hindi pagkakapantay-pantay ni Chebyshev

Hayaang mayroon ang random variable ξ
may hangganang inaasahan sa matematika
M[ξ] at variance D[ξ]. Pagkatapos ay para sa
anumang positibong numero ε
ang hindi pagkakapantay-pantay ay totoo:

Mga Tala

Para sa kabaligtaran na kaganapan:
Ang hindi pagkakapantay-pantay ni Chebyshev ay may bisa para sa
anumang batas sa pamamahagi.
Paglalagay
katotohanan:
, nakakakuha kami ng isang nontrivial

9.2. Ang batas ng malalaking numero sa anyo ng Chebyshev

Theorem Hayaan ang mga random na variable
ay pairwise independent at may hangganan
ang mga pagkakaiba ay limitado sa pareho
pare-pareho
Pagkatapos ay para sa
anuman
meron kami
Kaya, ang batas ng malaking bilang ay nagsasalita ng
convergence sa probability ng arithmetic mean ng random variables (i.e. random variable)
sa kanilang arithmetic mean mat. mga inaasahan (i.e.
sa isang hindi random na halaga).

9.2. Batas ng Malaking Numero sa Chebyshev Form: Complement

Theorem (Markov): batas ng malaki
ang mga numero ay nasiyahan kung ang pagkakaiba
ang kabuuan ng mga random na variable ay hindi lumalaki
masyadong mabilis habang lumalaki ang n:

10.9.3. Ang teorama ni Bernoulli

Theorem: Isaalang-alang ang Bernoulli scheme.
Hayaang μn ang bilang ng mga paglitaw ng kaganapan A sa
n mga independiyenteng pagsubok, ang p ay ang posibilidad ng paglitaw ng kaganapan A sa isa
pagsusulit. Pagkatapos ay para sa anumang
Yung. ang posibilidad na ang paglihis
relatibong dalas ng isang random na kaganapan mula sa
ang probabilidad nito ay magiging modulo nang arbitraryo
maliit, ito ay may posibilidad sa pagkakaisa habang dumarami ang bilang.
mga pagsubok n.

11.

Patunay: Random na variable μn
ipinamahagi ayon sa binomial na batas, kaya
meron kami

12.9.4. Mga katangiang pag-andar

Ang katangiang pag-andar ng random
ang dami ay tinatawag na function
kung saan exp(x) = ex.
Sa ganitong paraan,
kumakatawan
inaasahan ng ilan
kumplikadong random variable
nauugnay sa magnitude. Sa partikular, kung
ay isang discrete random variable,
ibinigay ng serye ng pamamahagi (xi, pi), kung saan i
= 1, 2,..., n, pagkatapos

13.

Para sa tuluy-tuloy na random variable
na may density ng pamamahagi
mga probabilidad

14.

15.9.5. Central limit theorem (Lyapunov's theorem)

16.

Naulit ang nakaraan

17. MGA PUNDAMENTAL NG TEORYA NG PROBABILIDAD AT MATHEMATICAL STATISTICS

BAHAGI II. MATHEMATICAL
STATISTICS

18. Epigraph

"May tatlong uri ng kasinungalingan: kasinungalingan,
tahasang kasinungalingan at istatistika"
Benjamin Disraeli

19. Panimula

Ang dalawang pangunahing gawain ng matematika
istatistika:
koleksyon at pagpapangkat ng istatistika
data;
pagbuo ng mga pamamaraan ng pagsusuri
nakatanggap ng data depende sa
layunin ng pananaliksik.

20. Mga paraan ng pagsusuri sa istatistikal na datos:

pagtatantya ng hindi alam na posibilidad ng isang kaganapan;
hindi kilalang pagtatantya ng function
pamamahagi;
pagtatantya ng mga parameter ng kilala
pamamahagi;
pagpapatunay ng mga istatistikal na hypotheses tungkol sa species
hindi kilalang pamamahagi o
mga halaga ng parameter ng kilala
pamamahagi.

21. KABANATA 1. MGA BATAYANG KONSEPTO NG MATHEMATICAL STATISTICS

22.1.1. Pangkalahatang populasyon at sample

Pangkalahatang populasyon - lahat
maraming sinaliksik na bagay,
Sample - isang hanay ng mga bagay, random
pinili mula sa pangkalahatang populasyon
para sa pananaliksik.
Ang dami ng pangkalahatang populasyon at
laki ng sample - ang bilang ng mga bagay sa pangkalahatang populasyon at sample - gagawin namin
tinutukoy bilang N at n, ayon sa pagkakabanggit.

23.

Ang sampling ay inuulit kapag
bawat napiling bagay
pagpili ng susunod na pagbabalik sa
pangkalahatang populasyon, at
hindi nauulit kung pinili
bagay sa pangkalahatang populasyon
nagbabalik.

24. Sampol ng kinatawan:

wastong kumakatawan sa mga katangian
pangkalahatang populasyon, i.e. ay isang
kinatawan (representative).
Ayon sa batas ng malalaking numero, maaari itong ipagtanggol
na ang kundisyong ito ay natutugunan kung:
1) sapat na malaki ang sample size n;
2) ang bawat bagay ng sample ay pinili nang random;
3) para sa bawat bagay, ang posibilidad ng paghagupit
sa sample ay pareho.

25.

Pangkalahatang populasyon at sample
maaaring one-dimensional
(iisang salik)
at multidimensional (multifacttorial)

26.1.2. Halimbawang batas sa pamamahagi (serye ng istatistika)

Ipasok ang isang sample ng laki n
random variable ng interes sa amin ξ
(anumang parameter ng mga bagay
populasyon) ay tumatagal ng n1
beses ang halaga ng x1, n2 beses ang halaga ng x2,... at
nk beses ay ang halaga ng xk. Tapos yung observables
mga halaga ng x1, x2,..., xk ng isang random na variable
Ang ξ ay tinatawag na mga variant, at n1, n2,..., nk
- kanilang mga frequency.

27.

Ang pagkakaiba xmax - xmin ay ang saklaw
sample, ang ratio ωi = ni / n –
mga opsyon sa relatibong dalas xi.
Obvious naman yun

28.

Kung isusulat namin ang mga opsyon sa pataas na pagkakasunud-sunod, makakakuha kami ng variational series. Isang mesa na binubuo ng
iniutos na variant at ang kanilang mga frequency
(at/o mga kamag-anak na frequency)
ay tinatawag na serye ng istatistika o
piling batas sa pamamahagi.
-- Analogue ng batas ng pamamahagi ng discrete
random variable sa probability theory

29.

Kung ang variation series ay binubuo ng very
maraming numero o
ilang tuloy-tuloy
mag-sign, gumamit ng nakapangkat
sample. Upang makuha ito, ang pagitan
na naglalaman ng lahat ng nakikita
Ang mga halaga ng tampok ay nahahati sa
ilang karaniwang pantay na bahagi
(subintervals) ng haba h. Sa
pag-iipon ng isang serye ng istatistika sa
bilang xi, kadalasang pinipili ang mga midpoint
subintervals, at katumbas ni sa bilang
variant na nahulog sa i-th subinterval.

30.

40
- Mga frequency -
35
30
n2
n3
ns
n1
25
20
15
10
5
0
a
a+h/2 a+3h/2
- Mga Pagpipilian -
b-h/2
b

31.1.3. Frequency polygon, sample distribution function

Ipagpaliban natin ang mga halaga ng random variable xi sa pamamagitan ng
ang abscissa axis, at ang ni values ​​sa kahabaan ng ordinate axis.
Isang putol na linya na ang mga segment ay kumonekta
mga puntos na may mga coordinate (x1, n1), (x2, n2),..., (xk,
nk) ay tinatawag na polygon
mga frequency. Kung sa halip
ganap na halaga ni
ilagay sa y-axis
mga kamag-anak na frequency ωi,
pagkatapos ay makakakuha tayo ng polygon ng mga relatibong frequency

32.

Sa pamamagitan ng pagkakatulad sa function ng pamamahagi
discrete random variable sa pamamagitan ng
ang sampling na batas ng pamamahagi ay maaaring
bumuo ng isang sample (empirical)
function ng pamamahagi
kung saan ang pagsusuma ay ginaganap sa lahat
mga frequency, na tumutugma sa mga halaga
variant, mas maliit na x. pansinin mo yan
empirical distribution function
depende sa sample size n.

33.

Hindi tulad ng pag-andar
natagpuan
para sa isang random na variable ξ experimental
sa pamamagitan ng pagproseso ng statistical data, ang tunay na function
pamamahagi
na nauugnay sa
ang pangkalahatang populasyon ay tinatawag
teoretikal. (karaniwan ay pangkalahatan
ang aggregate ay napakalaki na
imposibleng iproseso ang lahat ng ito;
maaari lamang tuklasin
sa teorya).

34.

Pansinin, na:

35.1.4. Mga katangian ng empirical distribution function

humakbang
tingnan

36.

Isa pang graphical na representasyon
ang sample na interesado kami ay
histogram - stepped figure,
na binubuo ng mga parihaba na ang mga base ay mga subinterval
lapad h, at taas - mga segment ng haba
ni/h (frequency histogram) o ωi/h
(histogram ng mga kamag-anak na frequency).
Sa unang kaso
Ang histogram area ay katumbas ng volume
sample n, habang
pangalawa - yunit

37. Halimbawa

38. KABANATA 2. NUMERICAL NA KATANGIAN NG SAMPLE

39.

Ang gawain ng mga istatistika ng matematika ay
makuha mula sa magagamit na sample
impormasyon tungkol sa heneral
pinagsama-samang. Mga numerical na katangian ng isang kinatawan na sample - pagtatasa ng mga nauugnay na katangian
random variable sa ilalim ng pag-aaral,
nauugnay sa pangkalahatan
pinagsama-sama.

40.2.1. Sample mean at sample variance, empirical moments

Ang sample mean ay tinatawag
arithmetic mean ng mga halaga
variant sa sample
Ginagamit ang sample mean para sa
istatistikal na pagsusuri ng matematika
inaasahan ng random variable na pinag-aaralan.

41.

Ang sample na pagkakaiba ay tinatawag
katumbas ng halaga
Sample ng mean square
paglihis -

42.

Madaling ipakita kung ano ang ginagawa
ang sumusunod na kaugnayan, maginhawa para sa
pagkalkula ng pagkakaiba-iba:

43.

Iba pang mga katangian
variation series ay:
mode M0 ay isang variant pagkakaroon
ang pinakamataas na dalas, at ang panggitna sa akin ay
variant na naghahati sa variational
row sa dalawang bahagi na katumbas ng numero
opsyon.
2, 5, 2, 11, 5, 6, 3, 13, 5 (mode = 5)
2, 2, 3, 5, 5, 5, 6, 11.13 (median = 5)

44.

Sa pamamagitan ng pagkakatulad sa kaukulang
ang mga teoretikal na pagpapahayag ay maaaring
bumuo ng mga empirical na sandali,
ginagamit para sa istatistika
mga pagtatasa ng pangunahin at sentral
sandali ng random
dami.

45.

Sa pamamagitan ng pagkakatulad sa mga sandali
mga teorya
mga probabilidad sa pamamagitan ng paunang empirikal
sandali ng order m ay ang dami
sentral na empirikal na punto
order m -

46.2.2. Mga katangian ng istatistikal na pagtatantya ng mga parameter ng pamamahagi: walang kinikilingan, kahusayan, pagkakapare-pareho

2.2. Mga katangian ng mga pagtatantya sa istatistika
mga parameter ng pamamahagi: walang kinikilingan, kahusayan, pagkakapare-pareho
Pagkatapos makatanggap ng mga istatistikal na pagtatantya
random na mga parameter ng pamamahagi
values ​​ξ: sample mean, sample variance, atbp., kailangan mong tiyakin iyon
na sila ay isang magandang approximation
para sa mga nauugnay na parameter
teoretikal na pamamahagi ξ.
Hanapin natin ang mga kondisyon na dapat para dito
gumanap.

47.

48.

Ang istatistikal na marka A* ay tinatawag
walang kinikilingan kung ito ay mathematical
ang inaasahan ay katumbas ng nasuri na parameter
pangkalahatang populasyon A para sa alinman
laki ng sample, i.e.
Kung ang kundisyong ito ay hindi natutugunan, ang pagtatantya
tinatawag na offset.
Hindi sapat ang walang pinapanigan na pagtatantya
kundisyon para sa isang mahusay na approximation ng istatistika
mga marka ng A* sa totoong (teoretikal) na halaga
tinantyang parameter A.

49.

Pagkalat ng mga indibidwal na halaga
nauugnay sa average na halaga M
depende sa pagkakaiba D.
Kung ang dispersion ay malaki, pagkatapos ay ang halaga
natagpuan mula sa data ng isang sample,
maaaring magkaiba nang malaki mula sa
nasuri na parameter.
Samakatuwid, para sa mapagkakatiwalaan
estimation variance D dapat
maging maliit. Pagsusuri ng istatistika
ay tinatawag na mabisa kung
ibinigay na sample size n, mayroon ito
pinakamaliit na posibleng pagkakaiba.

50.

Sa mga istatistikal na pagtatantya
requirement pa rin
kakayahang mabuhay. Tinatawag ang score
pare-pareho kung bilang n → ito
may posibilidad na
sinusuri ang parameter. pansinin mo yan
ang walang pinapanigan na pagtatantya ay magiging
pare-pareho kung bilang n → nito
ang pagkakaiba ay may posibilidad na 0.

51. 2.3. Sample ng ibig sabihin ng mga katangian

Ipagpalagay namin na ang mga opsyon x1, x2,..., xn
ay ang mga halaga ng katumbas
independiyenteng magkaparehong ipinamahagi na mga random na variable
,
pagkakaroon ng mathematical expectation
at pagpapakalat
. Pagkatapos
ang sample mean ay maaari
itinuturing bilang isang random na variable

52.

Walang pinapanigan. Mula sa mga ari-arian
Ipinahihiwatig iyon ng inaasahan ng matematika
mga. ang sample mean ay
walang pinapanigan na pagtatantya ng matematika
inaasahan ng isang random na variable.
Maaari mo ring ipakita ang pagiging epektibo
mga pagtatantya sa pamamagitan ng sample mean ng mathematical expectation (para sa normal
pamamahagi)

53.

Hindi pagbabago. Hayaan ang isang ay ang tinantiya
parameter, lalo na ang matematika
inaasahan ng populasyon
– pagkakaiba-iba ng populasyon
.
Isaalang-alang ang hindi pagkakapantay-pantay ng Chebyshev
Meron kami:
pagkatapos
. Bilang n → kanang bahagi
ang hindi pagkakapantay-pantay ay may posibilidad na maging zero para sa anumang ε > 0, ibig sabihin,
at samakatuwid ang halaga X na kumakatawan sa sample
ang pagtatantya ay may posibilidad sa tinantyang parameter a sa mga tuntunin ng posibilidad.

54.

Kaya, maaari itong tapusin
na ang ibig sabihin ng sample ay
walang kinikilingan, mahusay (ayon sa
kahit para sa normal
pamamahagi) at pare-pareho
pagtatantya ng inaasahan
random variable na nauugnay sa
pangkalahatang populasyon.

55.

56.

LECTURE 6

57. 2.4. Mga sample na katangian ng pagkakaiba

Sinisiyasat namin ang kawalan ng kinikilingan ng sample na variance D* bilang
mga pagtatantya ng pagkakaiba ng isang random na variable

58.

59.

60. Halimbawa

Maghanap ng sample mean, sample
variance at root mean square
paglihis, mode at naitama na sample
pagkakaiba para sa isang sample na mayroong mga sumusunod
batas sa pamamahagi:
Solusyon:

61.

62. KABANATA 3. PUNTO ESTIMATION NG MGA PARAMETER NG ISANG KILALA NA PAHAGI

63.

Ipinapalagay namin na ang pangkalahatang anyo ng batas
pamamahagi ay kilala sa amin at
ito ay nananatiling linawin ang mga detalye -
mga parameter na tumutukoy dito
aktwal na anyo. Umiiral
ilang mga paraan upang malutas ito
mga gawain, dalawa sa kanila
isaalang-alang: ang paraan ng mga sandali at ang pamamaraan
pinakamataas na posibilidad

64.3.1. Paraan ng mga sandali

65.

Paraan ng mga sandali na binuo ni Carl
Pearson noong 1894, batay sa
gamit ang mga tinatayang pagkakapantay-pantay na ito:
sandali
kalkulado
theoretically ayon sa alam na batas
mga distribusyon na may mga parameter na θ, at
sample na sandali
kalkulado
ayon sa magagamit na sample. Hindi alam
mga parameter
tinukoy sa
ang resulta ng paglutas ng isang sistema ng mga r equation,
nauugnay na pag-uugnay
teoretikal at empirikal na sandali,
Halimbawa,
.

66.

Ito ay maaaring ipakita na ang mga pagtatantya
mga parameter θ na nakuha ng pamamaraan
sandali, mayaman, kanilang
iba ang mga inaasahan sa matematika
mula sa totoong mga halaga ng mga parameter hanggang
halaga ng pagkakasunud-sunod ng n–1, at ang average
ang mga karaniwang paglihis ay
mga halaga ng pagkakasunud-sunod ng n-0.5

67. Halimbawa

Ito ay kilala na ang katangian ξ ng mga bagay
ang pangkalahatang populasyon, pagiging random
halaga, ay may pare-parehong pamamahagi depende sa mga parameter a at b:
Ito ay kinakailangan upang matukoy sa pamamagitan ng paraan ng mga sandali
mga parameter a at b ayon sa isang kilalang sample
karaniwan
at sample na pagkakaiba-iba

68. Paalala

α1 - inaasahan sa matematika β2 - pagkakaiba

69.

(*)

70.

71.3.2. Paraan ng maximum na posibilidad

Ang pamamaraan ay batay sa pag-andar ng posibilidad
L(x1, x2,..., xn, θ), na siyang batas
mga pamamahagi ng vector
, saan
mga random na variable
kumuha ng mga halaga
opsyon sa pag-sample, i.e. magkaroon ng pareho
pamamahagi. Dahil ang mga random na variable
ay independyente, ang function ng posibilidad ay may anyo:

72.

Ang ideya ng paraan ng pinakadakilang
ang pagiging totoo ay nakasalalay sa katotohanan na tayo
hinahanap namin ang mga naturang halaga ng mga parameter θ, sa
kung saan ang posibilidad ng paglitaw sa
pagpili ng mga value na variant x1, x2,..., xn
ay ang pinakamalaking. Sa ibang salita,
bilang pagtatantya ng mga parameter θ
isang vector ang kinuha kung saan ang function
ang posibilidad ay may lokal
maximum para sa ibinigay na x1, x2, …, xn:

73.

Mga pagtatantya sa pamamagitan ng paraan ng maximum
ang pagiging totoo ay nakukuha mula sa
kinakailangang matinding kondisyon
gumagana ang L(x1,x2,..., xn,θ) sa isang punto

74. Mga Tala:

1. Kapag naghahanap ng maximum ng function ng posibilidad
upang gawing simple ang mga kalkulasyon, maaari kang magsagawa
mga aksyon na hindi nagbabago sa resulta: una,
gamitin sa halip na L(x1, x2,..., xn,θ) ang logarithmic likelihood function l(x1, x2,..., xn,θ) =
log L(x1, x2,..., xn,θ); pangalawa, itapon sa expression
para sa function ng posibilidad na independiyente sa θ
mga tuntunin (para sa l) o positibo
mga kadahilanan (para sa L).
2. Ang mga pagtatantya ng parameter na isinasaalang-alang namin ay
ay matatawag na mga pagtatantya ng punto, dahil para sa
hindi kilalang parameter θ, isa
iisang punto
, na kanya
tinatayang halaga. Gayunpaman, ang diskarteng ito
maaaring humantong sa malalaking pagkakamali, at punto
Ang pagtatasa ay maaaring magkaiba nang malaki sa totoo
mga halaga ng tinantyang parameter (lalo na sa
maliit na sukat ng sample).

75. Halimbawa

Solusyon. Sa gawaing ito, kinakailangang suriin
dalawang hindi kilalang parameter: a at σ2.
Pag-andar ng log-likelihood
may porma

76.

Itapon ang termino sa formula na ito, na hindi
depende sa a at σ2, binubuo namin ang sistema ng mga equation
kredibilidad
Paglutas, nakukuha namin:

77. KABANATA 4. INTERVAL ESTIMATION NG MGA PARAMETER NG ISANG KILALA NA DISTRIBUTION

78.









(*)

79.

(*)

80.4.1. Pagtatantya ng mathematical na inaasahan ng isang normal na distributed na dami na may alam na pagkakaiba







sample ibig sabihin
bilang random na halaga



81.

Meron kami:
(1)
(2)

82.

(2)
(1)
(*)
(*)

83.4.2. Pagtatantya ng mathematical na inaasahan ng isang normal na distributed na dami na may hindi kilalang pagkakaiba

84.




antas ng kalayaan. Densidad

dami ay

85.

86. Distribusyon ng density ng mag-aaral na may n - 1 degrees ng kalayaan

87.

88.

89.







hanapin sa pamamagitan ng mga formula

90. 4.3. Tinatantya ang karaniwang paglihis ng isang normal na ipinamamahaging dami





paglihis σ.

hindi kilalang matematika
naghihintay.

91. 4.3.1. Isang espesyal na kaso ng kilalang pag-asa sa matematika






Gamit ang mga dami
,


sample na pagkakaiba-iba D*:

92.



dami
magkaroon ng normal




93.


kundisyon
saan
ay ang density ng pamamahagi χ2


94.

95.

96.

97.4.3.2. Espesyal na kaso ng hindi kilalang mathematical na inaasahan








(kung saan ang random variable


χ2 na may n–1 degrees ng kalayaan.

98.

99.4.4. Tinatantya ang mathematical na inaasahan ng isang random na variable para sa isang arbitrary na sample










isang malaking sample (n >> 1).

100.




dami
pagkakaroon

pagpapakalat
, at ang resulta
sample ibig sabihin
bilang halaga
random variable

magnitude
ay may asymptotically


.

101.






gamitin ang formula

102.

103.

Lektura 7

104.

Pag-uulit ng nakaraan

105. KABANATA 4. INTERVAL ESTIMATION NG MGA PARAMETER NG ISANG KILALA NA DISTRIBUTION

106.

Ang problema sa pagtantya ng isang parameter ng isang kilala
ang mga pamamahagi ay maaaring malutas sa pamamagitan ng
pagbuo ng isang pagitan kung saan, na may ibinigay
ang tunay na halaga ay malamang
parameter. Ang pamamaraang ito ng pagsusuri
ay tinatawag na interval estimate.
Karaniwan sa matematika para sa pagsusuri
parameter θ, binubuo namin ang hindi pagkakapantay-pantay
(*)
kung saan ang numero δ ay nagpapakilala sa katumpakan ng pagtatantya:
mas maliit ang δ, mas maganda ang pagtatantya.

107.

(*)

108.4.1. Pagtatantya ng mathematical na inaasahan ng isang normal na distributed na dami na may alam na pagkakaiba

Hayaang maipamahagi ang random variable ξ sa ilalim ng pag-aaral ayon sa normal na batas na may alam
karaniwang paglihis σ at
hindi alam na inaasahan sa matematika a.
Kinakailangan ng halaga ng sample mean
tantyahin ang mathematical expectation ξ.
Tulad ng dati, isasaalang-alang natin ang resulta
sample ibig sabihin
bilang random na halaga
mga halaga, at ang mga halaga ay ang sample na variant x1, x2, …,
xn - ayon sa pagkakabanggit, dahil ang mga halaga ay pareho
ibinahagi ang mga independiyenteng random na variable
, na ang bawat isa ay may banig. inaasahan a at karaniwang paglihis σ.

109.

Meron kami:
(1)
(2)

110.

(2)
(1)
(*)
(*)

111.4.2. Pagtatantya ng mathematical na inaasahan ng isang normal na distributed na dami na may hindi kilalang pagkakaiba

112.

Ito ay kilala na ang random variable tn,
ibinigay sa paraang ito ay
Pamamahagi ng mag-aaral na may k = n - 1
antas ng kalayaan. Densidad
ang probability distribution ng ganyan
dami ay

113.

114. Distribusyon ng density ng mag-aaral na may n - 1 degrees ng kalayaan

115.

116.

117.

Tandaan. Na may malaking bilang ng mga degree
kalayaan k Pamamahagi ng mag-aaral
may kaugaliang normal na distribusyon na may
zero mathematical expectation at
iisang pagkakaiba-iba. Samakatuwid, para sa k ≥ 30
Ang pagitan ng kumpiyansa ay maaaring nasa pagsasanay
hanapin sa pamamagitan ng mga formula

118. 4.3. Tinatantya ang karaniwang paglihis ng isang normal na ipinamamahaging dami

Hayaang pag-aralan ang random variable
ξ ay ipinamamahagi ayon sa normal na batas
may inaasahan a at
hindi kilalang ibig sabihin ng parisukat
paglihis σ.
Isaalang-alang ang dalawang kaso: may kilala at
hindi kilalang matematika
naghihintay.

119. 4.3.1. Isang espesyal na kaso ng kilalang pag-asa sa matematika

Hayaang malaman ang halaga M[ξ] = a at
suriin lamang ang σ o ang variance D[ξ] = σ2.
Alalahanin iyon para sa isang kilalang banig. naghihintay
ang walang pinapanigan na pagtatantya ng pagkakaiba ay
sample variance D* = (σ*)2
Gamit ang mga dami
,
tinukoy sa itaas, ipinakilala namin ang isang random
halaga Y, na kumukuha ng mga halaga
sample na pagkakaiba-iba D*:

120.

Isaalang-alang ang isang random na variable
Ang mga kabuuan sa ilalim ng tanda ay random
dami
magkaroon ng normal
distribusyon na may density fN (x, 0, 1).
Pagkatapos ang Hn ay may distribusyon χ2 na may n
antas ng kalayaan bilang kabuuan ng mga parisukat n
independiyenteng pamantayan (a = 0, σ = 1)
normal na random variable.

121.

Tukuyin natin ang agwat ng kumpiyansa mula sa
kundisyon
saan
ay ang density ng pamamahagi χ2
at γ - pagiging maaasahan (confidence
posibilidad). Ang halaga ng γ ay numerong katumbas ng
ang lugar ng shaded figure sa Fig.

122.

123.

124.

125. 4.3.2. Espesyal na kaso ng hindi kilalang mathematical na inaasahan

Sa pagsasagawa, ang pinakakaraniwang sitwasyon
kapag ang parehong mga parameter ng normal ay hindi alam
distribusyon: mathematical expectation a at
karaniwang paglihis σ.
Sa kasong ito, pagbuo ng isang tiwala
agwat ay batay sa Fisher's theorem, mula sa
pusa. ito ay sumusunod na ang random variable
(kung saan ang random variable
pagkuha ng mga halaga ng walang kinikilingan
may distribusyon ang sample variance s2
χ2 na may n–1 degrees ng kalayaan.

126.

127.4.4. Tinatantya ang mathematical na inaasahan ng isang random na variable para sa isang arbitrary na sample

Mga pagtatantya sa pagitan ng matematika
mga inaasahan M[ξ] na nakuha para sa normal
ibinahagi ang random variable ξ,
ay karaniwang hindi angkop para sa
mga random na variable na may ibang anyo
pamamahagi. Gayunpaman, mayroong isang sitwasyon kung saan
para sa anumang mga random na variable
gumamit ng magkatulad na pagitan
relasyon, ito ay nagaganap sa
isang malaking sample (n >> 1).

128.

Tulad ng nasa itaas, isasaalang-alang namin ang mga pagpipilian
x1, x2,..., xn bilang mga independiyenteng halaga,
pantay na ibinahagi nang random
dami
pagkakaroon
inaasahan M[ξi] = mξ at
pagpapakalat
, at ang resulta
sample ibig sabihin
bilang halaga
random variable
Ayon sa central limit theorem
magnitude
ay may asymptotically
batas sa normal na pamamahagi c
inaasahan mξ at pagkakaiba
.

129.

Samakatuwid, kung ang halaga ng pagkakaiba ay kilala
random variable ξ, pagkatapos ay magagawa natin
gumamit ng tinatayang mga formula
Kung ang halaga ng pagpapakalat ng dami ξ
hindi kilala, pagkatapos ay para sa malaki n isa maaari
gamitin ang formula
kung saan s ang naitama na rms. paglihis

130.

Naulit ang nakaraan

131. KABANATA 5. VERIFICATION NG STATISTICAL HYPOTHESES

132.

Ang statistical hypothesis ay isang hypothesis tungkol sa
ang anyo ng isang hindi kilalang pamamahagi o tungkol sa mga parameter
kilalang distribusyon ng isang random na variable.
Ang hypothesis na susuriin, kadalasang tinutukoy bilang
Ang H0 ay tinatawag na null o pangunahing hypothesis.
Ang karagdagang ginamit na hypothesis H1,
sumasalungat sa hypothesis ay tinatawag na H0
nakikipagkumpitensya o alternatibo.
Statistical verification ng advanced null
hypothesis H0 ay binubuo sa paghahambing nito sa
sample na data. Sa ganitong tseke
Dalawang uri ng mga error ang maaaring mangyari:
a) mga pagkakamali ng unang uri - mga kaso kapag ito ay tinanggihan
tamang hypothesis H0;
b) mga pagkakamali ng pangalawang uri - mga kaso kung kailan
ang maling hypothesis H0 ay tinatanggap.

133.

Ang posibilidad ng isang error ng unang uri ay magiging
tawagan ang antas ng kahalagahan at italaga
bilang isang.
Ang pangunahing pamamaraan para sa pagsuri sa istatistika
hypothesis yan
magagamit na sample, ang halaga ay kinakalkula
istatistikal na pamantayan - ilan
random variable T na may kilala
batas sa pamamahagi. Saklaw ng mga halaga T,
sa ilalim kung saan ang pangunahing hypothesis H0 ay dapat
tinatanggihan, tinatawag na kritikal, at
hanay ng mga halaga T kung saan ang hypothesis na ito
maaaring tanggapin, - lugar ng pagtanggap
mga hypotheses.

134.

135.5.1. Pagsubok ng mga hypotheses tungkol sa mga parameter ng isang kilalang distribusyon

5.1.1. Pagsusuri ng hypothesis tungkol sa matematika
inaasahan ng isang normal na ibinahagi na random
dami
Hayaang mayroon ang random variable ξ
normal na pamamahagi.
Kailangan nating suriin ang pagpapalagay na
na ang mathematical expectation nito ay
ilang numero a0. Isaalang-alang nang hiwalay
mga kaso kung saan alam ang pagkakaiba ξ at kung kailan
hindi siya kilala.

136.

Sa kaso ng kilalang dispersion D[ξ] = σ2,
tulad ng sa § 4.1, tinutukoy namin ang isang random
isang halaga na kumukuha ng mga halaga
sample ibig sabihin. Hypothesis H0
unang binabalangkas bilang M[ξ] =
a0. Dahil ang ibig sabihin ng sample
ay isang walang pinapanigan na pagtatantya ng M[ξ], kung gayon
ang hypothesis H0 ay maaaring katawanin bilang

137.

Isinasaalang-alang ang walang kinikilingan ng mga naitama
sample variances, ang null hypothesis ay maaaring
isulat ito ng ganito:
kung saan random variable
kinukuha ang mga halaga ng naitama na sample
pagpapakalat ng ξ at katulad ng random
ang halaga ng Z na isinasaalang-alang sa Seksyon 4.2.
Bilang istatistikal na pamantayan, pipiliin namin
random variable
pagkuha ng halaga ng ratio ng mas malaki
sample na pagkakaiba sa mas maliit.

145.

Ang random na variable F ay mayroon
Fisher-Snedecor distribution na may
ang bilang ng mga antas ng kalayaan k1 = n1 – 1 at k2
= n2 – 1, kung saan ang n1 ay ang sample size, ayon sa
alin ang mas malaki
naitama ang pagkakaiba-iba
, at n2
ang dami ng pangalawang sample, kung saan
natagpuan ang isang mas maliit na pagkakaiba-iba.
Isaalang-alang ang dalawang uri ng pakikipagkumpitensya
mga hypotheses

146.

147.

148. 5.1.3. Paghahambing ng mga inaasahan sa matematika ng mga independiyenteng random na variable

Isaalang-alang muna natin ang kaso ng isang normal
distribusyon ng mga random na variable na may kilala
mga pagkakaiba-iba, at pagkatapos ay batay dito - isang mas pangkalahatan
ang kaso ng isang arbitrary na pamamahagi ng mga dami sa
sapat na malaking independiyenteng mga sample.
Hayaang ang mga random na variable ξ1 at ξ2 ay independyente at
ay karaniwang ipinamamahagi, at hayaan ang kanilang mga pagkakaiba D[ξ1]
at D[ξ2] ay kilala. (Halimbawa, maaari silang matagpuan
mula sa ibang karanasan o kalkulado
sa teorya). Mga nakuhang sample ng laki n1 at n2
ayon sa pagkakabanggit. Hayaan
– pumipili
mga average para sa mga sample na ito. Kinakailangan ng pumipili
average sa isang naibigay na antas ng kahalagahan α
subukan ang hypothesis tungkol sa pagkakapantay-pantay ng matematika
mga inaasahan ng itinuturing na mga random na variable na gagawin mula sa isang priori na pagsasaalang-alang,
batay sa mga eksperimentong kondisyon, at
pagkatapos ay ang mga pagpapalagay tungkol sa mga parameter
ang mga pamamahagi ay sinusuri tulad ng ipinapakita
dati. Gayunpaman, napakadalas na mayroon
ang pangangailangang i-verify ang
hypothesis tungkol sa batas ng pamamahagi.
Idinisenyo ang mga pagsusulit sa istatistika
para sa mga ganitong tseke ay karaniwang tinatawag
pamantayan ng pagpayag.

154.

Alam ang ilang pamantayan para sa kasunduan. dangal
Ang pamantayan ni Pearson ay ang pagiging pangkalahatan nito. Kasama ang kanyang
maaaring gamitin upang subukan ang mga hypotheses tungkol sa iba't ibang
mga batas sa pamamahagi.
Ang pamantayan ng Pearson ay batay sa paghahambing ng mga frequency,
natagpuan mula sa sample (empirical frequency), s
mga frequency na kinakalkula gamit ang nasubok
batas sa pamamahagi (theoretical frequency).
Karaniwang empirical at theoretical frequency
magkaiba. Kailangan nating malaman kung nagkataon lang
frequency discrepancy o ito ay makabuluhan at ipinaliwanag
ang katotohanan na ang theoretical frequency ay kinakalkula batay sa
maling hypothesis tungkol sa pamamahagi ng pangkalahatan
pinagsama-samang.
Ang pamantayan ng Pearson, tulad ng iba pa, ay sumasagot sa
Ang tanong ay kung mayroong kasunduan sa pagitan ng iminungkahing hypothesis at
empirical data sa isang naibigay na antas
kahalagahan.

155. 5.2.1. Pagsubok sa Hypothesis ng Normal Distribution

Hayaang magkaroon ng random variable ξ at hayaan
isang sample ng isang sapat na malaking sukat n na may isang malaki
bilang ng iba't ibang mga pagpipilian sa halaga. Kailangan
sa antas ng kahalagahan α, subukan ang null hypothesis
H0 na ang random variable ξ ay ibinahagi
ayos lang.
Para sa kaginhawaan ng pagproseso ng sample, kumuha kami ng dalawang numero
α at β:
at hatiin ang pagitan [α, β] ng s
mga subinterval. Ipagpalagay namin na ang mga halaga ng variant,
ang pagbagsak sa bawat subinterval ay humigit-kumulang pantay
isang numero na tumutukoy sa gitna ng subinterval.
Binibilang ang bilang ng mga opsyon na nahuhulog sa bawat dami ng order α (0< α < 1) непрерывной
Ang random variable ξ ay isang bilang na xα,
kung saan ang pagkakapantay-pantay
.
Ang quantile x½ ay tinatawag na median ng random
ang mga dami ξ, ang mga quantile x0 at x2 ay ang mga quartile nito, a
x0.1, x0.2,..., x0.9 - decile.
Para sa karaniwang normal na pamamahagi (a =
0, σ = 1) at, samakatuwid,
kung saan ang FN (x, a, σ) ay ang normal na distribution function
distributed random variable, at Φ(x)
Laplace function.
Dami ng karaniwang normal na distribusyon
Ang xα para sa isang ibinigay na α ay matatagpuan mula sa kaugnayan

162.6.2. Pamamahagi ng mag-aaral

Kung
– malaya
pagkakaroon ng mga random na variable
normal na distribusyon na may zero
inaasahan sa matematika at
unit variance, kung gayon
random variable distribution
tinatawag na Student's t-distribution
na may n antas ng kalayaan (W.S. Gosset).


Ano ang sikreto ng mga matagumpay na nagbebenta? Kung pinapanood mo ang pinakamahusay na mga salespeople ng anumang kumpanya, mapapansin mo na mayroon silang isang bagay na karaniwan. Ang bawat isa sa kanila ay nakakatugon sa mas maraming tao at gumagawa ng mas maraming presentasyon kaysa sa hindi gaanong matagumpay na mga tindero. Nauunawaan ng mga taong ito na ang mga benta ay isang laro ng numero, at kapag mas maraming tao ang kanilang sinasabi tungkol sa kanilang mga produkto o serbisyo, mas maraming deal ang kanilang isinasara - iyon lang. Nauunawaan nila na kung nakikipag-usap sila hindi lamang sa iilan na tiyak na nagsasabi ng oo sa kanila, kundi pati na rin sa mga taong ang interes sa kanilang panukala ay hindi masyadong malaki, kung gayon ang batas ng mga average ay gagana sa kanilang pabor.


Ang iyong mga kita ay depende sa bilang ng mga benta, ngunit sa parehong oras, sila ay direktang proporsyonal sa bilang ng mga pagtatanghal na iyong gagawin. Kapag naunawaan mo at sinimulang isabuhay ang batas ng mga average, ang pagkabalisa na nauugnay sa pagsisimula ng isang bagong negosyo o pagtatrabaho sa isang bagong larangan ay magsisimulang mabawasan. At bilang isang resulta, ang isang pakiramdam ng kontrol at kumpiyansa sa kanilang kakayahang kumita ay magsisimulang lumago. Kung gagawa ka lang ng mga presentasyon at hahasa ang iyong mga kasanayan sa proseso, magkakaroon ng mga deal.

Sa halip na isipin ang tungkol sa bilang ng mga deal, isipin ang tungkol sa bilang ng mga presentasyon. Walang saysay na gumising sa umaga o umuwi sa gabi at magsimulang mag-isip kung sino ang bibili ng iyong produkto. Sa halip, pinakamahusay na planuhin bawat araw kung gaano karaming mga tawag ang kailangan mong gawin. At pagkatapos, kahit na ano - gawin ang lahat ng mga tawag na iyon! Ang diskarte na ito ay gagawing mas madali ang iyong trabaho - dahil ito ay isang simple at tiyak na layunin. Kung alam mo na mayroon kang isang napaka-tiyak at maaabot na layunin sa harap mo, magiging mas madali para sa iyo na gawin ang nakaplanong bilang ng mga tawag. Kung maririnig mo ang "oo" ng ilang beses sa prosesong ito, mas mabuti!

At kung "hindi", kung gayon sa gabi ay madarama mo na tapat mong ginawa ang lahat ng iyong makakaya, at hindi ka pahihirapan ng mga pag-iisip tungkol sa kung gaano karaming pera ang iyong kinita, o kung gaano karaming mga kasosyo ang iyong nakuha sa isang araw.

Sabihin nating sa iyong kumpanya o sa iyong negosyo, ang karaniwang salesperson ay nagsasara ng isang deal sa bawat apat na presentasyon. Ngayon isipin na gumuhit ka ng mga card mula sa isang deck. Ang bawat card ng tatlong suit - spade, diamante at club - ay isang presentasyon kung saan propesyonal kang nagpapakita ng produkto, serbisyo o pagkakataon. Ginagawa mo ito sa abot ng iyong makakaya, ngunit hindi mo pa rin isinasara ang deal. At ang bawat heart card ay isang deal na nagbibigay-daan sa iyong makakuha ng pera o makakuha ng bagong kasama.

Sa ganoong sitwasyon, hindi mo ba gustong gumuhit ng maraming card mula sa deck hangga't maaari? Ipagpalagay na inaalok kang gumuhit ng maraming card hangga't gusto mo, habang binabayaran ka o nagmumungkahi ng bagong kasama sa tuwing gumuhit ka ng heart card. Magsisimula kang gumuhit ng mga card nang masigasig, halos hindi napapansin kung ano ang angkop sa card na kakalabas lang.

Alam mo na mayroong labintatlong puso sa isang deck ng limampu't dalawang baraha. At sa dalawang deck - dalawampu't anim na card ng puso, at iba pa. Mabibigo ka ba sa pamamagitan ng pagguhit ng mga pala, diamante o club? Syempre hindi! Iisipin mo lang na ang bawat ganitong "miss" ay naglalapit sa iyo - sa ano? Sa card of hearts!

Pero alam mo kung ano? Nabigyan ka na ng alok na ito. Ikaw ay nasa isang natatanging posisyon upang kumita ng mas maraming hangga't gusto mo at gumuhit ng maraming card ng puso hangga't gusto mong iguhit sa iyong buhay. At kung ikaw ay "gumuhit ng mga card" nang buong taimtim, pagbutihin ang iyong mga kasanayan at magtiis ng kaunting spade, tamburin at mga club, kung gayon ikaw ay magiging isang mahusay na tindero at magtatagumpay.

Ang isa sa mga bagay na nagpapasaya sa pagbebenta ay na sa tuwing ka-shuffle mo ang deck, iba-iba ang pagba-shuffle ng mga card. Minsan ang lahat ng mga puso ay napupunta sa simula ng deck, at pagkatapos ng isang matagumpay na streak (kapag tila sa amin na hindi na kami mawawala!) Kami ay naghihintay para sa isang mahabang hilera ng mga card ng ibang suit. At sa isa pang pagkakataon, upang makarating sa unang puso, kailangan mong dumaan sa walang katapusang bilang ng mga pala, club at tamburin. At kung minsan ang mga card ng iba't ibang suit ay mahigpit na nahuhulog sa turn. Ngunit sa anumang kaso, sa bawat deck ng limampu't dalawang baraha, sa ilang pagkakasunud-sunod, palaging may labintatlong puso. Ilabas lang ang mga card hanggang sa makita mo ang mga ito.



Mula kay: Leylya,  

Kung ang phenomenon ng sustainability daluyan nagaganap sa katotohanan, pagkatapos ay sa modelong matematika kung saan pinag-aaralan natin ang mga random na phenomena, dapat mayroong isang teorama na sumasalamin sa katotohanang ito.
Sa ilalim ng mga kondisyon ng teorama na ito, ipinakilala namin ang mga paghihigpit sa mga random na variable X 1 , X 2 , …, X n:

a) bawat random na variable Х i may mathematical expectation

M(Х i) = a;

b) ang pagkakaiba-iba ng bawat random na variable ay may hangganan, o maaari nating sabihin na ang mga pagkakaiba-iba ay bounded mula sa itaas ng parehong numero, halimbawa SA, ibig sabihin.

D(Х i) < C, i = 1, 2, …, n;

c) ang mga random na variable ay pairwise independent, ibig sabihin, alinman sa dalawa X i at Xj sa i¹ j malaya.

Tapos obviously

D(X 1 + X 2 + … + X n)=D(X 1) + D(X 2) + ... + D(X n).

Bumalangkas tayo ng batas ng malalaking numero sa anyo ng Chebyshev.

Ang teorama ni Chebyshev: na may walang limitasyong pagtaas sa bilang n mga independyenteng pagsusulit" ang arithmetic mean ng mga naobserbahang halaga ng isang random na variable ay nagtatagpo sa probabilidad sa kanyang inaasahan sa matematika ”, ibig sabihin, para sa anumang positibo ε

R(| isang| < ε ) = 1. (4.1.1)

Ang kahulugan ng pagpapahayag "aritmetika ibig sabihin = nagtatagpo sa posibilidad sa isang" iyon ba ang posibilidad na ay mag-iiba nang kaunti sa a, lumalapit sa 1 nang walang katiyakan bilang numero n.

Patunay. Para sa isang may hangganang numero n mga independyenteng pagsusulit, inilalapat namin ang hindi pagkakapantay-pantay ng Chebyshev para sa isang random na variable = :

R(|–M()| < ε ) ≥ 1 – . (4.1.2)

Isinasaalang-alang ang mga paghihigpit a - b, kinakalkula namin M( ) at D( ):

M( ) = = = = = = a;

D( ) = = = = = = .

Pagpapalit M( ) at D( ) sa hindi pagkakapantay-pantay (4.1.2), nakukuha natin

R(| isang| < ε )≥1 .

Kung sa hindi pagkakapantay-pantay (4.1.2) kukuha tayo ng arbitraryong maliit ε >0 at n® ¥, pagkatapos makuha namin

na nagpapatunay sa Chebyshev theorem.

Isang mahalagang praktikal na konklusyon ang sumusunod mula sa itinuturing na teorama: may karapatan kaming palitan ang hindi kilalang halaga ng inaasahan sa matematika ng isang random na variable ng arithmetic mean na halaga na nakuha mula sa isang sapat na malaking bilang ng mga eksperimento. Kasabay nito, mas maraming mga eksperimento para sa pagkalkula, mas malamang (pagkakatiwalaan) maaari itong asahan na ang error na nauugnay sa pagpapalit na ito ( - a) ay hindi lalampas sa ibinigay na halaga ε .

Bilang karagdagan, ang iba pang mga praktikal na problema ay maaaring malutas. Halimbawa, ayon sa mga halaga ng posibilidad (kaasahan) R=R(| isang|< ε ) at ang maximum na pinapayagang error ε tukuyin ang kinakailangang bilang ng mga eksperimento n; sa R at P tukuyin ε; sa ε at P matukoy ang posibilidad ng isang kaganapan | isang |< ε.

espesyal na kaso. Hayaan sa n mga pagsubok na sinusunod n mga halaga ng isang random na variable x, pagkakaroon ng mathematical expectation M(X) at pagpapakalat D(X). Ang nakuha na mga halaga ay maaaring ituring bilang mga random na variable X 1 ,X 2 ,X 3 , ... ,X n,. Dapat itong maunawaan bilang mga sumusunod: isang serye ng P ang mga pagsusulit ay paulit-ulit na isinasagawa, kaya bilang isang resulta i ika na pagsubok, i= l, 2, 3, ..., P, sa bawat serye ng mga pagsubok ay lilitaw ang isa o isa pang halaga ng isang random na variable X, hindi alam nang maaga. Kaya naman, i-e halaga x i random variable na nakuha sa i ika test, random na nagbabago kung lilipat ka mula sa isang serye ng mga pagsubok patungo sa isa pa. Kaya bawat halaga x i maaaring ituring na random X i .


Ipagpalagay na ang mga pagsusulit ay nakakatugon sa mga sumusunod na kinakailangan:

1. Ang mga pagsusulit ay independyente. Nangangahulugan ito na ang mga resulta X 1 , X 2 ,
X 3 , ..., X n Ang mga pagsusulit ay mga independiyenteng random na variable.

2. Ang mga pagsusulit ay isinasagawa sa ilalim ng parehong mga kundisyon - nangangahulugan ito, mula sa punto ng view ng probability theory, na ang bawat isa sa mga random na variable X 1 ,X 2 ,X 3 , ... ,X n ay may parehong batas sa pamamahagi gaya ng orihinal na halaga X, Kaya naman M(X i) =M(X)at D(X i) = D(X), i = 1, 2, .... P.

Isinasaalang-alang ang mga kondisyon sa itaas, nakukuha namin

R(| isang| < ε )≥1 . (4.1.3)

Halimbawa 4.1.1. X ay katumbas ng 4. Ilang mga independiyenteng eksperimento ang kinakailangan upang may posibilidad na hindi bababa sa 0.9 ay maaaring asahan na ang arithmetic mean ng random variable na ito ay mag-iiba mula sa mathematical na inaasahan ng mas mababa sa 0.5?

Solusyon.Ayon sa kalagayan ng problema ε = 0,5; R(| isang|< 0,5) 0.9. Paglalapat ng formula (4.1.3) para sa random variable X, nakukuha namin

P(|–M(X)| < ε ) ≥ 1 .

Mula sa relasyon

1 = 0,9

tukuyin

P= = = 160.

Sagot: kinakailangan na gumawa ng 160 independiyenteng mga eksperimento.

Ipagpalagay na ang ibig sabihin ng arithmetic karaniwang ipinamamahagi, nakukuha namin ang:

R(| isang|< ε )= 2Φ () 0,9.

Mula sa kung saan, gamit ang talahanayan ng Laplace function, nakukuha namin
1.645, o ≥ 6.58 i.e. n ≥49.

Halimbawa 4.1.2. Pagkakaiba-iba ng isang random na variable X ay katumbas ng D( X) = 5. 100 independyenteng mga eksperimento ang isinagawa, ayon sa kung saan . Sa halip na ang hindi kilalang halaga ng inaasahan sa matematika a tinanggap . Tukuyin ang maximum na halaga ng error na pinapayagan sa kasong ito na may posibilidad na hindi bababa sa 0.8.

Solusyon. Ayon sa gawain n= 100, R(| isang|< ε ) ≥0.8. Inilapat namin ang formula (4.1.3)

R(| isang|< ε ) ≥1 .

Mula sa relasyon

1 = 0,8

tukuyin ε :

ε 2 = = = 0,25.

Kaya naman, ε = 0,5.

Sagot: maximum na halaga ng error ε = 0,5.

4.2. Batas ng malalaking numero sa anyong Bernoulli

Bagama't ang konsepto ng probabilidad ay ang batayan ng anumang statistical inference, maaari lamang nating matukoy sa ilang mga kaso ang posibilidad ng isang kaganapan nang direkta. Minsan ang probabilidad na ito ay maaaring itatag mula sa mga pagsasaalang-alang ng simetrya, pantay na pagkakataon, atbp., ngunit walang unibersal na paraan na magpapahintulot sa isa na ipahiwatig ang posibilidad nito para sa isang arbitrary na kaganapan. Ginagawang posible ng theorem ni Bernoulli na matantya ang probabilidad kung para sa kaganapang interesado sa atin A maaaring isagawa ang paulit-ulit na mga independyenteng pagsusulit. Hayaang gumawa P mga independiyenteng pagsusulit, sa bawat isa kung saan ang posibilidad ng paglitaw ng ilang kaganapan A pare-pareho at pantay R.

Ang teorama ni Bernoulli. Sa walang limitasyong pagtaas sa bilang ng mga independiyenteng pagsubok P relatibong dalas ng paglitaw ng isang pangyayari A nagtatagpo sa probabilidad sa probabilidad p paglitaw ng isang pangyayari A,T. e.

P(½ - p½≤ ε) = 1, (4.2.1)

saan ε ay isang arbitraryong maliit na positibong numero.

Para sa final n sa kondisyon na , ang hindi pagkakapantay-pantay ni Chebyshev para sa isang random na variable ay magkakaroon ng form:

P(| –p|< ε ) 1 .(4.2.2)

Patunay. Inilapat namin ang Chebyshev theorem. Hayaan X i– bilang ng mga paglitaw ng kaganapan A v i ika na pagsubok, i= 1, 2, . . . , n. Ang bawat isa sa mga dami X i maaari lamang kumuha ng dalawang halaga:

X i= 1 (kaganapan A nangyari) na may posibilidad p,

X i= 0 (kaganapan A hindi nangyari) na may posibilidad q= 1–p.

Hayaan Y n= . Sum X 1 + X 2 + … + X n ay katumbas ng bilang m mga pangyayari A v n mga pagsubok (0 m n), ibig sabihin Y n= – relatibong dalas ng paglitaw ng kaganapan A v n mga pagsubok. Pag-asa at pagkakaiba sa matematika X i ay pantay ayon sa pagkakabanggit:

M( ) = 1∙p + 0∙q = p,

Halimbawa 4.2.1. Upang matukoy ang porsyento ng mga may sira na produkto, 1000 units ang nasubok ayon sa return sampling scheme. Ano ang posibilidad na ang ganap na halaga ng rate ng pagtanggi na tinutukoy ng sample na ito ay mag-iiba mula sa rate ng pagtanggi para sa buong batch ng hindi hihigit sa 0.01, kung alam na, sa karaniwan, mayroong 500 na may sira na mga item para sa bawat 10,000 mga item ?

Solusyon. Ayon sa kondisyon ng problema, ang bilang ng mga independiyenteng pagsubok n= 1000;

p= = 0,05; q= 1 – p= 0,95; ε = 0,01.

Paglalapat ng formula (4.2.2), nakukuha namin

P(| p|< 0,01) 1 – = 1 – = 0,527.

Sagot: na may posibilidad na hindi bababa sa 0.527, maaaring asahan na ang sample fraction ng mga depekto (ang kamag-anak na dalas ng paglitaw ng mga depekto) ay mag-iiba mula sa bahagi ng mga depekto sa lahat ng mga produkto (mula sa posibilidad ng mga depekto) ng hindi hihigit sa 0.01 .

Halimbawa 4.2.2. Kapag nagtataktak ng mga bahagi, ang posibilidad ng kasal ay 0.05. Gaano karaming mga bahagi ang kailangang suriin upang may posibilidad na hindi bababa sa 0.95 maaari itong asahan na ang kamag-anak na dalas ng mga may sira na produkto ay mag-iiba mula sa posibilidad ng kasal ng mas mababa sa 0.01?

Solusyon. Ayon sa gawain R= 0,05; q= 0,95; ε = 0,01;

P(| p|<0,01) 0,95.

Mula sa pagkakapantay-pantay 1 = 0.95 mahanap n:

n= = =9500.

Sagot: 9500 item ang kailangang suriin.

Magkomento. Ang mga pagtatantya ng kinakailangang bilang ng mga obserbasyon na nakuha sa pamamagitan ng paglalapat ng teorama ni Bernoulli (o ni Chebyshev) ay labis na pinalaki. Mayroong mas tumpak na mga pagtatantya na iminungkahi nina Bernstein at Khinchin, ngunit nangangailangan ng mas kumplikadong kasangkapang pangmatematika. Upang maiwasan ang pagmamalabis ng mga pagtatantya, minsan ginagamit ang formula ng Laplace

P(| p|< ε ) ≈ 2Φ .

Ang kawalan ng formula na ito ay ang kakulangan ng pagtatantya ng pinapayagang error.

Batas ng malalaking numero sa probability theory ay nagsasaad na ang empirical mean (arithmetic mean) ng isang sapat na malaking finite sample mula sa fixed distribution ay malapit sa theoretical mean (expectation) ng distribution na ito. Depende sa uri ng convergence, nakikilala ng isa ang mahinang batas ng malalaking numero, kapag may convergence sa probabilidad, at ang malakas na batas ng malalaking numero, kapag may convergence halos saanman.

Palaging may limitadong bilang ng mga pagsubok kung saan, sa anumang naibigay na posibilidad, mas mababa sa 1 ang relatibong dalas ng paglitaw ng ilang kaganapan ay mag-iiba nang kaunti sa posibilidad nito.

Ang pangkalahatang kahulugan ng batas ng malalaking numero: ang magkasanib na pagkilos ng isang malaking bilang ng magkapareho at independiyenteng random na mga kadahilanan ay humahantong sa isang resulta na, sa limitasyon, ay hindi nakasalalay sa pagkakataon.

Ang mga pamamaraan para sa pagtatantya ng probabilidad batay sa pagsusuri ng isang limitadong sample ay batay sa property na ito. Ang isang magandang halimbawa ay ang hula ng mga resulta ng halalan batay sa isang survey ng isang sample ng mga botante.

Encyclopedic YouTube

    1 / 5

    ✪ Batas ng Malaking Bilang

    ✪ 07 - Teorya ng probabilidad. Batas ng Malaking Bilang

    ✪ 42 Batas ng Malaking Bilang

    ✪ 1 - Batas ng malalaking numero ni Chebyshev

    ✪ Baitang 11, aralin 25, Gaussian curve. Batas ng Malaking Bilang

    Mga subtitle

    Tingnan natin ang batas ng malalaking numero, na marahil ang pinaka-intuitive na batas sa matematika at teorya ng posibilidad. At dahil nalalapat ito sa napakaraming bagay, kung minsan ay ginagamit ito at hindi nauunawaan. Bigyan ko muna ito ng kahulugan para sa katumpakan, at pagkatapos ay pag-uusapan natin ang tungkol sa intuwisyon. Kunin natin ang isang random na variable, sabihin ang X. Sabihin nating alam natin ang mathematical expectation o populasyon nito. Sinasabi lang ng Law of Large Numbers na kung kukuha tayo ng halimbawa ng n-th na bilang ng mga obserbasyon ng isang random variable at average ang bilang ng lahat ng mga obserbasyon na iyon... Kunin natin ang isang variable. Tawagan natin itong X na may subscript n at gitling sa itaas. Ito ang arithmetic mean ng ika-n na bilang ng mga obserbasyon ng aming random variable. Narito ang aking unang obserbasyon. I do the experiment once and I make this observation, then I do it again and I make this observation, I do it again and I get this. Pinapatakbo ko ang eksperimentong ito ng n beses at pagkatapos ay hinahati sa bilang ng aking mga obserbasyon. Narito ang aking sample mean. Narito ang average ng lahat ng mga obserbasyon na ginawa ko. Sinasabi sa atin ng batas ng malalaking numero na ang aking sample mean ay lalapit sa mean ng random variable. O maaari ko ring isulat na ang aking sample na ibig sabihin ay lalapit sa ibig sabihin ng populasyon para sa ika-n bilang na pupunta sa infinity. Hindi ako gagawa ng malinaw na pagkakaiba sa pagitan ng "approximation" at "convergence", ngunit inaasahan kong maunawaan mo na kung kukuha ako ng isang medyo malaking sample dito, makukuha ko ang inaasahang halaga para sa populasyon sa kabuuan. Sa palagay ko naiintindihan ng karamihan sa inyo na kung gagawa ako ng sapat na mga pagsubok na may malaking sample ng mga halimbawa, sa kalaunan ay ibibigay sa akin ng mga pagsubok ang mga halagang inaasahan ko, na isinasaalang-alang ang inaasahan sa matematika, posibilidad at lahat ng iyon. Ngunit sa palagay ko ay madalas na hindi malinaw kung bakit ito nangyayari. At bago ko simulan ang pagpapaliwanag kung bakit ganito, hayaan mo akong magbigay sa iyo ng isang kongkretong halimbawa. Sinasabi sa atin ng batas ng malalaking numero na... Sabihin nating mayroon tayong random variable X. Ito ay katumbas ng bilang ng mga ulo sa 100 tosses ng tamang barya. Una sa lahat, alam natin ang mathematical expectation ng random variable na ito. Ito ang bilang ng mga coin tosses o pagsubok na pinarami ng posibilidad ng anumang pagsubok na magtagumpay. Kaya ito ay katumbas ng 50. Ibig sabihin, sinasabi ng batas ng malalaking numero na kung kukuha tayo ng sample, o kung average ko ang mga pagsubok na ito, nakukuha ko. .. Sa unang pagkakataon na gagawa ako ng pagsubok, nagpi-flip ako ng barya ng 100 beses, o kukuha ako ng isang kahon ng isang daang barya, inalog ito, at pagkatapos ay bilangin kung ilang ulo ang nakuha ko, at nakuha, sabihin nating, ang numerong 55. Ito ay magiging X1. Pagkatapos ay inalog ko muli ang kahon at nakuha ko ang numerong 65. Pagkatapos ay muli - at nakakuha ako ng 45. At ginagawa ko ito ng n beses, at pagkatapos ay hinahati ko ito sa bilang ng mga pagsubok. Sinasabi sa atin ng batas ng malalaking numero na ang average na ito (ang average ng lahat ng aking mga obserbasyon) ay magiging 50 habang ang n ay may posibilidad na infinity. Ngayon gusto kong pag-usapan nang kaunti kung bakit nangyayari ito. Maraming naniniwala na kung, pagkatapos ng 100 pagsubok, ang aking resulta ay higit sa karaniwan, kung gayon, ayon sa mga batas ng posibilidad, dapat akong magkaroon ng higit pa o mas kaunting mga ulo upang, kumbaga, mabayaran ang pagkakaiba. Hindi ito eksakto kung ano ang mangyayari. Ito ay madalas na tinutukoy bilang ang "pagkamali ng sugarol". Hayaan mong ipakita ko sa iyo ang pagkakaiba. Gagamitin ko ang sumusunod na halimbawa. Hayaan akong gumuhit ng isang graph. Palitan natin ang kulay. Ito ay n, ang aking x-axis ay n. Ito ang bilang ng mga pagsubok na aking tatakbo. At ang aking y-axis ang magiging sample mean. Alam natin na ang ibig sabihin ng arbitraryong variable na ito ay 50. Hayaan akong gumuhit nito. Ito ay 50. Bumalik tayo sa ating halimbawa. Kung ang n ay... Sa aking unang pagsusulit, nakakuha ako ng 55, na siyang aking average. Isa lang ang data entry point ko. Pagkatapos ng dalawang pagsubok, nakakuha ako ng 65. Kaya ang average ko ay magiging 65+55 na hinati ng 2. Iyon ay 60. At medyo tumaas ang average ko. Pagkatapos ay nakakuha ako ng 45, na nagpababa muli sa aking arithmetic mean. Hindi ako mag-plot ng 45 sa chart. Ngayon kailangan kong i-average ang lahat. Ano ang katumbas ng 45+65? Hayaan akong kalkulahin ang halagang ito upang kumatawan sa punto. Iyon ay 165 na hinati ng 3. Iyan ay 53. Hindi, 55. Kaya ang average ay bumaba muli sa 55. Maaari nating ipagpatuloy ang mga pagsubok na ito. Pagkatapos nating gumawa ng tatlong pagsubok at makabuo ng average na ito, iniisip ng maraming tao na gagawin ito ng mga diyos ng probabilidad upang mas kaunti ang ating makukuha sa hinaharap, na ang susunod na ilang pagsubok ay magiging mas mababa upang mabawasan ang average. Ngunit hindi ito palaging nangyayari. Sa hinaharap, ang posibilidad ay palaging nananatiling pareho. Ang posibilidad na ako ay gumulong ulo ay palaging 50%. Hindi sa una ay nakakakuha ako ng isang tiyak na bilang ng mga ulo, higit pa sa inaasahan ko, at pagkatapos ay biglang mahuhulog ang mga buntot. Ito ang "pagkakamali ng manlalaro". Kung makakakuha ka ng isang hindi katimbang na bilang ng mga ulo, hindi ito nangangahulugan na sa ilang mga punto ay magsisimula kang mahulog ng isang hindi katimbang na bilang ng mga buntot. Ito ay hindi ganap na totoo. Sinasabi sa atin ng batas ng malalaking numero na hindi ito mahalaga. Sabihin nating, pagkatapos ng tiyak na bilang ng mga pagsubok, ang iyong average... Ang posibilidad nito ay medyo maliit, ngunit, gayunpaman... Sabihin nating ang iyong average ay umabot sa markang ito - 70. Iniisip mo, "Wow, lumampas na kami sa inaasahan." Ngunit ang batas ng malalaking numero ay nagsasabi na wala itong pakialam kung gaano karaming mga pagsubok ang ating isinasagawa. Mayroon pa tayong walang katapusang bilang ng mga pagsubok sa hinaharap. Ang mathematical na inaasahan ng walang katapusang bilang ng mga pagsubok na ito, lalo na sa sitwasyong tulad nito, ay ang mga sumusunod. Kapag dumating ka sa isang may hangganang numero na nagpapahayag ng ilang malaking halaga, ang isang walang katapusang bilang na nagsasama-sama dito ay muling hahantong sa inaasahang halaga. Ito ay, siyempre, isang napakaluwag na interpretasyon, ngunit ito ang sinasabi sa atin ng batas ng malalaking numero. Ito ay mahalaga. Hindi niya sinasabi sa amin na kung kami ay makakakuha ng maraming mga ulo, kung gayon kahit papaano ang posibilidad na makakuha ng mga buntot ay tataas upang mabayaran. Sinasabi sa atin ng batas na ito na hindi mahalaga kung ano ang kahihinatnan ng may limitadong bilang ng mga pagsubok hangga't mayroon ka pa ring walang katapusang bilang ng mga pagsubok sa hinaharap. At kung gagawin mo nang sapat ang mga ito, babalik ka muli sa inaasahan. Ito ay isang mahalagang punto. Pag-isipan mo. Ngunit ito ay hindi ginagamit araw-araw sa pagsasanay sa mga lottery at casino, bagaman ito ay kilala na kung gumawa ka ng sapat na mga pagsubok... Maaari pa nga nating kalkulahin ito... ano ang posibilidad na tayo ay seryosong lumihis mula sa pamantayan? Ngunit ang mga casino at lottery ay gumagana araw-araw sa prinsipyo na kung kukuha ka ng sapat na mga tao, siyempre, sa maikling panahon, na may maliit na sample, pagkatapos ay ilang mga tao ang tatama sa dyekpot. Ngunit sa mahabang panahon, ang casino ay palaging makikinabang sa mga parameter ng mga laro na iniimbitahan ka nilang laruin. Ito ay isang mahalagang prinsipyo ng posibilidad na madaling maunawaan. Bagama't kung minsan, kapag ito ay pormal na ipinaliwanag sa iyo na may mga random na variable, ang lahat ay mukhang medyo nakakalito. Ang lahat ng sinasabi ng batas na ito ay ang mas maraming mga sample, mas ang arithmetic mean ng mga sample na iyon ay magsasama-sama patungo sa tunay na mean. At upang maging mas tiyak, ang arithmetic mean ng iyong sample ay magsasama-sama sa mathematical na inaasahan ng isang random variable. Iyon lang. See you sa susunod na video!

Mahinang batas ng malalaking numero

Ang mahinang batas ng malalaking numero ay tinatawag ding theorem ni Bernoulli, pagkatapos ni Jacob Bernoulli, na nagpatunay nito noong 1713.

Hayaang magkaroon ng walang katapusang sequence (magkakasunod na enumeration) ng magkakaparehong distributed at uncorrelated na random variable . Ibig sabihin, ang kanilang covariance c o v (X i , X j) = 0 , ∀ i ≠ j (\displaystyle \mathrm (cov) (X_(i),X_(j))=0,\;\forall i\not =j). Hayaan mong . Tukuyin sa pamamagitan ng sample mean ng una n (\displaystyle n) miyembro:

.

Pagkatapos X ¯ n → P μ (\displaystyle (\bar (X))_(n)\to ^(\!\!\!\!\!\!\mathbb (P) )\mu ).

Iyon ay, para sa bawat positibo ε (\displaystyle \varepsilon )

lim n → ∞ Pr (| X ¯ n − μ |< ε) = 1. {\displaystyle \lim _{n\to \infty }\Pr \!\left(\,|{\bar {X}}_{n}-\mu |<\varepsilon \,\right)=1.}

Malakas na batas ng malalaking numero

Hayaang magkaroon ng isang walang katapusang pagkakasunud-sunod ng mga independiyenteng magkaparehong ipinamamahagi na mga random na variable ( X i ) i = 1 ∞ (\displaystyle \(X_(i)\)_(i=1)^(\infty )) tinukoy sa isang puwang ng posibilidad (Ω , F , P) (\displaystyle (\Omega ,(\mathcal (F)),\mathbb (P))). Hayaan E X i = μ , ∀ i ∈ N (\displaystyle \mathbb (E) X_(i)=\mu ,\;\forall i\in \mathbb (N) ). Tukuyin ng X¯n (\displaystyle (\bar(X))_(n)) sample mean ng una n (\displaystyle n) miyembro:

X ¯ n = 1 n ∑ i = 1 n X i , n ∈ N (\displaystyle (\bar (X))_(n)=(\frac (1)(n))\sum \limits _(i= 1)^(n)X_(i),\;n\in \mathbb (N) ).

Pagkatapos X ¯ n → μ (\displaystyle (\bar (X))_(n)\to \mu ) halos palagi.

Pr (lim n → ∞ X ¯ n = μ) = 1. (\displaystyle \Pr \!\left(\lim _(n\to \infty )(\bar (X))_(n)=\mu \ kanan)=1.) .

Tulad ng anumang batas sa matematika, ang batas ng malalaking numero ay maaari lamang ilapat sa totoong mundo sa ilalim ng mga kilalang pagpapalagay, na maaari lamang matugunan nang may tiyak na antas ng katumpakan. Kaya, halimbawa, ang mga kondisyon ng sunud-sunod na mga pagsubok ay madalas na hindi mapapanatili nang walang katiyakan at may ganap na katumpakan. Bilang karagdagan, ang batas ng malalaking numero ay nagsasalita lamang ng kawalan ng posibilidad makabuluhang paglihis ng mean na halaga mula sa inaasahan sa matematika.