Evaluare statistică. Conceptul de estimare a parametrilor populației

Distribuția unei variabile aleatoare (distribuția populației) este de obicei caracterizată printr-un număr de caracteristici numerice:

  • pentru o distribuție normală N(a, σ) este așteptarea matematică a și abaterea standard σ;
  • pentru o distribuție uniformă, R(a,b) este limitele intervalului în care se observă valorile acestei variabile aleatoare.
Se numesc astfel de caracteristici numerice, de obicei necunoscute parametrii populației . Estimarea parametrilor - caracteristica numerică corespunzătoare calculată din probă. Estimările parametrilor populației se împart în două clase: punctŞi interval.

Când un scor este determinat de un singur număr, acesta este numit estimare punctuală. Estimarea punctuală, în funcție de eșantion, este o variabilă aleatorie și variază de la probă la probă cu experimente repetate.
Estimările punctuale au cerințe pe care trebuie să le îndeplinească pentru a fi „benigne” în orice sens. Acest nedeplasat, eficienţăŞi avere.

Estimări de intervale sunt determinate de două numere - capetele intervalului care acoperă parametrul estimat. Spre deosebire de estimările punctuale, care nu dau o idee despre cât de departe poate fi parametrul estimat de acestea, estimările pe intervale ne permit să stabilim acuratețea și fiabilitatea estimărilor.

Ca estimări punctuale ale așteptărilor matematice, varianței și abaterii standard, sunt utilizate caracteristicile eșantionului, respectiv media eșantionului, varianța eșantionului și abaterea standard a eșantionului.

Proprietatea estimării nepărtinitoare.
O cerință de dorit pentru evaluare este absența erorii sistematice, de ex. atunci când se utilizează în mod repetat în locul parametrului θ estimarea acestuia, valoarea medie a erorii de aproximare este zero - aceasta este proprietatea estimării nepărtinitoare.

Definiţie. O estimare se numește nepărtinitoare dacă așteptarea sa matematică este egală cu valoarea adevărată a parametrului estimat:

Media aritmetică a eșantionului este o estimare imparțială a așteptărilor matematice și a varianței eșantionului - estimarea părtinitoare a varianței generale D. O estimare imparțială a varianței generale este estimarea

Proprietatea consistenței evaluării.
A doua cerință pentru o estimare - consistența acesteia - înseamnă că estimarea se îmbunătățește odată cu creșterea dimensiunii eșantionului.

Definiţie. Nota se numește consistent dacă converge în probabilitate către parametrul estimat θ ca n→∞.


Convergența probabilității înseamnă că, cu o dimensiune mare a eșantionului, probabilitatea unor abateri mari ale estimării față de valoarea adevărată este mică.

Proprietate de estimare efectivă.
A treia cerință vă permite să selectați cea mai bună estimare dintre mai multe estimări ale aceluiași parametru.

Definiţie. Un estimator imparțial este eficient dacă are cea mai mică varianță dintre toți estimatorii nepărținați.

Aceasta înseamnă că estimarea efectivă are o dispersie minimă în raport cu valoarea reală a parametrului. Rețineți că o estimare eficientă nu există întotdeauna, dar dintre două estimări este de obicei posibil să o alegeți pe cea mai eficientă, adică. cu mai puțină variație. De exemplu, pentru un parametru necunoscut a al unei populații normale N(a,σ), atât media aritmetică a eșantionului, cât și mediana eșantionului pot fi luate ca o estimare imparțială. Dar varianța mediei eșantionului este de aproximativ 1,6 ori mai mare decât varianța mediei aritmetice. Prin urmare, o estimare mai eficientă este media aritmetică a eșantionului.

Exemplul nr. 1. Găsiți o estimare nepărtinitoare a varianței măsurătorilor unei variabile aleatorii folosind un singur dispozitiv (fără erori sistematice), ale cărui rezultate ale măsurătorilor (în mm): 13,15,17.
Soluţie. Tabel pentru calcularea indicatorilor.

x|x - x av |(x - x medie) 2
13 2 4
15 0 0
17 2 4
45 4 8

Media aritmetică simplă(estimare imparțială a așteptărilor matematice)


Dispersia- caracterizează măsura dispersiei în jurul valorii sale medii (o măsură a dispersiei, adică abaterea de la medie - estimare părtinitoare).


Estimator de varianță imparțial- estimarea consistentă a varianței (varianță corectată).

Exemplul nr. 2. Găsiți o estimare imparțială a așteptărilor matematice ale măsurătorilor unei anumite variabile aleatoare de către un dispozitiv (fără erori sistematice), ale cărei rezultate de măsurare (în mm): 4,5,8,9,11.
Soluţie. m = (4+5+8+9+11)/5 = 7,4

Exemplul nr. 3. Găsiți varianța corectată S2 pentru o dimensiune a eșantionului de n=10 dacă varianța eșantionului este D = 180.
Soluţie. S 2 = n*D/(n-1) = 10*180/(10-1) = 200

  • Evenimente dependente și independente. Producerea de evenimente. Conceptul de probabilitate condiționată. Teorema înmulțirii probabilităților (cu demonstrație).
  • Formule de probabilitate totală și Bayes (cu dovezi). Exemple.
  • Teste independente repetate. Formula lui Bernoulli (cu concluzie). Exemple.
  • Teorema locală a lui Moivre-Laplace, condiții de aplicabilitate. Proprietăţile funcţiei Dx). Exemplu.
  • Formula Poisson asimptotică și condițiile de aplicabilitate a acesteia. Exemplu.
  • Teorema integrală Moivre-Laplace și condițiile de aplicabilitate a acesteia. Funcția Laplace f(x) și proprietățile acesteia. Exemplu.
  • Corolare din teorema integrală Moivre-Laplace (cu concluzie). Exemple.
  • Așteptările matematice ale unei variabile aleatoare discrete și proprietățile acesteia (cu concluzie). Exemple.
  • Dispersia unei variabile aleatoare discrete și proprietățile acesteia (cu derivare). Exemple.
  • Funcția de distribuție a unei variabile aleatoare, definiția acesteia, proprietățile și graficul.
  • Variabilă aleatoare continuă (nouă). Probabilitatea unei singure valori a nsv. Așteptările matematice și dispersia nsv.
  • Densitatea probabilității unei variabile aleatoare continue, definiția acesteia, proprietățile și graficul.
  • O variabilă aleatoare distribuită în conformitate cu legea binomială, așteptările și varianța sa matematică. Legea distribuției Poisson.
  • Așteptări matematice și dispersie a numărului și frecvenței de apariție a unui eveniment în n încercări independente repetate (cu inferență).
  • Definiția legii distribuției normale. Sensul teoretic și probabilistic al parametrilor săi. Curba normală și dependența poziției și formei sale de parametri.
  • Funcția de distribuție a unei variabile aleatoare distribuite normal și expresia acesteia prin funcția Laplace.
  • Formule pentru determinarea probabilității ca: a) o variabilă aleatoare distribuită normal să se încadreze într-un interval dat; b) abaterile sale de la asteptarile matematice. Regula celor trei sigma.
  • Conceptul de variabilă aleatoare bidimensională (/7-dimensională). Exemple. Tabelul distribuției sale. Distribuții unidimensionale ale componentelor sale. Distribuții condiționate și determinarea lor din tabelul de distribuție.
  • Covarianța și coeficientul de corelație al variabilelor aleatoare. Relația dintre ecorelația și independența variabilelor aleatoare.
  • Conceptul unei legi de distribuție normală bidimensională. Așteptări și variații matematice condiționate.
  • Inegalitatea lui Markov (lema lui Cebyshev) (cu derivare). Exemplu.
  • Inegalitatea lui Cebyshev (cu derivare) și cazurile sale speciale pentru o variabilă aleatoare distribuită conform legii binomiale și pentru frecvența unui eveniment.
  • Teorema lui Cebyshev (cu dovezi), semnificația și consecința ei. Exemplu.
  • Legea numerelor mari. Teorema lui Bernoulli (cu dovezi) și semnificația ei. Exemplu.
  • Inegalitatea lui Cebyshev pentru media aritmetică a variabilelor aleatoare (cu derivare).
  • Teorema limitei centrale. Conceptul teoremei lui Lyapunov și semnificația acesteia. Exemplu.
  • Seria de variații, soiurile sale. Media aritmetică și varianța seriei. O modalitate simplificată de a le calcula.
  • Conceptul de estimare a parametrilor unei populații generale. Proprietățile evaluărilor: imparțial, consecvent, eficient.
  • Estimarea ponderii generale pe baza unui eșantion aleatoriu. Nepărtinirea și consistența proporției eșantionului.
  • Estimarea mediei generale pe baza unui eșantion aleatoriu. Nepărtinirea și consistența eșantionului înseamnă.
  • Estimarea varianței generale pe baza unui eșantion aleatoriu. Prejudecățile și consistența varianței de eșantionare (fără inferență). Varianta de eșantionare corectată.
  • Conceptul de estimare a intervalului. Probabilitatea de încredere și intervalul de încredere. Eroare marginală de eșantionare. Erori în reprezentativitatea eșantionului (aleatorie și sistematice).
  • Formula de încredere pentru estimarea mediei generale. Eroarea pătratică medie a eșantioanelor repetate și nerepetate și construcția unui interval de încredere pentru media generală.
  • Determinarea volumului necesar de probe repetate și nerepetitive la estimarea mediei generale și a cotei.
  • Ipoteza statistica si testul statistic. Erori de primul și al doilea fel. Nivelul de semnificație și puterea criteriului. Principiul certitudinii practice.
  • Construirea unei legi teoretice de distribuție pe baza datelor experimentale. Conceptul de criterii de consimțământ.
  • Criteriul x2-Pearson de bunătate și schema de aplicare a acestuia.
  • Dependențe funcționale, statistice și de corelare. Diferențele dintre ele. Sarcinile principale ale teoriei corelațiilor.
  • Regresia perechi liniare. Sistem de ecuații normale pentru determinarea parametrilor dreptelor de regresie. Covarianța eșantionului. Formule pentru calcularea coeficienților de regresie.
  • Mod simplificat:
  • Evaluarea etanșeității conexiunii. Coeficientul de corelație (eșantion), proprietățile sale și evaluarea fiabilității.
    1. Conceptul de estimare a parametrilor unei populații generale. Proprietățile evaluărilor: imparțial, consecvent, eficient.

    Să formulăm problema estimării parametrilor în formă generală . Fie distribuția atributului X - populația generală - să fie specificată de funcția ver-tey (pentru SV X discret) sau densitatea ver-ti
    (pentru SV X continuu), care conține un parametru necunoscut . De exemplu, acesta este parametrul λ în distribuția Poisson sau parametrii a și
    pentru legea distribuției normale etc.

    Pentru a calcula parametrul Nu este posibil să se studieze toate elementele populației. Prin urmare, despre parametru încercarea de a judeca după un eșantion format din valori (opțiuni)
    . Aceste valori pot fi considerate ca valori parțiale (realizări) a n variabile aleatoare independente
    fiecare dintre ele are aceeași lege de distribuție ca și SV X însuși.

    Definiţie . Prin evaluare parametru denumește orice funcție a rezultatelor observațiilor de pe Pământul Pământului (cu alte cuvinte, statistici), cu ajutorul căreia se judecă valoarea parametrului :

    .

    Din moment ce
    sunt variabile aleatoare, apoi estimarea (spre deosebire de parametrul estimat - o mărime nealeatoare, deterministă) este o variabilă aleatoare în funcție de legea de distribuție a SV X și de numărul n.

    Calitatea unei evaluări nu trebuie judecată după valorile sale individuale, ci doar după distribuția valorilor sale în retea mare teste, adică prin distribuția prin eșantionare a estimării.

    Dacă evaluarea valorează concentrat în jurul valorii adevărate a parametrului , adică cea mai mare parte a masei distribuției eșantionului estimată este concentrată într-o mică vecinătate a parametrului estimat , atunci cu mare încredere putem presupune că estimarea diferit de parametru doar cu o cantitate mică. Prin urmare, în ordinea valorii era aproape de , trebuie în mod evident să cerem ca împrăștierea variabilei aleatoare relativ , exprimat, de exemplu, prin așteptarea matematică a abaterii pătrate a estimării de la parametrul estimat
    , era cât se poate de mică. Aceasta este condiția principală pe care trebuie să o îndeplinească „cea mai bună” estimare.

    Proprietățile ratingurilor.

    Definiţie . Nota parametru numit imparțial, dacă așteptarea sa matematică este egală cu parametrul estimat, i.e.
    .

    in caz contrar se numeste estimarea deplasat.

    Dacă această egalitate nu este valabilă, atunci estimarea , obținută din probe diferite, va supraestima, în medie, valoarea (Dacă
    , sau subestimați-l (dacă
    ). Cerința imparțială asigură că nu există erori sistematice în estimare.

    Dacă, pentru o dimensiune finită a eșantionului n
    , adică bias de estimare
    , Dar
    , atunci o astfel de evaluare numit imparțial asimptotic.

    Definiţie . Nota parametru numit bogat, dacă îndeplinește legea numerelor mari, adică. converge în realitate către parametrul estimat:

    , sau .

    În cazul utilizării unor estimări consistente, se justifică creșterea dimensiunii eșantionului, deoarece în acest caz, erori semnificative de estimare devin improbabile. Prin urmare, numai estimările consistente au sens practic. Dacă estimarea este consecventă, atunci este aproape sigur că pentru un n suficient de mare
    .

    Dacă scorul parametru este imparțial și variația sa
    ca n → ∞, apoi estimarea este, de asemenea, bogat. Aceasta rezultă direct din inegalitatea lui Cebyshev:

    .

    Definiţie . Estimare imparțială parametrul este numit eficient, dacă are cea mai mică varianță dintre toate estimările posibile ale parametrilor imparțiali , calculat din probe de aceeași mărime n.

    Deoarece pentru estimatorul imparțial
    este varianța sa , atunci efectul este proprietate decisivă, care determină calitatea evaluării.

    Eficacitatea evaluării este determinată de raportul: .

    Unde Şi - în raport cu dispersia estimărilor efective şi date. Cu cât e mai aproape de 1, cu atât estimarea este mai eficientă. Dacă e → 1 ca n → ∞, atunci o astfel de estimare se numește eficientă asimptotic.

    "

    Ce parametru estimat este considerat consecvent, imparțial, eficient?

    1) Evaluare consistentă

    Bogat o estimare în statistica matematică este o estimare punctuală care converge în probabilitate către parametrul estimat.

    Definiții

    · Lasă-- eșantionarea dintr-o distribuție în funcție de parametru. Atunci estimarea se numește consistentă dacă

    conform probabilităţii la.

    În caz contrar, evaluarea se numește invalidă.

    · Se spune că o estimare este puternic consecventă dacă

    aproape probabil la.

    Proprietăți

    · Din proprietăţile convergenţelor variabile aleatoare avem că o estimare puternic consistentă este întotdeauna consecventă. Reversul, în general, nu este adevărat.

    • · Media eșantionului este o estimare consistentă a așteptării matematice X i .
    • · Parodograma este o estimare imparțială, dar inconsecventă a densității spectrale.
    • 2) Estimare imparțială

    O estimare imparțială în statistica matematică este o estimare punctuală a cărei așteptare matematică este egală cu parametrul estimat.

    Definiţie

    Fie un eșantion dintr-o distribuție în funcție de parametru. Atunci estimarea se numește imparțial dacă

    În caz contrar, estimarea se numește părtinitoare, iar variabila aleatoare se numește părtinire.

    Media eșantionului

    este o estimare imparțială a așteptării matematice a lui X i, deoarece dacă

    · Fie variabilele aleatoare X i au varianță finită DX i = ? 2. Să construim estimări

    Varianta eșantionului,

    Varianta eșantionului corectată.

    Atunci estimarea parametrului este părtinitoare și S 2 nepărtinitoare? 2.

    3) Evaluare eficientă

    Versiunea actuală (netestată)

    Definiţie

    O estimare a unui parametru se numește estimare eficientă într-o clasă dacă inegalitatea pentru oricare este valabilă pentru orice altă estimare.

    Estimările imparțiale joacă un rol special în statisticile matematice. Dacă un estimator imparțial este un estimator eficient în clasa celor imparțiali, atunci astfel de statistici sunt de obicei numite pur și simplu eficiente.

    O estimare eficientă într-o clasă în care există o anumită funcție există și este unică până la valorile din mulțime, probabilitatea de a fi în care este zero ().

    O estimare a unui parametru se numește efectivă dacă pentru aceasta inegalitatea Cramer-Rao devine o egalitate. Astfel, inegalitatea poate fi folosită pentru a demonstra că varianța unei estimări date este cea mai mică posibilă, adică că această estimare este într-un anumit sens mai bună decât toate celelalte.

    În statistica matematică, inegalitatea Cramer-Ramo (în onoarea lui Harald Cramer și K.R. Rao) este o inegalitate care, în anumite condiții pe modelul statistic, dă o limită inferioară pentru varianța estimării unui parametru necunoscut, exprimându-l în termenii informațiilor Fisher.

    Una dintre cerințele principale la construirea estimărilor este obținerea de estimări cu varianță minimă sau dispersie minimă (dacă există). În acest sens, conceptul de estimări eficiente a fost introdus în statistica matematică,

    În raport cu estimările părtinitoare ale unui parametru de semnal, estimarea se numește efectivă dacă valoarea medie a abaterii pătrate a estimării de la valoarea adevărată a parametrului estimat I nu depășește valoarea medie a abaterii pătrate a oricărei alte estimări y , adică inegalitatea este satisfăcută

    Pentru un estimator imparțial, dispersia estimatorului este aceeași cu varianța acestuia, prin urmare, estimatorul imparțial efectiv este definit ca estimatorul cu varianța minimă;

    S. Rao și Cramer au obținut în mod independent expresii pentru limitele inferioare ale variațiilor condiționate și dispersia estimărilor, care sunt dispersia și dispersia estimărilor efective, cu condiția ca acestea să existe pentru parametrii dați.

    Să prezentăm derivarea acestei expresii, presupunând că ipotezele necesare sunt valabile.

    Prezentăm estimarea parametrului y sub formă prescurtată, unde X este un eșantion multidimensional din implementare pe un interval de timp

    Să facem o medie a expresiei

    pentru toate valorile posibile ale unui eșantion multidimensional X, care este descris printr-o densitate de probabilitate condiționată Ținând cont de relația cunoscută pentru derivata logaritmului natural după medie, obținem

    Datorită proprietății de normalizare a densității de probabilitate, ultimul termen din (1.3.3) este egal cu zero. Integrala primului termen reprezintă valoarea medie a devizului

    Ținând cont de acestea din urmă, valoarea medie poate fi scrisă în formă

    Partea stângă a acestei expresii este media produsului a două variabile aleatoare cu valori finite ale primelor două momente. În aceste condiții, inegalitatea Bunyakovsky-Schwartz, cunoscută din statisticile matematice, este valabilă pentru variabile aleatoare

    care se transformă în egalitate dacă variabilele aleatoare sunt legate printr-o dependenţă deterministă. Ținând cont de (1.3.6), din expresia (1.3.5) putem obține

    Pentru estimatorii imparțiali și constante, varianța estimatorului satisface inegalitatea Rao-Kramer

    Trebuie remarcat faptul că, în toate relațiile, media se realizează pe un eșantion multidimensional de date observate X (cu procesare continuă - peste toate implementările posibile ale unui

    derivatele sunt luate în punctul valorii adevărate a parametrului estimat.

    Semnul egal în expresiile (1.3.7) și (1-3.8) este realizat numai pentru estimări eficiente.

    În raport cu expresia (1.3.7), luăm în considerare condițiile în care inegalitatea se transformă în egalitate, adică estimarea parametrului este o estimare efectivă părtinitoare Conform (1.3.6), pentru aceasta este necesar ca încrucișarea. coeficientul de corelaţie între be egal cu unu, adică astfel încât aceste funcții aleatoare sunt legate printr-o relație liniară deterministă.

    Într-adevăr, să reprezentăm derivata logaritmului funcției de probabilitate în formă

    unde este o funcție care nu depinde de estimarea lui y și de eșantionul de date observate, dar poate depinde de parametrul estimat. se transformă în egalitate. Totuși, reprezentarea derivatei logaritmului funcției de probabilitate în forma (1.3.9) este posibilă dacă este îndeplinită condiția de suficiență (1.2.9) pentru a estima y, din care rezultă că

    și prin urmare, dacă derivata logaritmului raportului de probabilitate depinde liniar de estimarea suficientă, atunci coeficientul de proporționalitate nu depinde de eșantion

    Astfel, pentru existența unei estimări efective părtinitoare, trebuie îndeplinite două condiții: estimarea trebuie să fie suficientă (1.2.9) și relația (1.3.9) trebuie îndeplinită. Restricții similare sunt impuse existenței unor estimări imparțiale efective, sub care în expresia (1.3.8) semnul inegalității se transformă în egalitate.

    Expresia obținută mai sus pentru limita inferioară a dispersiei estimării părtinitoare este valabilă și pentru limita inferioară a dispersiei estimării părtinitoare, deoarece i.e.

    Ultima inegalitate se transformă în egalitate dacă, pe lângă condiția de suficiență a estimării, următoarea relație este adevărată:

    unde are același sens ca în expresia (1.3.9).

    Formula (1.3.10) este derivată în mod similar cu (1.3.7), dacă în expresia originală (1.3.2) în loc să ia în considerare

    Din natura condițiilor (1.2.9) și (1.3.9) este clar că estimările efective există doar în cazuri foarte specifice. De asemenea, trebuie remarcat faptul că o estimare efectivă aparține în mod necesar clasei estimărilor suficiente, în timp ce o estimare suficientă nu este neapărat eficientă.

    Analiza expresiei pentru varianța estimatorului mixt efectiv 1.3.7) arată că pot exista estimatori părtinitori care oferă mai puțină varianță estimatorului decât cei nepărtinși. Pentru a face acest lucru, este necesar ca derivata offset-ului să aibă o valoare negativă și să fie aproape de unitatea în valoare absolută în punctul valorii adevărate a parametrului.

    Deoarece în majoritatea cazurilor pătratul mediu al erorii de estimare (dispersie) rezultată este de interes, este logic să vorbim despre pătratul mediu al erorii de estimare, care pentru orice estimare este mărginită de jos:

    În acest caz, pentru estimări eficiente există un semn egal.

    Este ușor de arătat că relațiile (1.3.10) și (1.3.12) coincid dacă sunt îndeplinite condițiile (1.3.11) și, respectiv, (1.3.9). Într-adevăr, înlocuind valorile exprimate prin funcții în numărător și numitor (1.3.10) obținem (1.3.12).

    Folosind proprietățile estimărilor efective discutate mai sus, vom clarifica definiția acestora. Vom numi o estimare y eficientă dacă oricare dintre condițiile (1.2.9) și (1.3.11) sunt îndeplinite pentru aceasta, sau dacă are o dispersie pentru o părtinire dată

    sau împrăștiere

    sau cu părtinire zero, această estimare are varianță

    Rețineți că caracteristicile estimării efective (1.3.13) - (1.3.15) pot fi calculate și pentru acei parametri pentru care nu există o estimare efectivă. În acest caz, valorile (1.3.13) - (1.3.15) determină limita inferioară (de neatins) pentru caracteristicile de evaluare corespunzătoare.

    Pentru a compara estimările reale cu cele efective în statistica matematică, a fost introdus conceptul de eficiență relativă a estimărilor, reprezentând raportul dintre deviația pătratică medie a estimării efective în raport cu valoarea reală a parametrului și abaterea medie pătrată a realului. estimare relativă la valoarea reală a parametrului:

    Aici y este estimarea reală, a cărei eficacitate este egală cu estimarea efectivă.

    Din definiția varianței estimării efective (1.3.1) este clar că eficiența relativă a estimării variază în

    Pe lângă conceptul de estimări eficiente, există și conceptul de estimări efective asimptotic. Se presupune că pentru un timp de observare suficient de lung sau pentru o creștere nelimitată a raportului semnal-zgomot, valoarea limită a eficienței relative a estimării reale este egală cu unitatea. Aceasta înseamnă că pentru asimptotic evaluare eficientă varianța estimării pentru o părtinire dată este determinată de expresia (1.3.13), iar în absența unei părtiniri, de expresia (1.3.15).

    Tema 7. Estimări statistice ale parametrilor de distribuție: estimări punctuale și pe intervale

    Scopul metodelor statistice este de a folosi un eșantion limitat, adică o anumită parte a populației generale, pentru a face o judecată rezonabilă asupra proprietăților sale în ansamblu.

    Desigur, înlocuirea unui studiu populațional cu un studiu eșantion ridică o serie de întrebări:

    1. În ce măsură eșantionul reflectă proprietățile populației, adică în ce măsură eșantionul este reprezentativ pentru populație?

    2. Ce informații despre valorile parametrilor populației pot furniza parametrii eșantionului?

    3. Se poate spune că caracteristicile statistice obţinute prin eşantionare (valori medii, varianţă sau orice alte valori derivate) sunt egale cu acele caracteristici care pot fi obţinute de la populaţia generală?

    Verificarea arată că, de obicei, valorile parametrilor obținuți pentru diferite eșantioane din aceeași populație nu coincid. Valorile numerice ale parametrilor eșantionului calculate prin eșantionare sunt doar rezultatul unei aproximative evaluare statistică valorile acestor parametri în populație. Evaluarea statistică, datorită variabilității fenomenelor observate, ne permite să obținem doar valorile lor aproximative.

    Nota. Strict vorbind, în statistică, o estimare este o regulă pentru calcularea unui parametru estimat, iar termenul estimare, adică efectuarea unei evaluări, înseamnă a indica o valoare aproximativă.

    Există evaluări diferite punctŞi estimări de interval.

    Estimarea punctuală a parametrilor de distribuție

    Lasă x 1 , x 2 , …, x n– volumul probei n dintr-o populație cu funcție de distribuție F(x).

    Caracteristicile numerice ale acestui eșantion se numesc selectiv (empiric) caracteristici numerice.

    Rețineți că caracteristicile numerice ale eșantionului sunt caracteristici ale unui eșantion dat, dar nu sunt caracteristici ale distribuției populației generale. Cu toate acestea, aceste caracteristici pot fi utilizate pentru a estima parametrii populației.

    Loc este o estimare statistică care este determinată de un singur număr.

    Estimarea punctuală se caracterizează prin proprietati: imparțialitate, consecvență și eficiență.

    imparțial numită estimare punctuală, a cărei așteptare matematică este egală cu parametrul estimat pentru orice dimensiune a eșantionului.

    Estimarea punctuala se numeste bogat , dacă cu o creștere nelimitată a dimensiunii eșantionului ( n® ¥) converge în probabilitate către valoarea adevărată a parametrului, adică tinde către valoarea adevărată a parametrului estimat al populației generale.

    Eficient este o estimare punctuală care (pentru o anumită dimensiune a eșantionului n) are cea mai mică dispersie posibilă, adică garantează cea mai mică abatere a estimării eșantionului de la aceeași estimare a populației generale.

    În statistica matematică se arată că o estimare consecventă, imparțială a valorii medii generale a este media eșantionului:

    Unde x i- opțiunea de eșantionare, n i– opțiuni de frecvență x i, – dimensiunea eșantionului.

    O estimare imparțială a varianței generale servește la corectarea varianței eșantionului

    ,

    Formula mai convenabilă  .

    Nota s 2 pentru varianța generală este, de asemenea, consecvent, dar nu este eficient. Totuși, în cazul unei distribuții normale este „eficientă asimptotic”, adică cu creștere n raportul dispersiei sale la cel minim posibil se apropie la infinit de unitate.

    Deci, dacă i se oferă un eșantion din distribuție F(x) variabilă aleatoare X cu așteptări matematice necunoscute Oși dispersia s 2, atunci pentru a calcula valorile acestor parametri avem dreptul de a folosi următoarele formule aproximative:

    Estimările punctuale au dezavantajul că, cu o dimensiune mică a eșantionului, pot diferi semnificativ de parametrii estimați. Prin urmare, pentru a ne face o idee despre apropierea dintre un parametru și estimarea acestuia, în statistica matematică sunt introduse așa-numitele estimări de interval.

    Interval de încredere

    Dacă, în timpul procesării statistice a rezultatelor, este necesar să se găsească nu numai o estimare punctuală a parametrului necunoscut θ, ci și să se caracterizeze acuratețea acestei estimări, atunci se găsește un interval de încredere.

    Interval de încredere– acesta este intervalul în care se află parametrul necunoscut al populației cu o probabilitate de încredere predeterminată.

    Probabilitatea de încredere este probabilitatea cu care un parametru necunoscut al populației aparține intervalului de încredere.

    Lungimea intervalului de încredere caracterizează acuratețea estimării intervalului și depinde de dimensiunea eșantionului și de probabilitatea de încredere. Pe măsură ce dimensiunea eșantionului crește, lungimea va crește. intervalul scade (precizia crește), iar pe măsură ce probabilitatea de încredere tinde spre 1, lungimea va fi de încredere. intervalul crește (precizia scade) Alături de probabilitatea de încredere p, în practică este adesea folosit nivelul de semnificație α = 1 - p.

    De obicei, se ia p = 0,95 sau (mai puțin frecvent) 0,99. Aceste probabilități sunt considerate suficiente pentru o judecată încrezătoare cu privire la parametrii generali pe baza indicatorilor eșantionului cunoscuți.

    Intervalul de încredere pentru așteptarea matematică are forma: unde S este abaterea standard, este valoarea critică a distribuției Student (vezi ANEXA 1 la Subiectul 7)