Cum se calculează media în excel. Cum să găsiți media aritmetică în Excel

În matematică (și statistică), o medie este un număr între cele mai mici și cele mai mari valori dintr-un set de numere. Există trei medii comune: media aritmetică, mediana și modul. ÎN Microsoft Excel puteți calcula toate cele trei cantități și puteți găsi, de asemenea, media ponderată, care este utilizată pentru a calcula prețul mediu.

Pași

Media aritmetică

    Introduceți numerele a căror medie aritmetică doriți să găsiți. De exemplu, luați în considerare un set de zece numere.

    • În cele mai multe cazuri, numerele sunt introduse în coloane (ca în exemplul nostru), așa că introduceți numerele în celulele A1 – A10.
    • Numerele de introdus: 2, 3, 5, 5, 7, 7, 7, 9, 16 și 19.
    • Dacă doriți, găsiți suma numerelor introducând formula „=SUM(A1:A10)” în celula A11 (fără ghilimele).
  1. Puteți găsi media aritmetică folosind funcția MEDIE.

    • Faceți clic pe o celulă goală, cum ar fi A12, apoi tastați „=AVERAGE(A1:10)” (fără ghilimele).
    • Faceți clic pe o celulă goală și apoi faceți clic pe butonul „f x” (în bara de formule direct deasupra foii de lucru Excel). În fereastra care se deschide, în lista „Selectați o funcție”, găsiți și evidențiați „AVERAGE”, apoi faceți clic pe OK. Introduceți intervalul „A1:A10” în linia „Numărul 1” a ferestrei care se deschide și faceți clic pe OK.
    • Introduceți un semn egal (=) în bara de formule. În stânga barei de formule, în lista derulantă Funcții, găsiți și selectați MEDIE. Introduceți intervalul „A1:A10” în linia „Numărul 1” a ferestrei care se deschide și faceți clic pe OK.
  2. În celula în care ați introdus formula, va fi afișată media aritmetică, egală cu raportul dintre suma numerelor din intervalul dat de celule (80) și numărul total de numere din intervalul (10): 80/ 10 = 8.

    • Pentru a verifica răspunsul corect în orice celulă goală, introduceți formula „=A11/10”.
    • Media aritmetică este utilă pentru centrarea unei distribuții atunci când numerele individuale dintr-un set de numere nu sunt foarte diferite unele de altele.

    Median

    1. Introduceți numerele a căror mediană doriți să o găsiți.

      Puteți găsi media aritmetică folosind funcția MEDIAN. Puteți introduce formula într-unul din trei moduri:

      • Faceți clic pe o celulă goală, cum ar fi A13, apoi introduceți „=MEDIAN(A1:10)” (fără ghilimele).
      • Faceți clic pe o celulă goală și apoi faceți clic pe butonul „f x” (în bara de formule direct deasupra foii de lucru Excel). În fereastra care se deschide, în lista „Selectați o funcție”, găsiți și evidențiați „MEDIAN”, apoi apăsați OK. Introduceți intervalul „A1:A10” în linia „Numărul 1” a ferestrei care se deschide și faceți clic pe OK.
      • Introduceți un semn egal (=) în bara de formule. În stânga barei de formule, în lista derulantă Funcții, găsiți și selectați MEDIAN. Introduceți intervalul „A1:A10” în linia „Numărul 1” a ferestrei care se deschide și faceți clic pe OK.
    2. Celula în care ați introdus formula va afișa valoarea mediană, unde jumătate din numerele dintr-un set de numere au valori mai mari decât mediana, iar cealaltă jumătate au valori mai mici decât mediana (în exemplul nostru, mediana este 7).

    Mediana poate fi sau nu egală cu unul dintre numerele dintr-un set de numere.

      Modă Introduceți numerele al căror mod doriți să îl găsiți.

      De exemplu, luați în considerare un set de zece numere (2, 3, 5, 5, 7, 7, 7, 9, 16 și 19). Introduceți aceste numere în celulele A1 - A10.

    1. Funcția de căutare a modului este diferită în diferite versiuni de Excel.

      • Puteți introduce formula într-unul din trei moduri:
      • Faceți clic pe o celulă goală, cum ar fi A14, apoi introduceți „=MODE(A1:10)” sau „=MODE.ONE(A1:10)” (fără ghilimele).
      • Faceți clic pe o celulă goală și apoi faceți clic pe butonul „f x” (în bara de formule direct deasupra foii de lucru Excel). În fereastra care se deschide, în lista „Selectați o funcție”, găsiți și evidențiați „FASHION” sau „FASHION.ONE”, apoi apăsați OK. Introduceți intervalul „A1:A10” în linia „Numărul 1” a ferestrei care se deschide și faceți clic pe OK.
    2. Introduceți un semn egal (=) în bara de formule. În stânga barei de formule, în lista derulantă Funcții, găsiți și selectați MEDIAN sau MODE.ONE. Introduceți intervalul „A1:A10” în linia „Numărul 1” a ferestrei care se deschide și faceți clic pe OK.

      • Celula în care ați introdus formula va afișa valoarea modului egală cu numărul care apare cel mai des într-un anumit set de numere.

    În exemplul nostru, modul este 7, deoarece numărul 7 apare de trei ori în setul nostru de numere.

    1. Dacă două numere apar de același număr de ori într-un interval de numere, funcția MODE sau MODE.ONE va afișa primul număr întâlnit. Dacă în exemplul nostru schimbați 3 în 5, atunci modul va fi 5, nu 7, deoarece 5 apare primul. Media ponderată

      • În exemplul nostru, vom introduce titluri de coloane. Introduceți „Prețul unitar” în celula A1 și „Numărul de unități expediate” în celula B1.
      • Primul lot a constat din 10 unități la 20 USD pe unitate. Introduceți „20 USD” în celula A2 și „10” în celula B2.
      • Cererea de tonic a crescut, așa că al doilea lot a constat din 40 de unități la 30 USD pe unitate. Introduceți „30 USD” în celula A3 și „40” în celula B3.
      • Pe măsură ce prețul a crescut, cererea de tonic a scăzut, iar al treilea lot a constat din 20 de unități la 25 USD pe unitate. Introduceți „25 USD” în celula A4 și „20” în celula B4.
    2. Pentru a calcula o medie ponderată în Excel, trebuie să utilizați două funcții:

      • SUMPRODUS Funcția SUMPRODUS înmulțește numerele pe un rând și adună produsele numerelor din toate rândurile. Specificați intervalul fiecărei coloane; în exemplul nostru: „SUMPRODUCT=(A2:A4,B2:B4)”. Ca urmare, veți primi costul total al tuturor tonicului expediat.
      • SUMĂ. Funcția SUM adaugă numere într-un singur rând sau coloană. Deoarece doriți să găsiți prețul unitar mediu al apei tonice livrate, trebuie să găsiți cantitate totală tonic expediat. În exemplul nostru: „=SUM(B2:B4)”.
      Deoarece media este determinată de raportul dintre suma tuturor numerelor și numărul de numere, puteți combina aceste două funcții într-o singură formulă: „SUMPRODUCT=(A2:A4,B2:B4)/SUM(B2:B4). ”
    3. Celula în care ați introdus formula va afișa valoarea mediei ponderate.În exemplul nostru, acesta este prețul mediu pe unitate de tonic, egal cu raportul dintre costul total al tonicului expediat și cantitatea totală de tonic.

      • Costul total al tonicului livrat: 20 x 10 + 30 x 40 + 25 x 20 = 200 + 1200 + 500 = 1900 USD.
      • Cantitatea totală de tonic livrat: 10 + 40 + 20 = 70.
      • Preț mediu: 1900/70 = 27,14 USD.
    • Nu trebuie să introduceți fiecare număr dintr-un rând (într-o coloană sau un rând), dar trebuie să vă asigurați că Excel înțelege ce numere doriți să includeți și să excludeți. În exemplul nostru, dacă doriți să găsiți media primelor cinci numere, introduceți formula astfel: „=AVERAGE(A1:A5,A10).”

Dacă nu există celule goale în interval și doar numere, niciun text etc., atunci formula valorii medii va fi calculată așa cum suntem obișnuiți în viața de zi cu zi. Puteți împărți la suma greutăților din aceeași celulă adăugând formula manual sau în următoarea. În cazul nostru, cifra de 18,9 indică faptul că valoarea medie (32,8 USD pe săptămână) pur și simplu nu poate fi de încredere. Să găsim media tuturor celulelor ale căror valori corespund unei anumite condiții.

Sunt luate în considerare valorile booleene și reprezentările textuale ale numerelor care sunt introduse direct în lista de argumente. Argumentele care sunt valori de eroare sau text care nu poate fi convertit în numere provoacă erori. Dacă valorile booleene și reprezentările textuale ale numerelor trebuie luate în considerare în calcule, utilizați funcția MEDIE. Dacă doriți să calculați media doar acelor valori care îndeplinesc anumite criterii, utilizați funcția AVERAGEIF sau AVERAGEIFS.

Media este o medie aritmetică, care se calculează adunând un set de numere și apoi împărțind suma rezultată la numărul lor. O mediană este un număr care este mijlocul unui set de numere, adică jumătate dintre numere au valori mai mari decât mediana, iar jumătate dintre numere au valori mai mici decât mediana.

Dacă această casetă de selectare este bifată, celulele goale sunt ignorate, dar valorile zero sunt numărate. În acest articol vom continua conversația pe care am început-o cândva despre medii. Permiteți-mi să vă reamintesc că câteva întrebări despre medii sunt discutate în articole despre esența mediei, scopul principal al acesteia și media ponderată. Au fost luate în considerare și proprietățile indicatorului și comportamentul acestuia în funcție de datele inițiale: un eșantion mic și prezența unor valori anormale.

Dar acum este secolul 21 (douăzeci și unu) și calculele manuale sunt destul de rare, ceea ce, din păcate, nu este cazul partea mai bună afectează abilitățile mentale ale cetățenilor. Nici măcar calculatoarele nu sunt la modă (inclusiv cele programabile și de inginerie), cu atât mai puțin abacul și regulile de calcul.

Deocamdată, am decis să acord mai multă atenție problemelor teoretice ale analizei datelor, astfel încât atunci când descriu calcule, de exemplu, în Excel, să mă pot referi la cunoștințele de bază de statistică. Media aritmetică este unul dintre cei mai des utilizați indicatori statistici.

Calcularea mediei aritmetice în Excel

Acest lucru este, desigur, adevărat, Excel calculează folosind o formulă, dar tipul formulei și rezultatul depind puternic de datele sursă. Și datele sursă pot fi foarte diferite, inclusiv dinamice, adică modificabile.

Intervalul de date inițiale din care se calculează valoarea medie este indicat în paranteze, ceea ce este convenabil de făcut cu un mouse (calculator). Această formulă are o proprietate remarcabilă care îi conferă valoare și o diferențiază de însumarea manuală și împărțirea după numărul de valori.

Mai întâi, trebuie să selectați celula în care va apărea formula. După apelarea formulei, în paranteze va trebui să specificați intervalul de date pentru care se va calcula valoarea medie.

Există, de asemenea, o metodă standard de apelare pentru toate funcțiile. Trebuie să faceți clic pe butonul fx de la începutul liniei în care sunt scrise funcțiile (formulele) și, prin urmare, să apelați Function Wizard. Faceți clic din nou pe „Enter” sau „Ok” Rezultatul calculului va fi reflectat în celula cu formula.

Abaterea standard: formula în Excel

După cum ați putea ghici, formula MEDIE poate calcula doar media aritmetică simplă, adică adună totul și o împarte la numărul de termeni (minus numărul de celule goale).

Nu există o formulă gata făcută în Excel, cel puțin eu nu am găsit una. Prin urmare, va trebui să utilizați mai multe formule aici. În general, dezvoltatorii Excel clar nu au finalizat acest punct. Trebuie să evitați și să calculați media ponderată în modul „semi-automat”. Folosind această funcție, puteți evita calculul intermediar din coloana alăturată și puteți calcula numărătorul cu o singură funcție.

În general, aceleași sarcini în Excel pot fi rezolvate în moduri diferite, ceea ce face ca procesorul de foi de calcul să fie foarte flexibil și practic. Există o formulă AVERAGEIF gata făcută pentru aceasta. Există și o astfel de posibilitate - funcția SUBTOTAL. Parametrul de selecție a formulei trebuie setat la 1 (și nu la 9, așa cum este cazul însumării).

Cu toate acestea, ceea ce este descris mai sus apare în 90% din cazuri și este destul de suficient pentru o utilizare cu succes. Media aritmetică în excel. Tabelele Excel sunt ideale pentru toate tipurile de calcule. Nici măcar nu ne gândim ce instrument puternic este pe computerele noastre, ceea ce înseamnă că nu îl folosim la întregul său potențial. Mulți părinți cred că un computer este doar o jucărie scumpă.

Cum se găsește media aritmetică a numerelor?

Am vorbit deja despre însumarea rapidă a celulelor în Excel, dar astăzi vom vorbi despre media aritmetică. Să presupunem că trebuie să calculăm media aritmetică a scorurilor la astfel de subiecte. Se va deschide următoarea fereastră Argumente și funcții.

Există un tabel format din două coloane: o coloană cu valori de text care se repetă și o coloană cu numere. Să creăm un tabel format numai din rânduri cu valori unice de text. Folosind o coloană numerică, vom calcula media.

Mulți oameni din munca lor trebuie să calculeze valoarea medie în Excel. Cel mai simplu mod de a face acest lucru este să folosești funcții medii, există câteva dintre ele în funcție de nevoile tale. Cel mai simplu mod de a găsi media este funcția MEDIE. S-ar părea că nu mai e nevoie de nimic. Dar chiar și într-un caz atât de simplu există nuanțe. Această funcție funcționează numai cu numere. Dar dacă conține, de exemplu, text, atunci o astfel de celulă va fi ignorată în calcule.

AVERAGE va ignora aceste valori și va calcula numai media valorilor numerice. Și acest lucru poate să nu mai fie corect. În astfel de cazuri, puteți fie înlocui textul cu zerouri, fie puteți utiliza alte funcții. Funcția de valoare medie care ia în considerare valorile booleene și textul se numește MEDIE. În încercarea de a afla care manager gestionează mai bine inventarul, decideți să analizați ultimele șase săptămâni de inventar.

La prima vedere, scorul mediu arată că ambii manageri au rezultate similare. În exemplul nostru, am folosit funcția STANDARDEVAL din Excel pentru a calcula abaterea standard împreună cu media.

Să selectăm celula C12 și, folosind Function Wizard, să scriem în ea formula pentru calcularea mediei aritmetice. Notă: Funcția MEDIE calculează media, care este centrul unui set de numere dintr-o distribuție statistică. Cu cât abaterea standard este mai aproape de 0, cu atât media este mai fiabilă. Pentru a găsi media aritmetică, trebuie să adunați toate numerele din mulțime și să împărțiți suma la cantitate. Cel mai simplu lucru este dacă trebuie să desenați un tabel cu date, iar mai jos, în linia finală, arătați valoarea medie.

În cele mai multe cazuri, datele sunt concentrate în jurul unui punct central. Astfel, pentru a descrie orice set de date, este suficient să indicați valoarea medie. Să luăm în considerare secvenţial trei caracteristici numerice care sunt utilizate pentru estimarea valorii medii a distribuţiei: media aritmetică, mediana şi modul.

Media aritmetică

Media aritmetică (deseori numită pur și simplu medie) este cea mai comună estimare a mediei unei distribuții. Este rezultatul împărțirii sumei tuturor valorilor numerice observate la numărul lor. Pentru un eșantion format din numere X 1, X 2, …, Xn, medie eșantionului (notat cu ) egal = (X 1 + X 2 + … + Xn) / n, sau

unde este media eșantionului, n- dimensiunea eșantionului, Xii-lea element mostre.

Descărcați nota în sau format, exemple în format

Luați în considerare calcularea mediei valoare aritmetică randamente anuale medii pe cinci ani de 15 fonduri mutuale cu foarte nivel înalt risc (fig. 1).

Orez. 1. Rentabilitatea medie anuală a 15 fonduri mutuale cu risc foarte ridicat

Media eșantionului se calculează după cum urmează:

Acesta este un randament bun, mai ales în comparație cu randamentul de 3-4% pe care l-au primit deponenții băncilor sau uniunii de credit în aceeași perioadă de timp. Dacă sortăm randamentele, este ușor de observat că opt fonduri au randamente peste medie și șapte - sub medie. Media aritmetică acționează ca un punct de echilibru, astfel încât fondurile cu randamente scăzute echilibrează fondurile cu venituri mari. Toate elementele eșantionului sunt implicate în calcularea mediei. Niciuna dintre celelalte estimări ale mediei unei distribuții nu are această proprietate.

Când ar trebui să calculezi media aritmetică? Deoarece media aritmetică depinde de toate elementele din eșantion, prezența valorilor extreme afectează în mod semnificativ rezultatul. În astfel de situații, media aritmetică poate distorsiona sensul datelor numerice. Prin urmare, atunci când se descrie un set de date care conține valori extreme, este necesar să se indice mediana sau media aritmetică și mediana. De exemplu, dacă eliminăm randamentele fondului RS Emerging Growth din eșantion, media eșantionului a randamentelor celor 14 fonduri scade cu aproape 1% până la 5,19%.

Median

Mediana reprezintă valoarea de mijloc a unui tablou ordonat de numere. Dacă tabloul nu conține numere care se repetă, atunci jumătate din elementele sale vor fi mai mici decât și jumătate va fi mai mare decât mediana. Dacă eșantionul conține valori extreme, este mai bine să folosiți mediana mai degrabă decât media aritmetică pentru a estima media. Pentru a calcula mediana unui eșantion, acesta trebuie mai întâi comandat.

Această formulă este ambiguă. Rezultatul depinde dacă numărul este par sau impar n:

  • Dacă eșantionul conține un număr impar de elemente, mediana este (n+1)/2-al-lea element.
  • Dacă eșantionul conține un număr par de elemente, mediana se află între cele două elemente din mijloc ale eșantionului și este egală cu media aritmetică calculată pentru aceste două elemente.

Pentru a calcula mediana unui eșantion care conține randamentele a 15 fonduri mutuale cu risc foarte ridicat, mai întâi trebuie să sortați datele brute (Figura 2). Atunci mediana va fi opusă numărului elementului mijlociu al probei; în exemplul nostru nr. 8. Excel are o funcție specială =MEDIAN() care funcționează și cu tablouri neordonate.

Orez. 2. Median 15 fonduri

Astfel, mediana este 6,5. Aceasta înseamnă că randamentul unei jumătăți din fondurile cu risc foarte mare nu depășește 6,5, iar randamentul celeilalte jumătate îl depășește. Rețineți că mediana de 6,5 nu este cu mult mai mare decât media de 6,08.

Dacă eliminăm randamentul fondului RS Emerging Growth din eșantion, atunci mediana celor 14 fonduri rămase scade la 6,2%, adică nu la fel de semnificativ ca media aritmetică (Figura 3).

Orez. 3. Median 14 fonduri

Modă

Termenul a fost inventat pentru prima dată de Pearson în 1894. Moda este numărul care apare cel mai des într-un eșantion (cel mai la modă). Moda descrie bine, de exemplu, reacția tipică a șoferilor la un semnal de semafor de a se opri din mișcare. Un exemplu clasic de utilizare a modei este alegerea mărimii pantofilor sau a culorii tapetului. Dacă o distribuție are mai multe moduri, atunci se spune că este multimodală sau multimodală (are două sau mai multe „vârfuri”). Multimodalitatea distribuției oferă informații importante despre natura variabilei studiate. De exemplu, în anchetele sociologice, dacă o variabilă reprezintă o preferință sau atitudine față de ceva, atunci multimodalitatea poate însemna că există mai multe opinii distinct diferite. Multimodalitatea servește, de asemenea, ca un indicator că eșantionul nu este omogen și că observațiile pot fi generate de două sau mai multe distribuții „suprapuse”. Spre deosebire de media aritmetică, valorile aberante nu afectează modul. Pentru variabile aleatoare distribuite continuu, cum ar fi randamentul mediu anual al fondurilor mutuale, modul uneori nu există (sau nu are sens) deloc. Deoarece acești indicatori pot lua valori foarte diferite, valorile repetate sunt extrem de rare.

Quartile

Quartilele sunt metricile cel mai des folosite pentru a evalua distribuția datelor atunci când se descriu proprietățile eșantioanelor numerice mari. În timp ce mediana împarte matricea ordonată în jumătate (50% din elementele matricei sunt mai mici decât mediana și 50% sunt mai mari), quartilele împart setul de date ordonat în patru părți. Valorile Q 1 , mediana și Q 3 sunt percentilele 25, 50 și, respectiv, 75. Prima cuartilă Q 1 este un număr care împarte eșantionul în două părți: 25% dintre elemente sunt mai mici decât prima cuartilă și 75% sunt mai mari decât prima.

A treia cuartilă Q 3 este un număr care împarte eșantionul în două părți: 75% dintre elemente sunt mai mici decât, iar 25% sunt mai mari decât, a treia cuartilă.

Pentru a calcula quartile în versiunile de Excel înainte de 2007, utilizați funcția =QUARTILE(array,part) . Începând cu Excel 2010, sunt utilizate două funcții:

  • =QUARTILE.ON(matrice,parte)
  • =QUARTILE.EXC(matrice,parte)

Aceste două funcții dau valori ușor diferite (Figura 4). De exemplu, atunci când se calculează quartilele unui eșantion care conține randamentele medii anuale a 15 fonduri mutuale cu risc foarte ridicat, Q 1 = 1,8 sau –0,7 pentru QUARTILE.IN și, respectiv, QUARTILE.EX. Apropo, funcția QUARTILE, folosită anterior, corespunde funcției moderne QUARTILE.ON. Pentru a calcula quartile în Excel folosind formulele de mai sus, matricea de date nu trebuie să fie ordonată.

Orez. 4. Calcularea quartilelor în Excel

Să subliniem din nou. Excel poate calcula cuartile pentru un univariat serie discretă, care conține valorile unei variabile aleatoare. Calculul quartilelor pentru o distribuție bazată pe frecvență este prezentat mai jos în secțiune.

Medie geometrică

Spre deosebire de media aritmetică, media geometrică vă permite să estimați gradul de modificare a unei variabile în timp. Media geometrică este rădăcina n gradul de la lucrare n cantități (în Excel se folosește funcția =SRGEOM):

G= (X 1 * X 2 * … * X n) 1/n

Un parametru similar - valoarea medie geometrică a ratei profitului - este determinat de formula:

G = [(1 + R 1) * (1 + R 2) * … * (1 + R n)] 1/n – 1,

Unde R i– rata profitului pt i a-a perioadă de timp.

De exemplu, să presupunem că investiția inițială este de 100.000 USD. Până la sfârșitul primului an, scade la 50.000 USD, iar la sfârșitul celui de-al doilea an, se recuperează la nivelul inițial de 100.000 USD -perioada anului este egală cu 0, deoarece sumele inițiale și finale ale fondurilor sunt egale între ele. Cu toate acestea, media aritmetică a ratelor anuale de rentabilitate este = (–0,5 + 1) / 2 = 0,25 sau 25%, deoarece rata rentabilității în primul an R 1 = (50.000 – 100.000) / 100.000 = –0,5 , iar în al doilea R 2 = (100.000 – 50.000) / 50.000 = 1. În același timp, valoarea medie geometrică a ratei profitului pe doi ani este egală cu: G = [(1–0,5) * (1+). 1 )] 1/2 – 1 = ½ – 1 = 1 – 1 = 0. Astfel, media geometrică reflectă mai exact modificarea (mai precis, absența modificărilor) a volumului investiției pe o perioadă de doi ani decât media aritmetică.

Fapte interesante.În primul rând, media geometrică va fi întotdeauna mai mică decât media aritmetică a acelorași numere. Cu excepția cazului în care toate numerele luate sunt egale între ele. În al doilea rând, luând în considerare proprietățile triunghi dreptunghic, se poate înțelege de ce media se numește geometrică. Înălțimea unui triunghi dreptunghic, coborât la ipotenuză, este media proporțională dintre proiecțiile catetelor pe ipotenuză, iar fiecare catete este media proporțională dintre ipotenuză și proiecția acesteia pe ipotenuză (Fig. 5). Aceasta oferă o modalitate geometrică de a construi media geometrică a două (lungimi) segmente: trebuie să construiți un cerc pe suma acestor două segmente ca diametru, apoi înălțimea restabilită de la punctul de conectare la intersecția cu cercul. va da valoarea dorita:

Orez. 5. Natura geometrică a mediei geometrice (figura de pe Wikipedia)

A doua proprietate importantă a datelor numerice este lor variaţie, care caracterizează gradul de dispersie a datelor. Două eșantioane diferite pot diferi atât în ​​ceea ce privește mediile, cât și variațiile. Totuși, așa cum se arată în Fig. 6 și 7, două mostre pot avea aceleași variații, dar mijloace diferite, sau aceleași mijloace și variații complet diferite. Datele care corespund poligonului B din Fig. 7, se modifică mult mai puțin decât datele pe care a fost construit poligonul A.

Orez. 6. Două distribuții simetrice în formă de clopot cu aceeași răspândire și valori medii diferite

Orez. 7. Două distribuții simetrice în formă de clopot cu aceleași valori medii și spread diferite

Există cinci estimări ale variației datelor:

  • domeniul de aplicare,
  • intervalul intercuartil,
  • dispersie,
  • abatere standard,
  • coeficient de variație.

Domeniul de aplicare

Intervalul este diferența dintre cele mai mari și cele mai mici elemente ale eșantionului:

Interval = XMax - XMin

Intervalul unui eșantion care conține randamentele anuale medii a 15 fonduri mutuale cu risc foarte ridicat poate fi calculat utilizând matricea ordonată (vezi Figura 4): Interval = 18,5 – (–6,1) = 24,6. Aceasta înseamnă că diferența dintre randamentul mediu anual cel mai ridicat și cel mai scăzut al fondurilor cu risc foarte ridicat este de 24,6%.

Intervalul măsoară răspândirea globală a datelor. Deși intervalul de eșantionare este o estimare foarte simplă a răspândirii generale a datelor, slăbiciunea sa este că nu ia în considerare exact modul în care datele sunt distribuite între elementele minime și maxime. Acest efect este clar vizibil în fig. 8, care ilustrează mostre având același interval. Scala B demonstrează că, dacă un eșantion conține cel puțin o valoare extremă, intervalul eșantionului este o estimare foarte imprecisă a răspândirii datelor.

Orez. 8. Comparația a trei probe cu același interval; triunghiul simbolizează suportul scalei, iar locația acestuia corespunde cu media eșantionului

Intervalul intercuartil

Intervalul intercuartil, sau media, este diferența dintre a treia și prima cuartilă a eșantionului:

Interval interquartil = Q 3 – Q 1

Această valoare ne permite să estimăm împrăștierea a 50% din elemente și să nu ținem cont de influența elementelor extreme. Intervalul intercuartil al unui eșantion care conține randamentele medii anuale a 15 fonduri mutuale cu risc foarte ridicat poate fi calculat folosind datele din Fig. 4 (de exemplu, pentru funcția QUARTILE.EXC): Interval interquartile = 9,8 – (–0,7) = 10,5. Intervalul delimitat de numerele 9,8 și -0,7 este adesea numit jumătatea mijlocie.

Trebuie remarcat faptul că valorile Q 1 și Q 3 și, prin urmare, intervalul intercuartil, nu depind de prezența valorilor aberante, deoarece calculul lor nu ia în considerare nicio valoare care ar fi mai mică decât Q 1 sau mai mare. decât Q 3 . Măsurile rezumative, cum ar fi mediana, primul și al treilea quartile și intervalul intercuartil care nu sunt afectate de valori aberante, se numesc măsuri robuste.

Deși intervalul și intervalul intercuartil oferă estimări ale răspândirii generale și, respectiv, medii a unui eșantion, niciuna dintre aceste estimări nu ia în considerare exact modul în care sunt distribuite datele. Varianta si abaterea standard sunt lipsite de acest dezavantaj. Acești indicatori vă permit să evaluați gradul în care datele fluctuează în jurul valorii medii. Varianta eșantionului este o aproximare a mediei aritmetice calculată din pătratele diferențelor dintre fiecare element eșantion și media eșantionului. Pentru un eșantion X 1, X 2, ... X n, varianța eșantionului (notat cu simbolul S 2 este dată de următoarea formulă:

În general, varianța eșantionului este suma pătratelor diferențelor dintre elementele eșantionului și media eșantionului, împărțită la o valoare egală cu dimensiunea eșantionului minus unu:

Unde - medie aritmetică, n- dimensiunea eșantionului, X i - i al-lea element al selecției X. În Excel înainte de versiunea 2007, funcția =VARP() a fost utilizată pentru a calcula varianța eșantionului din versiunea 2010, este utilizată funcția =VARP.V();

Cea mai practică și larg acceptată estimare a răspândirii datelor este abaterea standard a probei. Acest indicator este notat cu simbolul S și este egal cu rădăcină pătrată din varianța eșantionului:

În Excel înainte de versiunea 2007, funcția =STDEV.() a fost utilizată pentru a calcula abaterea standard a eșantionului începând cu versiunea 2010, este utilizată funcția =STDEV.V(). Pentru a calcula aceste funcții, matricea de date poate fi neordonată.

Nici varianța eșantionului și nici abaterea standard a eșantionului nu pot fi negative. Singura situație în care indicatorii S 2 și S pot fi zero este dacă toate elementele eșantionului sunt egale între ele. În acest caz complet improbabil, intervalul și intervalul intercuartil sunt, de asemenea, zero.

Datele numerice sunt în mod inerent variabile. Orice variabilă poate lua multe sensuri diferite. De exemplu, diferite fonduri mutuale au rate diferite de rentabilitate și pierdere. Datorită variabilității datelor numerice, este foarte important să se studieze nu numai estimări ale mediei, care sunt de natură rezumată, ci și estimări ale varianței, care caracterizează răspândirea datelor.

Dispersia și abaterea standard vă permit să evaluați răspândirea datelor în jurul valorii medii, cu alte cuvinte, să determinați câte elemente de eșantion sunt mai mici decât media și câte sunt mai mari. Dispersia are unele proprietăți matematice valoroase. Cu toate acestea, valoarea sa este pătratul unității de măsură - procent pătrat, dolar pătrat, inch pătrat etc. Prin urmare, o măsură naturală a dispersiei este abaterea standard, care este exprimată în unități comune de procent de venit, dolari sau inci.

Abaterea standard vă permite să estimați cantitatea de variație a elementelor eșantionului în jurul valorii medii. În aproape toate situațiile, majoritatea valorilor observate se află în intervalul de plus sau minus o abatere standard de la medie. În consecință, cunoscând media aritmetică a elementelor eșantionului și abaterea standard a eșantionului, este posibil să se determine intervalul căruia îi aparține cea mai mare parte a datelor.

Abaterea standard a randamentelor pentru cele 15 fonduri mutuale cu risc foarte ridicat este de 6,6 (Figura 9). Aceasta înseamnă că profitabilitatea majorității fondurilor diferă de valoarea medie cu cel mult 6,6% (adică fluctuează în intervalul de la – S= 6,2 – 6,6 = –0,4 la +S= 12,8). De fapt, randamentul mediu anual pe cinci ani de 53,3% (8 din 15) din fonduri se află în acest interval.

Orez. 9. Eșantion de abatere standard

Rețineți că atunci când însumăm diferențele pătrate, elementele eșantionului care sunt mai departe de medie sunt ponderate mai mult decât elementele care sunt mai aproape de medie. Această proprietate este principalul motiv pentru care media aritmetică este folosită cel mai adesea pentru a estima media unei distribuții.

Coeficientul de variație

Spre deosebire de estimările anterioare ale dispersiei, coeficientul de variație este o estimare relativă. Este întotdeauna măsurată ca procent și nu în unitățile datelor originale. Coeficientul de variație, notat cu simbolurile CV, măsoară dispersia datelor în jurul mediei. Coeficientul de variație este egal cu abaterea standard împărțită la media aritmetică și înmulțită cu 100%:

Unde S- abaterea standard a probei, - media eșantionului.

Coeficientul de variație vă permite să comparați două eșantioane ale căror elemente sunt exprimate în unități de măsură diferite. De exemplu, managerul unui serviciu de livrare poștă intenționează să-și reînnoiască flota de camioane. La încărcarea pachetelor, trebuie luate în considerare două restricții: greutatea (în lire sterline) și volumul (în picioare cubi) ale fiecărui pachet. Să presupunem că într-o probă care conține 200 de pachete, greutate medie este de 26,0 lire sterline, abaterea standard a greutății este de 3,9 lire sterline, volumul mediu al sacului este de 8,8 picioare cubi, iar abaterea standard a volumului este de 2,2 picioare cubi. Cum se compară variația de greutate și volum a pachetelor?

Deoarece unitățile de măsură pentru greutate și volum diferă între ele, managerul trebuie să compare răspândirea relativă a acestor cantități. Coeficientul de variație al greutății este CV W = 3,9 / 26,0 * 100% = 15%, iar coeficientul de variație al volumului este CV V = 2,2 / 8,8 * 100% = 25%. Astfel, variația relativă a volumului pachetelor este mult mai mare decât variația relativă a greutății acestora.

Formular de distribuire

A treia proprietate importantă a unui eșantion este forma distribuției sale. Această distribuție poate fi simetrică sau asimetrică. Pentru a descrie forma unei distribuții, este necesar să se calculeze media și mediana acesteia. Dacă cele două sunt la fel, variabila este considerată distribuită simetric. Dacă valoarea medie a unei variabile este mai mare decât mediana, distribuția ei are o asimetrie pozitivă (Fig. 10). Dacă mediana este mai mare decât media, distribuția variabilei este denaturată negativ. Deformarea pozitivă apare atunci când media crește la valori neobișnuit de ridicate. Deformarea negativă apare atunci când media scade la valori neobișnuit de mici. O variabilă este distribuită simetric dacă nu ia valori extreme în nicio direcție, astfel încât valorile mari și mici ale variabilei se anulează reciproc.

Orez. 10. Trei tipuri de distribuții

Datele afișate pe scara A sunt denaturate negativ. Această figură arată o coadă lungă și o înclinare spre stânga cauzată de prezența unor valori neobișnuit de mici. Aceste valori extrem de mici deplasează valoarea medie spre stânga, făcând-o mai mică decât mediana. Datele prezentate pe scara B sunt distribuite simetric. Jumătățile stânga și dreapta ale distribuției sunt imagini în oglindă ale lor. Valorile mari și mici se echilibrează reciproc, iar media și mediana sunt egale. Datele afișate pe scara B sunt denaturate pozitiv. Această figură arată o coadă lungă și o înclinare spre dreapta cauzată de prezența unor valori neobișnuit de ridicate. Aceste valori prea mari deplasează media spre dreapta, făcând-o mai mare decât mediana.

În Excel, statisticile descriptive pot fi obținute folosind un add-in Pachet de analize. Treceți prin meniu DateAnaliza datelor, în fereastra care se deschide, selectați linia Statistica descriptivăși faceți clic Bine. În fereastră Statistica descriptivă asigurați-vă că indicați Interval de intrare(Fig. 11). Dacă doriți să vedeți statistici descriptive pe aceeași foaie cu datele originale, selectați butonul radio Interval de ieșireși specificați celula în care ar trebui să fie plasat colțul din stânga sus al statisticilor afișate (în exemplul nostru, $C$1). Dacă doriți să scoateți date pe o foaie nouă sau către carte noua, trebuie doar să selectați comutatorul corespunzător. Bifați caseta de lângă Rezumat statistici. Dacă doriți, puteți alege și Nivel de dificultateal k-lea cel mai mic șia k-a cea mai mare.

Dacă în depozit Dateîn zonă Analiză nu vezi pictograma Analiza datelor, mai întâi trebuie să instalați suplimentul Pachet de analize(vezi, de exemplu,).

Orez. 11. Statistici descriptive ale randamentelor medii anuale pe cinci ani ale fondurilor cu niveluri foarte ridicate de risc, calculate folosind programul de completare Analiza datelor programe Excel

Excel calculează un număr de statistici discutate mai sus: medie, mediană, mod, abatere standard, varianță, interval ( interval), minim, maxim și dimensiunea eșantionului ( verifica). Excel calculează, de asemenea, unele statistici care sunt noi pentru noi: eroare standard, curtosis și asimetrie. Eroare standard egală cu abaterea standard împărțită la rădăcina pătrată a dimensiunii eșantionului. Asimetrie caracterizează abaterea de la simetria distribuţiei şi este o funcţie care depinde de cubul diferenţelor dintre elementele eşantionului şi de valoarea medie. Kurtosis este o măsură a concentrației relative a datelor în jurul mediei în comparație cu cozile distribuției și depinde de diferențele dintre elementele eșantionului și media ridicată la a patra putere.

Calculați statistici descriptive pentru populatia

Media, răspândirea și forma distribuției discutate mai sus sunt caracteristici determinate din eșantion. Cu toate acestea, dacă setul de date conține măsurători numerice ale întregii populații, parametrii acesteia pot fi calculați. Astfel de parametri includ valoarea așteptată, dispersia și abaterea standard a populației.

Aşteptare egal cu suma tuturor valorilor din populație împărțită la dimensiunea populației:

Unde µ - așteptări matematice, Xi- i a-a observație a unei variabile X, N- volumul populaţiei generale. În Excel, pentru a calcula așteptările matematice, se folosește aceeași funcție ca pentru media aritmetică: =AVERAGE().

Varianta populatiei egală cu suma pătratelor diferenţelor dintre elementele populaţiei generale şi mat. așteptări împărțite la dimensiunea populației:

Unde σ 2– dispersia populaţiei generale. În Excel înainte de versiunea 2007, funcția =VARP() este utilizată pentru a calcula varianța populației, începând cu versiunea 2010 =VARP().

Abaterea standard a populației egal cu rădăcina pătrată a varianței populației:

În Excel înainte de versiunea 2007, funcția =STDEV() este utilizată pentru a calcula abaterea standard a unei populații, începând cu versiunea 2010 =STDEV.Y(). Rețineți că formulele pentru varianța populației și abaterea standard sunt diferite de formulele pentru calcularea varianței eșantionului și a abaterii standard. La calcularea statisticilor eșantionului S 2Şi S numitorul fracției este n – 1, și la calcularea parametrilor σ 2Şi σ - volumul populaţiei generale N.

Regula generală

În majoritatea situațiilor, o mare parte a observațiilor sunt concentrate în jurul mediei, formând un cluster. În seturile de date cu asimetrie pozitivă, acest cluster este situat la stânga (adică, dedesubt) așteptării matematice, iar în seturile cu asimetrie negativă, acest cluster este situat la dreapta (adică, deasupra) așteptării matematice. Pentru datele simetrice, media și mediana sunt aceleași, iar observațiile se grupează în jurul mediei, formând o distribuție în formă de clopot. Dacă distribuția nu este în mod clar denaturată și datele sunt concentrate în jurul unui anumit centru de greutate, o regulă generală care poate fi utilizată pentru a estima variabilitatea este că, dacă datele au o distribuție în formă de clopot, atunci aproximativ 68% din observații sunt la o abatere standard a valorii așteptate, aproximativ 95% dintre observații sunt la cel mult două abateri standard de așteptarea matematică și 99,7% dintre observații sunt la cel mult trei abateri standard de așteptarea matematică.

Astfel, abaterea standard, care este o estimare a variației medii în jurul valorii așteptate, ajută la înțelegerea modului în care sunt distribuite observațiile și la identificarea valorii aberante. Regula generală este că, pentru distribuțiile în formă de clopot, doar o valoare din douăzeci diferă de așteptările matematice cu mai mult de două abateri standard. Prin urmare, valori în afara intervalului µ ± 2σ, pot fi considerate valori aberante. În plus, doar trei din 1000 de observații diferă de așteptările matematice cu mai mult de trei abateri standard. Astfel, valorile în afara intervalului µ ± 3σ sunt aproape întotdeauna valori aberante. Pentru distribuțiile care sunt foarte denaturate sau nu au formă de clopot, se poate aplica regula generală Bienamay-Chebyshev.

În urmă cu mai bine de o sută de ani, matematicienii Bienamay și Chebyshev au descoperit în mod independent proprietate utilă abaterea standard. Ei au descoperit că pentru orice set de date, indiferent de forma distribuției, procentul de observații situate la o distanță de k abateri standard de la așteptările matematice, nu mai puțin (1 – 1/ k 2)*100%.

De exemplu, dacă k= 2, regula Bienname-Chebyshev prevede că cel puțin (1 – (1/2) 2) x 100% = 75% din observații trebuie să se situeze în interval µ ± 2σ. Această regulă este valabilă pentru orice k, depășind unu. Regula Bienamay-Chebyshev este foarte generală și valabilă pentru distribuțiile de orice tip. Specifică numărul minim de observații, distanța de la care până la așteptarea matematică nu depășește o valoare specificată. Cu toate acestea, dacă distribuția este în formă de clopot, regula generală estimează mai precis concentrația datelor în jurul valorii așteptate.

Calcularea statisticilor descriptive pentru o distribuție bazată pe frecvență

Dacă datele originale nu sunt disponibile, distribuția de frecvență devine singura sursă de informații. În astfel de situații, este posibil să se calculeze valori aproximative ale indicatorilor cantitativi ai distribuției, cum ar fi media aritmetică, abaterea standard și quartilele.

Dacă datele eșantionului sunt reprezentate ca o distribuție de frecvență, o aproximare a mediei aritmetice poate fi calculată presupunând că toate valorile din fiecare clasă sunt concentrate la mijlocul clasei:

Unde - media eșantionului, n- numărul de observații sau dimensiunea eșantionului; Cu- numărul de clase în distribuția de frecvență, m j- punctul de mijloc j clasa a-a, fj- frecventa corespunzatoare j- clasa a-a.

Pentru a calcula abaterea standard de la o distribuție de frecvență, se presupune, de asemenea, că toate valorile din cadrul fiecărei clase sunt concentrate la mijlocul clasei.

Pentru a înțelege cum se determină quartilele unei serii pe baza frecvențelor, luați în considerare calculul quartilei inferioare pe baza datelor pentru 2013 privind distribuția populației ruse în funcție de venitul monetar mediu pe cap de locuitor (Fig. 12).

Orez. 12. Ponderea populației ruse cu venit mediu pe cap de locuitor pe lună, ruble

Pentru a calcula primul quartil al unei serii de variații de interval, puteți folosi formula:

unde Q1 este valoarea primului cuartil, xQ1 este limita inferioară a intervalului care conține primul cuartil (intervalul este determinat de frecvența acumulată care depășește mai întâi 25%); i – valoarea intervalului; Σf – suma frecvențelor întregului eșantion; probabil întotdeauna egal cu 100%; SQ1–1 – frecvența acumulată a intervalului care precede intervalul care conține quartila inferioară; fQ1 – frecvența intervalului care conține quartila inferioară. Formula pentru a treia cuartilă diferă prin aceea că, în toate locurile, trebuie să utilizați Q3 în loc de Q1 și să înlocuiți ¾ în loc de ¼.

În exemplul nostru (Fig. 12), quartila inferioară se află în intervalul 7000,1 – 10.000, a cărei frecvență acumulată este de 26,4%. Limita inferioară a acestui interval este de 7000 de ruble, valoarea intervalului este de 3000 de ruble, frecvența acumulată a intervalului care precede intervalul care conține quartila inferioară este de 13,4%, frecvența intervalului care conține quartila inferioară este de 13,0%. Astfel: Q1 = 7000 + 3000 * (¼ * 100 – 13,4) / 13 = 9677 rub.

Capcane asociate cu statisticile descriptive

În această postare, am analizat cum să descriem un set de date folosind diverse statistici care evaluează media, răspândirea și distribuția acestuia. Următorul pas este analiza și interpretarea datelor. Până acum, am studiat proprietățile obiective ale datelor, iar acum trecem la interpretarea subiectivă a acestora. Cercetătorul se confruntă cu două greșeli: un subiect de analiză ales incorect și o interpretare incorectă a rezultatelor.

Analiza randamentelor a 15 fonduri mutuale cu risc foarte mare este destul de imparțială. El a condus la concluzii complet obiective: toate fondurile mutuale au randamente diferite, spread-ul randamentelor fondurilor variază de la -6,1 la 18,5, iar randamentul mediu este de 6,08. Obiectivitatea analizei datelor este asigurată alegerea corectă indicatori cantitativi totali de distribuţie. Au fost luate în considerare mai multe metode de estimare a mediei și dispersării datelor și au fost indicate avantajele și dezavantajele acestora. Cum să alegi statisticile potrivite care să ofere o analiză obiectivă și imparțială? Dacă distribuția datelor este ușor denaturată, ar trebui să alegeți mediana mai degrabă decât media? Care indicator caracterizează mai exact răspândirea datelor: abaterea standard sau intervalul? Ar trebui subliniată asimetria pozitivă a distribuției?

Pe de altă parte, interpretarea datelor este un proces subiectiv. Oameni diferiți ajung la concluzii diferite atunci când interpretează aceleași rezultate. Fiecare are punctul lui de vedere. Cineva consideră că randamentele totale medii anuale a 15 fonduri cu un nivel de risc foarte ridicat sunt bune și este destul de mulțumit de veniturile primite. Alții pot considera că aceste fonduri au randamente prea mici. Astfel, subiectivitatea ar trebui compensată de onestitate, neutralitate și claritatea concluziilor.

Probleme etice

Analiza datelor este indisolubil legată de problemele etice. Ar trebui să criticați informațiile difuzate de ziare, radio, televiziune și internet. De-a lungul timpului, vei învăța să fii sceptic nu numai cu privire la rezultate, ci și cu privire la obiectivele, subiectul și obiectivitatea cercetării. Celebrul politician britanic Benjamin Disraeli a spus-o cel mai bine: „Există trei feluri de minciuni: minciuni, minciuni blestemate și statistici”.

După cum se menționează în notă, la alegerea rezultatelor care ar trebui prezentate în raport apar probleme etice. Ar trebui publicate atât rezultatele pozitive, cât și cele negative. În plus, la realizarea unui raport sau raport scris, rezultatele trebuie prezentate onest, neutru și obiectiv. Trebuie făcută o distincție între prezentările nereușite și cele necinstite. Pentru a face acest lucru, este necesar să se determine care au fost intențiile vorbitorului. Uneori, vorbitorul omite informații importante din ignoranță, iar uneori este deliberat (de exemplu, dacă folosește media aritmetică pentru a estima media datelor clar denaturate pentru a obține rezultatul dorit). De asemenea, este necinstit să suprimi rezultate care nu corespund punctului de vedere al cercetătorului.

Sunt folosite materiale din cartea Levin et al. Statistics for Managers. – M.: Williams, 2004. – p. 178–209

Funcția QUARTILE a fost păstrată pentru compatibilitate cu versiunile anterioare de Excel.

O invenție foarte convenabilă a lumii computerelor sunt foile de calcul. Puteți introduce date în ele și le puteți aranja frumos sub formă de documente pe gustul dvs. (sau pe gustul superiorilor).

Puteți crea un astfel de document o dată - de fapt, o întreagă familie de documente simultan, care, în terminologia Excel, se numește „registru de lucru” (versiunea în engleză a registrului de lucru).

Cum se comportă Excel

Apoi, trebuie doar să schimbați câteva numere inițiale când datele se schimbă, apoi Excel va efectua mai multe acțiuni simultan, aritmetice și altele. Este in document:

Pentru a face acest lucru, un program de foaie de calcul (și Excel este departe de a fi singurul) are un întreg arsenal de instrumente aritmetice și funcții gata făcute, realizate folosind programe deja depanate și funcționale. Trebuie doar să indicați în orice celulă atunci când scrieți o formulă, printre alți operanzi, numele funcției corespunzătoare și argumentele din paranteze ale acesteia.

Există o mulțime de funcții și sunt grupate pe domenii de aplicare:

Există un întreg set de funcții statistice pentru rezumarea mai multor date. Obținerea valorii medii a unor date este probabil primul lucru care îi vine în minte unui statistician când se uită la numere.

Care este media?

Acesta este momentul în care se ia o anumită serie de numere, din ele se calculează două valori - numărul total de numere și suma lor totală, iar apoi a doua este împărțită la prima. Apoi obțineți un număr a cărui valoare este undeva la mijlocul seriei. Poate chiar va coincide cu unele numere din serie.

Ei bine, să presupunem că acel număr a fost teribil de norocos în acest caz, dar, de obicei, media aritmetică nu numai că nu coincide cu niciunul dintre numerele din seria sa, dar chiar și, după cum se spune, „nu se încadrează în nicio poartă” în această serie. De exemplu, număr mediu de persoane Ar putea fi 5.216 de persoane care locuiesc în apartamente într-un oraș din N-Ska. Cum este asta? Traiesc 5 persoane si inca 216 miimi din unul dintre ei? Cei care știu vor rânji doar: despre ce vorbești! Acestea sunt statistici!

Tabelele statistice (sau pur și simplu contabile) pot fi complet diferite forme si dimensiuni. De fapt, forma este un dreptunghi, dar pot fi largi, înguste, repetate (să zicem, date pentru o săptămână de zi), împrăștiate pe diferite foi ale registrului de lucru.

Și chiar și în alte cărți de lucru (adică în cărți, în engleză), și chiar pe alte computere din rețeaua locală, sau, înfricoșător să spun, în alte părți ale lumii noastre, acum unite de Internetul atotputernic. O mulțime de informații pot fi obținute din surse foarte reputate de pe Internet în formă gata făcută. Apoi procesează, analizează, trage concluzii, scrie articole, disertații...

De fapt, astăzi trebuie doar să calculăm media pe o serie de date omogene, folosind miraculosul program foaie de calcul. Omogen înseamnă date despre unele obiecte similare și în aceleași unități de măsură. Pentru ca oamenii să nu fie rezumați niciodată cu saci de cartofi și kilobiți cu ruble și copeici.

Exemplu de găsire a valorii medii

Să avem datele inițiale scrise în unele celule. De obicei, aici sunt înregistrate cumva datele generalizate sau datele obținute din datele originale.

Datele inițiale sunt situate în partea stângă a tabelului (de exemplu, o coloană este numărul de piese fabricate de un angajat A, care corespunde unei linii separate din tabel, iar a doua coloană este prețul unei piese) , ultima coloană indică producția angajatului A în bani.

Anterior, acest lucru se făcea folosind un calculator, dar acum puteți încredința o sarcină atât de simplă unui program care nu face niciodată greșeli.

Tabel simplu al câștigurilor zilnice

Aici in poza cuantumul câștigurilorși se calculează pentru fiecare angajat din coloana E folosind formula de înmulțire a numărului de piese (coloana C) cu prețul pieselor (coloana D).

Apoi nici măcar nu va putea păși în alte locuri din tabel și nu va putea să se uite la formule. Deși, desigur, toată lumea din acel atelier știe cum producția unui lucrător individual se transformă în banii pe care îi câștigă într-o zi.

Valori totale

Apoi, valorile totale sunt de obicei calculate. Acestea sunt cifre sumareîn întregul atelier, în zonă sau în întreaga echipă. De obicei, aceste cifre sunt raportate de unii șefi altora - șefi mai sus.

Acesta este modul în care puteți calcula sumele în coloanele de date sursă și, în același timp, în coloana derivată, adică coloana câștiguri

Permiteți-mi să notez imediat că în timp ce tabelul Excel este creat, nu se face protectie in celule. Altfel, cum am desena semnul în sine, am introduce designul, îl coloram și introducem formule inteligente și corecte? Ei bine, când totul este gata, înainte de a da acest registru de lucru (adică un fișier de foaie de calcul) unei persoane complet diferite, protecția este făcută. Da, pur și simplu dintr-o acțiune neglijentă, pentru a nu deteriora accidental formula.

Și acum tabelul de autocalculare va începe să funcționeze în atelier împreună cu restul lucrătorilor atelierului. După terminarea zilei de lucru, toate astfel de tabele de date despre activitatea atelierului (și nu numai unul dintre acestea) sunt transferate conducerii superioare, care va rezuma aceste date a doua zi și va trage câteva concluzii.

Iată-l, mediu (adică - în engleză)

Este primul va calcula numărul mediu de piese, produs pe lucrător pe zi, precum și castigurile medii pe zi pentru lucrătorii atelierului (și apoi pentru fabrică). Vom face acest lucru și în ultimul rând, cel mai de jos al tabelului nostru.

După cum puteți vedea, puteți utiliza sumele deja calculate în rândul precedent, pur și simplu împărțiți-le la numărul de angajați - 6 în acest caz.

În formule, împărțirea la constante, numere constante, este o formă proastă. Ce se întâmplă dacă ni se întâmplă ceva ieșit din comun, iar numărul de angajați devine mai mic? Apoi va trebui să parcurgeți toate formulele și să schimbați numărul șapte cu altul peste tot. Puteți, de exemplu, „înșela” semnul astfel:

În loc de un anumit număr, puneți un link în formulă către celula A7, unde este numărul de serie al ultimului angajat din listă. Adică, acesta va fi numărul de angajați, ceea ce înseamnă că împărțim corect suma pentru coloana care ne interesează la număr și obținem valoarea medie. După cum puteți vedea, numărul mediu de piese s-a dovedit a fi de 73 și plus o uluitoare din punct de vedere al numerelor (deși nu este semnificativă) makeweight, care este de obicei eliminată prin rotunjire.

Rotunjirea la copecul cel mai apropiat

Rotunjirea este o acțiune comună când în formule, în special în cele contabile, un număr este împărțit la altul. Mai mult, acesta este un subiect separat în contabilitate. Contabilii sunt implicați în rotunjire de mult timp și cu scrupulozitate: rotunjesc imediat fiecare număr obținut prin împărțire la copecul cel mai apropiat.

Excel este un program matematic. Ea nu este uluită de o parte dintr-un ban - unde să o pun. Excel pur și simplu stochează numerele așa cum sunt, cu toate zecimale incluse. Și din nou și din nou va efectua calcule cu astfel de numere. Iar rezultatul final poate fi rotunjit (dacă dăm comanda).

Numai contabilitatea va spune că aceasta este o greșeală. Pentru că rotunjesc fiecare număr „strâmb” rezultat la ruble întregi și copeici. Iar rezultatul final se dovedește de obicei puțin diferit de cel al unui program indiferent la bani.

Dar acum vă voi spune principalul secret. Excel poate găsi valoarea medie fără noi, are o funcție încorporată pentru aceasta. Ea trebuie doar să specifice intervalul de date. Și apoi ea însăși le va însuma, le va număra și apoi ea însăși va împărți suma la cantitate. Și rezultatul va fi exact același cu ceea ce am înțeles pas cu pas.

Pentru a găsi această funcție, mergem la celula E9, unde ar trebui plasat rezultatul acesteia - valoarea medie din coloana E și facem clic pe pictograma fx, care se află în stânga barei de formule.

  1. Se va deschide un panou numit „Asistent de funcții”. Acesta este un dialog în mai mulți pași (Wizard, în engleză), cu ajutorul căruia programul ajută la construirea de formule complexe. Și, rețineți că ajutorul a început deja: în bara de formule, programul a introdus semnul = pentru noi.
  2. Acum putem fi liniștiți, programul ne va ghida prin toate dificultățile (chiar și în rusă, chiar și în engleză) și ca urmare va fi construit formula corecta pentru calcul.

În fereastra de sus („Căutare funcție:”) este scris că putem căuta și găsi aici. Adică, aici puteți scrie „medie” și faceți clic pe butonul „Găsiți” (Găsiți, în engleză). Dar o poți face altfel. Știm că această funcție este din categoria statistică. Așa că vom găsi această categorie în a doua fereastră. Și în lista care se deschide mai jos, vom găsi funcția „AVERAGE”.

În același timp, vom vedea cât de grozav este acolo multe funcții la categoria statistică sunt doar 7 medii. Iar pentru fiecare dintre funcții, dacă mutați indicatorul peste ele, mai jos puteți vedea un scurt rezumat al acestei funcții. Și dacă faceți clic și mai jos, pe inscripția „Ajutor pentru această funcție”, puteți obține o descriere foarte detaliată a acesteia.

Acum vom calcula doar media. Faceți clic pe „OK” (așa este exprimat acordul în engleză, deși este mai probabil în americană) pe butonul de mai jos.

Programul a intrat la începutul formulei, acum trebuie să setați intervalul pentru primul argument. Doar selectați-l cu mouse-ul. Faceți clic pe OK și obțineți rezultatul. Stânga adăugați rotunjire aici, pe care am realizat-o în celula C9, iar placa este gata de utilizare zilnică.

Să presupunem că trebuie să găsiți numărul mediu de zile pentru finalizarea sarcinilor de către diferiți angajați. Sau doriți să calculați un interval de timp de 10 ani Temperatura medie într-o anumită zi. Calcularea mediei unei serii de numere în mai multe moduri.

Media este o funcție a măsurării tendinței centrale la care se află centrul unei serii de numere dintr-o distribuție statistică. Trei sunt cele mai comune criterii de tendință centrală.

    Medie Media aritmetică se calculează adunând o serie de numere și apoi împărțind numărul acestor numere. De exemplu, media 2, 3, 3, 5, 7 și 10 este 30 împărțit la 6,5;

    Median Numărul mediu al unei serii de numere. Jumătate dintre numere au valori care sunt mai mari decât mediana, iar jumătate dintre numere au valori care sunt mai mici decât mediana. De exemplu, mediana lui 2, 3, 3, 5, 7 și 10 este 4.

    Modul Cel mai frecvent număr dintr-un grup de numere. De exemplu, modul 2, 3, 3, 5, 7 și 10 - 3.

Aceste trei măsuri de tendință centrală, distribuția simetrică a unei serii de numere, sunt aceleași. Într-o distribuție asimetrică a unui număr de numere, acestea pot fi diferite.

Calculați media celulelor care sunt învecinate în același rând sau coloană

Urmați acești pași:

Calcularea mediei celulelor aleatoare

Pentru a efectua această sarcină, utilizați funcția MEDIE. Copiați tabelul de mai jos pe o foaie de hârtie goală.

Calculul mediei ponderate

SUMPRODUSŞi sume. vAcest exemplu calculează prețul unitar mediu plătit pentru trei achiziții, unde fiecare achiziție este pentru un număr diferit de unități la prețuri unitare diferite.

Copiați tabelul de mai jos pe o foaie de hârtie goală.

Calcularea mediei numerelor, excluzând valorile zero

Pentru a efectua această sarcină, utilizați funcțiile MEDIEŞi Dacă. Copiați tabelul de mai jos și rețineți că în acest exemplu, pentru a fi mai ușor de înțeles, copiați-l pe o foaie de hârtie goală.