Matematica și programarea merg mână în mână. Dacă sunteți programator, la un moment dat va trebui să folosiți matematica.
Știința datelor, învățarea automată, inteligența artificială și criptomonedele se bazează pe principii matematice complexe.
Cu toate acestea, utilizarea funcțiilor matematice nu trebuie să fie complexă! Python abstractizează totul, așa că, odată ce înțelegeți conceptele, nu va trebui să înțelegeți detaliile complete ale implementării.
Matematica nu trebuie să fie înfricoșătoare
Există o mulțime de funcții matematice pe care le veți întâlni. Dacă lucrați cu date sau analize, este important să înțelegeți câteva principii și funcții matematice.
O astfel de funcție pe care trebuie să o înțelegeți este mean
funcţie.
Nu vă lăsați amăgiți de nume – nu există nimic semnificativ (joc de cuvinte) în legătură cu mean
funcție în Python.
Această postare este autonomă, dar mă aștept să aveți ceva experiență în lucrul cu Python și să știți ce este o listă Python. Dacă nu, consultați acest articol înainte de a trece mai departe.
Odată ce ai terminat, întoarce-te și alătură-te mie pentru o scufundare profundă în mean
funcţie.
Statistici
Deci vrei să afli despre mean
funcţie. Grozav! Dar înainte să analizăm această funcție, este important să ne uităm la disciplina din care provine: statisticile.

În imaginea de mai sus vedem un grafic. Un grafic este o reprezentare picturală care arată relația unei variabile în raport cu alta.
Graficele sunt utile, deoarece ne permit să organizăm date, astfel încât să putem vedea rapid tendințele și relațiile dintre date. Un grafic este doar un instrument pe care îl putem folosi pentru a vizualiza și analiza datele.
Statistica este o ramură a matematicii care ne permite să avem un mod sistematic de clasificare, analiză și interpretare a datelor. Acest lucru este important deoarece, cu statisticile, avem o colecție de instrumente gata făcute pentru a face fiecare dintre aceste lucruri.
Imaginați-vă dacă ați fi nevoie să reinventați un ferăstrău de fiecare dată când ați avut nevoie să tăiați o bucată de lemn. Am vrea ca mulți oameni să numească ferăstraie cu nume diferite, chiar dacă fac același lucru. Pentru a evita această problemă, am dat ferăstrăului un nume pe care toată lumea îl poate face referire.
La fel se întâmplă și în statistici – avem instrumente cunoscute, pe care toată lumea le cunoaște. Un astfel de instrument este mijlocul.
Mod, Median și Mediu
Deși media este perfect capabilă să stea pe cont propriu, este predată de obicei ca parte a unui trio, care include modul, mediana și media.
Să ne uităm la un grup de numere, astfel încât să înțelegeți ce se întâmplă aici. Imaginați-vă că aveți numerele de mai jos:
1, 2, 3, 3, 4, 6, 9
Să presupunem că am vrut să exprimăm numărul care apare de cele mai multe ori. Ar fi 3, iar numele pe care îl dăm acestei proprietăți este modul. Modul este numărul care este cel mai frecvent într-un set pe care îl examinăm.
Numărul din mijlocul unui set ordonat se numește mediană. Pentru a găsi mediana unui set numeric, aranjați numerele de la cel mai mic la cel mai mare și apoi uitați-vă la numărul din mijloc. Setul de numere de mai sus este deja aranjat de la cel mai mic la cel mai mare, astfel încât numărul mediu este și 3.
În cele din urmă, media este un alt mod de a se referi la media setului. Pentru a găsi media, trebuie doar să adăugați toate numerele împreună și să le împărțiți la numărul total de elemente din set. În cazul numerelor de mai sus, dacă le adunăm pe toate, obținem 28. Numărul total de articole din set este 7, deci media noastră este 4.
De ce avem nevoie de rău?
Așadar, în acest moment s-ar putea să vă întrebați de ce ar trebui oricum să găsim media unui număr.
Problema este că chiar și statisticile în sine sunt împărțite în mai multe grupuri. La fel cum aveți instrumente care sunt folosite pentru lucrul cu lemnul și altele pentru lucrul cu metalul, unele instrumente din statistici sunt grupate în clase, deoarece sunt utilizate pentru un scop similar.
Un astfel de grup din statistici se numește statistici sumare. Unul dintre elementele pentru care se utilizează statisticile este descrierea datelor, iar statisticile sumare reprezintă o colecție de instrumente utilizate în acest scop. Unul dintre elementele din acea clasă de instrumente este media.
Media este importantă datorită faptului că ne ajută să analizăm ceea ce este cunoscut sub numele de distribuție. În statistici, o distribuție este o metodă pe care o folosim pentru a privi o variabilă despre care dorim informații. Folosind o distribuție vom analiza valorile acestei variabile și cât de des apare.
Dacă colectăm date, un tip comun de distribuție pe care îl vedem este distribuția normală care ia forma curbei clopotului:

Adică variabila va avea o valoare comună spre care tinde, precum și un punct de plecare și un punct final.
Ceea ce înseamnă media este că ne permite să luăm o distribuție ca aceasta și să privim tendința centrală a variabilei, care este punctul în care valorile variabilei tind să se grupeze.
Astfel putem spune că media descrie tendința centrală a distribuției.
Calculul mediei în Python
Putem calcula manual media dacă avem un set de date numerice mici, avem câteva valori cu care să lucrăm. Cu toate acestea, atunci când avem sute sau mii de valori într-un set de date, devine imposibil să o calculăm manual.
Deoarece Python este un limbaj „baterii incluse”, modul în care putem face acest lucru este să folosim mean
funcția modulului de statistici din Python.
Să folosim mean
funcție pentru a calcula media setului de date numerice pe care le-am avut mai devreme în postare:
# 1. import the statistics module
import statistics
# 2. list containing our numerical data set
numerical_data_set = [1, 2, 3, 3, 4, 6, 9]
# 3. calculate the mean
calc_mean = statistics.mean(numerical_data_set)
# 4. print our calculated mean
print("Mean is: ", calc_mean)
Codul nostru constă dintr-o secvență în 4 pași pe care o putem folosi pentru a calcula media:
- Importăm modulul de statistici care conține funcția noastră medie
- Creăm o listă Python care conține setul de date numerice din care am dori să calculăm media
- Calculăm media și stocăm rezultatul într-o variabilă,
calc_mean
- Emitem media calculată astfel încât să putem obține feedback vizual
Când rulăm codul, vom obține următoarea ieșire:

Programul produce aceeași valoare ca și calculele noastre manuale. Atunci când lucrăm cu seturi de date mari, această funcție va putea scala pentru a gestiona orice putem arunca asupra ei.
Încheierea
În această postare ne-am uitat la mean
funcție în Python. Am început discutând statistici în ansamblu, apoi am făcut o scufundare profundă în mediu.
Acum, că aveți o înțelegere solidă a statisticilor și a mean
funcționează în Python, îl puteți folosi în propriile programe.
Dacă ți-a plăcut acest articol, atunci s-ar putea să fii curios și să afli despre structurile de date și algoritmi. Dacă doriți un ghid simplu, clar, pas cu pas pentru a afla despre structurile de date și algoritmi fără a fi nevoie să scrieți o singură linie de cod, atunci puteți consulta cartea Structuri și algoritmi de date fără cod.
Citiți cartea aici:
