Distribuțiile de probabilități joacă un rol important în viața noastră de zi cu zi. Le folosim în mod obișnuit atunci când încercăm să rezumăm și să obținem informații din diferite forme de date.

Din această cauză, sunt un subiect destul de important în domenii precum matematică, informatică, statistică și știința datelor.

Există două tipuri principale de date: Numeric (de exemplu, numere întregi și flotante) și Categoric (de exemplu șiruri de text).

Datele numerice pot fi, de asemenea, în oricare dintre cele două forme:

  • Discret: această formă de date poate lua doar un număr limitat de valori (cum ar fi numărul de haine pe care le avem). Putem deduce funcții de masă de probabilitate din date discrete.
  • Continuu: pe de altă parte, datele continue sunt utilizate pentru a descrie concepte mai abstracte, cum ar fi greutatea / distanța, care pot lua orice valoare fracționată sau reală. Din datele continue putem deduce în schimb funcții de densitate a probabilității.

Funcțiile de masă de probabilitate ne pot oferi probabilitatea ca o variabilă să fie egală cu o anumită valoare. Pe de altă parte, valorile funcțiilor de densitate a probabilității nu reprezintă probabilități pe cont propriu, ci mai întâi trebuie integrate (în intervalul considerat).

Ce este o distribuție Poisson?

Distribuțiile Poisson sunt utilizate în mod obișnuit în două scopuri principale:

  • Prezicerea de câte ori va avea loc un eveniment într-o perioadă de timp aleasă. Această tehnică poate fi utilizată pentru diferite aplicații de analiză a riscurilor, cum ar fi estimarea prețului asigurărilor de locuințe.
  • Estimarea unei probabilități ca un eveniment să se producă având în vedere cât de des s-a întâmplat în trecut (de exemplu, cât de probabil este că va exista o întrerupere a curentului electric în următoarele două luni).

Distribuțiile Poisson ne permit să fim încrezători în timpul mediu dintre apariția diferitelor evenimente. Cu toate acestea, ei nu ne pot spune momentul precis în care ar putea avea loc un eveniment (deoarece procesele au de obicei un comportament stochastic).

Sisteme liniare vs neliniare

Sistemele naturale pot fi, de fapt, împărțite în două categorii principale: liniar și neliniar (stocastic).

În sistemele liniare, cauzele preced întotdeauna efectul lor, ceea ce creează un efect puternic de prioritate în timp.

Dar acest lucru nu este valabil în schimb atunci când vorbim despre sisteme neliniare, deoarece modificările mici ale condițiilor inițiale ale sistemului pot duce la rezultate imprevizibile.

Având în vedere cât de complexă și haotică este lumea noastră reală, cele mai multe procese sunt mai bine descrise folosind sisteme neliniare, deși uneori sunt posibile aproximări liniare.

Distribuțiile Poisson pot fi modelate folosind expresia din figura de mai jos, unde λ este obișnuit reprezintă numărul așteptat de evenimente care pot avea loc în intervalul de timp considerat.

Imagine pentru postare

Principalele caracteristici care descriu procesele Poisson sunt:

  1. Două evenimente nu pot avea loc simultan.
  2. Rata medie între apariția evenimentului este în general constantă.
  3. Evenimentele sunt independente unele de altele (dacă se întâmplă unul, acest lucru nu are nicio influență asupra probabilității ca un alt eveniment să aibă loc).
  4. Evenimentele pot avea loc de câte ori (în intervalul de timp considerat).

Un exemplu de distribuție Poisson

În figura de mai jos, puteți vedea cum variația numărului așteptat de evenimente (λ) care pot avea loc într-o perioadă poate schimba o distribuție Poisson. Imaginea de mai jos a fost simulată, folosind acest cod Python:

import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats

# n = number of events, lambd = expected number of events 
# which can take place in a period
for lambd in range(2, 12, 2):
    n = np.arange(0, 9)
    poisson = stats.poisson.pmf(n, lambd)
    plt.plot(n, poisson, '-o', label="λ = {:f}".format(lambd))
    plt.xlabel('Number of Events', fontsize=12)
    plt.ylabel('Probability', fontsize=12)
    plt.title("Poisson Distribution varying λ")
    plt.legend()
    plt.savefig('name.png')

Aruncând o privire mai atentă la această simulare, putem descoperi următoarele tipare:

  • În fiecare dintre diferitele cazuri, numărul atribuit lui λ corespunde vârfului distribuției, care apoi se îndepărtează mai departe de vârf.
  • Cu cât se așteaptă să aibă loc mai multe evenimente în timpul simulării, cu atât va fi mai mare aria așteptată sub curba de distribuție.
1611445807 144 Distributia Poisson O formula pentru a calcula distributia probabilitatii

Acest tip de simulare ar putea fi, de exemplu, folosit pentru a încerca să reducă timpul de așteptare atunci când mergeți la cumpărături la un supermarket.

Proprietarul ar putea crea o evidență a numărului de clienți care vizitează magazinul în momente diferite și în diferite zile ale săptămânii, pentru a se potrivi apoi aceste date cu Poisson Distribution.

În acest fel, ar fi mult mai ușor să se determine câți casieri ar trebui să lucreze în diferite momente ale zilei / săptămânii pentru a îmbunătăți experiența clientului.

Înfășurându-se

În cazul în care sunteți interesat să aflați mai multe despre aplicațiile distribuțiilor în setări stocastice, sunt disponibile mai multe informații aici.

Sper că v-a plăcut acest articol, vă mulțumesc pentru lectură!

Contacteaza-ma

Dacă doriți să fiți la curent cu ultimele mele articole și proiecte urmărește-mă pe Medium și abonați-vă la listă de email-uri. Acestea sunt câteva dintre detaliile mele de contact: