Valorile P sunt unul dintre conceptele cele mai utilizate în analiza statistică. Acestea sunt utilizate de cercetători, analiști și statistici pentru a extrage informații din date și a lua decizii în cunoștință de cauză.

Alături de semnificația statistică, acestea sunt, de asemenea, unul dintre conceptele cele mai utilizate pe scară largă și neînțelese în analiza statistică.

Acest articol va explica:

  • cum se utilizează o valoare P pentru deducerea semnificației statistice
  • modul în care sunt calculate valorile P
  • și cum să evitați unele concepții greșite obișnuite

Recapitulare: testarea ipotezei

Testarea ipotezei este o abordare standard pentru a extrage informații din date. Este folosit practic în fiecare disciplină cantitativă și are o istorie bogată care se întinde pe o sută de ani în urmă.

Abordarea obișnuită a testării ipotezelor este de a defini o întrebare în funcție de variabilele care vă interesează. Apoi, puteți forma două ipoteze opuse pentru a răspunde la aceasta.

  • ipoteza nulă susține că nu există o relație semnificativă statistic între variabile
  • ipoteză alternativă susține că există o relație semnificativă statistic între variabile

De exemplu, spuneți că testați dacă cofeina afectează productivitatea programării. Există două variabile care vă interesează – doza de cofeină și productivitatea unui grup de dezvoltatori de software.

ipoteza nulă va fi:

  • “Aportul de cafeină are nici un efect semnificativ privind productivitatea programării “.

ipoteză alternativă va fi:

  • “Aportul de cafeină are un efect semnificativ pe productivitate “.

Cuvântul „semnificativ” are un sens foarte specific aici. Se referă la o relație între variabilele existente datorită ceva mai mult decât întâmplarea singură.

În schimb, relația există (cel puțin parțial) datorită diferențelor sau efectelor „reale” între variabile.

Următorul pas este colectarea unor date pentru a testa ipotezele. Acest lucru ar putea fi colectat dintr-un experiment sau sondaj sau dintr-un set de date la care aveți acces.

Ultimul pas este calcularea unei statistici de test din date. Acesta este un singur număr care reprezintă o caracteristică a datelor dvs. Exemplele includ testul t, testul Chi-pătrat și testul Kruskal-Wallis – printre multe altele.

Exact pe care să îl calculați va depinde de întrebarea pe care o puneți, de structura datelor dvs. și de distribuția datelor dvs.

Iată o foaie de înșelătorie la îndemână pentru referinta ta.

În exemplul de cofeină, un test adecvat ar putea fi un test cu două eșantioane.

Veți ajunge cu o singură statistică de test din datele dvs. Tot ce rămâne de făcut este să interpretăm acest rezultat pentru a determina dacă susține sau respinge ipoteza nulă.

Aici intră în joc valorile P.

Cât de puțin probabil este această statistică?

Amintiți-vă că ați calculat o statistică de testare, care reprezintă unele caracteristici ale datelor dvs. Vrei să înțelegi dacă susține sau respinge ipoteza nulă.

Abordarea luată este de a presupune că ipoteza nulă este adevărată. Adică, presupuneți că nu există relații semnificative între variabilele care vă interesează.

Apoi, uitați-vă la datele pe care le-ați colectat. Cât de probabil ar fi statisticile de testare dacă ipoteza nulă este cu adevărat adevărată?

Să ne referim la exemplul de aport de cofeină dinainte.

Ce este semnificatia statistica Valoarea P definita si cum sa
  • Spuneți că nivelurile de productivitate au fost împărțite în mod egal între dezvoltatori, indiferent dacă au consumat sau nu cofeină (graficul A). Acest rezultat ar fi probabil să apară întâmplător dacă ipoteza nulă ar fi adevărată.
  • Cu toate acestea, să presupunem că aproape toate cele mai mari productivități au fost observate la dezvoltatorii care au consumat cofeină (graficul B). Acesta este un rezultat mai „extrem” și ar fi puțin probabil să apară doar întâmplător dacă ipoteza nulă ar fi adevărată.

Dar cât de „extrem” trebuie să fie un rezultat înainte de a fi considerat prea puțin probabil să susțină ipoteza nulă?

Aceasta este ceea ce o valoare P vă permite să estimați. Acesta oferă un răspuns numeric la întrebarea: “dacă ipoteza nulă este adevărată, care este probabilitatea unui rezultat extrem sau mai extrem?”

Valorile P sunt probabilități, deci sunt întotdeauna între 0 și 1.

  • A valoare P ridicată indică rezultatele observate probabil să apară întâmplător sub ipoteza nulă.
  • A valoare P scăzută indică faptul că rezultatele sunt mai puțin probabil să apară întâmplător sub ipoteza nulă.

De obicei, se alege un prag pentru a determina semnificația statistică. Acest prag este adesea notat α.

Dacă valoarea P este sub prag, rezultatele tale sunt ‘semnificativ din punct de vedere statistic‘. Aceasta înseamnă că puteți respinge ipoteza nulă (și puteți accepta ipoteza alternativă).

Nu există un prag unic pentru toate aplicațiile. De obicei, se va utiliza un prag arbitrar adecvat contextului.

De exemplu, în domenii precum ecologia și evoluția, este dificil de controlat condițiile experimentale, deoarece mulți factori pot afecta rezultatul. De asemenea, poate fi dificil să colectați eșantioane foarte mari. În aceste câmpuri, va fi adesea utilizat un prag de 0,05.

În alte contexte, cum ar fi fizica și ingineria, un prag de 0,01 sau chiar mai mic va fi mai potrivit.

Exemplu Chi-pătrat

În acest exemplu, există două variabile (fictive): regiunea și apartenența la un partid politic. Se folosește de Test Chi-pătrat pentru a vedea dacă există o relație între regiune și apartenența la partidul politic.

Puteți modifica numărul de membri pentru fiecare partid.

  • Ipoteză nulă: „există nici o relație semnificativă între regiune și apartenența la partidul politic “
  • Ipoteză alternativă: „acolo este o relație semnificativă între regiune și apartenența la partidul politic “

Apăsați butonul „reluare” pentru a încerca diferite scenarii.

Concepții greșite frecvente și cum să le evitați

Există mai multe greșeli pe care chiar practicienii cu experiență le fac adesea cu privire la utilizarea valorilor P și testarea ipotezelor. Această secțiune va avea ca scop clarificarea acestora.

Ipoteza nulă este neinteresantă – dacă datele sunt bune și analiza este făcută corect, atunci este o concluzie validă în sine.

O întrebare demnă de răspuns ar trebui să aibă un răspuns interesant – oricare ar fi rezultatul.

Valoarea P este probabilitatea ca ipoteza nulă să fie adevărată – o valoare P reprezintă „probabilitatea rezultatelor, având în vedere că ipoteza nulă este adevărată”. Acest lucru nu este același lucru cu „probabilitatea ca ipoteza nulă să fie adevărată, având în vedere rezultatele”.

P (Date | Ipoteză) ≠ P (Ipoteză | Date)

Aceasta înseamnă că o valoare P scăzută vă spune: „dacă ipoteza nulă este adevărată, aceste rezultate sunt puțin probabil”. Da nu vă spun: „dacă aceste rezultate sunt adevărate, ipoteza nulă este puțin probabilă”.

Puteți utiliza același prag de semnificație pentru comparații multiple – rețineți definiția valorii P. Este probabilitatea de a observa o anumită statistică de testare doar din întâmplare.

Dacă utilizați un prag de α = 0,05 (sau 1-în-20) și efectuați, să zicem, 20 de teste statistice … s-ar putea să vă așteptați din întâmplare să găsiți o valoare P scăzută.

Ar trebui să utilizați un prag mai mic dacă efectuați mai multe comparații. Sunt metode de corectare care vă va permite să calculați cât de mic ar trebui să fie pragul.

Pragul de semnificație înseamnă orice – este complet arbitrar. 0.05 este doar o convenție. Diferența dintre p = 0,049 și p = 0,051 este aproape la fel ca între p = 0,039 și p = 0,041.

Aceasta este una dintre cele mai mari puncte slabe ale testării ipotezelor în acest fel. Te obligă să trasezi o linie în nisip, chiar dacă nu poate fi trasată cu ușurință nici o linie.

Prin urmare, luați întotdeauna în considerare pragurile de semnificație pentru ceea ce sunt – total arbitrare.

Semnificația statistică înseamnă că șansa nu joacă niciun rol – departe de. Adesea, există multe cauze ale unui rezultat dat. Unii vor fi aleatorii, alții mai puțin.

Găsirea unei cauze nealeatorii nu înseamnă că explică toate diferențele dintre variabilele dvs. Este important să nu confundați semnificația statistică cu „dimensiunea efectului”.

Valorile P sunt singura modalitate de a determina semnificația statistică – există alte abordări care uneori sunt mai bune.

Pe lângă testarea clasică a ipotezelor, luați în considerare și alte abordări – cum ar fi utilizarea Factorii Bayes, sau Risc fals pozitiv in schimb.