de Moshe Binieli

Învățarea automată: o introducere pentru a însemna erori pătrate și linii de regresie

Invatarea automata o introducere pentru a insemna erori patrate si
Imagine de introducere

Introducere

Acest articol se va ocupa de metoda statistică eroare pătrată medie, și voi descrie relația acestei metode cu linia de regresie.

Exemplul constă din puncte de pe axa carteziană. Vom defini o funcție matematică care ne va da linia dreaptă care trece cel mai bine între toate punctele de pe axa carteziană.

Și în acest fel, vom învăța legătura dintre aceste două metode și cum arată rezultatul conexiunii lor.

Explicatie generala

Aceasta este definiția din Wikipedia:

În statistici, eroarea pătrată medie (MSE) a unui estimator (a unei proceduri de estimare a unei cantități neobservate) măsoară media pătratelor erorilor – adică diferența medie pătrată între valorile estimate și ceea ce este estimat. MSE este o funcție de risc, care corespunde valorii așteptate a pierderii de eroare pătrată. Faptul că MSE este aproape întotdeauna strict pozitiv (și nu zero) se datorează întâmplării sau deoarece estimatorul nu ia în considerare informațiile care ar putea produce o estimare mai precisă.

Structura articolului

  • Descoperiți ideea, vizualizarea graficului, ecuația de eroare pătrată medie.
  • Partea matematică care conține manipulări algebrice și o derivată a funcțiilor cu două variabile pentru a găsi un minim. Această secțiune este pentru cei care vor să înțeleagă cum primim formulele matematice mai târziu, puteți sări peste ea dacă asta nu vă interesează.
  • O explicație a formulelor matematice pe care le-am primit și a rolului fiecărei variabile în formulă.
  • Exemple

Obțineți o idee despre idee

Să presupunem că avem șapte puncte, iar scopul nostru este să găsim o linie care minimizează distanțele pătrate până la aceste puncte diferite.

Să încercăm să înțelegem asta.

Voi lua un exemplu și voi trasa o linie între puncte. Desigur, desenul meu nu este cel mai bun, dar este doar în scop demonstrativ.

Invatarea automata o introducere pentru a insemna erori patrate si
Puncte pe un grafic simplu.

S-ar putea să vă întrebați, ce este acest grafic?

  • puncte mov sunt punctele de pe grafic. Fiecare punct are o coordonată x și o coordonată y.
  • linia albastră este linia noastră de predicție. Aceasta este o linie care trece prin toate punctele și li se potrivește în cel mai bun mod. Această linie conține punctele prezise.
  • linie rosie între fiecare punct purpuriu și linia de predicție sunt erori. Fiecare eroare este distanța de la punct la punctul său prevăzut.

Ar trebui să vă amintiți această ecuație din zilele dvs. de școală, y = Mx + B, Unde M este pantă a liniei și B este y-interceptare a liniei.

Vrem să găsim M (pantă) și B (y-interceptare) acea minimizează eroarea pătrată!

Să definim o ecuație matematică care ne va da eroarea pătrată medie pentru toate punctele noastre.

Invatarea automata o introducere pentru a insemna erori patrate si
Formula generală pentru eroarea medie pătrată.

Să analizăm ce înseamnă de fapt această ecuație.

  • În matematică, caracterul care arată ca E ciudat se numește însumare (sigma greacă). Este suma unei succesiuni de numere, de la i = 1 la n. Să ne imaginăm acest lucru ca o serie de puncte, în care parcurgem toate punctele, de la primul (i = 1) la ultimul (i = n).
  • Pentru fiecare punct, luăm coordonata y a punctului și coordonata y. Coordonata y este punctul nostru purpuriu. Punctul y se află pe linia pe care am creat-o. Scădem valoarea coordonatei y din valoarea coordonatei y și calculăm pătratul rezultatului.
  • A treia parte este să luați suma tuturor valorilor (y-y ‘) ² și să o împărțiți cu n, ceea ce va da media.

Scopul nostru este să reducem la minim această medie, care ne va oferi cea mai bună linie care trece prin toate punctele.

De la concept la ecuații matematice

Această parte este pentru oamenii care doresc să înțeleagă cum am ajuns la ecuațiile matematice. Dacă doriți, puteți trece la următoarea parte.

După cum știți, ecuația liniei este y = mx + b, unde m este pantă și b este y-interceptare.

Să luăm fiecare punct din grafic și vom face calculul nostru (y-y ‘) ².
Dar ce este y ‘și cum îl calculăm? Nu o avem ca parte a datelor.

Dar știm că, pentru a calcula y ‘, trebuie să ne folosim ecuația de linie, y = mx + b, și să punem x în ecuație.

De aici obținem următoarea ecuație:

1611716708 283 Invatarea automata o introducere pentru a insemna erori patrate si

Să rescriem această expresie pentru a o simplifica.

1611716708 661 Invatarea automata o introducere pentru a insemna erori patrate si

Să începem prin a deschide toate parantezele din ecuație. Am colorat diferența dintre ecuații pentru a ușura înțelegerea.

1611716708 909 Invatarea automata o introducere pentru a insemna erori patrate si

Acum, să aplicăm o altă manipulare. Vom lua fiecare parte și o vom pune împreună. Vom lua tot y, și (-2ymx) și etc, și le vom pune pe toate una lângă alta.

1611716709 898 Invatarea automata o introducere pentru a insemna erori patrate si

În acest moment începem să fim dezordinați, deci să luăm media tuturor valorilor pătrate pentru y, xy, x, x².

Să definim, pentru fiecare, un caracter nou care va reprezenta media tuturor valorilor pătrate.

Să vedem un exemplu, să luăm toate valorile y și să le împărțim la n, deoarece este media și să-i spunem y (HeadLine).

1611716709 269 Invatarea automata o introducere pentru a insemna erori patrate si

Dacă înmulțim ambele părți ale ecuației cu n obținem:

1611716709 216 Invatarea automata o introducere pentru a insemna erori patrate si

Ceea ce ne va conduce la următoarea ecuație:

1611716709 876 Invatarea automata o introducere pentru a insemna erori patrate si

Dacă ne uităm la ceea ce avem, putem vedea că avem o suprafață 3D. Arată ca un pahar, care se ridică brusc în sus.

Vrem să găsim M și B care să minimizeze funcția. Vom face o derivată parțială cu privire la M și o derivată parțială cu privire la B.

Deoarece căutăm un punct minim, vom lua derivatele parțiale și le vom compara cu 0.

1611716710 142 Invatarea automata o introducere pentru a insemna erori patrate si
Formula derivatelor parțiale
1611716710 440 Invatarea automata o introducere pentru a insemna erori patrate si
Derivate parțiale

Să luăm cele două ecuații pe care le-am primit, izolând variabila b de ambele și apoi scăzând ecuația superioară din ecuația inferioară.

1611716710 657 Invatarea automata o introducere pentru a insemna erori patrate si
Scrierea diferită a ecuațiilor după derivarea pe părți

Să scădem prima ecuație din a doua ecuație

1611716710 882 Invatarea automata o introducere pentru a insemna erori patrate si
Îmbinați două ecuații împreună

Să scăpăm de numitorii din ecuație.

1611716711 574 Invatarea automata o introducere pentru a insemna erori patrate si
Ecuația finală pentru a găsi M.

Și acolo mergem, aceasta este ecuația pentru a găsi M, să luăm acest lucru și să notăm ecuația B.

1611716711 956 Invatarea automata o introducere pentru a insemna erori patrate si
Ecuația finală pentru a găsi B.

Ecuații pentru panta și interceptarea y

Să oferim ecuațiile matematice care ne vor ajuta să găsim necesarul pantă și y-interceptare.

1611716711 290 Invatarea automata o introducere pentru a insemna erori patrate si
Ecuații de înclinare și interceptare y

Deci, probabil că te gândești la tine, ce naiba sunt acele ecuații ciudate?

Sunt de fapt ușor de înțeles, așa că hai să vorbim puțin despre ele.

1611716711 969 Invatarea automata o introducere pentru a insemna erori patrate si
Suma lui x împărțită la n
1611716712 909 Invatarea automata o introducere pentru a insemna erori patrate si
Suma de x² împărțită la n
1611716712 682 Invatarea automata o introducere pentru a insemna erori patrate si
Suma lui xy împărțită la n
1611716712 368 Invatarea automata o introducere pentru a insemna erori patrate si
Suma y împărțită la n

Acum, că ne înțelegem ecuațiile, este timpul să adunăm toate lucrurile și să arătăm câteva exemple.

Exemple

Un mare mulțumire Academia Khan pentru exemple.

Exemplul nr. 1

Să luăm 3 puncte, (1,2), (2,1), (4,3).

1611716712 794 Invatarea automata o introducere pentru a insemna erori patrate si
Puncte pe grafic.

Să găsim M și B pentru ecuația y = mx + b.

1611716712 268 Invatarea automata o introducere pentru a insemna erori patrate si
Sumați valorile x și împărțiți la n
1611716713 772 Invatarea automata o introducere pentru a insemna erori patrate si
Sumați valorile y și împărțiți la n
1611716713 661 Invatarea automata o introducere pentru a insemna erori patrate si
Sumați valorile xy și împărțiți la n
1611716713 56 Invatarea automata o introducere pentru a insemna erori patrate si
Sumați valorile x² și împărțiți la n

După ce am calculat părțile relevante pentru ecuația noastră M și ecuația B, să punem aceste valori în ecuații și să obținem pantă și y-interceptare.

1611716713 926 Invatarea automata o introducere pentru a insemna erori patrate si
Calculul pantei
1611716714 144 Invatarea automata o introducere pentru a insemna erori patrate si
calculul interceptării y

Să luăm acele rezultate și să le setăm în ecuația liniei y = mx + b.

1611716714 879 Invatarea automata o introducere pentru a insemna erori patrate si

Acum să trasăm linia și să vedem cum linia trece prin linii în așa fel încât să minimizeze distanțele pătrate.

1611716714 356 Invatarea automata o introducere pentru a insemna erori patrate si
Linie de regresie care minimizează MSE.

Exemplul nr. 2

Să luăm 4 puncte, (-2, -3), (-1, -1), (1,2), (4,3).

1611716714 401 Invatarea automata o introducere pentru a insemna erori patrate si
Puncte pe grafic.

Să găsim M și B pentru ecuația y = mx + b.

1611716715 877 Invatarea automata o introducere pentru a insemna erori patrate si
Sumați valorile x și împărțiți la n
1611716715 834 Invatarea automata o introducere pentru a insemna erori patrate si
Sumați valorile y și împărțiți la n
1611716715 46 Invatarea automata o introducere pentru a insemna erori patrate si
Sumați valorile xy și împărțiți la n
1611716715 695 Invatarea automata o introducere pentru a insemna erori patrate si
Sumați valorile x² și împărțiți la n

La fel ca înainte, să punem acele valori în ecuațiile noastre pentru a găsi M și B.

1611716716 148 Invatarea automata o introducere pentru a insemna erori patrate si
Calculul pantei
1611716716 231 Invatarea automata o introducere pentru a insemna erori patrate si
calculul interceptării y

Să luăm aceste rezultate și să le setăm în ecuația liniei y = mx + b.

1611716716 66 Invatarea automata o introducere pentru a insemna erori patrate si

Acum să trasăm linia și să vedem cum linia trece prin linii în așa fel încât să minimizeze distanțele pătrate.

1611716716 966 Invatarea automata o introducere pentru a insemna erori patrate si
Linie de regresie care minimizează MSE

In concluzie

După cum puteți vedea, întreaga idee este simplă. Trebuie doar să înțelegem principalele părți și modul în care lucrăm cu ele.

Puteți lucra cu formulele pentru a găsi linia pe un alt grafic și pentru a efectua un calcul simplu și pentru a obține rezultatele pentru pantă și y-interceptare.

Atât, simplu, nu? ?

Fiecare comentariu și toate feedback-urile sunt binevenite – dacă este necesar, voi remedia articolul.

Nu ezitați să mă contactați direct pe LinkedIn – Click aici.