de Kirill Dubovikov

Cum să vă schimbați următorul proiect de prognoză a seriilor temporale

Cum sa va schimbati urmatorul proiect de prognoza a seriilor
Fotografie de Wil Stewart pe Unsplash

Prognoza seriilor cronologice este o sarcină de mare importanță. Are o mare varietate de aplicații, de la prognoza vânzărilor până la detectarea anomaliilor în procesele de fabricație complexe.

Cu toate acestea, este destul de diferit de metodele tradiționale de învățare automată.

Proiectele de prognoză au multe avertismente de care ar trebui să fiți conștienți pentru a reuși în sarcina de față. În acest articol vom explora punctele cheie care vă vor ajuta să finalizați cu succes sarcina. Citiți mai departe pentru a afla cele pe care le pierdeți.

Cercetează-ți metodele

1611497408 574 Cum sa va schimbati urmatorul proiect de prognoza a seriilor

Este crucial să vă studiați problema în detaliu și să vă planificați înainte de a întreprinde acțiuni care vor afecta succesul proiectului dumneavoastră.

1. Studiază-ți teoria

Înainte de a începe un proiect de modelare, asigurați-vă că înțelegeți teoria dacă nu ați făcut-o deja. Prognoza: Principii și practică este o resursă foarte solidă care poate contura elementele de bază într-un mod practic și concis.

2. Studiați domeniul

Înainte de a discuta orice detaliu al proiectului, asigurați-vă că înțelegeți elementele de bază. Aflați cât de mult puteți despre domeniul de afaceri în care veți opera. Google vă poate ajuta să începeți. Înțelegeți definițiile cheie și modelele de afaceri comune. Fără acest pas, s-ar putea să ajungi să faci luni de muncă pentru nimic. Nu doriți să dați greș, deoarece ați rezolvat o problemă care nu are sens pentru afaceri.

3. Studiază problema

Primul lucru pe care ar trebui să-l faci în orice proiect de știință a datelor este să studiezi problema. Și nu mă refer la discuția cu clientul dvs. timp de 15 minute și la scrierea unei înțelegeri inițiale. Ar trebui să puneți la îndoială totul și să fiți sceptici (într-un sens bun).

Amintiți-vă că știința datelor este un domeniu relativ nou în lumea aplicațiilor practice. Aceasta înseamnă că viziunea clientului dvs. poate fi incompletă. Pentru a-i ajuta, ar trebui să le înțelegeți afacerea și problema lor cât de profund puteți.

Lucrați cu cerințele, digerați-le cuvânt cu cuvânt și simțiți problema la îndemână. Apoi, încercați să înțelegeți afacerea din spatele problemei.

Este solid din punct de vedere economic? Care este scopul final al clientului dvs.? Este posibil să nu fie profituri directe, dar trebuie să existe un obiectiv. Rezolvarea problemei pe care o solicită clientul dvs. ajută cu adevărat la atingerea acestui obiectiv?

Dacă nu, încercați să aflați ce poate fi schimbat împreună cu clientul dvs. Nu vă temeți să puneți întrebări – succesul proiectului depinde de ele.

Găsirea datelor corecte

1611497409 599 Cum sa va schimbati urmatorul proiect de prognoza a seriilor
Fotografie de Franki Chamaki pe Unsplash

În acest moment ar trebui să avem o bună înțelegere a problemei și domeniului nostru. În continuare, vom analiza importanța cercetării și interogării datelor.

4. Gândiți-vă la valori și evaluare

Apoi, ar trebui să vă gândiți la evaluare. Și nu vorbesc despre validarea modelului, ci despre o evaluare care are sens pentru client. Adesea, nu vor veni cu valori de afaceri gata de utilizat, aceasta este responsabilitatea dvs. de a lucra cu ei la aceasta. În cele din urmă, ar trebui să aveți o definiție matematică solidă a modului în care previziunile dvs. afectează obiectivul final al proiectului.

Și vă rugăm să nu încercați să utilizați metricele convenționale de validare a științei datelor, cum ar fi MAPE, MAE, RMSE, ca metrice principală a proiectului. Sunt valori bune în scopuri de validare, deși încă vă pot da greș într-un context de afaceri.

De exemplu, să considerăm că avem câteva date despre vânzări pentru diferite articole. Clientul ne-a cerut să estimăm vânzările viitoare pe orizontul de două luni. În plus, ea ne-a oferit date istorice privind strategia actuală de prognoză a vânzărilor (de exemplu, realizată manual de analiști).

De exemplu, noul tău model de învățare profundă distruge strategia existentă cu 30% diferență în MAPE. Puteți să-l implementați în producție și să eșuați lamentabil din următoarele motive:

  • Modelul tău subvinde frecvent comparativ cu strategia actuală. Eroarea poate fi mică și nu afectează MAPE cu mult, dar din punct de vedere al afacerii 4% subvinde în comparație cu abordarea lor actuală poate fi un dezastru
  • Modelul tău reduce posibilele vânzări cu o marjă mare. În multe cazuri, acest lucru nu ar impresiona clientul. În cele din urmă, chiar vă pot cere să utilizați intervalul de încredere superior pentru a reduce riscurile de subvânzare
  • MAPE (metrica aleasă) nu are sens pentru client și este greu de înțeles de către persoanele care vor citi raportul

Asigurați-vă întotdeauna că aveți o strategie solidă de evaluare a modelului. Este centura ta de siguranță și este mai bine să ai una decât să nu, nu-i așa?

5. Uită-te la datele tale

Faceți-vă temele de analiză exploratorie a datelor (EDA). Poate fi foarte seducător să omiți această parte. „Vom face asta mai târziu, cu siguranță! Mă voi uita doar la performanța unor modele ”. Asta ai putea crede. Mănâncă-ți mai întâi broaștele. Desenați parcele, căutați valori aberante, verificați modele ciudate. Dacă aveți multe serii cronologice, uitați-vă la sumele lor dacă are sens să faceți acest lucru.

Comunicați toate constatările către client. Dacă ceva din date nu este ușor de înțeles și clar, atunci ar trebui să se descopere cât mai curând posibil.

Este posibil să aveți bug-uri în cod sau cadrele dvs. să aibă și bug-uri sau poate conducta de export a datelor clientului poate fi, de asemenea, buggy. Verificați de două ori analiza datei. Indicați întotdeauna în mod deliberat formatul de dată pentru cadrul dvs. De exemplu, biblioteca panda Python vă poate eșua în mod tăcut atunci când analizați datele în diferite locații.

Chiar dacă nu veți găsi erori, clientul dvs. poate fi surprins de constatările dvs. Modelele sezoniere neobișnuite și descoperirile anomaliilor pot oferi și o valoare extraordinară. Este posibil ca clientul dvs. să nu fie conștient de acestea, deoarece nu a privit datele așa cum faceți dvs.

6. Uită-te la datele tale din nou

Faceți mai mult EDA. Nu pot sublinia cât de important este acest lucru.

7. Scrieți teste pentru încărcarea și preprocesarea datelor

Scrieți teste automate pentru conducta de date. Testele vă vor plăti și vă vor economisi timp mai târziu.

8. Gândește-te la valorile afacerii

Sunt definite valorile dvs. de afaceri? Clientul dvs. a fost de acord asupra lor și fiecare piesă este limpede pentru ei? Aveți funcții pentru a le calcula implementate și testate corespunzător? Dacă nu, atunci este timpul să vă opriți și să faceți această parte.

Dacă veți continua să sperați că MAPE sau RMSE o vor compensa pentru o valoare a afacerii, puteți ajunge la probleme. Va face rapoartele dvs. greu de înțeles și vă va crește șansele de a rezolva sarcina greșită.

Simplitatea este cheia

1611497409 760 Cum sa va schimbati urmatorul proiect de prognoza a seriilor

În cele din urmă, să nu uităm de simplitate. Ultimele cinci puncte explorează valoarea din spatele lucrurilor simple: modele simple, verificări duble și comunicare.

9. Începeți cu media

Înainte de a începe învățarea completă, verificați modul în care funcționează modelele simple, cum ar fi prezicerea mediei medii. Nu chiar.

Cateva exemple:

  • Previziunea medie de alergare pentru ultimele N săptămâni
  • Predicția cuantilelor care rulează
  • Prezicerea mediei ponderate exponențial
  • Folosirea regulilor euristice pentru sărbători și evenimente regulate. O medie cu un multiplicator poate face minuni la Anul Nou

Acest lucru vă va oferi o bază solidă. Poate fi greu de crezut, dar, în unele cazuri, ați putea chiar găsi că este cea mai bună soluție posibilă. Din acest motiv exact, am creat un întreg modul dedicat regulilor euristice și modelelor statistice simple în cadrul nostru de prognoză.

10. Alegeți modelul potrivit

În cele din urmă, partea distractivă. Încercați câte modele vă puteți permite. Faceți un test inițial pe o gamă largă de modele, filtrați-le și reglați cel mai bun unul sau două.

Aveți grijă la cerințele nefuncționale. Măsurați întotdeauna timpul necesar pentru montarea modelului. Sarcina dvs. poate avea limitări care vă vor afecta alegerea:

  • Timpul de funcționare, mai ales dacă aveți zeci de mii de serii temporale pentru care să faceți prognoze
  • Resurse de calcul disponibile

11. Măsurați performanța

Calculați-vă valorile comerciale și tehnice utilizând validarea încrucișată a seriilor temporale. Folosiți cât mai multe pliuri pentru a obține estimări corecte. Cercetați-vă concluziile dacă vedeți ceva neobișnuit. Performanță extrem de bună? Performanță extrem de proastă? Acestea sunt adesea semne de precauție.

12. Verifică din nou totul

Verifică-te. Verifică-ți clientul. Scrieți câteva teste, dacă este posibil.

13. Pregătiți rapoarte și comunicați clar

Acum este momentul să comunicați și să vă prezentați concluziile și rezultatele. Cercetează consumatorii cu privire la rezultatele tale. Știu despre învățarea automată sau despre prognozele seriilor temporale? Sunt competenți în informatică? Dacă sunt, această parte poate fi ușoară.

Dacă nu, încercați să utilizați statisticile fanteziste și tezaurul de învățare automată cât mai puțin posibil. Pregătiți definiții clare dacă nu puteți merge fără termeni complecși. Utilizați comploturi cu titluri, legende și nume de axe. Scopul final este de a vă comunica rezultatele cât mai clar posibil. Nimeni nu va putea folosi rezultatele dvs. dacă nu le va înțelege. Și nimeni nu va putea descoperi o greșeală dacă te vei ascunde în spatele descrierilor complexe și a formulelor criptice.

Îndrumări generale pentru desfășurarea întregului proiect

  • Comunică mai mult. Nu pot accentua mai mult acest lucru. În cele din urmă, comunicarea este probabil mai importantă decât întreaga dvs. putere de ansamblu de 100 de modele
  • Scapă de tezaurul complex
  • Scufundați-vă în afacere

Concluzie

1611497410 852 Cum sa va schimbati urmatorul proiect de prognoza a seriilor

Am explorat câteva puncte cheie care vă vor ajuta să reușiți într-un proiect de prognoză a seriilor cronologice. Unele dintre ele pot părea intuitive și puteți crede că nu veți face niciodată aceste greșeli, dar asigurați-vă că vă verificați. Adesea, cel mai ușor lucru în care nu reușești este cel mai evident.

Vă rog, siepure articolului dacă te-a ajutat. De asemenea, vă gândiți să-i dați niște aplauze? .

Urmăriți-mă pe? Twitter ,?Pe minedium and ?? ‍? LinkedIn.