În zilele noastre, limbajele de programare precum Python și R sunt, fără îndoială, unele dintre cele mai solicitate limbaje în știința datelor și învățarea automată.

Dar este, de asemenea, posibil să efectuați sarcini comune de învățare automată și știință a datelor, fără a fi neapărat abili în codificare?

Desigur ca este! Weka este un pachet open-source bazat pe interfața grafică a utilizatorului. Poate fi folosit pentru a efectua sarcini comune în domeniul științei datelor, doar utilizând interfața grafică.

Noțiuni de bază

Weka poate fi instalat cu ușurință pe orice tip de platformă urmând instrucțiunile de mai jos legătură. Singura condiție prealabilă este instalarea Java 8.0 pe mașina dvs. locală.

Odată ce ați instalat Weka, veți avea un set de tehnici standard de prelucrare a datelor și inferență, cum ar fi:

  • Prelucrarea datelor: după ce ați încărcat un set de date, Weka vă permite să explorați rapid atributele și instanțele acestuia. În plus, sunt disponibile diferite tehnici de filtrare pentru a converti, de exemplu, datele categorice în numerice sau pentru a efectua selectarea caracteristicilor pentru a reduce dimensionalitatea setului nostru de date (de exemplu, pentru a accelera timpul de antrenament și performanța).
  • Algoritmi de clasificare și regresie: o colecție de algoritmi diferiți, cum ar fi Gaussian Naive Bayes, arbori de decizie, K-Near Neighbor, tehnici Ensembles și diverse variante de regresie liniară.
  • Clusterizare: această tehnică poate fi utilizată pentru a identifica principalele categorii din datele noastre într-un mod nesupravegheat. Câteva exemple de algoritmi disponibili în colecția Weka sunt K-Means Clustering și Expectation Maximization.
  • Descoperirea asociațiilor: descoperirea regulilor din setul nostru de date pentru a identifica mai ușor tiparele și conexiunile dintre diferitele caracteristici.
  • Vizualizare date: o suită de tehnici integrate de vizualizare a datelor pentru a vizualiza rapid corelațiile dintre caracteristici și a reprezenta modele de învățare automată învățate, cum ar fi Arbori de decizie și Clusterarea K-Means.

O altă caracteristică interesantă a Weka este capacitatea de a instala pachete noi pe măsură ce sunt create.

Un exemplu de pachet suplimentar pe care îl puteți instala este AutoML. AutoML poate fi, de fapt, deosebit de util pentru începătorii cărora le-ar putea fi greu să identifice ce model de învățare automată ar putea fi cel mai bine să utilizeze pentru o anumită sarcină.

Folosind pachetul Weka AutoML, puteți testa cu ușurință diferite modele de învățare automată din mers. De asemenea, vă permite să reglați automat hiper-parametri în scopul creșterii performanței.

În cele din urmă, pentru utilizatorii mai experți, Weka oferă, de asemenea, o interfață de linie de comandă pentru a utiliza codul Java. Acest lucru poate fi deosebit de util mai ales dacă lucrați cu cantități mari de date.

Exemplu

Acum vom parcurge un exemplu simplu pentru a demonstra cum să începeți cu Weka.

În primul rând, putem începe analiza deschizând Weka Explorer și deschizând setul nostru de date (în acest exemplu, setul de date Iris).

Weka Tutorial Invatare automata bazata pe GUI cu Java
Figura 1: Importarea și vizualizarea datelor

Selectați fila Clasificare, alegeți Naive Bayes ca clasificator și faceți clic pe Start. Veți vedea că putem obține rapid o precizie de clasificare de 96% fără a fi nevoie să scriem niciun cod!

1611929046 2 Weka Tutorial Invatare automata bazata pe GUI cu Java
Figura 2: Rezultatele clasificării Naive Bayes

Concluzie

În cazul în care căutați mai multe informații despre cum să începeți cu Weka, această serie YouTube de la Google Developers este un loc minunat pentru a începe.

Contacteaza-ma

Dacă doriți să fiți la curent cu ultimele mele articole și proiecte, urmărește-mă pe Medium și abonați-vă la listă de email-uri. Acestea sunt câteva dintre detaliile mele de contact:

Copertă fotografie din acest articol.