Lupta dintre limbajele de programare a fost întotdeauna un subiect fierbinte în lumea tehnologiei. Și având în vedere cât de rapid avansează tehnologia, avem un nou limbaj de programare sau cadru la fiecare câteva luni.

Acest lucru face din ce în ce mai greu pentru dezvoltatori, analiști și cercetători să aleagă cel mai bun limbaj care își va îndeplini sarcinile eficient, suportând în același timp cel mai mic cost.

Dar cred că avem tendința să ne uităm la motivele greșite pentru alegerea unei limbi. Există o grămadă de factori care conduc la alegerea unei anumite limbi. Și odată cu proiectele Data Science care inundă piața, întrebarea NU este „care este cel mai bun limbaj”, ci „care se potrivește cerințelor și mediului dvs. (setarea de lucru)?”

Deci, cu această postare, vă voi prezenta setul corect de întrebări pe care ar trebui să le puneți pentru a decide care este cel mai bun limbaj de programare pentru proiectul dvs. de știință a datelor.

Cele mai utilizate limbaje de programare pentru știința datelor

Python și R sunt cele mai utilizate limbi pentru analize statistice sau proiecte centrate pe învățarea automată. Dar există și altele – cum ar fi Java, Scala sau Matlab.

Atât Python cât și R sunt limbaje de programare open-source de ultimă generație, cu un sprijin comunitar excelent. Și continuăm să învățăm despre noi biblioteci și instrumente care ne permit să atingem niveluri mai mari de performanță și complexitate.

Piton

Cum sa alegeti cel mai bun limbaj de programare pentru

Python este bine cunoscut pentru sintaxa sa ușor de învățat și lizibilă. Cu un limbaj de uz general (jack of all trade), cum ar fi Python, puteți construi ecosisteme științifice complete, fără a vă face griji cu privire la compatibilitate sau la problemele de interfață.

Codul Python are costuri mici de întreținere și este, probabil, mai robust. De la luptă de date până la selectarea caracteristicilor, răzuirea web și implementarea modelelor noastre de învățare automată, Python poate realiza aproape totul cu ajutorul integrării de la toate API-urile majore ML și deep learning precum Theano, TensorFlow și PyTorch

R

1612191907 947 Cum sa alegeti cel mai bun limbaj de programare pentru

R a fost dezvoltat de academicieni și statistici în urmă cu peste două decenii. R astăzi permite multor statisticieni, analiști și dezvoltatori să își efectueze analiza în mod eficient. Avem peste 12000 de pachete disponibile în CRAN (un depozit open-source).

Deoarece a fost dezvoltat ținând cont de statisticieni, R este adesea prima alegere pentru toate analizele științifice și statistice de bază. Există un pachet în R pentru aproape orice tip de analiză.

De asemenea, analiza datelor a fost făcută foarte ușor cu instrumente precum RStudio care vă permit să comunicați rezultatele cu rapoarte concise și elegante.

4 întrebări pentru a vă ajuta să alegeți CEL MAI BUN limbă potrivită pentru proiectul dvs.

Deci, cum faci alegerea potrivită pentru munca ta la îndemână?

Încercați să răspundeți la aceste 4 întrebări:

1. Ce limbă / cadru este preferat în organizația / industria dvs.?

Uită-te la industria în care lucrezi și la limba cea mai des utilizată de colegii și de concurenți. Ar putea fi mai ușor dacă vorbiți aceeași limbă.

Aici este o analiza executat de David Robinson, un om de știință al datelor. Este o reflectare a popularității R în fiecare industrie și puteți vedea că R este foarte utilizat în mediul academic și în domeniul sănătății.

Deci, dacă sunteți cineva care dorește să intre în cercetare, în mediul academic sau în bioinformatică, ați putea lua în considerare R peste Python.

1612191907 480 Cum sa alegeti cel mai bun limbaj de programare pentru
Sursă: https://stackoverflow.blog/2017/10/10/impressive-growth-r/

Cealaltă față a acestei monede implică industrii de software, organizații bazate pe aplicații și companii bazate pe produse. Este posibil să trebuiască să utilizați stiva tehnologică a infrastructurii organizației dvs. sau limba pe care o folosesc colegii / echipele dvs.

Și majoritatea acestor organizații / industrii au infrastructura bazată pe Python, inclusiv în mediul academic:

1612191907 570 Cum sa alegeti cel mai bun limbaj de programare pentru
Sursă: https://stackoverflow.blog/2017/09/14/python-growing-quickly/

Ca aspirant cercetător în date, prin urmare, ar trebui să vă concentrați asupra învățării limbii și tehnologiei care au cele mai multe aplicații și care vă pot crește șansele de a obține un loc de muncă.

2. Care este scopul proiectului dumneavoastră?

Aceasta este o întrebare importantă, deoarece înainte de a alege o limbă, trebuie să aveți o agendă pentru proiectul dvs.

De exemplu, ce se întâmplă dacă doriți să rezolvați pur și simplu o problemă statistică printr-un set de date, să efectuați câteva analize multi-variate și să pregătiți un raport sau un tablou de bord care să explice ideile? În acest caz, R ar putea fi o alegere mai bună. Are niște biblioteci de vizualizare și comunicare foarte puternice.

Pe de altă parte, ce se întâmplă dacă scopul dvs. este să efectuați mai întâi analize exploratorii, să dezvoltați un model de învățare profundă și apoi să implementați modelul într-o aplicație web? Apoi, cadrele web și suportul Python de la toți furnizorii majori de cloud îl fac un câștigător clar.

3. Cât de experimentat sunteți în domeniul științei datelor?

Pentru un începător în știința datelor, care are o cunoștință limitată statistici și concepte matematice, Piton ar putea fi o alegere mai bună, deoarece vă permite să codificați cu ușurință fragmentele unui algoritm.

Cu biblioteci precum NumPy, puteți manipula singuri matrici și algoritmi de cod. Ca novice, este întotdeauna mai bine să înveți să construiești lucruri de la zero, mai degrabă decât să faci salt la utilizarea bibliotecilor de învățare automată.

Dar dacă știți deja elementele fundamentale ale algoritmilor de învățare automată, puteți alege oricare dintre limbi și să începeți cu ele.

4. Cât timp aveți la îndemână și care este costul învățării?

Timpul pe care îl puteți investi este un alt caz pentru alegerea dvs. În funcție de experiența dvs. cu programarea și de timpul de livrare al proiectului dvs., puteți alege o limbă peste alta pentru a începe în domeniu.

Dacă există un proiect cu prioritate ridicată și nu cunoașteți niciuna dintre limbi, R ar putea fi o opțiune mai ușoară pentru dvs. de a începe, deoarece aveți nevoie de experiență limitată / fără experiență în programare. Puteți scrie modele statistice cu câteva linii de cod folosind bibliotecile existente.

Python (adesea alegerea programatorului) este o opțiune excelentă pentru a începe dacă aveți o lățime de bandă pentru a explora bibliotecile și a afla despre metodele de explorare a seturilor de date. (În cazul R, acest lucru se poate face rapid în Rstudio.)

Un alt factor important este că există mai mulți mentori Python în comparație cu R. Dacă sunteți cineva care are nevoie de ajutor cu proiectul lor Python / R, puteți căuta un Coding Mentor aici și folosind acest link veți obține, de asemenea, un credit de 10 USD la înscriere pentru a fi utilizat pentru prima întâlnire a mentorilor.

Concluzie

Pe scurt, decalajul dintre capacitățile R și Python devine din ce în ce mai mic. Majoritatea lucrărilor pot fi realizate în ambele limbi. Și ambele au ecosisteme bogate care să vă susțină.

Alegerea unei limbi pentru proiectul dvs. va depinde apoi de:

  • Experiența dvs. anterioară cu știința datelor (statistici și matematică) și programare.
  • Domeniul proiectului în cauză și amploarea procesării statistice sau științifice necesare.
  • Scopul viitor al proiectului dumneavoastră.
  • Limbajul / cadrul care este cel mai larg acceptat în echipele, organizația și industria dvs.

Puteți consulta versiunea video a acestui blog aici,

Știința datelor cu Harshit

Cu acest canal, intenționez să lansez câteva serie care acoperă întregul spațiu al științei datelor. Iată de ce ar trebui să vă abonați la canal:

  • Seria ar acoperi toate tutorialele de calitate cerute / solicitate pe fiecare dintre subiecte și subteme, cum ar fi Fundamentele Python pentru știința datelor.
  • Matematică explicată și derivări de ce facem ceea ce facem în ML și Deep Learning.
  • Podcast-uri cu oameni de știință și ingineri de date de la Google, Microsoft, Amazon etc. și CEO-uri ale companiilor mari bazate pe date.
  • Proiecte și instrucțiuni pentru a implementa subiectele învățate până acum.

Vă puteți conecta cu mine pe Stare de nervozitate, sau LinkedIn.