Cu o multitudine de instrumente de vizualizare disponibile, este greu de găsit unul potrivit pentru datele MongoDB, care are funcționalitate out-of-the-box.

Astăzi, vreau să vă povestesc despre experiența mea în explorarea unor astfel de instrumente de vizualizare.

Scopul meu a fost să analizez un set de date dintr-o bază de date MongoDB. Am vrut să elaborez un flux de lucru pentru analiza datelor care combină analiza gestionării bazelor de date, agregarea datelor și vizualizarea datelor.

Iată instrumentele pe care le-am ales:

  • Busolă este o aplicație GUI pentru analiza aprofundată și vizualizarea datelor MongoDB și a schemei unei colecții. Oferă o vizualizare în timp real a datelor dvs. Interfața intuitivă m-a ajutat să mă concentrez asupra semnificației datelor.
  • Masă pivot Flexmonster este un instrument de raportare și analiză web avansată. În timp ce Compass este o aplicație autonomă, am descoperit că Flexmonster este integrat direct în proiectul web. Am reușit să-l încorporez în aplicația mea Angular 4 și l-am folosit pentru analiza datelor.

Prima parte a procesului de vizualizare este de a configura o conexiune la o bază de date MongoDB cu Compass. Apoi, puteți explora ce funcționalități oferă Compass și ce analiză puteți efectua folosind acest instrument.

A doua parte este dedicată analizei ulterioare a datelor MongoDB. Vom încărca date într-un tabel pivot și vom explora posibilitățile oferite de acesta.

Ca sursă de date pentru cercetarea mea, Am ales o set de date despre 120 de ani de istorie olimpică și rezultate.

Acest set de date are o structură tipică JSON care este diferită de formatul cerut de MongoDB. Pentru a importa acest lucru în MongoDB, am executat următoarea comandă în CLI:

mongoimport - db <db-name> - collection athletes - type json - file athletes.json
 - jsonArray

Înțelegerea datelor cu busolă

La început, voi menționa câteva caracteristici de gestionare a bazelor de date.

Busola este capabilă să genereze histograme pentru a reprezenta frecvența datelor. Acest lucru m-a ajutat să analizez prezența documentelor, tipurile de date și distribuția valorilor pentru câmpuri specifice din colecție.

În primul rând, m-am conectat la instanța MongoDB care rulează pe localhost folosind aplicația Compass.

Pe pagina principală a colecției „sportivi”, am verificat informațiile despre colecție, am editat datele într-un mod interactiv și am încercat interogări simple și complexe.

Un instrument de vizualizare a schemelor m-a ajutat să-mi înțeleg datele.

Instrumente puternice pentru vizualizarea datelor MongoDB

Aici am verificat statisticile privind tipurile de date ale câmpurilor: procentul tipurilor de date utilizate pentru acest câmp în toate documentele din colecție.

Am identificat că am tipuri de date mixte pentru unele câmpuri. În exemplul meu, am un tip numeric pentru „Înălțime” în 80% din documente, dar un tip de șir apare în 20% din cazuri.

1612000746 244 Instrumente puternice pentru vizualizarea datelor MongoDB

Pentru mine, asta însemna că există un decalaj în setul meu de date. Înălțimea este stocată diferit între sportivi.

Agregare cu busolă

Ce caracteristici fac MongoDB și Compass atât de populare în rândul analiștilor de date care lucrează adesea cu date semi-structurate și nestructurate?

MongoDB este util pentru analize în timp real, deoarece acceptă conducte de agregare. Acestea pot include operații de sortare și filtrare și gruparea datelor.

În timp ce Compass acceptă crearea de interogări în timp real pentru agregare.

Pentru a mă concentra pe porțiuni specifice ale datelor, am filtrat documentele după câmpul „Vârstă”.

Pentru a le arăta doar acelor sportivi cu vârsta sub 22 de ani, am selectat zona necesară pe histogramă pentru a construi o interogare pe câmpul „Vârstă”. Ca urmare, documentele potrivite au fost returnate.

1612000746 427 Instrumente puternice pentru vizualizarea datelor MongoDB

În același mod, am filtrat după gama de valori. Apoi am sortat datele după „Vârstă” în ordine crescătoare:

1612000746 470 Instrumente puternice pentru vizualizarea datelor MongoDB

Dar pentru a construi etape în conducta de agregare și a grupa datele, am avut nevoie să-mi folosesc cunoștințele despre limbajul de interogare MongoDB. A fost mai ușor de făcut în tabelul pivot.

Analiza datelor cu tabelul pivot Flexmonster

În proiectele mele web, folosesc Angular. Deci, am urmat un Tutorial unghiular pentru a încorpora tabelul pivot. Pentru a obține datele din baza de date pe care am folosit-o acest tutorial.

M-am conectat la MongoDB din aplicația mea și am recuperat datele despre sportivi. Datele au fost comprimate și apoi trecute la tabelul pivot pentru vizualizare.

După ce am încărcat eșantionul de date despre sportivi în tabelul pivot, am vrut să analizez vârsta minimă și maximă dintre sportivi. În plus, am vrut să definesc cele mai bune echipe din istorie pe baza cantității lor totale de medalii.

Pentru a începe analiza datelor, am selectat câmpuri pentru coloane și rânduri.

Pentru a lucra cu câmpul „Medalie”, l-am selectat pe măsuri și am obținut următoarele rezultate:

  1. Filtrarea înregistrărilor după valoare pentru a afișa primele 5 echipe cu cea mai mare cantitate de medalii
  2. Am aplicat formatarea condiționată pentru raportul meu pentru a evidenția echipele care au mai mult de 185 de medalii.
1612000747 645 Instrumente puternice pentru vizualizarea datelor MongoDB

3. Apoi, am selectat „Vârstă” și am analizat vârsta maximă dintre sportivi:

1612000747 484 Instrumente puternice pentru vizualizarea datelor MongoDB

4. Apoi am trecut la diagramele pivot și am analizat datele într-un mod mai vizual pentru a afla despre cele mai bune echipe din sezonul estival:

1612000748 261 Instrumente puternice pentru vizualizarea datelor MongoDB

Concluzie

Așadar, astăzi am împărtășit experiența mea în utilizarea Compass și a tabelului pivot Flexmonster. În opinia mea, ambele instrumente sunt capabile să ajute la realizarea unei povești vizuale creative și să analizeze datele într-un mod inteligent.

Sper că ați găsit utilă citirea despre experiența mea și acum sunteți pe drumul cel bun spre o analiză de succes a datelor MongoDB.

Voi fi bucuros să aud orice feedback cu privire la această prezentare generală. Vă rog, dați-vă părerea în comentarii. Pentru ce instrumente Vizualizare date MongoDB ai putea recomanda? Se ocupă și procesează bine datele dvs.?