de Okoh Anita

Cum am analizat datele de închiriere DVD cu SQL

Cum am analizat datele de inchiriere DVD cu SQL

Introducere

Recent am finalizat câteva cursuri de formare în Data Foundation, facilitate de Școala de Științe a Datelor din Bertelsmann (în parteneriat cu Udacity). Pentru un proiect personal, am decis să analizez baza de date pentru o companie de închiriere DVD pe care o vom numi Închiriază un film. Să aruncăm o privire la un studiu de caz care detaliază procesul și rezultatul meu.

Set de date

Am început prin a arunca o privire la baza de date. Baza de date DvdRental are 15 mese. Mai jos sunt diferite tabele și o scurtă descriere a acestora.

  • actor – conține date despre actori, inclusiv numele și prenumele.
  • film – conține date despre filme precum titlul, anul lansării, lungimea, ratingul etc.
  • film_actor – conține relațiile dintre filme și actori.
  • categorie – conține date despre categoriile filmului.
  • film_category – conținând relațiile dintre filme și categorii.
  • magazin – conține datele magazinului, inclusiv personalul managerului și adresa.
  • inventar – stochează date de inventar.
  • închiriere – stochează date despre închiriere.
  • plata – stochează plățile clientului.
  • personal – stochează date despre personal.
  • client – stochează datele clientului.
  • adresa – stochează datele de adresă pentru personal și clienți
  • oraș – stochează numele orașelor.
  • țară – stochează numele țărilor.

Notă: Am analizat această bază de date folosind PostgreSQL. Puteți obține detalii despre instalarea PostgreSQL aici și descărcați baza de date pentru închirierea DVD-urilor aici.

Obiectiv și obiective

În acest proiect, voi viza să răspund la următoarele întrebări:

  1. Care sunt genurile de top și cele mai puțin închiriate (la cerere) și care sunt vânzările lor totale?
  2. Putem ști câți utilizatori distincti au închiriat fiecare gen?
  3. Care este rata medie de închiriere pentru fiecare gen? (de la cel mai mare la cel mai mic)
  4. Câte filme închiriate au fost returnate târziu, devreme și la timp?
  5. În ce țări există Închiriază un film au o prezență și care este baza de clienți din fiecare țară? Care sunt vânzările totale din fiecare țară? (de la cel mai mult la cel mai mic)
  6. Cine sunt primii 5 clienți pe totalul vânzărilor și putem obține detaliile lor pentru orice eventualitate Închiriază un film vrea să-i recompenseze?

Înainte de a începe cu analizele, am încercat mai întâi să înțeleg ERM (Entity Relationship Model) al acestei baze de date cunoscută și sub numele de Schema. Iată Schema de mai jos:

Cum am analizat datele de inchiriere DVD cu SQL
SCHEMA DE ÎNCHIRIERE DVD

Puteți vizualiza codul meu în profilul meu GitHub aici.

Analiză

Pentru a răspunde la prima întrebareCare sunt genurile de top și cele mai puțin închiriate (la cerere) și care sunt vânzările lor totale? ”, M-am identificat mai întâi cu tabele la care ar trebui să mă înscriu, care sunt:

Categorie> film_Categorie> film> inventar> închiriere> customer> plata

Mai jos este interogarea pe care am folosit-o pentru a răspunde la întrebare:

1611318006 579 Cum am analizat datele de inchiriere DVD cu SQL
1611318006 661 Cum am analizat datele de inchiriere DVD cu SQL

Perspective

Din tabelul de mai sus, putem trage 3 perspective importante:

  • Închiriază un film are 16 genuri disponibile
  • Categoria sportului pare să fie cel mai închiriat gen în ceea ce privește numărul de închirieri și are, de asemenea, cele mai mari vânzări totale în termeni de bani.
  • Categoria de muzică este cel mai puțin închiriat din punct de vedere al numărului de ori închiriat și are cele mai mici vânzări totale în termeni de bani

Întrebarea 2: Putem ști câți utilizatori distincti au închiriat fiecare gen? Pe scurt, da putem.

Tabelele de alăturat sunt după cum urmează:

Categorie> film_Categorie> film> inventar> rental> client

Mai jos este interogarea mea pentru această întrebare:

1611318006 135 Cum am analizat datele de inchiriere DVD cu SQL
1611318006 545 Cum am analizat datele de inchiriere DVD cu SQL

Perspective

Am vrut să știu câți clienți distincti au închiriat fiecare dintre genuri. Un lucru fascinant din interogare este că, deși genul muzical are cel mai mic record total închiriat, acesta nu are cel mai mic număr de clienți distincti care au închiriat genul. Genul de călătorie deține acest record.

Făcând un pas înapoi și conectând ideile derivate din întrebările 1 și 2, putem spune că genul călătoriei a fost reînchiriat de mai multe ori decât genul muzical.

Și, desigur, genul sportiv are cel mai mare număr de clienți distincti care au închiriat genul.

Întrebarea 3: Care este rata medie de închiriere pentru fiecare gen? (de la cel mai mare la cel mai mic)

Tabelele de alăturat sunt după cum urmează:

Categorie> film_Categorie>; film

Mai jos este interogarea mea pentru această întrebare:

1611318006 652 Cum am analizat datele de inchiriere DVD cu SQL
1611318006 576 Cum am analizat datele de inchiriere DVD cu SQL

Perspective

Am continuat să văd dacă de câte ori a fost închiriată o categorie are ceva de-a face cu rata medie de închiriere a fiecărui gen. Din tabelul de mai sus, putem concluziona cu ușurință că rata medie de închiriere poate să nu fie un factor.

Deși genul jocului are cea mai mică rată medie de închiriere, este unul dintre primele cinci genuri cele mai închiriate. În mod surprinzător, genul muzical nu este cel mai scump – Acțiunea este, chiar dacă genul de acțiune este unul dintre cele mai închiriate genuri.

Putem spune cu siguranță că majoritatea clienților sunt iubitori de filme legate de sport și sunt cel mai puțin interesați de filme muzicale.

Întrebarea 4: Câte filme închiriate au fost returnate târziu, devreme și la timp?

Tabelele de alăturat sunt după cum urmează:

film> inventar> închiriere

1611318006 289 Cum am analizat datele de inchiriere DVD cu SQL
1611318006 803 Cum am analizat datele de inchiriere DVD cu SQL

Perspective

Starea de returnare a filmelor este, fără îndoială, unul dintre cele mai importante aspecte de monitorizat într-o afacere de închiriere de DVD-uri. Din interogarea de mai sus, 48% din filme sunt returnate mai devreme decât data scadentă, în timp ce 41% din filme sunt returnate târziu și 11% sosesc la timp.

Ar putea exista o serie de factori pentru motivul pentru care acest lucru s-ar putea întâmpla, cum ar fi distanța de expediere a acestor filme de la magazine, care ar putea fi complet sub controlul clienților și așa mai departe. Ar trebui să ne adâncim în date pentru a obține esența problemei.

Cu toate acestea, este înțelept să observăm că un procent semnificativ de filme sunt returnate târziu. Introducerea unei taxe de penalizare pentru sosirea târzie ar putea fi o sursă suplimentară de venit și, la rândul său, poate descuraja returnarea târzie.

Dar o astfel de decizie poate avea sens numai dacă știm de ce apare problema.

Întrebarea 5: În ce țări este prezent Rent A Film și care este baza de clienți din fiecare țară? Care sunt vânzările totale din fiecare țară? (De la cel mai mult la cel mai mic)

Tabelele de alăturat sunt după cum urmează:

Țară> Oraș> Adresă> client > plata

Vedeți interogarea de mai jos:

1611318006 102 Cum am analizat datele de inchiriere DVD cu SQL
1611318006 469 Cum am analizat datele de inchiriere DVD cu SQL
1611318006 278 Cum am analizat datele de inchiriere DVD cu SQL
1611318006 532 Cum am analizat datele de inchiriere DVD cu SQL
1611318006 632 Cum am analizat datele de inchiriere DVD cu SQL
1611318006 209 Cum am analizat datele de inchiriere DVD cu SQL
1611318006 864 Cum am analizat datele de inchiriere DVD cu SQL
1611318006 410 Cum am analizat datele de inchiriere DVD cu SQL

Perspective

Închiriază un film are o prezență în 108 țări, India având cea mai mare bază de clienți de 60 de clienți și cele mai mari vânzări totale în termeni de bani. Afganistanul are cele mai mici vânzări totale în termeni de bani, chiar dacă nu este singura țară cu cea mai mică bază de clienți de 1 client

Întrebarea 6: Cine sunt primii 5 clienți pe vânzări totale și le putem obține detaliile doar în cazul în care Rent A Film vrea să-i recompenseze?

Tabelele de alăturat sunt după cum urmează:

Țară> Oraș> Adresă> client > plata

Vedeți interogarea de mai jos:

1611318007 927 Cum am analizat datele de inchiriere DVD cu SQL
1611318007 108 Cum am analizat datele de inchiriere DVD cu SQL

Perspective

Presupunând că dorim să recompensăm sau să trimitem cadouri fizice celor mai buni clienți, tabelul de mai sus arată numele complete, adresele, e-mailurile etc.

Aceste informații pot fi trimise echipei de marketing a companiei pentru a-și folosi cunoștințele de domeniu pentru a decide cum să le recompenseze.

Concluzie

În acest proiect, am analizat datele de la o companie de închiriere DVD pe care am decis să o apelăm „Rent A Film” pentru a găsi informații despre clienți și preferința acestora. Am obținut 3 concluzii majore:

  1. Compania are clienți iubitori de sport și ar fi recomandabil să stocheze mai multe filme legate de sport pentru a crește vânzările totale în comparație cu filmele legate de muzică. Ar fi o idee bună să creșteți rata medie de închiriere a filmelor de gen sport, deoarece nu este un factor major în închirierea pentru clienți. Acest lucru, la rândul său, crește veniturile totale. Cu toate acestea, este necesară o analiză suplimentară pentru a concluziona asupra acestui lucru.
  2. Există potențialul de a avea o sursă suplimentară de venituri printr-o taxă pentru returnările târzii ale filmului.
  3. Închiriază un film are o prezență în 108 țări, India fiind cea mai mare piață de oameni și venituri. În plus, 20% din țările în care au prezență contribuie la 80% din baza totală de clienți.

PS Ca mine, oricine poate învăța să fie analist de date și, dacă doriți să fiți informat despre următorul meu proiect sau despre actualizări despre învățarea mea, nu ezitați să vă înscrieți la buletin informativ