Przejdź do głównej zawartości

Jak stworzyć swój pierwszy projekt analityczny? Praktyczny przewodnik dla początkujących




Tutoriale to nie wszystko

W internecie można znaleźć mnóstwo instruktaży, w których autor krok po kroku tłumaczy, jak stworzyć projekt – na przykład piękny dashboard. Wygląda to świetnie, czasem wykorzystuje zaawansowane funkcje Excela czy innych narzędzi do pracy z danymi. Łatwo wpaść w bezkrytyczny zachwyt, choć oczywiście nie chcę umniejszać autorom – to naprawdę kawał dobrej roboty. Do celów edukacyjnych sprawdzają się doskonale.

Sama wiele zyskałam, odwzorowując kilka takich projektów. Dzięki temu upewniłam się, że potrafię wykonać określone zadania – a potem zyskałam potwierdzenie, że zrobiłam je poprawnie, bo autor tutorialu zastosował dokładnie to samo podejście. Cieszy mnie fakt, że tych materiałów jest tak wiele, są dobrej jakości i bardzo rozbudowane.

Problem: projekt do portfolio

Kiedy jednak nadchodzi moment stworzenia własnego projektu, z którego chcielibyśmy być dumni – na przykład do opublikowania na GitHubie – same tutoriale mogą (choć nie muszą!) okazać się niewystarczające. Poświęciłam trochę czasu na zebranie informacji o tym, jak zrobić sensowny projekt, korzystając m.in. z YouTube’a. Okazało się, że niektóre materiały, które wcześniej oglądałam, nie do końca zgadzały się z profesjonalnym podejściem, które poznałam później.

Skąd wziąć dane?

Pierwsza istotna kwestia to zbiór danych. Tu zdania są podzielone. Jedni twierdzą, że można korzystać z danych dostępnych np. na Kaggle’u. Inni uważają, że to raczej opcja B. Idealna sytuacja to posiadanie własnych danych – ale jak je stworzyć?

Pomysł 1: domowy budżet

Najprostszy przykład: domowy budżet. Każdy ma wydatki i jest w stanie je spisać. Taki projekt pozwala nie tylko przećwiczyć analizę danych, ale też zyskać realne korzyści: lepszy wgląd w swoje finanse, potencjalne oszczędności czy wskazanie kategorii, w których przesadzamy z wydatkami (np. jedzenie na mieście).

Pomysł 2: dane z zegarków sportowych

Inna opcja to dane z zegarków sportowych, które rejestrują np. długość i jakość snu. Często można je pobrać jako plik CSV. Opracowując je, również osiągamy podwójną korzyść – trening analizy i lepsze zrozumienie własnego organizmu.

Pomysł 3: dane publiczne

Dobrym rozwiązaniem są także otwarte dane publikowane przez rządy lub organizacje non-profit. Temat ten zasługuje na osobny wpis, dlatego wrócę do niego w przyszłości.

Dane dopasowane do stanowiska

Specjaliści radzą, aby dane w projektach do portfolio były związane z branżą, w której chcemy pracować – np. medycyną, finansami itp. To zwiększa szanse, że projekt będzie interesujący dla rekruterów. Ja sama jeszcze nie tworzę portfolio – uczę się, przypominam zapomniane rzeczy i rozszerzam wiedzę o nowe obszary – ale warto mieć to na uwadze.

Uwaga: niektórych zbiorów danych lepiej unikać. Klasyczne zestawy jak Titanic Dataset czy Iris Dataset są zbyt popularne i przez to mało oryginalne.

Określenie zakresu projektu

Kolejnym kluczowym aspektem jest określenie zakresu projektu. Bez tego łatwo się „zaciąć” – paraliżuje nas nadmiar możliwości. Gdy nie wiemy, dokąd zmierzamy, trudno zrobić pierwszy krok.

Pomocne może być zadanie sobie pytania: jakie pytania mogliby zadać interesariusze, dysponując tymi danymi? Dzięki temu unikniemy zagubienia i utrzymamy koncentrację na celu analizy.

Wybór narzędzi

Ważny jest również wybór narzędzi. Czasem wystarczy jedno narzędzie (np. Excel), ale w projektach do portfolio warto pokazać różnorodność – np. połączyć Excel z Pythonem lub SQL-em. Oczywiście pierwsze projekty można zrealizować z użyciem tylko jednego narzędzia, ale w kolejnych warto je mieszać, by zademonstrować pełnię swoich umiejętności.

Dokumentacja projektu

Na koniec: dokumentacja. Stworzenie samego dashboardu to nie wszystko. Warto przygotować plik README.md, w którym opiszemy:

  • jakie dane wykorzystaliśmy i skąd je pobraliśmy,

  • jak przebiegała analiza,

  • jakie były jej etapy,

  • jakie napotkaliśmy ograniczenia i jakie mamy rekomendacje.

Taka dokumentacja pokazuje nasze myślenie analityczne i sprawia, że projekt wygląda profesjonalnie.

Podsumowanie

Każdy z tych tematów zasługuje na osobny, pogłębiony wpis. Ten tekst traktuję jako wprowadzenie – mini-przewodnik zarówno dla mnie samej, jak i dla tych, którzy dopiero zaczynają swoją przygodę z projektami analitycznymi. Czuję, że temat dopiero „zahaczyłam”, a w przyszłości z pewnością pojawi się tu więcej wpisów na ten temat.

Komentarze

Popularne posty z tego bloga

10+ najczęstszych błędów w analizie danych (i jak ich uniknąć przed certyfikatem DataCamp)

  Gdy życie krzyżuje plany  (i co z tego wynika) Jestem na etapie kończenia zaplanowanych powtórek. Wszystko idzie trochę wolniej, niż zakładałam, bo życie (ech, znowu ono) pokrzyżowało mi plany. Mam teraz coś znacznie ważniejszego, z czym muszę się zmierzyć, niż jakikolwiek certyfikat. W tym krótkim poście chciałabym pochylić się nad częstymi błędami, które zdarzają się osobom przygotowującym się do certyfikatu, do którego ja też podchodzę. Pisałam o nim tutaj →  Certyfikat DataCamp: Python Data Associate- jak się do niego przygotowuję? . Skąd wzięłam te błędy? Najpierw przedstawię błędy wymieniane przez autorów materiałów na DataCampie. Potem przejdę przez takie, które często pojawiają się w innych źródłach (np. tu: laboratorium-mozliwosci.pl , dataconversion.ie ). Później dorzucę coś od siebie - czyli błędy, które sama popełniłam. A na koniec to, co podpowiedział mi jeszcze ChatGPT (jako uzupełnienie listy). Z mojej perspektywy - osoby, która przygotowuje się do egza...

Excel od podstaw – jak skutecznie się go nauczyć? Mój sposób.

Obraz  Mango Matter  z  Pixabay Zaczynam od Excela     Zgodnie z wynikami analizy z poprzedniego wpisu, moja nauka zaczyna się od Excela.  Plan nauki zakładał pierwotnie opanowanie tego programu w takim stopniu żeby móc w nim swobodnie pracować. Tylko, że to stwierdzenie nic tak naprawdę nie znaczy.  Dlatego w tym poście staram się trochę usystematyzować, co uważam za znajomość Excela na poziomie zerowym, podstawowym, średnim i zaawansowanym. W tej całej nauce, którą tak planuję nie chcę dać się przytłoczyć mnogością materiałów. Nie chcę dać się ponieść perfekcjonizmowi. Postaram się mieć na uwadze, że nawet, jeśli wiemy dużo, to nie wszystko. Tak też będzie ze mną i Excelem. I to jest zupełnie ok.  Mój plan nauki      Postanowiłam wypunktować umiejętności, które można nabyć, a w miarę nauki zobaczę, ile z tej listy tak naprawdę powinnam zrealizować i na którym etapie poczuję się pewniej z tym programem. Jako, że uwielbiam cał...

SQL w 2 godziny dziennie - plan, motywacja, materiały

  Przyszedł czas na ustalenie nowych celów. Mój wybór padł na powtórki i rozszerzanie wiedzy z SQL. Opracowałam już prosty plan, którego zamierzam się trzymać, rozplanowałam sobie jaką część tego planu zamierzam wykonać w poszczególne dni. Jestem podekscytowana. Jak zawsze, gdy zaczynam coś nowego.  Małe sprostowanie: SQL nie jest dla mnie ZUPEŁNIE nowy, uczyłam się go już kiedyś, ale to było dawno i mam potrzebę go odświeżyć.  Dlaczego akurat SQL? Bo to narzędzie, które mimo upływu lat nie traci na aktualności. W świecie danych SQL wciąż jest podstawą  - niezależnie od tego, czy pracujesz w analizie danych, nauce o danych, czy w IT szerzej. Ja sama coraz częściej trafiam na sytuacje, w których jego znajomość bardzo by mi się przydała - przy analizie wyników, raportach, czy integracji danych z różnych źródeł. Poza tym lubię jego logiczność i strukturę - jest coś satysfakcjonującego w dobrze napisanym zapytaniu, które robi dokładnie to, co powinno. Czuję, że warto poś...