Tutoriale to nie wszystko
W internecie można znaleźć mnóstwo instruktaży, w których autor krok po kroku tłumaczy, jak stworzyć projekt – na przykład piękny dashboard. Wygląda to świetnie, czasem wykorzystuje zaawansowane funkcje Excela czy innych narzędzi do pracy z danymi. Łatwo wpaść w bezkrytyczny zachwyt, choć oczywiście nie chcę umniejszać autorom – to naprawdę kawał dobrej roboty. Do celów edukacyjnych sprawdzają się doskonale.
Sama wiele zyskałam, odwzorowując kilka takich projektów. Dzięki temu upewniłam się, że potrafię wykonać określone zadania – a potem zyskałam potwierdzenie, że zrobiłam je poprawnie, bo autor tutorialu zastosował dokładnie to samo podejście. Cieszy mnie fakt, że tych materiałów jest tak wiele, są dobrej jakości i bardzo rozbudowane.
Problem: projekt do portfolio
Kiedy jednak nadchodzi moment stworzenia własnego projektu, z którego chcielibyśmy być dumni – na przykład do opublikowania na GitHubie – same tutoriale mogą (choć nie muszą!) okazać się niewystarczające. Poświęciłam trochę czasu na zebranie informacji o tym, jak zrobić sensowny projekt, korzystając m.in. z YouTube’a. Okazało się, że niektóre materiały, które wcześniej oglądałam, nie do końca zgadzały się z profesjonalnym podejściem, które poznałam później.
Skąd wziąć dane?
Pierwsza istotna kwestia to zbiór danych. Tu zdania są podzielone. Jedni twierdzą, że można korzystać z danych dostępnych np. na Kaggle’u. Inni uważają, że to raczej opcja B. Idealna sytuacja to posiadanie własnych danych – ale jak je stworzyć?
Pomysł 1: domowy budżet
Najprostszy przykład: domowy budżet. Każdy ma wydatki i jest w stanie je spisać. Taki projekt pozwala nie tylko przećwiczyć analizę danych, ale też zyskać realne korzyści: lepszy wgląd w swoje finanse, potencjalne oszczędności czy wskazanie kategorii, w których przesadzamy z wydatkami (np. jedzenie na mieście).
Pomysł 2: dane z zegarków sportowych
Inna opcja to dane z zegarków sportowych, które rejestrują np. długość i jakość snu. Często można je pobrać jako plik CSV. Opracowując je, również osiągamy podwójną korzyść – trening analizy i lepsze zrozumienie własnego organizmu.
Pomysł 3: dane publiczne
Dobrym rozwiązaniem są także otwarte dane publikowane przez rządy lub organizacje non-profit. Temat ten zasługuje na osobny wpis, dlatego wrócę do niego w przyszłości.
Dane dopasowane do stanowiska
Specjaliści radzą, aby dane w projektach do portfolio były związane z branżą, w której chcemy pracować – np. medycyną, finansami itp. To zwiększa szanse, że projekt będzie interesujący dla rekruterów. Ja sama jeszcze nie tworzę portfolio – uczę się, przypominam zapomniane rzeczy i rozszerzam wiedzę o nowe obszary – ale warto mieć to na uwadze.
Uwaga: niektórych zbiorów danych lepiej unikać. Klasyczne zestawy jak Titanic Dataset czy Iris Dataset są zbyt popularne i przez to mało oryginalne.
Określenie zakresu projektu
Kolejnym kluczowym aspektem jest określenie zakresu projektu. Bez tego łatwo się „zaciąć” – paraliżuje nas nadmiar możliwości. Gdy nie wiemy, dokąd zmierzamy, trudno zrobić pierwszy krok.
Pomocne może być zadanie sobie pytania: jakie pytania mogliby zadać interesariusze, dysponując tymi danymi? Dzięki temu unikniemy zagubienia i utrzymamy koncentrację na celu analizy.
Wybór narzędzi
Ważny jest również wybór narzędzi. Czasem wystarczy jedno narzędzie (np. Excel), ale w projektach do portfolio warto pokazać różnorodność – np. połączyć Excel z Pythonem lub SQL-em. Oczywiście pierwsze projekty można zrealizować z użyciem tylko jednego narzędzia, ale w kolejnych warto je mieszać, by zademonstrować pełnię swoich umiejętności.
Dokumentacja projektu
Na koniec: dokumentacja. Stworzenie samego dashboardu to nie wszystko. Warto przygotować plik README.md, w którym opiszemy:
-
jakie dane wykorzystaliśmy i skąd je pobraliśmy,
-
jak przebiegała analiza,
-
jakie były jej etapy,
-
jakie napotkaliśmy ograniczenia i jakie mamy rekomendacje.
Taka dokumentacja pokazuje nasze myślenie analityczne i sprawia, że projekt wygląda profesjonalnie.
Podsumowanie
Każdy z tych tematów zasługuje na osobny, pogłębiony wpis. Ten tekst traktuję jako wprowadzenie – mini-przewodnik zarówno dla mnie samej, jak i dla tych, którzy dopiero zaczynają swoją przygodę z projektami analitycznymi. Czuję, że temat dopiero „zahaczyłam”, a w przyszłości z pewnością pojawi się tu więcej wpisów na ten temat.

Komentarze
Prześlij komentarz