Ako na portfólio dátového vedca

portfolio data veda

Dnešný článok vychádza z bežnej praxe v dátovej vede a slúži ako odporúčanie pre začiatočníkov, ktorí si chcú vybudovať praktické portfólio a zvýšiť si tak šancu na získanie práce. Treba si uvedomiť, že tak ako každý projekt aj kariérna cesta môže vyzerať inak.

 
Prečo je portfólio dôležitejšie než certifikáty.

V dátovej vede platí jedno dôležité pravidlo a to, že projekty hovoria viac než životopis.

Firmy chcú vidieť, že viete:

  • pracovať s dátami
  • riešiť reálne problémy
  • vysvetliť svoj postup
  • prezentovať výsledky

Dobré portfólio môže v podstate rozhodnúť o tom, či bude uchádzač o zamestnanie pozvaný na pohovor aj bez predchádzajúcich pracovných skúseností.

 
Čo by teda malo obsahovať portfólio?

Ide v podstate o zbierku projektov, ktoré ukazujú technické zručnosti (Python, SQL,..), analytické myslenie, schopnosť vysvetľovať výsledky a prácu s reálnymi dátami. Portfólio má najčastejšie podobu osobného webu alebo blogu s prepojením na Linkedin profil, prípadne doplneného o GitHub repozitár (popis reálnych projektov vrátane zdrojového kódu).

Z pohľadu samotného obsahu portfólia by:

  • nemala chýbať ukážka analýzy dátovej sady (načítanie dát, čistenie, vizualizácia,..)
  • poukázať na realizované projekty s SQL (práca s databázou, agregácie, analytické dotazy)
  • vývoj napríklad v jazyku Python (práca so súbormi, transformácie, grafy alebo export dát)
  • schopnosť vysvetliť jednoduchý model strojového učenia (predikcia, klasifikácia, vysvetlenie výsledkov)

A čo by mal obsahovať dobrý projekt?

  • popis problému
  • zdroj dát
  • použitý postup
  • zdrojový kód
  • výsledky
  • záver a odporúčania

Príklad mini projektu:

Názov projektu: Analýza predaja e-shopu

Popis problému: Cieľom projektu je analyzovať predajný výkon e-shopu za vybrané obdobie

Dátový zdroj: CSV súbor s objednávkami (order_id, customer, product, price, date)

Použitý postup:

  • načítanie dát (jazyk Python, knižnica Pandas)
  • čistenie a transformácia dát
  • vizualizácia predaja podľa produktov a zákazníkov
  • výpočet mesačného obratu

Výsledky: Grafy predaja, identifikácia najpredávanejších produktov, odporúčania pre marketing

 

Z pohľadu počtu prezentovaných projektov v rámci portfólia, je dobré si uvedomiť, že kvalita je vždy dôležitejšia než kvantita (t.j. 3 až 5 kvalitne spracovaných projektov bude mať rozhodne vyššiu cenu, než 20 projektov rôznej kvality alebo z časti nedokončených).

Vyššie uvedené informácie sú presne to, čo hľadajú personalisti.

Budovanie portfólia je jednoducho proces, ktorý si vyžaduje čas, ale výsledky sa dostavia. Dobre spracované projekty, prehľadný GitHub a súčasne schopnosť vysvetliť vlastný postup výrazne zvýšia šance na uplatnenie v oblasti dátovej vedy. Treba teda začať s malými projektmi, postupne ich zlepšovať a vybudovať si tak portfólio s kvalitným obsahom.


Zaujal Vás článok?  

Zvážte možnosť jeho zdieľania na sociálnych sieťach alebo sa podeľte o svoj názor a pripomienky k článku a to odoslaním správy na e-mailovú adresu info@dataspark.sk.