Dnešný článok vychádza z bežnej praxe v dátovej vede a slúži ako odporúčanie pre začiatočníkov, ktorí si chcú vybudovať praktické portfólio a zvýšiť si tak šancu na získanie práce. Treba si uvedomiť, že tak ako každý projekt aj kariérna cesta môže vyzerať inak.
Prečo je portfólio dôležitejšie než certifikáty.
V dátovej vede platí jedno dôležité pravidlo a to, že projekty hovoria viac než životopis.
Firmy chcú vidieť, že viete:
- pracovať s dátami
- riešiť reálne problémy
- vysvetliť svoj postup
- prezentovať výsledky
Dobré portfólio môže v podstate rozhodnúť o tom, či bude uchádzač o zamestnanie pozvaný na pohovor aj bez predchádzajúcich pracovných skúseností.
Čo by teda malo obsahovať portfólio?
Ide v podstate o zbierku projektov, ktoré ukazujú technické zručnosti (Python, SQL,..), analytické myslenie, schopnosť vysvetľovať výsledky a prácu s reálnymi dátami. Portfólio má najčastejšie podobu osobného webu alebo blogu s prepojením na Linkedin profil, prípadne doplneného o GitHub repozitár (popis reálnych projektov vrátane zdrojového kódu).
Z pohľadu samotného obsahu portfólia by:
- nemala chýbať ukážka analýzy dátovej sady (načítanie dát, čistenie, vizualizácia,..)
- poukázať na realizované projekty s SQL (práca s databázou, agregácie, analytické dotazy)
- vývoj napríklad v jazyku Python (práca so súbormi, transformácie, grafy alebo export dát)
- schopnosť vysvetliť jednoduchý model strojového učenia (predikcia, klasifikácia, vysvetlenie výsledkov)
A čo by mal obsahovať dobrý projekt?
- popis problému
- zdroj dát
- použitý postup
- zdrojový kód
- výsledky
- záver a odporúčania
Príklad mini projektu:
Názov projektu: Analýza predaja e-shopu
Popis problému: Cieľom projektu je analyzovať predajný výkon e-shopu za vybrané obdobie
Dátový zdroj: CSV súbor s objednávkami (order_id, customer, product, price, date)
Použitý postup:
- načítanie dát (jazyk Python, knižnica Pandas)
- čistenie a transformácia dát
- vizualizácia predaja podľa produktov a zákazníkov
- výpočet mesačného obratu
Výsledky: Grafy predaja, identifikácia najpredávanejších produktov, odporúčania pre marketing
Z pohľadu počtu prezentovaných projektov v rámci portfólia, je dobré si uvedomiť, že kvalita je vždy dôležitejšia než kvantita (t.j. 3 až 5 kvalitne spracovaných projektov bude mať rozhodne vyššiu cenu, než 20 projektov rôznej kvality alebo z časti nedokončených).
Vyššie uvedené informácie sú presne to, čo hľadajú personalisti.
Budovanie portfólia je jednoducho proces, ktorý si vyžaduje čas, ale výsledky sa dostavia. Dobre spracované projekty, prehľadný GitHub a súčasne schopnosť vysvetliť vlastný postup výrazne zvýšia šance na uplatnenie v oblasti dátovej vedy. Treba teda začať s malými projektmi, postupne ich zlepšovať a vybudovať si tak portfólio s kvalitným obsahom.
Zaujal Vás článok?
Zvážte možnosť jeho zdieľania na sociálnych sieťach alebo sa podeľte o svoj názor a pripomienky k článku a to odoslaním správy na e-mailovú adresu info@dataspark.sk.
