Vizualizácia dát patrí medzi najdôležitejšie zručnosti v dátovej vede a dátovej analytike. Práve ona dokáže premeniť veľké množstvo čísel a tabuliek na zrozumiteľný príbeh, ktorý je jednoduchšie pochopiť a interpretovať. Vďaka správne vytvoreným grafom dokážu aj ľudia bez technického alebo analytického pozadia rýchlo pochopiť, čo dáta v skutočnosti zobrazujú a súčasne, aké informácie z nich vyplývajú. Aj veľmi kvalitná analýza môže pôsobiť nepresvedčivo, ak je prezentovaná neprehľadne, chaoticky alebo dokonca zavádzajúco. Práve preto je pri začiatkoch dôležité pochopiť nielen to, ako grafy vytvárať, ale tiež aj akým najčastejším chybám sa pri vizualizácii dát vyhnúť.
Dobrý graf dokáže povedať oveľa viac než desiatky riadkov v tabuľke alebo dlhé textové vysvetlenia.
Príliš veľa informácií v jednom grafe
Jednou z najčastejších chýb pri vizualizácii dát je snaha zobraziť príliš veľa informácií v jednom grafe. Nebudem asi ďaleko od pravdy ak napíšem, že začiatočníci majú často pocit, že čím viac údajov do grafu pridajú, tým bude hodnotnejší. Výsledkom však bývajú neprehľadné vizualizácie plné farieb, kategórií, čiar alebo rôznych typov údajov, v ktorých sa dá rýchlo stratiť. Namiesto toho, aby graf pomáhal lepšie pochopiť dáta, začína pôsobiť chaoticky a jeho hlavná myšlienka sa vytráca.
Dobrý graf by mal mať vždy jasný cieľ a odpovedať ideálne na jednu konkrétnu otázku. Pritom jednoduchosť a prehľadnosť sú pri vizualizácii dát oveľa dôležitejšie než množstvo zobrazených informácií.

Zlý výber typu grafu
Niektorí používajú pri tvorbe vizualizácií typ grafu, ktorý dobre poznajú alebo ktorý sa im vizuálne páči, namiesto toho, aby zvolili vhodnejší graf pre konkrétny typ dát. Každý graf má pritom svoje využitie a funguje najlepšie v určitej situácii. Napríklad koláčové grafy môžu pôsobiť atraktívne, no sú vhodné najmä pri menšom počte kategórií. Na porovnávanie hodnôt je zase lepší stĺpcový graf a ak treba ukázať vývoj v čase, tak na to je dobré použiť čiarový graf.
Správny výber typu grafu je preto veľmi dôležitý, pretože aj kvalitné dáta môžu pôsobiť neprehľadne alebo chaoticky, ak sú zobrazené nevhodným spôsobom.

Zavádzajúce osi grafu
Na prvý pohľad môže graf pôsobiť úplne správne a profesionálne, no spôsob nastavenia osí dokáže výrazne ovplyvniť to, ako budú dáta vo výsledku prezentované. Jedným z častých problémov je situácia, keď os grafu nezačína od nuly. V takom prípade potom rozdiely medzi jednotlivými hodnotami budú vizuálne pôsobiť oveľa výraznejšie, než aké sú v skutočnosti a to môže ľahko viesť k nesprávnym alebo zavádzajúcim záverom.
Práve preto je veľmi dôležité pri každej vizualizácii skontrolovať, či nastavenie osí dáva zmysel a neskresľujú realitu dát.

Farby ako pomocník, nie nepriateľ
Farby zohrávajú pri vizualizácii dát veľmi dôležitú úlohu, pretože pomáhajú lepšie sa orientovať v grafe a zároveň dokážu zvýrazniť najdôležitejšie informácie. Problém však vzniká vtedy, keď sa použije príliš veľa rôznych farieb naraz. Výsledná vizualizácia potom môže pôsobiť chaoticky, neprehľadne a bude problém sa v nej orientovať.
Vo väčšine prípadov funguje najlepšie jednoduchý a konzistentný prístup. Často stačí použiť jednu hlavnú farbu pre väčšinu dát a jednu doplnkovú farbu na zvýraznenie najdôležitejších hodnôt alebo informácií, na ktoré chceme upriamiť pozornosť.

Graf bez vysvetlenia je len obrázok
Aj dobre vytvorený graf môže stratiť svoju hodnotu, ak mu chýba vysvetlenie. Bez potrebných informácií je vizualizácia často len súborom čísel, farieb a tvarov bez jasného významu. Jednou z častých chýb sa preto stáva, že graf neobsahuje názov, popis osí, jednotky alebo krátke vysvetlenie toho, čo vlastne zobrazuje.
Každý graf by mal jasne odpovedať na tieto základné otázky:
- čo graf zobrazuje
- aké obdobie alebo typ dát pokrýva
- aký je hlavný záver alebo najdôležitejšia informácia
Bez týchto informácií môže dôjsť k nesprávnemu pochopeniu dát.

Ešte doplním, že v praxi sa oveľa častejšie používajú jednoduché 2D grafy než 3D. Dôvod je jednoduchý a to, že sú prehľadnejšie, presnejšie a ľahšie na pochopenie.
Ignorovanie cieľovej skupiny
Pri vizualizácii dát je veľmi dôležité myslieť na to, kto bude výsledný graf čítať. Inak by mal vyzerať graf určený pre dátového analytika a inak pre manažéra alebo zákazníka bez technického vzdelania. Častou chybou preto býva tvorba príliš technických vizualizácií, ktoré síce môžu byť presné a detailné, no pre bežného človeka sú ťažko pochopiteľné.
Tu by som zdôraznil, že kvalitný graf by mal byť navrhnutý tak, aby bol pochopiteľný aj bez dodatočného vysvetľovania a aby jeho hlavná myšlienka bola jasná hneď na prvý pohľad.
Na záver si najčastejšie chyby spolu s ich riešeniami zhrňme do prehľadnej tabuľky, ktorá môže slúžiť ako rýchla pomôcka pri tvorbe grafov. Vďaka nej bude možné vytvárať vizualizácie, ktoré sú prehľadnejšie a zrozumiteľnejšie pri práci s dátami.
| Chyba | Prečo je problém | Lepšie riešenie |
| Príliš veľa dát v grafe | Neprehľadnosť | Jeden graf = jedna otázka |
| Zlý typ grafu | Nesprávna interpretácia | Prispôsobiť dátam |
| Zlá os | Skreslenie reality | Začínať od nuly (ak je to vhodné) |
| Príliš veľa farieb | Chaos | Minimalizmus |
| Bez kontextu | Nejasný význam | Popisy, titulok, jednotky |
Vizualizácia dát je silný nástroj, ale len vtedy, ak sa používa správne.
Najčastejšie chyby vznikajú zo snahy zobraziť príliš veľa informácií naraz, z nesprávneho výberu typu grafu alebo z ignorovania kontextu a cieľovej skupiny. Kvalitná vizualizácia pritom nemusí byť zložitá, pretože jej najväčšia sila spočíva práve v jednoduchosti, prehľadnosti a tiež schopnosti rýchlo a jasne vysvetliť hlavnú myšlienku dát.
Zaujal Vás článok?
Zvážte možnosť jeho zdieľania na sociálnych sieťach alebo sa podeľte o svoj názor a pripomienky k článku a to odoslaním správy na e-mailovú adresu info@dataspark.sk.
