Dáta

data

Dátová veda je odbor, ktorý sa neustále vyvíja a využíva pokročilé analytické nástroje k tomu, aby sa z veľkého množstva dát získali užitočné informácie, dôležité pre podporu rozhodovania. Oblasť dátovej vedy je teda prirodzene spojená s pojmom „dáta“ a preto sa dnes zameriam na popis toho, čo tento pojem znamená a prečo sú dáta tak dôležité.

Takže..

Dáta môžeme považovať za základnú jednotku informácie, ich obsah pomáha lepšie porozumieť svetu okolo nás a tak súčasne zlepšiť naše rozhodovanie a zefektívniť procesy v mnohých oblastiach. Dáta možno získavať, spracovať a následne analyzovať za účelom dosiahnutia užitočných poznatkov, alebo iných hodnotných informácií.

A teraz ako dáta vznikajú.

Niektoré z nich je možné získať z manuálneho (články, komentáre alebo zdieľanie ľubovoľného obsahu na sociálnych sieťach,..) spôsobu zaznamenania informácií, iné zase z automatizovaného procesu (senzory v zariadeniach, funkcie rôznych smart/chytrých zariadení,.. ), ktorý generuje dáta v reálnom čase.

A teraz niečo k typom dát.

Dáta možno rozdeliť na štruktúrované, neštruktúrované a kombinované.

Štruktúrované dáta

Sú to údaje, ktoré sú uložené v definovanej štruktúre a tá umožňuje jednoduché spracovanie, analýzu a vyhľadávanie. Príkladom takýchto dát môžu byť excelovské tabuľky alebo údaje v relačných databázach (dáta sú rozdelené do riadkov a stĺpcov), kde každý údaj má konkrétny formát a každý záznam je usporiadaný podľa vopred definovaných pravidiel.

Napríklad je to evidencia dodávateľov, odberateľov, objednávok alebo inventúrnych údajov.

Neštruktúrované dáta

V tomto prípade ide o údaje, ktoré nemajú vopred definovanú štruktúru a preto pri nich treba použiť pokročilé techniky spracovania (strojové učenie,..). Ide o dáta, ktoré nie sú organizované v tabuľkách alebo dátových poliach, ako je to pri štruktúrovaných dátach a preto sa pri nich spracovanie a analýza ťažšie realizuje s použitím štandardných databázových nástrojov.

Napríklad ide o textové dokumenty, fotografie, alebo zvukové nahrávky.

Kombinované, resp. čiastočne štruktúrované dáta

Tento typ údajov poskytuje síce určité usporiadanie, ale môže obsahovať aj voľne štruktúrované alebo neštruktúrované časti. Možno ich teda popísať tak, že sa nachádzajú niekde medzi štruktúrovanými (napríklad údaje v relačných databázach) a neštruktúrovanými (napríklad obsah textového dokumentu) dátami.

Napríklad sú to XML (angl. Extensible Markup Language) alebo JSON (angl. JavaScript Object Notation) formáty súborov.

 

Nakoniec som si ponechal oblasť dôležitosti dát.

V súčasnosti sú dáta neoddeliteľnou súčasťou nášho života (aj keď určitú „váhu“ v rozhodovaní mali samozrejme aj v minulosti) a vďaka nim sa získavajú cenné poznatky. Výhody, ktoré nám dáta poskytujú je možné uplatniť v mnohých oblastiach, ako je zdravotná starostlivosť (dáta o pacientoch a diagnózach na zlepšenie zdravotnej starostlivosti, nové liečebné postupy,..), veda a výskum (dáta ako základ k novým objavom vo fyzike, biológii,..), podnikanie (dáta o zákazníkoch,..) alebo verejný sektor (dáta pre analýzu stavu vzdelávania, ekonomiky,.. ).

Podrobná analýza dát a ich správne využitie nám poskytuje objektívne informácie, ktoré umožnia výrazne lepšie možnosti v rozhodovaní, analýze trendov, v inovácii produktov a služieb, predpovedaní budúcich udalostí alebo k optimalizácii procesov.

A samozrejme, dáta sú dôležité aj pre osobné rozhodovanie každého jedného z nás.

Malé zhrnutie na záver.

V podstate všetko, čo v živote robíme, vytvára dáta v rôznych formách (napríklad čísla, text, zvuk, alebo obraz) a je nevyhnutné si uvedomiť, že s rastúcim objemom týchto dát, bude rásť aj ich význam pre našu budúcnosť.


Zaujal Vás článok? 

Zvážte možnosť jeho zdieľania na sociálnych sieťach alebo sa podeľte o svoj názor a pripomienky k článku a to odoslaním správy na e-mailovú adresu info@dataspark.sk.