Dáta

data

Dátová veda je odbor, ktorý sa neustále vyvíja a využíva pokročilé analytické nástroje k tomu, aby sa z veľkého množstva dát získali užitočné informácie, dôležité pre podporu rozhodovania. Dáta sú teda prirodzenou súčasťou tejto oblasti a preto sa dnes zameriam na popis toho, čo tento pojem znamená a prečo sú dáta tak dôležité.

Takže..

Čo sú dáta a ako vznikajú?

Dáta predstavujú základnú jednotku informácie.

Ich obsah pomáha lepšie porozumieť svetu okolo nás a tak súčasne zlepšiť naše rozhodovanie a zefektívniť procesy v mnohých oblastiach. Dáta možno získavať, spracovať a analyzovať za účelom dosiahnutia užitočných poznatkov, alebo iných hodnotných informácií.

Dáta môžu vzniknúť rôznymi spôsobmi a z rôznych zdrojov.

Niektoré z dát je možné získať z manuálneho (články, komentáre alebo zdieľanie ľubovoľného obsahu na sociálnych sieťach,..) spôsobu zaznamenania informácií, iné zase z automatizovaného procesu (senzory v zariadeniach, funkcie rôznych smart/chytrých zariadení,.. ), ktorý generuje dáta v reálnom čase.

 

Typy dát

Dáta možno rozdeliť na štruktúrované, neštruktúrované a kombinované.

1/ Štrukturované dáta

Sú to údaje, ktoré sú uložené v definovanej štruktúre a tá umožňuje jednoduché spracovanie, analýzu a vyhľadávanie. Príkladom takýchto dát môžu byť excelovské tabuľky alebo údaje v relačných databázach (dáta sú rozdelené do riadkov a stĺpcov), kde každý údaj má konkrétny formát a každý záznam je usporiadaný podľa vopred definovaných pravidiel.

Príklad:

  • evidencia dodávateľov a odberateľov
  • evidencia objednávok alebo inventúrnych údajov

2/ Neštrukturované dáta

V tomto prípade ide o údaje, ktoré nemajú vopred definovanú štruktúru a preto pri nich treba použiť pokročilé techniky spracovania (strojové učenie,..). Ide o dáta, ktoré nie sú organizované v tabuľkách alebo dátových poliach, ako je to pri štruktúrovaných dátach a preto sa pri nich spracovanie a analýza ťažšie realizuje s použitím štandardných databázových nástrojov.

Príklad:

  • textové dokumenty
  • fotografie
  • zvukové nahrávky

3/ Kombinované, resp. čiastočne štruktúrované dáta

Tento typ údajov poskytuje síce určité usporiadanie, ale môže obsahovať aj voľne štruktúrované alebo neštruktúrované časti. Možno ich teda popísať tak, že sa nachádzajú niekde medzi štruktúrovanými (napríklad údaje v relačných databázach) a neštruktúrovanými (napríklad obsah textového dokumentu) dátami.

Príklad:

  • XML (angl. Extensible Markup Language) formát súborov
  • JSON (angl. JavaScript Object Notation) formát súborov
data
Prečo sú dáta dôležité?

V súčasnosti sú dáta neoddeliteľnou súčasťou nášho života (aj keď určitú „váhu“ v rozhodovaní mali samozrejme aj v minulosti) a vďaka nim sa získavajú cenné poznatky. Výhody, ktoré nám dáta poskytujú, je možné uplatniť v mnohých oblastiach, ako je napríklad:

  • zdravotná starostlivosť (dáta o pacientoch a diagnózach na zlepšenie zdravotnej starostlivosti, nové liečebné postupy,..)
  • veda a výskum (dáta ako základ k novým objavom vo fyzike, biológii,..)
  • podnikanie (dáta o zákazníkoch,..)
  • verejný sektor (dáta pre analýzu stavu vzdelávania, ekonomiky,.. )

Podrobná analýza dát a ich správne využitie nám poskytuje objektívne informácie, ktoré umožnia výrazne lepšie možnosti v rozhodovaní, analýze trendov, v inovácii produktov a služieb, predpovedaní budúcich udalostí alebo k optimalizácii procesov.

A samozrejme, dáta sú dôležité aj pre osobné rozhodovanie každého jedného z nás.

 

Malé zhrnutie na záver.

V podstate všetko, čo v živote robíme, vytvára dáta v rôznych formách (napríklad čísla, text, zvuk, alebo obraz) a je nevyhnutné si uvedomiť, že s rastúcim objemom týchto dát, bude rásť aj ich význam pre našu budúcnosť.


Zaujal Vás článok? 

Zvážte možnosť jeho zdieľania na sociálnych sieťach alebo sa podeľte o svoj názor a pripomienky k článku a to odoslaním správy na e-mailovú adresu info@dataspark.sk.