Dáta

data

Dátová veda je odbor, ktorý sa neustále vyvíja a využíva pokročilé analytické nástroje k tomu, aby sa z veľkého množstva dát získali užitočné informácie, dôležité pre podporu rozhodovania. Dáta sú teda prirodzenou súčasťou tejto oblasti a preto sa dnes zameriam na popis toho, čo tento pojem znamená a prečo sú dáta tak dôležité.

Takže..

V tomto článku sa pozrieme na to, čo sú dáta, ako vznikajú, aké typy dát poznáme a prečo sú kľúčové pre rozhodovanie v obchode, vede aj v každodennom živote.

Čo sú dáta a ako vznikajú?

Dáta predstavujú základnú jednotku informácie a môžu mať podobu čísla, textu, obrazu, zvuku alebo iného zaznamenaného faktu o realite. Samotné dáta ešte nemusia mať význam, pretože ich význam získavajú až vtedy, keď sú spracované, analyzované a interpretované v konkrétnom kontexte.

Ich obsah pomáha lepšie porozumieť svetu okolo nás a tak súčasne zlepšiť naše rozhodovanie a zefektívniť procesy v mnohých oblastiach. Dáta možno získavať, spracovať a analyzovať za účelom dosiahnutia užitočných poznatkov, alebo iných hodnotných informácií.

Dáta môžu vzniknúť rôznymi spôsobmi:

  • manuálne – napríklad písanie článkov alebo blogových príspevkov, vyplňovanie formulárov, komentáre alebo zdieľanie ľubovoľného obsahu (texty, fotografie, videá) na sociálnych sieťach
  • automaticky – prostredníctvom senzorov (teplota, pohyb, vlhkosť, GPS poloha), smart zariadení, transakčných systémov (platby, nákupy, objednávky) alebo online aplikácií
  • systémovo – generované databázami, cez logy serverov a aplikácií, automaticky generované reporty alebo cez výstup z podnikového informačného systému

Dnes prakticky každá digitálna interakcia (kliknutie, nákup, vyhľadávanie alebo len pohyb mobilného zariadenia) vytvára nové údaje. Objem dát na svete rastie exponenciálne, čo vedie k vzniku pojmov ako veľlé dáta (angl. Big Data) a k potrebe pokročilých analytických technológií.

 
Typy dát

Dáta možno podľa ich štruktúry rozdeliť na tri základné kategórie.

1/ Štrukturované dáta

Ide o údaje, ktoré sú uložené v presne definovanej štruktúre. Výhodou štruktúrovaných dát je jednoduché vyhľadávanie, filtrovanie a analýza cez databázové nástroje. Príkladom takýchto dát môžu byť excelovské tabuľky alebo údaje v relačných databázach (dáta sú rozdelené do riadkov a stĺpcov), kde každý údaj má konkrétny formát a každý záznam je usporiadaný podľa vopred definovaných pravidiel.

Typickým príkladom sú:

  • evidencia dodávateľov a odberateľov
  • objednávky a inventúrne údaje
  • relačné databázy využívajúce jazyk SQL

Praktický význam:

Štruktúrované dáta sú základom reportingu, finančných analýz a podnikových informačných systémov.

2/ Neštrukturované dáta

V tomto prípade ide o údaje, ktoré nemajú pevne definovanú štruktúru a preto pri nich treba použiť pokročilé techniky spracovania (strojové učenie,..). Ide o dáta, ktoré nie sú organizované v tabuľkách alebo dátových poliach, ako je to pri štruktúrovaných dátach a preto sa pri nich spracovanie a analýza ťažšie realizuje s použitím štandardných databázových nástrojov.

Typickým príkladom sú:

  • textové dokumenty
  • e-maily
  • fotografie
  • video záznamy a zvukové nahrávky
  • príspevky na sociálnych sieťach

Praktický význam:

Neštruktúrované dáta umožňujú analyzovať emócie zákazníkov, obrazový obsah alebo hlasové záznamy.

3/ Kombinované, resp. čiastočne štruktúrované dáta

Tento typ údajov obsahuje určitú organizačnú štruktúru, no zároveň môže zahŕňať voľné štruktúrované alebo neštruktúrované časti. Možno ich teda popísať tak, že sa nachádzajú niekde medzi štruktúrovanými (napríklad údaje v relačných databázach) a neštruktúrovanými (napríklad obsah textového dokumentu) dátami.

Typickým príkladom sú:

  • XML (angl. Extensible Markup Language) formát súborov
  • JSON (angl. JavaScript Object Notation) formát súborov
  • log súbory internetových serverov

Praktický význam:

Umožňujú flexibilitu pri prenose dát medzi rôznymi platformami (systém, aplikácia) a službami.

data
Prečo sú dáta dôležité?

Dáta sú dnes neoddeliteľnou súčasťou nášho života (aj keď určitú „váhu“ v rozhodovaní mali samozrejme aj v minulosti) a vďaka nim sa získavajú cenné poznatky. Pomáhajú firmám, vedcom aj jednotlivcom robiť lepšie rozhodnutia na základe faktov, nie len intuície.

Využitie dát možno nájsť napríklad v oblastiach:

  • zdravotná starostlivosť (dáta o pacientoch a diagnózach na zlepšenie zdravotnej starostlivosti, nové liečebné postupy,..)
  • veda a výskum (dáta ako základ k novým objavom vo fyzike, biológii,..)
  • podnikanie (dáta o zákazníkoch,..)
  • verejný sektor (plánovanie rozpočtu, dáta pre analýzu stavu vzdelávania, ekonomiky,.. )

Správne spracované dáta umožňujú identifikovať trendy, predpovedať budúci vývoj, optimalizovať procesy, znižovať riziká a inovovať produkty a služby. Dôležité však nie je len množstvo dát, ale ich kvalita, presnosť a správna interpretácia.

Súčasne treba doplniť, že dáta neovplyvňujú len firmy a inštitúcie. Každý z nás sa s nimi stretáva denne, napríklad pri sledovaní výdavkov, hodnotení športových výkonov, používaní navigácie alebo výbere produktov na základe recenzií.

 

Malé zhrnutie na záver.

Takmer všetko, čo v živote robíme, vytvára dáta v rôznych formách (napríklad čísla, text, zvuk, alebo obraz) a je nevyhnutné si uvedomiť, že s rastúcim objemom týchto dát, bude rásť aj ich význam pre našu budúcnosť. Budúcnosť patrí tým, ktorí dokážu dáta nielen zbierať, ale ich aj správne interpretovať a následne využívať. Práve preto sú dáta základným pilierom dátovej vedy a moderného rozhodovania.

Schopnosť porozumieť dátam sa preto stáva dôležitou zručnosťou 21. storočia.


Zaujal Vás článok? 

Zvážte možnosť jeho zdieľania na sociálnych sieťach alebo sa podeľte o svoj názor a pripomienky k článku a to odoslaním správy na e-mailovú adresu info@dataspark.sk.