Dáta

data

Dátová veda je odbor, ktorý sa neustále vyvíja a využíva pokročilé analytické a štatistické nástroje k tomu, aby sa z veľkého množstva dát získali užitočné informácie, dôležité pre podporu rozhodovania. Dáta sú teda prirodzenou súčasťou tejto oblasti a preto sa dnes zameriam na popis toho, čo tento pojem znamená a prečo sú dáta tak dôležité.

Takže..

V tomto článku sa pozrieme na to, čo sú dáta, spôsoby ich vzniku, ktoré typy dát poznáme a prečo sú kľúčové pre rozhodovanie v obchode, vede aj v každodennom živote.

Čo sú dáta a ako vznikajú?

Dáta predstavujú základnú jednotku informácie a môžu mať podobu čísla, textu, obrazu, zvuku alebo iného zaznamenaného faktu o realite. Samotné dáta ešte nemusia mať význam, pretože ich význam získavajú až vtedy, keď sú spracované, analyzované a interpretované v konkrétnom kontexte.

Ich obsah pomáha lepšie porozumieť svetu okolo nás a tak súčasne zlepšiť naše rozhodovanie a zefektívniť procesy v mnohých oblastiach. Dáta možno získavať, spracovať a analyzovať za účelom dosiahnutia užitočných poznatkov, alebo iných hodnotných informácií.

Dáta môžu vzniknúť rôznymi spôsobmi:

  • manuálne – napríklad písaním článkov alebo blogových príspevkov, vyplňovaním formulárov, pridávaním komentárov alebo zdieľaním obsahu (texty, fotografie, videá) na sociálnych sieťach
  • automaticky – prostredníctvom senzorov (teplota, pohyb, vlhkosť, GPS poloha), inteligentných zariadení, transakčných systémov (platby, nákupy, objednávky) alebo online aplikácií, ktoré kontinuálne zaznamenávajú údaje
  • systémovo – generované databázami a softvérovými systémami, napríklad z logov serverov a aplikácií, automaticky generovaných reportov alebo výstupov z podnikového informačného systému

Dnes prakticky každá digitálna interakcia (kliknutie, nákup, vyhľadávanie alebo len pohyb mobilného zariadenia) vytvára nové údaje. Objem dát na svete rastie exponenciálne, čo vedie k vzniku pojmov ako veľlé dáta (angl. Big Data) a k potrebe pokročilých analytických technológií.

 
Typy dát

Dáta možno podľa ich štruktúry rozdeliť na tri základné kategórie.

1/ Štrukturované dáta

Ide o údaje, ktoré sú uložené v presne definovanej štruktúre. Výhodou štruktúrovaných dát je jednoduché vyhľadávanie, filtrovanie a analýza cez databázové nástroje. Príkladom takýchto dát môžu byť excelovské tabuľky alebo údaje v relačných databázach (dáta sú rozdelené do riadkov a stĺpcov), kde každý údaj má konkrétny formát a každý záznam je usporiadaný podľa vopred definovaných pravidiel.

Typickým príkladom sú:

  • evidencia dodávateľov, odberateľov, objednávok alebo inventárnych položiek
  • excel tabuľky alebo CSV súbory so stĺpcami a riadkami, kde každý údaj má presne stanovený typ
  • relačné databázy využívajúce jazyk SQL, kde sú záznamy logicky usporiadané

Praktický význam:

Výhodou štrukturovaných dát je ich kompatibilita s analytickými nástrojmi, automatizovaná kontrola integrity a jednoduchá integrácia do ďalších systémov.

2/ Neštrukturované dáta

V tomto prípade ide o údaje, ktoré nemajú pevne definovanú štruktúru a preto pri nich treba použiť pokročilé techniky spracovania (strojové učenie,..). Ide o dáta, ktoré nie sú organizované v tabuľkách alebo dátových poliach, ako je to pri štruktúrovaných dátach a preto sa pri nich spracovanie a analýza ťažšie realizuje s použitím štandardných databázových nástrojov.

Typickým príkladom sú:

  • textové dokumenty
  • e-maily
  • fotografie
  • video záznamy a zvukové nahrávky
  • príspevky a komentáre na sociálnych sieťach

Praktický význam:

Neštruktúrované dáta umožňujú získavať poznatky z kvalitatívneho obsahu, napríklad sledovať sentiment zákazníkov, identifikovať obrazové vzory, spracovať hlasové nahrávky alebo analyzovať interakcie na sociálnych sieťach.

3/ Kombinované, resp. čiastočne štruktúrované dáta

Tento typ údajov obsahuje určitú organizačnú štruktúru, no zároveň môže zahŕňať voľné štruktúrované alebo neštruktúrované časti. Možno ich teda popísať tak, že sa nachádzajú niekde medzi štruktúrovanými (napríklad údaje v relačných databázach) a neštruktúrovanými (napríklad obsah textového dokumentu) dátami.

Typickým príkladom sú:

  • súbory vo formáte XML (angl. Extensible Markup Language)
  • súbory vo formáte JSON (angl. JavaScript Object Notation)
  • log súbory webových serverov alebo programov

Praktický význam:

Umožňujú flexibilnú výmenu informácií medzi rôznymi platformami (systém, program) a službami. Sú kľúčové pre integráciu dát z rôznych zdrojov, prenos dát cez API, tvorbu reportov a moderné analytické programy, kde je potrebné kombinovať štruktúrované a neštrukturované informácie.

data
Prečo sú dáta dôležité?

Dáta sú dnes neoddeliteľnou súčasťou našej každodennej reality (aj keď určitú „váhu“ v rozhodovaní mali samozrejme aj v minulosti) a rozhodovacích procesov vo firmách, vede samozrejme aj vo verejnom sektore. Umožňujú získavať cenné poznatky, podporovať rozhodnutia založené na faktoch a minimalizovať závislosť na intuícii alebo odhadoch.

Využitie dát možno nájsť napríklad v oblastiach:

  • zdravotná starostlivosť – dáta o pacientoch, diagnózach a liečebných postupoch umožňujú optimalizovať starostlivosť a vyvíjať nové liečebné metódy
  • veda a výskum – dáta tvoria základ pre objavy vo fyzike, biológii, chemických aj sociálnych vedách
  • podnikanie a marketing – analýza zákazníckych dát, správanie používateľov a trhové trendy podporujú
  • verejný sektor – dáta sa využívajú pri plánovaní rozpočtov, vyhodnocovaní vzdelávacích systémov, ekonomických ukazovateľov a optimalizácii verejných služieb

Správne spracované dáta umožňujú identifikovať trendy, predpovedať budúci vývoj, optimalizovať procesy, znižovať riziká a podporovať inováciu produktov alebo služieb. Dôležité však nie je len množstvo dát, ale predovšetkým ich kvalita, presnosť a správna interpretácia.

Súčasne treba doplniť, že dáta neovplyvňujú len firmy a inštitúcie. Každý z nás sa s nimi stretáva denne, napríklad pri sledovaní osobných výdavkov, hodnotení športových výkonov, používaní navigácie alebo výbere produktov v obchode na základe recenzií.

 

Malé zhrnutie na záver.

Takmer všetko, čo v živote robíme, vytvára dáta v rôznych formách (napríklad čísla, text, zvuk, alebo obraz) a je nevyhnutné si uvedomiť, že s rastúcim objemom týchto dát, bude rásť aj ich význam pre našu budúcnosť. Budúcnosť patrí tým, ktorí dokážu dáta nielen zbierať, ale ich aj správne interpretovať a následne využívať. Práve preto sú dáta základným pilierom dátovej vedy a moderného rozhodovania.

Schopnosť porozumieť dátam sa preto stáva dôležitou zručnosťou 21. storočia.


Zaujal Vás článok? 

Zvážte možnosť jeho zdieľania na sociálnych sieťach alebo sa podeľte o svoj názor a pripomienky k článku a to odoslaním správy na e-mailovú adresu info@dataspark.sk.