Dnes sa budem venovať téme, ktorá nadväzuje na predchádzajúci článok a doplním informácie k pojmu „Veľké dáta“, ktorý je v súčasnosti veľmi populárny. Ide o pojem, s ktorým sa dnes stretávame čoraz častejšie, najmä v súvislosti s digitálnymi technológiami, internetom a dátovou vedou.
Čo sú veľké dáta (angl. Big Data)?
Označujú sa nimi obrovské množstvá dát (extrémne veľké a zložité dátové súbory), ktoré sú generované denne v reálnom čase, alebo v rôznych časových intervaloch. Tieto dáta môžu byť pritom štruktúrované, neštruktúrované alebo kombinované (t.j. ide o kombináciu prvých dvoch uvedených typov) a sú získané z veľkého počtu rôznych zdrojov.
Množstvo, komplexnosť a rýchlosť získavania týchto dát znemožňuje efektívne spracovanie s použitím základných analytických nástrojov. Preto sa na ich spracovanie vyžaduje špecializovaná infraštruktúra a pokročilé technológie.
Štandardne sa charakterizujú podľa niekoľkých oblastí:
1/ Objem (angl. Volume)
Dáta sa získavajú v obrovskom objeme, ide o hodnoty v rozsahu od jednotiek TB (Terabajt) až po EB (Exabajt). Uvedené jednotky sa používajú na meranie veľkosti dát v rámci digitálneho úložiska. Jednotka TB sa často používa pri bežnom dátovom úložisku (napríklad pri pevných diskoch v počítačoch), naopak jednotka EB sa používa skôr pri veľkých objemoch dát v oblastiach, ako sú napríklad veľké dátové centrá.
2/ Rýchlosť (angl. Velocity)
Ďalšou veľmi podstatnou oblasťou je samotná rýchlosť ako sa dáta vytvárajú. Tu je dôležité zdôrazniť, že dáta sú dosť často generované priamo v reálnom čase, kde doslova každú sekundu prebieha nejaká aktualizácia pôvodného dátového stavu. Súčasne aj samotná rýchlosť analýzy môže byť dosť časovo náročná.
3/ Rôznorodosť (angl. Variety)
Túto oblasť som už čiastočne načrtol (dáta sa vytvárajú v rôznych formátoch, môže ísť o štruktúrované a neštruktúrované dáta, prípadne o ich kombináciu) už v úvode tohto článku a súčasne v určitom rozsahu aj v minulom článku, kde som sa zaoberal témou dát.
4/ Pravdivosť (angl. Veracity)
Tu už je zameranie smerované na oblasť presnosti dát. V zásade ide o to, že dáta vo svojej podstate môžu obsahovať rôzne nepresnosti, alebo tiež neúplné informácie a tie je potrebné najskôr spracovať a až potom bude možné z nich získať hodnotné výstupy.

Prečo sú veľké dáta dôležité?
Efektívne využitie tzv. „Veľkých dát“ prináša výrazný potenciál nielen pre firmy a organizácie.
Prístup k obrovskému množstvu údajov umožňuje získať cenné informácie, ktoré sú nielen zaujímavé, ale aj mimoriadne užitočné pri strategickom rozhodovaní. Tieto dáta pomôžu optimalizovať a zefektívniť procesy, zvyšovať produktivitu a zároveň pomáhajú pri identifikovaní nových príležitostí a predvídaní trendov v rôznych oblastiach.
Zaujal Vás článok?
Zvážte možnosť jeho zdieľania na sociálnych sieťach alebo sa podeľte o svoj názor a pripomienky k článku a to odoslaním správy na e-mailovú adresu info@dataspark.sk.

