Od dát k veľkým dátam

big data

Dnes sa budem venovať téme, ktorá nadväzuje na predchádzajúci článok a doplním informácie k pojmu „Veľké dáta“, ktorý je v súčasnosti veľmi populárny. Ide o pojem, s ktorým sa dnes stretávame čoraz častejšie, najmä v súvislosti s digitálnymi technológiami, internetom a dátovou vedou.

 

Čo sú veľké dáta (angl. Big Data)?

Označujú sa nimi obrovské množstvá dát (extrémne veľké a zložité dátové súbory), ktoré sú generované denne v reálnom čase,  alebo v rôznych časových intervaloch. Tieto dáta môžu byť pritom štruktúrované, neštruktúrované alebo kombinované (t.j. ide o kombináciu prvých dvoch uvedených typov) a sú získané z veľkého počtu rôznych zdrojov.

Množstvo, komplexnosť a rýchlosť získavania týchto dát znemožňuje efektívne spracovanie s použitím základných analytických nástrojov. Preto sa na ich spracovanie vyžaduje špecializovaná infraštruktúra a pokročilé technológie.

Štandardne sa charakterizujú podľa niekoľkých oblastí:

1/ Objem (angl. Volume)

Dáta sa získavajú v obrovskom objeme, ide o hodnoty v rozsahu od jednotiek TB (Terabajt) až po EB (Exabajt). Uvedené jednotky sa používajú na meranie veľkosti dát v rámci digitálneho úložiska. Jednotka TB sa často používa pri bežnom dátovom úložisku (napríklad pri pevných diskoch v počítačoch), naopak jednotka EB sa používa skôr pri veľkých objemoch dát v oblastiach, ako sú napríklad veľké dátové centrá.

2/ Rýchlosť (angl. Velocity)

Ďalšou veľmi podstatnou oblasťou je samotná rýchlosť ako sa dáta vytvárajú. Tu je dôležité zdôrazniť, že dáta sú dosť často generované priamo v reálnom čase, kde doslova každú sekundu prebieha nejaká aktualizácia pôvodného dátového stavu. Súčasne aj samotná rýchlosť analýzy môže byť dosť časovo náročná.

3/ Rôznorodosť (angl. Variety)

Túto oblasť som už čiastočne načrtol (dáta sa vytvárajú v rôznych formátoch, môže ísť o štruktúrované a neštruktúrované dáta, prípadne o ich kombináciu) už v úvode tohto článku a súčasne v určitom rozsahu aj v minulom článku, kde som sa zaoberal témou dát.

4/ Pravdivosť (angl. Veracity)

Tu už je zameranie smerované na oblasť presnosti dát. V zásade ide o to, že dáta vo svojej podstate môžu obsahovať rôzne nepresnosti, alebo tiež neúplné informácie a tie je potrebné najskôr spracovať a až potom bude možné z nich získať hodnotné výstupy.

big data
Prečo sú veľké dáta dôležité?

Efektívne využitie tzv. „Veľkých dát“ prináša výrazný potenciál nielen pre firmy a organizácie.

Prístup k obrovskému množstvu údajov umožňuje získať cenné informácie, ktoré sú nielen zaujímavé, ale aj mimoriadne užitočné pri strategickom rozhodovaní. Tieto dáta pomôžu optimalizovať a zefektívniť procesy, zvyšovať produktivitu a zároveň pomáhajú pri identifikovaní nových príležitostí a predvídaní trendov v rôznych oblastiach.


Zaujal Vás článok? 

Zvážte možnosť jeho zdieľania na sociálnych sieťach alebo sa podeľte o svoj názor a pripomienky k článku a to odoslaním správy na e-mailovú adresu info@dataspark.sk.