Dnes sa budem venovať téme, ktorá nadväzuje na predchádzajúci článok a doplním informácie k pojmu „Veľké dáta“ (angl. Big Data), ktoré sú v súčasnosti veľmi populárne.
Označujú sa nimi obrovské množstvá dát (extrémne veľké a zložité dátové súbory), ktoré sú generované denne v reálnom čase, alebo v rôznych časových intervaloch. Tieto dáta môžu byť pritom štruktúrované, neštruktúrované alebo kombinované (t.j. ide o kombináciu prvých dvoch uvedených typov) a sú získané z veľkého počtu rôznych zdrojov. Množstvo a komplexnosť týchto dát, alebo aj rýchlosť ich získavania, znemožňuje efektívne spracovanie s použitím základných analytických nástrojov a tak na ich spracovanie sa vyžaduje špecializovaná infraštruktúra a pokročilé technológie.
Štandardne sa charakterizujú podľa niekoľkých oblastí:
Objem (angl. Volume)
Dáta sa získavajú v obrovskom objeme, ide o hodnoty v rozsahu od jednotiek TB (Terabajt) až po EB (Exabajt). Uvedené jednotky sa používajú na meranie veľkosti dát v rámci digitálneho úložiska. Jednotka TB sa často používa pri bežnom dátovom úložisku (napríklad pri pevných diskoch v počítačoch), naopak jednotka EB sa používa skôr pri veľkých objemov dát v oblastiach, ako sú napríklad veľké dátové centrá.
Rýchlosť (angl. Velocity)
Ďalšou veľmi podstatnou oblasťou, je samotná rýchlosť ako sa dáta vytvárajú. Tu je dôležité zdôrazniť, že dáta sú dosť často generované priamo v reálnom čase, kde doslova každú sekundu prebieha nejaká aktualizácia pôvodného dátového stavu. Súčasne aj samotná rýchlosť analýzy môže byť dosť časovo náročná.
Rôznorodosť (angl. Variety)
Túto oblasť som už čiastočne načrtol (dáta sa vytvárajú v rôznych formátoch, môže ísť o štruktúrované a neštruktúrované dáta, prípadne o ich kombináciu) už v úvode tohto článku a súčasne v určitom rozsahu aj v minulom článku, kde som sa zaoberal témou dát.
Pravdivosť (angl. Veracity)
Tu už je zameranie smerované na oblasť presnosti dát. V zásade ide o to, že dáta vo svojej podstate môžu obsahovať rôzne nepresnosti, alebo tiež neúplné informácie a tie je potrebné najskôr spracovať a až potom bude možné z nich získať hodnotné výstupy.

Efektívne využitie tzv. „Veľkých dát“ prináša výrazný potenciál nielen pre firmy a organizácie.
Prístup k obrovskému množstvu údajov umožňuje získať cenné informácie, ktoré sú nielen zaujímavé, ale aj mimoriadne užitočné pri strategickom rozhodovaní. Tieto dáta pomôžu optimalizovať a zefektívniť procesy, zvyšovať produktivitu a zároveň pomáhajú pri identifikovaní nových príležitostí a predvídaní trendov v rôznych oblastiach.
Zaujal Vás článok?
Zvážte možnosť jeho zdieľania na sociálnych sieťach alebo sa podeľte o svoj názor a pripomienky k článku a to odoslaním správy na e-mailovú adresu info@dataspark.sk.