Dnes sa zameriame na to, ako môže byť dátová veda užitočná v bežnom živote.
Dátová veda dnes skutočne ovplyvňuje mnoho oblastí nášho každodenného života a často si to ani neuvedomujeme. Jedným z najlepších príkladov je vyhľadávač Google a jeho schopnosť predpovedať vyhľadávanie ešte skôr, než používateľ dopíše celý dopyt.
Predstavme si jednoduchú situáciu.
Používateľ si otvorí internetový prehliadač, načíta stránku Google a začne do vyhľadávacieho poľa písať text napríklad „Ako napro…“. Ešte ani nestihne dopísať celé slovo a už mu Google ponúka viacero návrhov vyhľadávania, ktoré sa začínajú presne tým, čo práve napísal.
Ako dokáže Google predpovedať, čo chce používateľ vyhľadávať?
Dátová veda v praxi
Za touto funkciou stojí kombinácia dátovej vedy, strojového učenia a štatistických modelov. Google využíva systém s názvom Google Autocomplete, ktorý dokáže analyzovať obrovské množstvo dát a na ich základe odhadnúť najpravdepodobnejšie pokračovanie vyhľadávacieho dopytu.
Hlavným cieľom tejto technológie je zrýchliť vyhľadávanie a zlepšiť používateľský komfort, pretože ten tak nemusí dopísať celý text a môže si jednoducho vybrať z ponúkaných návrhov.
Pri jednom vyhľadávaní ide možno len o niekoľko sekúnd. Keď si však uvedomíme, že Google spracuje miliardy vyhľadávaní denne, celková úspora času je obrovská.
Odkiaľ Google získava návrhy vyhľadávania
Aby mohol Google ponúkať relevantné návrhy, využíva viacero zdrojov dát.
Najčastejšie vyhľadávania používateľov
Jedným z hlavných zdrojov sú najčastejšie vyhľadávacie dopyty ostatných používateľov. Ak veľa ľudí hľadá rovnakú alebo podobnú frázu, systém ju považuje za pravdepodobné pokračovanie. Práve preto sa niekedy môže stať, že návrh úplne nesúvisí s tým, čo konkrétny používateľ plánoval vyhľadať.
História vyhľadávania používateľa
Google môže zohľadňovať aj predchádzajúce vyhľadávania konkrétneho používateľa. Ak napríklad niekto často vyhľadáva informácie o programovaní v jazyku Python alebo o tvorbe hier, systém mu môže častejšie ponúkať návrhy súvisiace práve s týmito témami.
Aktuálne trendy a udalosti
Dôležitým faktorom sú aj aktuálne trendy na internete. Ak sa určitá téma stane populárnou – napríklad kvôli spravodajstvu, športovej udalosti alebo virálnemu obsahu – môže sa rýchlo objaviť medzi návrhmi vyhľadávania. Niekedy tak vznikajú aj zaujímavé alebo dokonca vtipné návrhy, ktoré odrážajú aktuálne dianie na internete.
Jazyk a geografická lokalita
Výsledky Autocomplete sú ovplyvnené aj jazykom a lokalitou používateľa. Ľudia v rôznych krajinách majú odlišné záujmy, kultúrne zvyklosti aj aktuálne témy, ktoré ich zaujímajú. Preto môže rovnaký začiatok vyhľadávania priniesť rôzne návrhy napríklad na Slovensku, v Nemecku alebo v USA.
Technológia v pozadí: jazykové modely a strojové učenie
Technická stránka systému je mimoriadne zaujímavá. Google spracováva obrovské množstvo dát v reálnom čase pre miliardy používateľov po celom svete. Na analýzu vyhľadávacích dopytov využíva jazykové modely založené na pravdepodobnosti textu.
Tieto modely sa učia zo miliárd predchádzajúcich vyhľadávaní. Keď používateľ začne písať prvé písmená, systém okamžite vypočíta, ktoré slová alebo frázy majú najvyššiu pravdepodobnosť pokračovania.
Moderné algoritmy kombinujú:
- štatistické metódy analýzy textu
- strojové učenie
- hlboké neurónové siete
- spracovanie prirodzeného jazyka (NLP)
Výsledkom je systém, ktorý dokáže reagovať prakticky okamžite.
Číta Google naše myšlienky?
Na prvý pohľad môže funkcia Autocomplete pôsobiť takmer „magicky“. Niektorí používatelia môžu mať skutočne pocit, že Google dokáže čítať ich myšlienky. V skutočnosti ide len o pokročilú analýzu dát a pravdepodobnosti. Google nepozná presne úmysel používateľa, ale dokáže veľmi presne odhadnúť, ktoré vyhľadávania by mohli byť relevantné.
Čím viac dát systém analyzuje, tým presnejšie dokáže tieto odhady robiť.
Google Autocomplete je ukážkovým príkladom toho, ako môže dátová veda pomáhať v každodennom živote. Aj jednoduchá funkcia, ktorú väčšina používateľov považuje za samozrejmosť, v skutočnosti stojí na analýze veľkých dát (angl. Big Data), pokročilých algoritmoch, strojovom učení a výpočtoch v reálnom čase. Práve vďaka týmto technológiám sa vyhľadávanie na internete stalo rýchlejším, jednoduchším a presnejším.
Zaujal Vás článok?
Zvážte možnosť jeho zdieľania na sociálnych sieťach alebo sa podeľte o svoj názor a pripomienky k článku a to odoslaním správy na e-mailovú adresu info@dataspark.sk.

