Kto zbiera veľké dáta a prečo?

Na jeseň 2019 vypukol škandál so službou Apple Card: pri registrácii vystavila rôzne úverové limity pre mužov a ženy. Dokonca aj Steve Wozniak mal smolu:

O rok skôr vyšlo najavo, že platforma Netflix zobrazuje používateľom rôzne plagáty a upútavky v závislosti od ich pohlavia, veku a národnosti. Za to bola služba obvinená z rasizmu.

Napokon, Mark Zuckerberg je pravidelne napomínaný za údajné zhromažďovanie, predaj a manipuláciu s údajmi svojich používateľov zo strany Facebooku. V priebehu rokov bol obvinený a dokonca súdený za manipuláciu počas amerických volieb, napomáhanie ruským špeciálnym službám, podnecovanie nenávisti a radikálnych názorov, nevhodnú reklamu, únik užívateľských údajov, marenie vyšetrovania pedofilov.

Facebook príspevok od zuck

Online služba Pornhub zároveň každoročne zverejňuje správy o tom, aké porno ľudia rôznych národností, pohlavia a veku hľadajú. A z nejakého dôvodu to nikoho netrápi. Hoci všetky tieto príbehy sú podobné: v každom z nich máme do činenia s veľkými dátami, ktoré sa v XNUMX storočí nazývajú „nová ropa“.

Čo sú veľké dáta

Veľké dáta – sú to tiež veľké dáta (angl. Big Data) alebo metadáta – sú súborom dát, ktoré prichádzajú pravidelne a vo veľkých objemoch. Zhromažďujú sa, spracúvajú a analyzujú, výsledkom čoho sú jasné modely a vzory.

Pozoruhodným príkladom sú údaje z Veľkého hadrónového urýchľovača, ktoré prichádzajú nepretržite a vo veľkých množstvách. S ich pomocou vedci riešia mnohé problémy.

Veľké dáta na webe však nie sú len štatistikou pre vedecký výskum. Môžu byť použité na sledovanie toho, ako sa správajú používatelia rôznych skupín a národností, čomu venujú pozornosť a ako interagujú s obsahom. Niekedy sa na tento účel nezhromažďujú údaje z jedného zdroja, ale z viacerých, pričom sa porovnávajú a identifikujú určité vzory.

O tom, aké dôležité sú veľké dáta na sieti, sa začalo rozprávať, keď ich bolo naozaj veľa. Na začiatku roka 2020 bolo na svete 4,5 miliardy používateľov internetu, z toho 3,8 miliardy bolo registrovaných na sociálnych sieťach.

Kto má prístup k Big Data

Podľa prieskumov sa viac ako polovica našich krajín domnieva, že ich údaje v sieti využívajú tretie strany. Zároveň mnohí zverejňujú na sociálnych sieťach a aplikáciách osobné informácie, fotografie a dokonca aj telefónne číslo.

Kto zbiera veľké dáta a prečo?
Kto zbiera veľké dáta a prečo?
Kto zbiera veľké dáta a prečo?
Kto zbiera veľké dáta a prečo?

Tu je potrebné vysvetliť: prvou osobou je samotný používateľ, ktorá umiestňuje svoje údaje na akýkoľvek zdroj alebo aplikáciu. Zároveň súhlasí (zaškrtne súhlas) so spracovaním týchto údajov druhá strana – teda vlastníci zdroja. Treťou stranou sú tí, ktorým vlastníci zdroja môžu prenášať alebo predávať používateľské údaje. Často je to napísané v používateľskej zmluve, ale nie vždy.

Treťou stranou sú vládne agentúry, hackeri alebo spoločnosti, ktoré nakupujú údaje na komerčné účely. Prvý môže získať údaje rozhodnutím súdu alebo vyššieho orgánu. Hackeri samozrejme nepoužívajú žiadne povolenia – jednoducho hacknú databázy uložené na serveroch. Spoločnosti (podľa zákona) majú prístup k údajom len vtedy, ak ste im to vy sami povolili – zaškrtnutím políčka pod zmluvou. V opačnom prípade je to nezákonné.

Prečo spoločnosti používajú Big Data?

Veľké dáta v komerčnej oblasti sa používajú už desaťročia, len to nebolo také intenzívne ako teraz. Ide napríklad o záznamy z monitorovacích kamier, údaje z GPS navigácií či online platby. Teraz, s rozvojom sociálnych sietí, online služieb a aplikácií, sa to všetko dá prepojiť a získať ten najkompletnejší obraz: kde žijú potenciálni zákazníci, čo radi pozerajú, kam chodia na dovolenky a akú značku auta majú.

Z vyššie uvedených príkladov je zrejmé, že pomocou veľkých dát chcú firmy v prvom rade cieliť reklamy. Teda ponúkať produkty, služby či jednotlivé možnosti len tomu správnemu publiku a dokonca prispôsobiť produkt pre konkrétneho používateľa. Navyše reklama na Facebooku a iných veľkých platformách je čoraz drahšia a ukazovať ju všetkým za sebou nie je vôbec rentabilné.

Informácie o potenciálnych zákazníkoch z otvorených zdrojov aktívne využívajú poisťovne, súkromné ​​kliniky a zamestnávatelia. Tí prví môžu napríklad zmeniť podmienky poistenia, ak uvidia, že často hľadáte informácie o niektorých chorobách alebo liekoch, a zamestnávatelia môžu posúdiť, či máte sklony ku konfliktom a antisociálnemu správaniu.

Ale je tu ešte jedna dôležitá úloha, ktorá sa posledné roky trápi: priblížiť sa k najsolventnejšiemu publiku. Nie je to také jednoduché, aj keď túto úlohu výrazne uľahčujú platobné služby a elektronické šeky prostredníctvom jediného OFD (operátor fiškálnych údajov). Aby sa spoločnosti čo najviac priblížili, dokonca sa snažia vystopovať a „vychovať“ potenciálnych zákazníkov už od detstva.: prostredníctvom online hier, interaktívnych hračiek a vzdelávacích služieb.

Ako to funguje?

Najväčšie príležitosti na zber dát sú od globálnych korporácií, ktoré vlastnia niekoľko služieb naraz. Facebook má v súčasnosti viac ako 2,5 miliardy aktívnych používateľov. Zároveň spoločnosť vlastní aj ďalšie služby: Instagram – viac ako 1 miliarda, WhatsApp – viac ako 2 miliardy a ďalšie.

Google má však ešte väčší vplyv: Gmail používa 1,5 miliardy ľudí na svete, ďalších 2,5 miliardy mobilný operačný systém Android a viac ako 2 miliardy YouTube. A to nepočítam aplikácie Vyhľadávanie Google a Mapy Google, Obchod Google Play a prehliadač Chrome. Zostáva upevniť svoju online banku – a Google o vás bude vedieť doslova všetko. Mimochodom, Yandex je už v tomto ohľade o krok vpred, ale pokrýva len rusky hovoriace publikum.



???? V prvom rade sa firmy zaujímajú o to, čo uverejňujeme a lajkujeme na sociálnych sieťach. Ak napríklad banka uvidí, že ste ženatý a aktívne sa vám páčia dievčatá na Instagrame alebo Tinderi, je väčšia pravdepodobnosť, že schválite spotrebný úver. A hypotéka na rodinu je preč.

Dôležité je aj to, na aké reklamy klikáte, ako často a s akým výsledkom.

(Tj Ďalším krokom sú súkromné ​​správy: obsahujú oveľa viac informácií. Správy unikli na VKontakte, Facebooku, WhatsApp a ďalších instant messengeroch. Podľa nich je mimochodom ľahké sledovať geolokáciu v čase odoslania správy. Určite ste si všimli: keď s niekým diskutujete o kúpe niečoho alebo len o objednávke pizze, v feede sa okamžite objaví relevantná reklama.

🚕 Veľké dáta aktívne využívajú a „unikajú“ doručovacími a taxislužbami. Vedia, kde žijete a pracujete, čo milujete, aký je váš približný príjem. Napríklad Uber ukazuje cenu vyššiu, ak idete domov z baru a očividne ste to prehnali. A keď máte v telefóne kopu iných agregátorov, naopak, ponúknu lacnejšie.

(Tj Existujú služby, ktoré pomocou fotografií a videí zbierajú čo najviac informácií. Napríklad knižnice počítačového videnia – Google jednu má. Skenujú vás a vaše okolie, aby zistili, akú máte veľkosť alebo výšku, aké značky nosíte, v akom aute jazdíte, či máte deti alebo domáce zvieratá.

(Tj Tí, ktorí poskytujú bankám SMS brány pre svoje korešpondencie, môžu sledovať vaše nákupy na karte – poznať posledné 4 číslice a telefónne číslo – a potom tieto údaje predať niekomu inému. Preto všetok tento spam so zľavami a pizzou ako darčekom.

🤷️️ Nakoniec aj my sami unikáme naše dáta do ľavých služieb a aplikácií. Spomeňte si na ten humbuk okolo Getcontactu, keď každý rád vypĺňal svoje telefónne číslo, aby zistil, ako to napísali ostatní. A teraz nájdite ich súhlas a prečítajte si, čo hovorí o prenose vašich údajov (spoiler: vlastníci ich môžu preniesť na tretie strany podľa vlastného uváženia):

Kto zbiera veľké dáta a prečo?

Korporácie môžu úspešne zbierať a dokonca predávať používateľské údaje roky, kým nedôjde k súdnemu sporu – ako sa to stalo s rovnakým Facebookom. A potom rozhodujúcu úlohu zohralo porušovanie GDPR – zákona v EÚ, ktorý obmedzuje používanie dát oveľa prísnejšie ako ten americký. Ďalším nedávnym príkladom je antivírusový škandál Avast: jedna z dcérskych služieb spoločnosti zbierala a predávala údaje od 100 do 400 miliónov používateľov.

Ale má to všetko pre nás nejaké výhody?

Ako veľké dáta pomáhajú nám všetkým?

Áno, má to aj svetlú stránku.

Veľké dáta pomáhajú chytiť zločincov a predchádzať teroristickým útokom, nájsť nezvestné deti a chrániť ich pred nebezpečenstvom.

S ich pomocou sme dostávame skvelé ponuky od bánk a osobné zľavy. Vďaka nim my neplatíme za mnohé služby a sociálne siete, ktoré zarábajú len na reklame. Inak by nás len Instagram stál niekoľko tisíc dolárov mesačne.

Samotný Facebook má 2,4 miliardy aktívnych používateľov. Zároveň ich zisk za rok 2019 dosiahol 18,5 miliardy dolárov. Ukázalo sa, že spoločnosť zarobí až 7,7 USD ročne od každého používateľa prostredníctvom reklamy.

Napokon, niekedy je to len pohodlné: keď už služby vedia, kde ste a čo chcete, a nemusíte si potrebné informácie hľadať sami.

Ďalšou perspektívnou oblasťou pre aplikáciu Big Data je vzdelávanie.

Na jednej z amerických univerzít vo Virgínii prebehla štúdia na zber údajov o študentoch rizikovej skupiny tzv. Sú to tí, ktorí sa slabo učia, vynechávajú hodiny a sú pred odchodom. Faktom je, že v štátoch sa každý rok odpočíta asi 400 ľudí. Je to zlé tak pre univerzity, ktorým sa znižuje rating a znižuje financovanie, ako aj pre samotných študentov: mnohí si berú pôžičky na vzdelanie, ktoré po odpočítaní budú musieť aj tak splatiť. Nehovoriac o stratenom čase a kariérnych vyhliadkach. Pomocou big data je možné včas identifikovať zaostávajúcich a ponúknuť im tútora, doplnkové kurzy a ďalšiu cielenú pomoc.

To je mimochodom vhodné aj pre školy: vtedy systém upozorní učiteľov a rodičov – povedia, dieťa má problémy, pomôžme mu spoločne. Big Data vám tiež pomôžu pochopiť, ktoré učebnice fungujú lepšie a ktorí učitelia vysvetľujú látku ľahšie.

Ďalším pozitívnym príkladom je profilovanie kariéry.: vtedy sa tínedžerom pomáha pri rozhodovaní o ich budúcom povolaní. Veľké dáta tu umožňujú zbierať informácie, ktoré nie je možné získať pomocou tradičných testov: ako sa používateľ správa, čomu venuje pozornosť, ako interaguje s obsahom.

V tých istých USA existuje program kariérového poradenstva – SC ACCELERATE. Okrem iného využíva technológiu CareerChoice GPS: analyzuje údaje o povahe študentov, ich sklonoch k predmetom, silných a slabých stránkach. Údaje sa potom použijú na pomoc tínedžerom vybrať si pre nich tie správne vysoké školy.


Prihláste sa na odber a sledujte nás na Yandex.Zen – technológie, inovácie, ekonomika, vzdelávanie a zdieľanie na jednom kanáli.

Nechaj odpoveď