Hlavní stránka Hardware Sítě a Internet Facebooková hysterie má jméno Cambridge Analytica
Facebooková hysterie má jméno Cambridge Analytica
autor: Michal Rybka , publikováno 31.3.2018
Facebooková hysterie má jméno Cambridge Analytica

Tak jsme si konečně všimli data miningu. Je s námi již od konce 80. let. Dlouho to byla totální nuda, kterou ignorovali všichni – až na politology a paranoiky, kteří nudně mleli o rizicích, jež z data miningu plynou. Hysterie, která propukla v posledních týdnech, je založena na tom, že si ho konečně všimli i apologisté za Brexit a volbu Donalda Trumpa.


Pak se dostaneme ještě hlouběji k Johnu Nashovi a teorii her, kterou rozvíjela americká výzkumná organizace RAND Corporation. Ta sama stojí na základech teorie her Johna von Neumanna z roku 1928, tedy vznikla ještě před počítači. A když budeme zkoumat ještě hlouběji, tak se dopracujeme k Manuale d'Economia Politica od V. Pareta z roku 1909, takže vidíme, že zájem o modelování ekonomiky a lidského chování se táhne skutečně daleko do minulosti.

Co kecám! Když půjdeme ještě dál, tak se dostaneme do roku 1890, kdy proběhl US Census, tedy sčítání obyvatelstva. To se od předchozích lišilo tak, že bylo první strojové, využívalo děrnoštítkové stroje Tabulating Machine Company amerického vynálezce Hermana Holleritha. Tento prekurzor počítačů byl od samého počátku pevně spojen 1) s účetnictvím, 2) s evidencí aka databázemi, 3) s demografií a politikou. Počítače a politika jsou navzájem pevně propojené od samotného začátku a celé jejich dějiny jsou jenom o vzájemném vylepšování tohoto vztahu. Takže ten, kdo se dnes tváří překvapeně, že se počítače využívají k analýze dat o obyvatelstvu, buď nemá nejmenší tušení o světě ve kterém žije - anebo strávil posledních 150 let v kryogenické komoře.

Dnes jsme samozřejmě kvalitativně úplně jinde. Většina lidí zná matematickou politologii nejvíce z průzkumů veřejného mínění, ale behaviorální modely se používají roky a roky nejen v politice, ale i v ekonomii. Existují hybridní systémy, které mají behaviorální ekonomické modely a průběžně hodnotí frekvence slov objevujících se v časových řezech tweetů. Tyhle systémy slouží k tomu, aby rychle zadetekovaly na peak zpráv, obsahujících jméno firmy či suroviny a vyhodnotily, zda je o pozitivní či negativní zprávy, jejich objem, dynamiku a regionalitu a podle toho automaticky obchodovaly.

Googlí PageRank funguje systémem hodnocení referencí, podle kterého pozná, co je důležité a co nedůležité.

Třídění a klasifikace informací neprobíhá jen u webu, ale doslova u všech informací. Pro masivní systémy je kriticky důležité, aby poznaly, s čím se bude pracovat hodně a s čím málo a podle toho se například určilo, zda čerstvě nahrané video půjde do nejrychlejších cachí anebo postupně zamíří do cold storage. Jinak řečeno – matematické sledování chování a jeho klasifikace je s námi hodně dlouho a funguje tak, že vlastně ani nevíte, že tu s námi je.

Když pročítám mainstreamová média, zhrozená datově analytickou kauzou Cambridge Analytica, mám pocit, že sleduji amazonské domorodce, jenž ve svém životě poprvé vidí helikoptéru. Muzikálovému charakteru celé kauzy ovšem napomáhá neotřelá osobnost whistleblowera. Christopher Wylie, muž s jahodovými vlasy či „muž, který už nenajde analytické zaměstnání“, jak ho pracovně nazývám,  je pozoruhodný případ. Každému doporučuji podívat se na jeho rozhovor pro The Guardian a udělat si názor o tom, co je to za člověka – jednak podle toho, jak vystupuje a jednak podle toho, co říká.

Podle Wikipedie sám sebe popisuje jako gaye a vegana, přičemž ve své historii uvádí zneužívání v dětském věku, dyslexii a ADHD. Školu nedokončil, opustil ji v šestnácti, přičemž se ihned přidal k politice. Programovat se prý naučil v devatenácti a ve dvaceti začal studovat práva. To mi za prvé přijde poměrně pozdě a potom mi to přijde jako poměrně zvláštní kombinace. Z rozhovoru mám dojem, že podle mě ve skutečnosti ví sotva něco víc, než že Cambridge Analytica přišla do kontaktu s obřími soubory dat z Facebooku, ke kterým se podle všeho dostala ne zcela transparentním způsobem. Tedy tak, že pro extrakci dat použila aplikaci, která získala přístup k datům z účtu uživatele, aniž by mu jasně vysvětlila, co přesně s daty hodlá dělat. (CA to vysvětluje tak, že získala tato data od společnosti GSR, která je získala ne zcela transparentním způsobem, porušujícím Facebookovské Terms od Service.)

Zbytek jeho vysvětlování o „kulturních zbraních“ jsou jenom kecy člověka, který má velmi vágní představu o tom, co se přesně s daty dělo. Osobně si myslím, že toho ví ve skutečnosti velice málo, s čímž korelují informace, že se do SCL Elections dostal jako kontraktor na částečný úvazek v srpnu 2013 a podle údajů CA v červenci dalšího roku (2014) spolupráci ukončil. Celkovou časovou osu události zveřejnila CA na svém webu.



 
Komentáře naleznete na konci poslední kapitoly.
202 čtenářů navrhlo autorovi prémii: 90.6Kč Prémie tohoto článku jsou již uzavřené, děkujeme za váš zájem.
Tento web používá k poskytování služeb soubory cookie.