Úvaha: Data nám můžete svěřit bez obav, drazí blázni
i Zdroj: PCTuning.cz
Hardware Článek Úvaha: Data nám můžete svěřit bez obav, drazí blázni

Úvaha: Data nám můžete svěřit bez obav, drazí blázni | Kapitola 4

Michal Rybka

Michal Rybka

20. 5. 2011 03:00 59

Seznam kapitol

1. Jen mezi Vámi a naším serverem 2. EULA s ďáblem 3. Orwell je nakonec žabař 4. O základních metodách
5. Databáze a vzorce chování 6. Data mining a komparace dat 7. Dávná přátelství odhalí celé skupiny  8. Ideální pro chytřejší diktátory

Facebook slouží pro naše šmírování, iPhone si pamatuje naši polohu, co někam napíšeme, to patří podle licenčních ujednání provozovateli služby. Kde je hranice mezi paranoiou a reálným ohrožením svobody? Po mrazivých zprávách z minulých dní přinášíme trochu temné zamyšlení nad současnou situací a blízkou budoucností.

Reklama

Samotný sběr dat moc užitečný není, je třeba je profiltrovat a zpracovat, což je náročný proces. Ne nadarmo je sledovací kamerový systém v Británii považován za extrémně neúčinný, neumí sám detekovat události a na kamery se musí dívat operátor, což je šíleně pracné. Vývoj ale pokračuje dále a zvláště po jedenáctém září se výrazně zvětšily investice do systémů strojového rozeznávání, které dodají sledovacím systémům úplně jinou razanci. Počítačové systémy dovolují podstatně zekonomičtit sledování, čímž dávají současným a budoucím totalitám prostředky, které by jim Hitler i Stalin záviděl. Dovolují totiž sledovat ne několik tisíců jednotlivců, ale prakticky celou populaci a to i retroaktivně – nahrajete si sledovací data a ta pak můžete zpětně analyzovat.

Úvaha: Data nám můžete svěřit bez obav, drazí blázni
i Zdroj: PCTuning.cz

Základem je běžné filtrování, kdy systémy vytřiďují zprávy podle klíčových slov na základě zájmového slovníku. Odkládají odkazy na všechny komunikace, které obsahují „zájmové termíny“, třeba jako „bomba“, ale i klíčová slova, které používají konkurenti (traduje se, že špionáž NSA vedla k tomu, že Boeing získal výhodu nad Airbusem). Filtrování je možné dělat nad textovými, audio informacemi nebo videoinformacemi.

Dalším prvkem je agregace podle obsahu, neboli párování informací. Pokud víte, jak složit jednotlivé informace vůči sobě, získáte obvykle něco mnohem zajímavějšího, než bylo na začátku. Nejprimitivnější metodou je agregace u zájmových (vyfiltrovaných) informací. Kupříkladu vás zajímá určitý účet na diskusi, ke kterému znáte jenom uživatelské jméno. Pokud máte dostatečné páky, můžete od správy serveru získat dodatečné informace – IP adresy, registrační údaje – a z těch už lze vyvodit, zda je možné, že člověk vkládal skutečnou adresu nebo fiktivní. Agregovat můžete i dále – zjistíte si, kdo všechno se na diskusní thread díval, kdo přispíval a tím přidáváte další a další informace, které popisují plastičtějším způsobem, co se děje.

V případě podezření, že thread je ve skutečnosti o tom, že teroristé plánují akci, nebo hardcore fanoušci nějaké sportovní tlupy nějakou mlátírnu, může vám agregace říci, kolik jich asi je, jak často spolu komunikují a pomocí IP adres můžete zkusit lokalizovat místa, odkud se připojují. Je to plynulé rozbalování informací, přidávání dalších a dalších kousků skládačky, které připomíná klasickou detektivní práci.

Pokročilejší metodou je kvalitativní interpretace. V podstatě jde o vyvozování netriviálních závěrů z relativně bezvýznamně vypadajících dat. Začalo se to používat u bank, které se snažily zhodnotit rizikovost klientů. Jako vstupní údaje můžete mít velmi neutrálně vypadající informace, například časovou řadu kreditních a debetních operací pro nějaký daný účet. Víte, kdy došlo k transakci, z jakého účtu na jaký účet, jaký byl objem transakce a případně nějaké další detaily (počínaje symboly a konče zprávou pro příjemce).

Úvaha: Data nám můžete svěřit bez obav, drazí blázni
i Zdroj: PCTuning.cz

Už jen z těchto informací je možné zjistit překvapivě hodně – poznáte, zda jde o soukromý a nebo podnikatelský účet, ohodnotíte si sociální status klienta, jak bydlí, kolik má asi dětí, dokonce lze zjistit i určité dynamické rysy jeho osobnosti (o co se zajímá, zda je impulzivní kupující, zda svůj život metodicky plánuje, a nebo má rád spontánní aktivity). Čím delší časový úsek máte, tím přesnější obraz o něm získáte – a často je mnohem přesnější, než jaké hodnocení by o něm sepsal jeho zaměstnavatel.

Předchozí
Další
Reklama
Reklama

Komentáře naleznete na konci poslední kapitoly.

Reklama
Reklama