Hlavní stránka Hardware Multimedia, zvuk, TV Úvaha: Vzpomínky na budoucnost aneb kam nás dostalo scifi
Úvaha: Vzpomínky na budoucnost aneb kam nás dostalo scifi
autor: Michal Rybka , publikováno 3.6.2011
Úvaha: Vzpomínky na budoucnost aneb kam nás dostalo scifi

Vývoj jde stále kupředu a už dnes se máme lépe než zítra. Jak ale vypadala představa našich předků o budoucnosti, tedy dnešní realitě? A kam se můžeme posunout my? Zabruslíme do historie, která nás viděla plně automatizované a virtuální. Něco se vyplnilo, něco byla utopie a něco teprve ještě přijde, až se naučíme pracovat s kontextem.


Porozumění řeči není možné bez pochopení kontextu a toho, čemu se v AI říká modelování scény. Scénou se nemyslí jenom interpretace vztahů mezi prostorovými objekty, ale obecný model situace, ve kterém se pohybujeme. Jedině díky scéně lze pochopit sarkasmus, který detekujeme jako zjevný rozpor mezi situací ve scéně a sdělením, které situaci zjevně popírá (a to je to, co dělá sarkasmus vtipný, takže ne, není to „vtipné, protože to je pravda“, jak říká Sheldon, ale vtipné je to proto, že to pravdu zjevným způsobem popírá).

Určitý pokrok v této oblasti znamená systém DEVIANT (Double Entendre via Noun Transfer) známý spíše jako TWSS (That's What She Said) vyvinutý Chloe Kiddon a Jurijem Brunem z University of Washington, který umí rozeznávat obraty s vícenásobnou interpretací, obvykle sexuální. „Snažil jsem se celou noc, ale prostě to tam nešlo nacpat!“ „That's what she said!“ Ano, je to vtipné v případě, že se bavíme o pokusu nacpat veškeré vybavení do kufru, a vyrobíme z toho sexuální narážku. Ale co když se opravdu bavíme o sexu a „opravdu to tam nešlo nacpat“? Pak je tento komentář pouze „trapným opakováním faktu“ a nic vtipného na tom není. Na to, abychom nejenom detekovali dvojsmysl, ale poznali, v jakém kontextu byl vysloven, potřebujeme modelovat scénu, abychom z ní odvodili relevantní situaci a zjistili, zda je jedná o validní výrok a nebo sarkasmus / vtip. 

Zkrátka a dobře – pokud nejde o relativně jednoduché příkazy, není strojové porozumění moc použitelné. A pokud uvážíme, že v reálném světě obvykle nemluví jenom jeden člověk, je to ještě horší. Chcete, aby váš počítač dělal to, co slyší z televize? Abyste si doma navzájem překřikovali počítače? Jeden z mála pokusů IBM o domácí / školní počítač IBM PCjr měl infračervenou bezdrátovou klávesnici, ale klávesnice byly univerzální, nespárované, takže pokud v učebně někdo zvedl klávesnici do vzduchu, psal do všech počítačů v dohledu. Tak – a teď si představte školní učebnu s počítači ovládanými hlasem. Pokud má člověk problém soustředit se na jednoho mluvícího, i když ho očima lokalizuje v prostoru a vypomáhá si tak trochu odezíráním, představte si jenom, co všechno ještě čeká vývojáře, aby dosáhla kvalit konverzace z klasických scifi.

Daleko přirozenější se jeví „integrace počítače do něčeho normálního“, kterou nám slibují už hodně let a zatím nikde nic nevidět. Od svého raného dětství si strašně přeji pracovní stůl, jehož deska slouží jako dotyková obrazovka. Viděl jsem to v „Tronovi“ a přísahám, že jsem ochoten nahradit svůj běžný stůl něčím takhle báječným, jakmile to bude k dispozici v rozumné velikosti, odolnosti, v přijatelné ceně a s nějakým kvalitním rozhraním (ne tedy běžnou dotykovou matlaninou nanesenou na generická Windows).

Je ale možné, že se vývojáři rozhodnou tuto fázi přeskočit a rovnou přikročit ke gesty ovládanému sytému s holografickými obrazovkami jako v Minority Report. Zde je ovšem na místě poznamenat, že dost možná jde o vítězství „efektu nad funkčností“, protože malý pohyb myší je energeticky méně náročný než máchání pazourami v prostoru (o používání klávesových shortcutů ani nemluvě), čímž by se z kancelářské práce s počítačem mohla stát dosti drsná osmihodinová aerobiková facha.

Úvaha: Vzpomínky na budoucnost aneb kam nás dostalo scifi

Opět, podobně jako při ovládání funkcí hlasem, navíc najdeme situace, kdy je ovládání gestem vyloženě nepraktické (řízení a nebo činnosti, kde se pohybujete normálně a můžete běžným pohybem počítač mást). Ve finále předpokládám, že nekontaktní ovládací rozhraní budoucnosti bude vypadat tak, že počítač na vás ve stylu Kinectu kouká, čte gesta, poslouchá vás a detekuje, kdy mluvíte na něj, jaksi z kontextu. Rozeznávání přirozených gest a čtení mimiky bude rovněž nutné.



 
Komentáře naleznete na konci poslední kapitoly.
178 čtenářů navrhlo autorovi prémii: 81.8Kč Prémie tohoto článku jsou již uzavřené, děkujeme za váš zájem.
Tento web používá k poskytování služeb soubory cookie.