Jsou digitální sny umělé inteligence modelem našeho skutečného snění?
i Zdroj: depositphotos
Software Článek Jsou digitální sny umělé inteligence modelem našeho skutečného snění?

Jsou digitální sny umělé inteligence modelem našeho skutečného snění?

Michal Rybka

Michal Rybka

27. 11. 2022 00:15 4

Seznam kapitol

1. Latentní difúze 2. Sny pod kontrolou 3. Řád v chaosu 4. Efektivněji díky AI

Základem moderních programů pro generování obrazu je algoritmus zvaný latentní difúze. Když se podíváme na to, jak funguje, je tam překvapivá paralela ke skutečnému snění!

Reklama

Kreativní inteligenci jsme se věnovali už docela rozsáhle. To, co mě ale překvapilo, bylo video vysvětlující principy latentní difúze. Zjednodušeně řešeno se na velmi rozsáhlých obrazových setech neuronové sítě učí rozeznávat tvary na zašuměných obrazech. A potom přijde kouzlo, kdy dáme síti jen náhodný šum a napovíme jí, co by v něm měla vidět. Latentní difúze přitom nepracuje přímo s obrazem, ale jeho zkomprimovanou verzí, takže dochází k částečné abstrakci informace. 

Algoritmus je poměrně nový, popsaný zhruba rok – a překvapivě je uvolněný jak zdroják, tak i naučený model, který vyžaduje velké množství trénovacích dat a obrovský výpočetní výkon. Doma si tak můžete obrázky jen generovat, stačí na to GPU s alespoň 8 GB VRAM. Zdrojové kódy zájemci najdou například na GitHubu.

Člověk, který stojí za programem, Emad Mostaque, je nesmírně zajímavý. Založil a řídí společnost Stability AI, kterou z části financoval ze svých peněz, protože je bývalý manažer hedgeového fondu. Přiznám se, že přechod ze světa financí do světa vývoje umělé inteligence, kterou v zásadě lidem rozdává, mě docela ohromil, i když rozhodně nejde o jediný podobný případ – Elon Musk vydělal svůj první velký balík na PayPalu a teď vyvíjí rakety. Rozhodně se podívejte na videorozhovor s Emadem, je to velice zajímavé!

Snaha o kreativní AI je pokusem získat „třetí aplikační pilíř“, protože zatím se AI prosazuje hlavně v oblasti průmyslu a také výzkumu. Většina použití, se kterými se denně setkáváme, se typicky týká telefonů: Jde hlavně o hlasové asistenty a dále výpočetní fotografii, která stojí za focením a natáčením prakticky všeho. Kreativní AI je skutečně inovativní věc.

Dost možná nejlepší vysvětlení přinesl kanál Anastasi in Tech, který popisuje Stable Diffusion velmi ilustrativně a také odkazuje na původní práci, ze které model vychází. Ta se dá stáhnout jako PDF, takže pokud se o to zajímáte, klidně tahejte! Dozvíte se z ní například to, že stejný model, který dovoluje generování obrazů, má i schopnost z fotek vymazávat dokonale věci a nahradit je představou o tom, co by tam mohlo být. Takhle precizní vymazávání nepohodlných osob z fotek by se jistě v Sovětském Rusku líbilo!

Předchozí
Další
Reklama
Reklama

Komentáře naleznete na konci poslední kapitoly.

Reklama
Reklama