GTC 2013 druhý den – keynote a uvedení roadmapy
i Zdroj: PCTuning.cz
Hardware Článek GTC 2013 druhý den – keynote a uvedení roadmapy

GTC 2013 druhý den – keynote a uvedení roadmapy | Kapitola 2

Jan Buriánek

Jan Buriánek

20. 3. 2013 19:00 15

Seznam kapitol

1. Klíčová řeč Jen-Hsun Huanga 2. GPU pro výpočty – úspěch CUDA technologie 3. Vzdálený přístup s grafikou – výpočetní grid, VCA

Druhý den je již tradičně smrští informací a novinek, které si prostě není možné nechat ujít. Nejeden novinář a analytik si přivstane, aby získal exkluzivní místa na klíčové řeči zakladatele nVidie Jen-Hsun Huanga. Zde vždy zazní zásadní sdělení a ukazují se dech beroucí dema. Ano, ani letos to nebylo jinak a klíčová řeč byla více než plodná.

Reklama

Druhá část klíčové řeči se týkala použití GPU jako masivního paralelního výpočetního stroje. Úspěch technologie CUDA je nepopiratelný. Hlavními ukazateli jsou: zájem o stažení CUDA SDK (to vzrostlo ze 150 tisíc v roce 2008 na 1.6 miliónů v roce 2013), počty superpočítačů (HPC), které používají GPU k výpočtům (tady z jednoho super-počítače jich je již 50), kolik universit již CUDA a GPU technologie učí (ke dnešnímu dni je více než 650 universitních kursů po světě, mezi ně patří samozřejmě i kurzy na ČVUT FEL, ČVUT FIT, MatFyzu UK a Masarykově universitě v Brně). Samotný zájem potvrzují i vědecké články, kde je již publikováno přes 37000 vědeckých článků o GP GPU.

GTC 2013 druhý den – keynote a uvedení roadmapy
i Zdroj: PCTuning.cz

Extrémní výpočetní sílu používá nový IBM Cell superpočítač, který má díky CUDA výkon 5 PETAFLOPS (40 miliónů CUDA procesorů). V Evropě vzniká ve Švýcarsku superpočítač Piz Daint (jejich nejvyšší hora), který bude sloužit pro předpověď počasí a bude mít podobné parametry jako IBM Cell.

GTC 2013 druhý den – keynote a uvedení roadmapy
i Zdroj: PCTuning.cz

Sílu paralelního zpracování vektorových dat využívá dnes mnoho firem, na klíčové řeči se ukázaly produkty: SHAZAM, Twitter, eBay (Cortexica). Všechny tři společnosti ukázali živě dech beroucí demonstraci síly jejich výpočetních farem, ale není možné dema pitvat, proto jen stručně. Shazam (hledání skladeb podle nahraného vzorku nebo zazpívané melodie) musí zpracovávat 300 miliónů požadavků (queries) za měsíc a prohledávat databázi 27 miliónů skladeb, to vše v co nejkratším čase (uživatel nepočká). Počet uživatelů jim ale stoupá a počet skladeb také. Jason Titus ukázal roadmap tohoto projektu a čísla jsou to opravdu úctyhodná. Twitter musí zpracovávat více než 500 miliónů krátkých zpráv denně.

GTC 2013 druhý den – keynote a uvedení roadmapy
i Zdroj: PCTuning.cz
GTC 2013 druhý den – keynote a uvedení roadmapy
i Zdroj: PCTuning.cz
GTC 2013 druhý den – keynote a uvedení roadmapy
i Zdroj: PCTuning.cz

Nad těmito daty společnost SalesForce prohledává klíčová slova, která si zadávají komerční společnosti a hledá nad nimi „vnímání značky spotřebiteli“. Vše musí zpracovávat na denní bázi a výsledky zobrazovat do 5ti minut. Bez masivní CUDA farmy by to nešlo. Velmi pěkné demo ukázala společnost Cortexica, která má speciální rozpoznávací software na oblečení. Uživatel si prostě zadá vzor oblečení (dle fotky, výřezu, snímáním iPhonem apod.) a Cortexica nalezne příslušné oblečení v nejrůznějších obchodech, přičemž prohledává primárně eBay. Výsledky byly impresivní, systém navrhuje skutečně sémanticky podobné oblečení a dokonce díky parametrizaci navrhuje příbuzné, ale ne shodné tvary, barvy atd. Toto v rukou manželek může být pro konta manželů velmi nebezpečný nástroj...

nVidia Roadmap aneb Maxwell, Volta, Kayla, Logan

Významná řečnická pausa po praktických demech předznamenávala velké sdělení. Přesně tak se stalo. CEO nVidia oznámil další vývoj v oblasti GPU procesorů nVidia – roadmap.

GTC 2013 druhý den – keynote a uvedení roadmapy
i Zdroj: PCTuning.cz

Příslušný graf je výmluvný. Po FERMI technologii z roku 2010 přišel Kepler (2012) s dynamickým paralelismem. Nová technologie Maxwell je ohlášena již na 2014 a bude obsahovat unifikovanou virtuální paměť (Unified Virtual Memory). Prakticky to bude znamenat, že aplikace budou moci používat jak CPU, tak GPU paměť a to naprosto volně. Díky takto sdílené paměti a vyšší průchodnosti sběrnic se očekává výkon přes 10 TFLOPS! Naprosto nově však byla představena technologie VOLTA, nové označení pro generaci GPU procesorů pro rok 2016 (nebo také 2018), který bude obsahovat tzv. Stacked DRAM, na které nVidia pilně pracuje. Jedná se o speciální paměť, která bude na procesor napařena prostorově (nahoru) tak, že vnitřně dosáhne přenosovou rychlost 1TB/sec. Jinak řešeno 4 BluRay disky se přenesou za 1sec. V tomto revolučním postupu přímo vidím kdysi slavné CRAY, které dokázaly ve své době nemožné pravě díky rychlým sběrnicím.

GTC 2013 druhý den – keynote a uvedení roadmapy
i Zdroj: PCTuning.cz

Další roadmap se týkala mobilních procesorů, konkrétně oznámení TEGRA 4. Mezitím co Tegra 3 měla chytrý powemanagement (tzv. 4+1 výkon), tak nová Tegra 4 přináší koprocessing ve formě výpočetní kamery (Computation Camera) pro real-time pokročilé zpracování obrazu z fotoaparátu mobilu (umožňuje dělat tracking objektů, panoramata, HDR videa, AR matching aj. to vše v reálném čase). Pro podporu streamu dat je tu SDR modem. Nebyla by to nVidia, kdyby nepřišla ještě s další revolucí a tou se stalo oznámení nové generace procesorů Logan, která je vlastně mobilní CUDA 5 procesor s plnout OpenGL akcelerací. Logan bude mít 4x CUDA 5 jádra a OpenGL 4.3 s podporou shaderů. Více než herní konzole do kapsy. Novinkou bylo oznámení plánované generace procesorů Parker, kde nVidia spojila ARM procesor a Mawell GPU. Bude se jednat o první FinFET procesor a v roce 2015 tak bude nVidia plným konkurentem Intelu, protože takto bude systém nezávislý na jejich architektuře.

GTC 2013 druhý den – keynote a uvedení roadmapy
i Zdroj: PCTuning.cz
GTC 2013 druhý den – keynote a uvedení roadmapy
i Zdroj: PCTuning.cz
GTC 2013 druhý den – keynote a uvedení roadmapy
i Zdroj: PCTuning.cz

nVidia se též pustila do kompletních řešení. Konkrétně byla představena KAYLA. Jedná se malý motherboard, který obsahuje Tegra 3 procesor a plné osazení jako počítač, tj. lze na něm spouštět například Linux Ubuntu a bude se tvářit jako CUDA 5 počítač s OpenGL podporou (včetně PhysX). Je jasné, že tady bude díky malé spotřebě prostor pro OEM řešení a nejrůznější průmyslové aplikace.

Předchozí
Další
Reklama
Reklama

Komentáře naleznete na konci poslední kapitoly.

Reklama
Reklama