PC-IQE - Počítač pro záchranu lidských životů | Kapitola 4
Seznam kapitol
Dnešní příběh začal již před více než 20 lety a je směsicí smutku, odhodlání, lidské spolupráce a samozřejmě počítačového výkonu. Pojednává o člověku, který celý svůj život bojoval s krutou nemocí a který se i v době, kdy byl zcela odkázán na pomoc druhých, neuzavřel do sebe, ale naopak se snažil pomoci, kde mohl.
Výpočty na CPU
Výkonný čtyřjádrový procesor (s HT) Intel i920 je celý věnován přímo zpracovávání dat potřebných pro pokrok v oblasti hledání léků na svalovou dystrofii, která byla Michalovi krutým společníkem po celou dobu jeho života.
Projekt World Community Grid (dále jen
WCG)
patří mezi projekty s dlouholetou historií, která sahá ještě před vznik
platformy BOINC (2004). Nejedná se o samostatný projekt, ale pod
hlavičkou WCG se skrývá několik podprojektů, jejichž výzkumná činnost
je zaměřena především do oblasti biologie. Na vzniku tohoto projektu se
podílela společnost IBM, která se zároveň významně zasloužila o rozvoj
a rozšíření distribuovaných výpočtů. Projekt vznikl na základě prvotní
spolupráce společností IBM a United Devices. Tehdy se jednalo o výzkum
léku proti neštovicím. Studie zahrnovala ověření 35 milionů molekul a
jejich reakce s několika bílkovinami, které tvoří toto virové
onemocnění, za účelem nalezení potenciálních léků. Během prvních 72
hodin funkčnosti projektu bylo odevzdáno na 100 tisíc výsledků. Po
skončení studie bylo nalezeno 44 velmi nadějných kandidátů. Na základě
tohoto úspěchu se IBM rozhodla vytvořit technické prostředí, pod kterým
by mohly fungovat další humanitární výzkumy. Samotný projekt WCG
odstartoval 16. listopadu 2004.
O zařazení výzkumného projektu pod WCG rozhoduje mezinárodní vědecká
rada složená ze zástupců nejprestižnějších vědeckých, výzkumných a
charitativních organizací na světě včetně národních zdravotnických
institucí, Oxfordské univerzity, Světové zdravotnické organizace a
Rozvojového programu OSN. Aby byl projekt přijat, musí kromě podpory
distribuovaných výpočtů splňovat několik základních kritérií. Především
se musí jednat o projekt vedený veřejnou neziskovou organizací, musí
být zaměřen na řešení problémů, které mohou pomoci celému lidstvu a
jeho výsledky musí být veřejně dostupné. Tedy volně k dispozici všem,
kdo by chtěli pracovat na výzkumu léků z dané oblasti.
V současné době je aktivních celkem 6 podprojektů. Výzkum je zaměřen na
boj proti hladovění v zaostalých zemích, hledání léků proti nemoci
AIDS, malárii, různým druhům rakoviny a také svalové dystrofii, kterou
trpěl i Michal Pavelka (IQE). Tento projekt nese název Help
Cure Muscular Dystrophy (dále jen HCMD) a právě možnost
zapojení přímo do výzkumu proti této zákeřné nemoci byla hlavním
impulsem sestavení týmového počítače na jeho památku.
Co přesně je cílem podprojektu HCMD a kdo za jeho vznikem stojí?
Tento projekt se zabývá oblastí výzkumu
neurosvalových
onemocnění a různých druhů svalové dystrofie. Neurosvalové onemocnění
je obecný pojem pro skupinu poruch (více než 200), které snižují
svalovou činnost, a to buď přímo prostřednictvím svalové patologie
(svalové dystrofie) nebo nepřímo prostřednictvím nervové patologie.
Většina z těchto poruch je vzácná (postihují méně než jednu osobu z
2000), mají genetický původ (80 %) a mezi postiženými jsou jak děti,
tak i dospělí. Tato chronická onemocnění vedou ke snížení svalové síly
a působí vážná postižení motorických funkcí (pohybu, dýchání, srdce
atd.). I přes pokroky v medicíně v současné době není k dispozici žádná
léčebná metoda pro osoby postižené neurosvalovými onemocněními.
Tento výzkum do distribuovaných výpočtů přinesli výzkumní pracovníci
podporovaní organizací Decrypthon, sdružující AFM (French Muscular
Dystrophy Association), CNRS (French National Center for Scientific
Research), Universite Pierre et Marie Curie, ENS Lyon, Université Paris
XI, Bordeaux 1, Lille 1 a IBM. Zkoumají vzájemné interakce mezi více
než 2200 známými strukturami bílkovin se zaměřením na ty, které hrají
roli v neurosvalových onemocněních. Vytvořená databáze získaných
informací pomůže výzkumníkům navrhnout molekuly, které by mohly vést k
léčbě svalové dystrofie a dalších neurosvalových onemocnění.
Ukázka grafického výstupu
projektu HCMD při
zpracování
na počítači.
Jak probíhá zpracování dat v podprojektu HCMD?
Hledání párů vzájemně se ovlivňujících bílkovin a
ligandů (ligand je atom, iont nebo molekula, která poskytuje jeden nebo
více elektronových párů centrálnímu atomu), nebo větších komplexů
vzájemně se ovlivňujících bílkovin patří do základního výzkumu v
biologii s bezprostředním dopadem na vývoj nových léků. HCMD je
multidisciplinární projekt, který se zabývá právě tímto druhem výzkumu.
Zpracování dat spočívá v prohledávání databáze známých bílkovin
(obsahující tisíce bílkovin) se zaměřením na určitou oblast vazeb na
jiné bílkoviny nebo ligandy. Hlavním úkolem je určit, zda jsou dvě
vybrané bílkoviny potenciálními partnery vzájemného působení v buňce.
Dále zjišťuje, jak bude tato interakce pozměněna přírodními nebo
umělými mutacemi buď v jednom z interagujících partnerů, nebo výsledkem
působení vnější molekuly, tedy nějakého farmaceutika. Databáze těchto
informací má v medicíně obrovský význam, protože podobný výzkum v
laboratorních podmínkách je příliš nákladný a zdlouhavý.
Molekulární modelování za pomoci výpočetní techniky dnes dokáže
napodobovat chování molekul na základě různých vstupních dat a ověřovat
tak mnoho vědeckých teorií. Vzájemné působení bílkovin a ligandů je
technika molekulárního modelování, která vychází z předpovědi polohy a
orientace bílkovin ve 3D prostředí. Tato metoda je založena na čistě
fyzikálních principech a je schopna do modelů zahrnout i bílkoviny s
dosud neznámými funkcemi. Jedinou podmínkou je, že jejich 3D struktura
byla určena buď experimentálně nebo ji lze odhadnout na základě
některých podobností. Program, který byl vytvořen pro zjednodušení
tohoto 3D modelování se nazývá Joint Evolutionary Trees (dále jen JET).
Ukázka funkce programu JET, který
systematicky
určí
výchozí pozici bílkovin, a určí výchozí body pro zpracování (zelené
koule na bílkovinách). Modrými a červenými tečkami je znázorněna pozice
ligandu. Zelenou tečnou jsou opět zobrazeny ty pozice, které je potřeba
zpracovat.
U složitých struktur, jako jsou bílkoviny (nejmenší jsou složeny ze stovek atomů), je k určení správné polohy a vzájemného působení dvou bílkovin zapotřebí obrovského množství výpočetního výkonu. Bez zapojení do distribuovaných výpočtů projektu World Community Grid by výpočetní nároky potřebné k tomuto modelování byly neúnosně náročné. Jen pro zpracování prvních 168 vybraných bílkovin byl odhadovaný čas na 2 Ghz procesoru 8000 let. Lidem trpícím neurosvalovými onemocněními tak díky projektu HCDM svitla naděje, že se svého léku dožijí.
První fáze projektu HCMD
První fáze zpracování dat byla ukončena v červnu
2007.
Údaje vyplývající z této první etapy byly jednak použity k nastavení
různých parametrů programu JET a také ke zjištění, jak daleko můžeme
jít ve filtrování bílkovin pro další zpracování bez ztráty důležitých
kandidátů pro pomoc v oblasti neurosvalových nemocí.
Celkem bylo modelováno vzájemné působení 168 bílkovin, které byly
zkoumány již pomocí krystalografie a o kterých existovaly předem důkazy
o vzájemném působení v buňce. Průzkum probíhal za pomoci algoritmu
MAXDo. Byly postupně zkoumány všechny páry bílkovin (28 224) a jejich
energetické hodnoty. Dle výsledků samotného provozu první fáze došlo i
k menším úpravám algoritmu MAXDo, aby výsledky druhé fáze byly
přesnější, zpracování rychlejší a tedy i celkový výzkum efektivnější.
Nově upravený algoritmus by měl již automaticky rozlišit výsledky na
pozitivní (došlo ke vzájemnému působení bílkovin) a negativní (u
kterých ke vzájemnému působení nedošlo).
Po zpracování výsledků z první fáze a dokončení příprav byla dne 13. 5.
2009 spuštěna druhá fáze projektu.
Ukázka vzájemných kombinací všech
vybraných
bílkovin.
Druhá fáze projektu HCMD
Nová verze MAXDo bude již zohledňovat informace
vytvořené programem JET. Tím dojde k poklesu potřebného výpočetního
času k určování výchozí pozice bílkovin o 85 %. V kombinaci s dalšími
vylepšeními algoritmu MAXDo by měly být pro modelování vzájemného
působení dvou vybraných bílkovin potřeba jen 3% výpočetního výkonu
oproti modelováním v první fázi.
Ve druhé fázi výzkumu bude zpracováváno celkem 2246 lidských bílkovin,
jejichž trojrozměrné struktury jsou známé (a uložené v databázi
bílkovin www.rcsb.org). Druhá fáze projektu HCMD tedy bude zpracovávat
celkem 2 466 753 párů bílkovin a zkoumat jejich vzájemné působení. Na
tento výzkum je tedy i přes velké urychlení výpočtů potřeba
několikanásobně více výpočetního výkonu než tomu bylo v první fázi. Čím
více výkonu běžných osobních počítačů tedy bude do HCMD zapojeno, tím
rychleji půjde výzkum potřebných léků proti neurosvalovým onemocněním a
svalové dystrofii kupředu.
Výpočty na GPU
Projektem, do kterého je zapojena druhá část
výkonu
PC-IQE, nese název GPUGRID. Tento projekt má
částečné návaznosti na HCMD a využívá ke zpracování dat (v současné
době) pouze výkonu grafických karet nVidia. Všechny 4 karty (8
grafických jader) PC-IQE odvádějí neuvěřitelné množství výpočetního
výkonu do této oblasti výzkumu.
Projekt je zaměřen na výpočty v oblasti biologie a biomedicíny.
Přesněji se jedná o studium vlastností biomolekul, jejich vzájemného
ovlivňování a dynamického chování. K výpočtům jsou používány různé
metody pro popis biologických problémů v atomárních, molekulárních i
nadmolekulárních systémech. Zkoumá se zde také vzájemné působení mezi
různými bílkovinami, nebo bílkovinami a ligandy. Podobnost výzkumu s
výpočty podprojektu HCMD pod projektem WCG není náhodná. Zde ovšem
nejde o úzce zaměřenou oblast bílkovin a konkrétního využití, ale o
celkové porozumění molekulárním interakcím. Momentálně probíhá výzkum
dopaminových receptorů, bílkoviny SH2 a enzymu TPI. Projekt
v současné době kromě výpočtů prostřednictvím grafických karet
nVidia s podporou technologie CUDA rozjíždí ještě testování
aplikace pro grafické karty ATI. Prvotní fáze projektu (rok 2007-2008)
ovšem probíhala pod názvem PS3GRID a využívala výhradně výpočtů
prostřednictvím herních konzolí playstation 3 a jejich sedmijádrových
procesorů CELL.
Cílem projektu je doplnit informace o bílkovinách, jejich funkci,
vzájemném působení, struktuře a tím rozšířit možnosti boje proti
některým zákeřným nemocem.