Hlavní stránka Multimédia DD blog Zamyšlení: Už i univerzita zkoumá jak nejlépe ukládat informace
Zamyšlení: Už i univerzita zkoumá jak nejlépe ukládat informace
autor: Dočekal Daniel , publikováno 14.2.2005
Vyhovuje vám více všechno třídit do složek a podsložek? Nebo naopak rádi "plochou" strukturu doplněnou kvalitním vyhledávacím mechanismem? Zamyšlení v článku, mimochodem, očekává, že budete reagovat.

Na Washingtonské univerzitě se věnují čemusi, co jsme probírali nedávno na setkání GigaCentristů v úzkém kroužku několika bloggerů - a totiž to, jakým způsobem lidé třídí informace. A protože jsem právě přes Google News objevil článek o zkoumání na UW, hodlám se právě dokopat k tomu, abych o tom něco hodil na "papír". Elektronický, pochopitelně.

Začněte trochu přemýšlet nad tím, jak si ideálně představujete uložení vámi používaných informací, schválně co vám z toho vyjde. Nejlépe se to pochopitelně demonstruje na elektronické poště a souborech - tyto dvě kategorie nosičů informací zaručeně používáte. Budete-li ale přemýšlet více, najdete i leccos dalšího, co vyžaduje práci s informacemi - fotogalerie, zajímavé internetové odkazy či kontakty. Po chvíli přemýšlení dojdete určitě k několika alternativám.

Velmi častý způsob je třídění informací do složek - vytvoříte si takovou strukturu složek a podsložek (na disku, nebo v mailovém programu), jaká vám vyhovuje. A do ní třídíte poštu či soubory - v případě pošty vám v tom navíc často pomáhají různá automatická pravidla. V případě souborů tak činíte zpravidla ručně - soubor uložíte tam "kam patří" v okamžiku vytvoření nebo získání.

V okamžiku, kdy je potřeba nějaké informace najít, začnete na "předpokládaném" místě v stromu složek. A při trošce štěstí něco najdete. Za sebe ale mohu rovnou říci, že po čase nenajdu vůbec nic. A po ještě delším čase zjistím, že stejně nedodržuji vytvořený systém složek a vytvářím další, paralelní systém.

Proto se mi hodil další způsob  - nechat všechno jak to je (tj. na jednom místě) a poté hledat pomocí kvalitního fulltextového hledání. Tahle metoda se mi perfektně osvědčila u Googláckého 1GB mailu (www.gmail.com) - prostě to tam tak nějak perfektně hledá. A když potřebuji nějaký mail, tak mi ho to najde. Pochopitelně, jako doplněk "ponechání kde to leží" je ještě potřeba mít možnost nějak některé vybrané zprávy/soubory označovat - buď nějakými barvami, nebo nějakými slovy (nálepkami).

Právě v možnostech označovat je, pro mojí maličkost, skryto konečné řešení celého problému. Mám minimalistickou sadu složek (do kterých přeci jenom některé věci třídím) a k tomu používám zhusta označování nálepkami (v Outlooku zejména barvičkami) - u těch věcí, které jsou nějakým způsobem "pravděpodobně" významější.

Dřívě zmíněný článek o zkoumání na UW mě ale přivedl ještě k dalším postřehům, které se mi nedařilo formulovat dříve. Například fenoménu "dokázat najít již nalezené". Zajímavá věc, všimli jste si, jak často vlastně potřebujete znovu nalézt to, co jste již jednou našli? A já v tomhle občas jdu tak daleko, že důležité věci si pošlu sám sobě elektronickou poštou.  Zajímavé, jako by právě e-mail hrál nějakou významější roli.

Nebo skutečnost, rovněž popsaná v článku, že lidé nemají tendenci používat samostatné programy k tomu, aby si dělali pořádek ve svých informací. Věci "z Outlooku" prostě chtějí organizovat "v Outlooku". Na tomhle zjištění pravděpodobně také něco bude - na sobě to vidím třeba v tom, že jsem vyzkoušel řadu programů na "vyhledávání v počítači" (tolik proklamovaný Desktop Search), ale nakonec jsem je všechny smazal. Nedokázaly ve skutečnosti ani píď toho, co dokáže obyčejný Gmail. A dodnes například sním o tom, že Microsoft do Outlooku konečně dodělá vyhledávání. Protože to co tam je, to je neuvěřitelně pomalé a rozhodně ne fulltextové.

Právě vědci na UW došli k tomu, co vlastně i nejvíce vyhovuje mě - mít možnost označkovat (polepit, oznámkovat) cokoliv co je potřeba nějak "katalogizovat" - a to tak, aby oněch značek mohlo být libovolný počet na jednu určitou věc. A pochopitelně, aby nijak nesouvisely s tím, jak je ta či která věc vlastně v počítači uložena.

A uplně nakonec. Víte, že můj Compaq iPaq už dávno skončil někde na dně šuplíku a místo něj používam obyčejný papírový diař a k němu mobilní telefon? O něčem to také svědčí. Ale o tom možná někdy jindy.

 
Komentáře k článku
RSS
Pouze registrovaní uživatelé mohou přidat komentář!
15.2.2005 17:25:43   0.0.0.xxx 4545
he? jak "že Microsoft do Outlooku konečně dodělá vyhledávání" to tam neni???? to v opere je indexovaci system jako ve vyhledavaci....
15.2.2005 17:46:46   0.0.0.xxx 5250
V Outlooku je velmi základní "tupé" vyhledávání mající dvě vady - není to fulltext a je to neuvěřitelně pomalé. Viz věta "Protože to co tam je, to je neuvěřitelně pomalé a rozhodně ne fulltextové." v článku.

možná bych před "vyhledávání" měl dát slovo "skutečné"
15.2.2005 19:34:46   0.0.0.xxx 6244
Kdo neznate, doporucuju http://del.icio.us - ke kazde zalozce libovolny pocet tagu, ovladani pres bookmarklet. A na fotky www.flickr.com

Gmail, google: nevite jak hledat i podle casti slova ? OExpress to umi a google ani gmail ne ? Format blabl* nefunguje...
15.2.2005 22:02:56   0.0.0.xxx 5249
Naprosty souhlas s autorem. Zda se, ze jako prvni prijde s resenim Apple se svou technologii Spotlight. Diky pluginum je to navic rozsiritelny system. Chcete vyhledat slovo v PDF? Nebo dle informaci z EXIFu? Nebo ID3? Neni problem.

Rychlost je neuveritelna- vysledky hledani se zobrazujou okamzite behem psani.

Pokud se to Redmondakum podari ve svem WinFS obslehnout alespon z poloviny tak to bude parada.
16.2.2005 05:47:30   0.0.0.xxx 4545
Po mnoha problémech najít konkrétní soubor či mail (mám cca 1 GB dokumentů ve Wordu a 4GB PSTček včetně archivů) jsem se dostal až k aplikaci Copernic desktop search. Jako jediná mi plně vyhovuje, především rychlým vyhledáváním a náhledy nalezených souborů či mailů. K tomu ještě používám v Outlooku systém praporků (označené maily se zobrazují ve složce "pro zpracování").
16.2.2005 07:59:16   0.0.0.xxx 4748
Nejlepší vyhledávaní pro Outlook je Lookout
http://www.lookoutsoft.com/Lookout/
16.2.2005 08:03:57   0.0.0.xxx 4646
Zdar,
já více méně všechno třídím do složek a podle názvu.
To co už mám na CD, tak hodím do Catalogu 1.48 a hledám v něm. Na disku vyhledávám zpravidla ručně, to není tak velký problém, když je to utříděné a při menších problémech s pomocí Total commanderu (Alt+F7).
Maily třídím do složek, ale v tom je takový bordel, že to vždycky smažu a mám zase chvíli klid.
Tom
16.2.2005 08:59:36   0.0.0.xxx 4848
Ta teorie o "ploche strukture" ma hlavne u souboru jedna zasadni vadu. MS dodneska nebyl schopnej upravit system tak, aby mohlo mit nekolik souboru stejnej nazev (podle me by to slo - jde jen o "tradici"). Potom pokud byste meli tuny souboru v jedne slozce, tak by se kazdej musel jmenovat jinak (pokud by to samozrejme byl stejnej typ souboru), coz je neprakticky (casem budou ty nazvy docela dlouhy) ale i slozity. Samozrejme u mailu to tak neni.
16.2.2005 14:56:44   0.0.0.xxx 4545
nějaxem nepobral o čemže to tenhle článek je ...?
16.2.2005 15:00:10   0.0.0.xxx 4850
Ja uz roky pouzivam triedenie mailov a suborov do zloziek.
Mozno je to zvykom, ale ja s tym nemam nejmensi problem, vyhladanie potrebneho mailu ci suboru mi zaberie naozaj malo casu.
Mam urcity system ukladania suborov, ten striktne dodrzujem. Neviem si predstavit ze by som mal vsetko nahadzane v jednej zlozke, to by bola pre mna tragedia.
Kazdopadne, kolko ludi tolko nazorov...
16.2.2005 15:06:39   0.0.0.xxx 4347
no flame, ale podle ceho bys ty chytrej chtel ten soubor definovat?
16.2.2005 17:47:22   0.0.0.xxx 5051
co takto si nainstalovat lookout??? Pouzivam uz 8mes a by som bol bez neho strateny.
http://www.lookoutsoft.com/Lookout/download.html
17.2.2005 09:42:58   0.0.0.xxx 6747
Treba tak, jak to je resene v OS VMS. Je to ale trochu o zvyk a ze zacatku o nervy ;-)

neco;1
neco;2
...

Jinak Digital VMS je uzasny OS.
17.2.2005 18:16:04   0.0.0.xxx 5051
Ale myslím že každému vyhovuje jiné uspořádání. Někdo rád velkou hromadu v které věci loví, někdo rád úhledné komínky a někdo hromadu šuplíků a podšuplíků.
A to že iPaq skončil na dně šluplíku.... inu není nad to napsat si něco vlastní rukou na papír. A myslím že ani elektronický papír to nezmění :-))
18.2.2005 17:17:00   0.0.0.xxx 4547
Rozhodně do složek...
Když si vyrobíte kvalitní systém složek a podložek, tak není co řešit ;-) (Většinou to nedokážou dodržovat ti lidi, kteří nedokážou ani přestat kouřit:o) --> většina lidí, co pracuje s počítačem a mají v něm bordel jsou kuřáci <-- Murphyho zákon:o)
18.2.2005 20:53:21   0.0.0.xxx 5050
fajn clanek - privedl me na jednu myslenku - k cemu ze je OS? Ha, 1 - k spousteni programu... Oki, k cemu je spousteni programu / k cemu je ta kalkulacka? Hahaaa, k zpracovani informaci > OS je k zpracovani informaci... Chtelo by to neco krapet inteligentniho - a tim nemyslim system s hlavou a patou (aka Amiga, AS/400, OpenVMS), tim myslim stroj, co bude sledovat uzivatele a pracovat pro nej...

Jinak vice k tematu:
osobne nejradsi strom - ma ale dva problemy:
1) pokud neni clovek opravdu pedant, je v tom za chvili bor...
2) i kdyby clovek pedantem byl, jak navrhnout strom? Aneb "mam tu prezentacku narvat do adr. prijate, prace, prezentacky, nebo udelat prezentacky prace? Nebo... aaaa jdu se povesit..."
Resenim je hromada + databaze, znackovani pri prvnim objeveni informace, krapet inteligentnejsi stroj bdici nad tim vsim. M$ neco takoveho zrejme dela, jestli me ale mile prekvapi, bude to reseni tak na 65%... Aneb clovece, udelej si sam :/

Mimochodem: co centralni datatypy a identifikace souboru dle obsahu (viz Amiga)? Nevim jak u Linuxu/Maca, ale na Wintelech to asi jeste nepochopili...
21.2.2005 08:36:23   0.0.0.xxx 6747
Vse je jen o zvyku a smyslu dodrzovat poradek v PC. Ja mam v C. ctxri slozky, pouzivam pro sve data dokumenty a pro programy Program files a jsem spokojen. Moznost oznacovat a fulltextove hledat je ovsem take zajimave, ale neverim, ze soucasny OS by byl schopen vyhledat data rychle a efektivne. Vyhledavani v WinXP jsem uz davno vzdal. No A pokud svuj Compaq iPaq nepouzivas, tak bis mi ho mohl strelit :-)
21.2.2005 14:38:40   0.0.0.xxx 4649
Mam na svych 2 discich celkem 160GB dat roztridenych do slozek. Neni to zadny presne dany hierarchicky system, nekdo by to dokonce mozna mohl nazvat anarchismem , ale ja s tim zadny problem nemam. Vetsinou to co hledam najdu do par vterin. Bud vim presne kde to je, nebo aspon zhruba tusim kde by se dana vec mohla nachazet a pak si pomuzu klasickym windows vyhledavanim pres F3. Na offline vyhledavani na cd/dvd se mi osvedcilo WhereIsIt.
22.2.2005 12:24:56   0.0.0.xxx 5149
Podle me je nejvetsi chyba v dnesnich souborovych systemech, ktere vyuzivaji 30 let stare principy. Sebelepsi souborovy system proste neni schopnej dodat to co je potreba. Idealni by bylo nahradit souborovy system databazi, bylo by to mnohem rychlejsi, predstavte si, ze by smazani milionu souboru trvalo sekund, nebo jejich prejmenovani sekund, ci vyhledani sekundu, ty moznosti databazi jsou nekde jinde.

Navic by se do souboroveho systemu mohli dostat i maily, kontakty apod. Kazdy mail by byl ulozen jako soubor, kazdy kontakt. V databazi to neni problem, u souboroveho systemu to problem je, protoze ktery souborovy system si dnes poradi s miliardou souboru? Teda uprimne znam takovy - ReiserFS, ale ten zase nema vyhledavani, i kdyz si dokaze efektne poradit s obrovskym mnozstvim souboru a dokonce i obnovou po havarii.
22.2.2005 13:20:01   0.0.0.xxx 5046
Je pravda že jsem sve PDA na psani poznamek prestal pouzivat. Tak nejak je ten normalni papir prece jen lepsi.
23.2.2005 10:57:35   0.0.0.xxx 4550
Vynikajuca aplikacia: rychle vyhladavanie, inteligentna indexacia, funguje samostatne a je zadarmo bez hlupich reklam a spamov. Vyhladavanie v Win XP so psikom nestoji za nic, toto riesenie ho nahradza na 800%. Idexaciu v XP som uz davno vypol a keby sa ten vyhladavaci pes dal odinstalovat, tak je uz davno prec
10.12.2005 20:12:58   84.242.94.xxx 4546
Nejlepší by bylo 1 program = 1 soubor.
Je to hodně složitý na programování, hlavně, když je potřeba data dynamicky pozměňovat, ale není to zas takový problém.

Jak přinutit programátory pro PC, aby to tak dělali? Představte si ten pocit otevřít C:\ a mít pouze kategorie a v nich jednotlivé soubory. Např c:\hry vyberu jakýkoliv soubor kliknu a mám to spuštěný, už žádný projíždění souborů. Indexování by bylo daleko rychlejší, v případě fat tabulek by vše běželo rychleji, registry by byly několikanásobně menší, atd.

Bylo by to perfektní, jen se k tomu nikdo nemá a tak naše disky zejména operační soubory jsou změtí nejrůznějších souborů, nejvíc mi vadí instalace (je to obyčejná dekomprimace souborů s přidáním informací do registrů), proč to nenaprogramovat tak, aby se dekomprimovalo a komprimovalo realtime? PC už na to jsou rychlé dost.

Čili spustím soubor, ten si dynamicky dekomprimuje požadovanou část do paměti a při ukončení ji opět vymaže. To bych chtěl !
10.12.2005 20:13:30   84.242.94.xxx 4749
Ještě si uvědomte jak rychlé by bylo vyhledávání při tak malém počtu souborů na disku
23.9.2008 16:11:02   84.42.208.xxx 21
test

Redakce si vyhrazuje právo odstranit neslušné a nevhodné příspěvky. Případné vyhrady na diskuze(zavináč)pctuning.cz

0 čtenářů navrhlo autorovi prémii: 0Kč Prémie tohoto článku jsou již uzavřené, děkujeme za váš zájem.
Tento web používá k poskytování služeb soubory cookie.