Zamyšlení: Už i univerzita zkoumá jak nejlépe ukládat informace |
autor: Dočekal Daniel , publikováno 14.2.2005 |
Na Washingtonské univerzitě se věnují čemusi, co jsme probírali nedávno na setkání GigaCentristů v úzkém kroužku několika bloggerů - a totiž to, jakým způsobem lidé třídí informace. A protože jsem právě přes Google News objevil článek o zkoumání na UW, hodlám se právě dokopat k tomu, abych o tom něco hodil na "papír". Elektronický, pochopitelně.
Začněte trochu přemýšlet nad tím, jak si ideálně představujete uložení vámi používaných informací, schválně co vám z toho vyjde. Nejlépe se to pochopitelně demonstruje na elektronické poště a souborech - tyto dvě kategorie nosičů informací zaručeně používáte. Budete-li ale přemýšlet více, najdete i leccos dalšího, co vyžaduje práci s informacemi - fotogalerie, zajímavé internetové odkazy či kontakty. Po chvíli přemýšlení dojdete určitě k několika alternativám.
Velmi častý způsob je třídění informací do složek - vytvoříte si takovou strukturu složek a podsložek (na disku, nebo v mailovém programu), jaká vám vyhovuje. A do ní třídíte poštu či soubory - v případě pošty vám v tom navíc často pomáhají různá automatická pravidla. V případě souborů tak činíte zpravidla ručně - soubor uložíte tam "kam patří" v okamžiku vytvoření nebo získání.
V okamžiku, kdy je potřeba nějaké informace najít, začnete na "předpokládaném" místě v stromu složek. A při trošce štěstí něco najdete. Za sebe ale mohu rovnou říci, že po čase nenajdu vůbec nic. A po ještě delším čase zjistím, že stejně nedodržuji vytvořený systém složek a vytvářím další, paralelní systém.
Proto se mi hodil další způsob - nechat všechno jak to je (tj. na jednom místě) a poté hledat pomocí kvalitního fulltextového hledání. Tahle metoda se mi perfektně osvědčila u Googláckého 1GB mailu (www.gmail.com) - prostě to tam tak nějak perfektně hledá. A když potřebuji nějaký mail, tak mi ho to najde. Pochopitelně, jako doplněk "ponechání kde to leží" je ještě potřeba mít možnost nějak některé vybrané zprávy/soubory označovat - buď nějakými barvami, nebo nějakými slovy (nálepkami).
Právě v možnostech označovat je, pro mojí maličkost, skryto konečné řešení celého problému. Mám minimalistickou sadu složek (do kterých přeci jenom některé věci třídím) a k tomu používám zhusta označování nálepkami (v Outlooku zejména barvičkami) - u těch věcí, které jsou nějakým způsobem "pravděpodobně" významější.
Dřívě zmíněný článek o zkoumání na UW mě ale přivedl ještě k dalším postřehům, které se mi nedařilo formulovat dříve. Například fenoménu "dokázat najít již nalezené". Zajímavá věc, všimli jste si, jak často vlastně potřebujete znovu nalézt to, co jste již jednou našli? A já v tomhle občas jdu tak daleko, že důležité věci si pošlu sám sobě elektronickou poštou. Zajímavé, jako by právě e-mail hrál nějakou významější roli.
Nebo skutečnost, rovněž popsaná v článku, že lidé nemají tendenci používat samostatné programy k tomu, aby si dělali pořádek ve svých informací. Věci "z Outlooku" prostě chtějí organizovat "v Outlooku". Na tomhle zjištění pravděpodobně také něco bude - na sobě to vidím třeba v tom, že jsem vyzkoušel řadu programů na "vyhledávání v počítači" (tolik proklamovaný Desktop Search), ale nakonec jsem je všechny smazal. Nedokázaly ve skutečnosti ani píď toho, co dokáže obyčejný Gmail. A dodnes například sním o tom, že Microsoft do Outlooku konečně dodělá vyhledávání. Protože to co tam je, to je neuvěřitelně pomalé a rozhodně ne fulltextové.
Právě vědci na UW došli k tomu, co vlastně i nejvíce vyhovuje mě - mít možnost označkovat (polepit, oznámkovat) cokoliv co je potřeba nějak "katalogizovat" - a to tak, aby oněch značek mohlo být libovolný počet na jednu určitou věc. A pochopitelně, aby nijak nesouvisely s tím, jak je ta či která věc vlastně v počítači uložena.
A uplně nakonec. Víte, že můj Compaq iPaq už dávno skončil někde na dně šuplíku a místo něj používam obyčejný papírový diař a k němu mobilní telefon? O něčem to také svědčí. Ale o tom možná někdy jindy.
Redakce si vyhrazuje právo odstranit neslušné a nevhodné příspěvky. Případné vyhrady na diskuze(zavináč)pctuning.cz
možná bych před "vyhledávání" měl dát slovo "skutečné"
Gmail, google: nevite jak hledat i podle casti slova ? OExpress to umi a google ani gmail ne ? Format blabl* nefunguje...
Rychlost je neuveritelna- vysledky hledani se zobrazujou okamzite behem psani.
Pokud se to Redmondakum podari ve svem WinFS obslehnout alespon z poloviny tak to bude parada.
http://www.lookoutsoft.com/Lookout/
já více méně všechno třídím do složek a podle názvu.
To co už mám na CD, tak hodím do Catalogu 1.48 a hledám v něm. Na disku vyhledávám zpravidla ručně, to není tak velký problém, když je to utříděné a při menších problémech s pomocí Total commanderu (Alt+F7).
Maily třídím do složek, ale v tom je takový bordel, že to vždycky smažu a mám zase chvíli klid.
Tom
Mozno je to zvykom, ale ja s tym nemam nejmensi problem, vyhladanie potrebneho mailu ci suboru mi zaberie naozaj malo casu.
Mam urcity system ukladania suborov, ten striktne dodrzujem. Neviem si predstavit ze by som mal vsetko nahadzane v jednej zlozke, to by bola pre mna tragedia.
Kazdopadne, kolko ludi tolko nazorov...
http://www.lookoutsoft.com/Lookout/download.html
neco;1
neco;2
...
Jinak Digital VMS je uzasny OS.
A to že iPaq skončil na dně šluplíku.... inu není nad to napsat si něco vlastní rukou na papír. A myslím že ani elektronický papír to nezmění :-))
Když si vyrobíte kvalitní systém složek a podložek, tak není co řešit ;-) (Většinou to nedokážou dodržovat ti lidi, kteří nedokážou ani přestat kouřit:o) --> většina lidí, co pracuje s počítačem a mají v něm bordel jsou kuřáci <-- Murphyho zákon:o)
Jinak vice k tematu:
osobne nejradsi strom - ma ale dva problemy:
1) pokud neni clovek opravdu pedant, je v tom za chvili bor...
2) i kdyby clovek pedantem byl, jak navrhnout strom? Aneb "mam tu prezentacku narvat do adr. prijate, prace, prezentacky, nebo udelat prezentacky prace? Nebo... aaaa jdu se povesit..."
Resenim je hromada + databaze, znackovani pri prvnim objeveni informace, krapet inteligentnejsi stroj bdici nad tim vsim. M$ neco takoveho zrejme dela, jestli me ale mile prekvapi, bude to reseni tak na 65%... Aneb clovece, udelej si sam :/
Mimochodem: co centralni datatypy a identifikace souboru dle obsahu (viz Amiga)? Nevim jak u Linuxu/Maca, ale na Wintelech to asi jeste nepochopili...
Navic by se do souboroveho systemu mohli dostat i maily, kontakty apod. Kazdy mail by byl ulozen jako soubor, kazdy kontakt. V databazi to neni problem, u souboroveho systemu to problem je, protoze ktery souborovy system si dnes poradi s miliardou souboru? Teda uprimne znam takovy - ReiserFS, ale ten zase nema vyhledavani, i kdyz si dokaze efektne poradit s obrovskym mnozstvim souboru a dokonce i obnovou po havarii.
Je to hodně složitý na programování, hlavně, když je potřeba data dynamicky pozměňovat, ale není to zas takový problém.
Jak přinutit programátory pro PC, aby to tak dělali? Představte si ten pocit otevřít C:\ a mít pouze kategorie a v nich jednotlivé soubory. Např c:\hry vyberu jakýkoliv soubor kliknu a mám to spuštěný, už žádný projíždění souborů. Indexování by bylo daleko rychlejší, v případě fat tabulek by vše běželo rychleji, registry by byly několikanásobně menší, atd.
Bylo by to perfektní, jen se k tomu nikdo nemá a tak naše disky zejména operační soubory jsou změtí nejrůznějších souborů, nejvíc mi vadí instalace (je to obyčejná dekomprimace souborů s přidáním informací do registrů), proč to nenaprogramovat tak, aby se dekomprimovalo a komprimovalo realtime? PC už na to jsou rychlé dost.
Čili spustím soubor, ten si dynamicky dekomprimuje požadovanou část do paměti a při ukončení ji opět vymaže. To bych chtěl !