Diakritika v adresách - zkáza internetu?
autor: Filip Eckstein , publikováno 23.7.2008
Je to už nějaký ten pátek, co se světem internetových domén začal rozmáhat další podivný fenomém. Myšlenka zavedení národních znaků do systému webových domén může znít v první chvíli geniálně, nicméně opak je pravdou. Jedná se ale opravdu o další planý poplach šílených vědátorů? Snad ano.

Zavedení diakritiky ve webových adresách, a tím i rozšíření poměrně omezené ASCII znakové sady, je jistě velice zajímavá a záslužná idea. Znalejší z vás jistě napadla otázka, jak vlastně může celý tento systém fungovat v kombinaci s klasickým DNS standardem. Ten totiž, jak všichni jistě víme, umí pracovat jen s ASCII. Princip samotný je vlastně docela jednoduchý.

Po technické stránce vyřešeno... bohužel

V první řadě je třeba vědět, co to vlastně je IDN. Jak už ze zkratky samotné vyplývá (Internationalized Domain Names), jedná se o novou standardu internetových domén, která upravuje pravidla pro používaní národních znaků ve webových adresách. Dále už tedy budeme o tomto systému mluvit jen ve zkratce - IDN.

Jak už jsem výše zmiňoval, nynější DNS (Domain Name System) s jinými, než čistě anglickými ASCII znaky nedokáže pracovat. Jinak by to už v dnešní době ani nešlo. Každá doména má svojí vlastní IP adresu, která se vytváří právě na základě přidělené domény. DNS má tedy svoji vlastní metodu, jak ASCII bez problému převádět na IP. Měnit ji by bylo nesmírně složité, jelikož je třeba mít na mysli, že standard by se musel měnit v globálním měřítku, a to je opravdu neřešitelný oříšek. Nic ale není ztraceno, pár "šílených vědátorů" skutečně přišlo na způsob, jak několikatisíceré rozšíření znakové sady implementovat. IDN je vlastně jenom jakási "nadstavba" nad běžným dnes používaným DNS. Po výpisu domény ve formátu IDN se všechny diakritické znaky převedou na kód ve znakové sadě ASCII. V praxi to znamená, že uvedená "rádoby" diakriticky přívětivá doména je vlastně jen její delší ASCII verze. Uvedem si to na příkladu domény "www.háčkyčárky.cz" (existující doména, pod níž se skrývá český projekt pro zavedení IDN i v Čechách). Zkuste si ji zadat do prohlížeče - po načtení stránky se vám místo diakriticky krásné domény zobrazí něco na způsob "www.xn--hkyrky-ptac70bc.cz". Ano, to je právě ono převedení národních znaků na běžné ASCII kódování. Písmena, jež jsou součástí domény a svým formátem odpovídají standardní znakové sadě ASCII se nijak nezměnili - viz. "hkyrky". Po pomlčce už následuje řada nesrozumitelných číslic a písmen - to pak představuje samotné převedení znaků "á" a "č" do DNS "srozumitelné" formy. Nakonec nesmíme zapomenout ani na prapodivné znaky "xn--". Ty definují, že se jedná o IDN doménu, jsou tedy konstantní; chybět by neměly v žádné diakriticky přátelské webové adrese. A máme to. V praxi si tak vlastně zaregistrujeme ne jednu, ale hned dvě domény. Prozíravé, že?


S přeložením vámi definované IDN domény vám pomůže server háčkyčárky.cz

IDN? Ne, děkujem.

Nyní už se konečně dostáváme k jádru věci. Mnozí z vás jistě již mají alespoň nepatrnou představu o tom, co nám vlastně používání takových domén v praxi přinese. Abych pravdu řekl, téma je to vskutku paradoxní. Na jednu stranu bude internet zase o kousek přívětivější a lidštější, na stranu druhou nám zavedení IDN do běžné praxe přinese mnoho bezpečnostních rizik a nejen jich. Víte třeba, kdo to je takový type-squatter? Inu, to je osoba, která využije překlepů, jež se většina uživatelů internetu může dopustit například při "vyklepávání" webové adresy nějaké známé společnosti nebo serveru. Mohu vymyslet fiktivní příklad. Dobře demonstrovat se to bude například na webové doméně www.banka-čech.cz - takovému type-squatterovi stačí zaregistrovat www.banka-cech.cz. A je to tady, teď už jen zbývá perfektně napodobit přhlašovací interface domovských stránek napadené společnosti a loupež století je na světe. Ochran proti type-squatterům v současné době zatím moc není, snad jen registrace více domén, tedy i těch s překlepem. Dobrým příkladem je například Google, ten se proti takovým osobám již pojistil. Koneckonců si to můžete vyzkoušet sami. V poli pro zadání webové adresy spáchejte asi nejčastější chybu, jež se při návštěvě vyhledavače dopouští nejvíce uživatelů - Google s jedním "o" - tedy www.gogle.com. Teď ale upřímně, kolik společností si může dovolit registrovat několik variant domény jen proto, aby se vyhnuly bezpečnostním rizikům? Nehledě na to, variant je rovnou celá řada. Co když se mi podaří napsat Google ne s jedním "o", ale naopak se dvěma "l"? To je právě to, proč je IDN pro internet tak nebezpečné - mnohem více příležitostí, jak napálit, okrást nebo zneužit - především pak ty důveřivější - uživatele internetu.

Kdyby to tak ale bylo jen o té bezpečnosti. Některé národní weby budou například totálně uzavřené jen komunitě hovořící danou řečí. Abych zde nemluvil do vzduchu, uvedu příklad. Jen si zkuste na klávesnici "vyťukat" třeba www.даль.com nebo www.茶.co.jp. Nejspíš už asi víte, co jsem tím měl na mysli, vyhledávání na internetu nebude jednoduší, ba dokonce možná i složitější. To je právě to, co mě děsí.

Česi zatím odolávají, ale na jak dlouho?

V České republice je situace zatím klidná. Podle několika výzkumů o to většina společností a valná většina uživatelů nemá zájem. V současné době je tedy vývoj a udělování domén IDN standardu v ČR pozastaveno. Tento stav však nepotrvá věčně, celkem nedávno se českým internetem začala šířit výhružka o opět stoupajícím zájmu a pomalu zvyšující se aktivitě ze strany projektu www.háčkyčárky.cz. Je tak docela pravděpodobné, že současný "zmrazený" stav se brzo promění ve velký boom. Možná působím poněkud konzervativně, nicméně myšlenka zavádění IDN se mi ani trochu nelíbí.



Tagy: Diakritika  adresa  web  zkaza  
 
Komentáře k článku
RSS
Pouze registrovaní uživatelé mohou přidat komentář!
23.7.2008 22:30:46   83.240.80.xxx 184
Taky si myslím, že to není zrovna přínos.
Ale rozesmálo mě po přeložení...
www.даль.com (www.vysoký.cz)
www.茶.co.jp (www.čaj.co.com)

Moc hezký příklad
27.7.2008 09:17:31   88.212.18.xxx 143
diakritika? a naco? aby sa uz tak dost omylni ludia mohli mylit este viac? co zleho je na tom, co mame dnes? ludia sa MUSIA ucit aj ine jazyky. ak budeme ovladat len ten svoj tak to nikam nepovedie (Predstavte si ze by sa ludia neucili iny jazyk nez ten svoj, kde by sme boli dnes). Zato ze niekto nie je schpony naucit sa aspon HURBE zaklady cuzdieho jazyka (v internete najcastejsie anglictina) ... tak to je jeho problem. Da sa to, ak clovek chce

uz len cakam kedy budu chciet ti "experti" zaviest diakritiku aj do programovania a dalsich sfer zivota... LOL

o xvilu budeme mat nove instrukcie v procesoroch:

"MDX" (Multi-Diacritics-eXtension) - podpora diakritiky
23.7.2008 23:24:47   62.209.237.xxx 186
Zobrazení názvu domény je asi závislé na prohlížeči - po zadání www.háčkyčárky.cz se zobrazí buď www.háčkyčárky.cz (IE7) nebo výše zmíněné www.xn--hkyrky-ptac70bc.cz (firefox)
24.7.2008 08:50:11   82.209.36.xxx 156
Ano, je zavisle na prohlizeci - Safari can’t open the page “http://www.háčkyčárky.cz/” because it can’t find the server “www.háčkyčárky.cz”.

Ale jinak jsem vsema deseti pro IDN. Nerikam ze u nas, ale treba v rusku ci japonsku jsou lidi co chcou na internet nuceni znat nase (pro ne cizi) znaky ... schvalne, kolik z Vas ovlada azbuku nebo japonske ci cinske znaky ?
24.7.2008 09:22:05   217.67.21.xxx 153
no neviem ci si niekedy videl japonsku klavesnicu, ty si myslis ze oni maju klavesnicu s nejakymi 200 klavesami aby mohli pisat?
japonci maju klasicke qwerty(z) klavesnice, jedine co je ine je japonsky windows, ktory automaticky preklada klasicke znaky na tie ich. teda ty napises "arigato gozaimas" a windows to automaticky zmeni na tie ich znaky...
takze kazdy japonec co ma pocitac "nase" znaky ovlada, o to sa neboj...

neviem ako je to azbukou, ale tam to bude asi ine, kedze v podstate jeden ich znak reprezentuje jeden nas znak, takze klavesnice maju asi azbukove...
24.7.2008 09:32:44   82.209.36.xxx 144
Presne tak, ruska klavesnice je stejne jako nase - jeden znak jedno pismeno. Je to stejny druh jazyka - ctes tak jak je to napsane na obrazovce/papiru ne jak anglictina ... pisu beautifull a ctu to bjutyfl.

S tou japonstinou diky za osvetleni - tohle jsem nevedel, ale mam pocit ze existuji i znakove klavesy, protoze jsem enco takoveho videl na jedne fotky ... klavesnici plnou rosypaneho caje
24.7.2008 08:16:11   85.207.200.xxx 154
"A je to tady, teď už jen zbývá perfektně napodobit přhlašovací interface domovských stránek napadené společnosti a loupež století je na světe."

A především certifikát banky. ;-)

"Jen si zkuste na klávesnici "vyťukat" třeba www.даль.com nebo www.茶.co.jp."

Očekávám, že obsah takovýchto stránek pro mě stejně nebude čitelný a pokud tam budou informace "mezinárodního charakteru", tak tam bude běžná ASCII doména a angličtina jako jeden z jazyků k výběru.

Jako spravce sítě (a tím i DNS) bych mohl být tisíckrát proti, ale nejsem. Naopak mě velmi naštvě, když ještě po více než 15letech od vzniku unicode ještě někde musím konvertovat mezi kodováními.
24.7.2008 08:53:04   82.209.36.xxx 134
"Naopak mě velmi naštvě, když ještě po více než 15letech od vzniku unicode ještě někde musím konvertovat mezi kodováními."

+1 - vyborne, ja jsem sice spravce pouze sveho vlastniho serveru a svych vlastnich webu, ale kdyz jsem chtel presunout data z jedne SQL do jine, tak to nakonec skoncilo tak ze jsem sice presunul hosting stranek, ale data zustala ve stejne databazi jelikoz ani po 38mi (nekecam) pokusech o import/export dat se nepovedlo naimportovat vse korektne s cestinou a jejimi znaky.
24.7.2008 20:19:25   217.119.116.xxx 134
presne, tieto rozne kodovania seru aj mna,, nemoze byt jedno kodovanie ktore by obsahovalo vsetky znaky na svete a ostatne dame proste prec?
29.7.2008 22:45:41   92.52.3.xxx 143
UTF-8 ?
Len to by muselo byť ako výchozie kódovanie majoritného OS - Windowsu... ale nie je stále bohužial existuje humus typu CP1250.
24.7.2008 09:38:35   77.48.235.xxx 134
Dle meho nazoru je to pitomost! Pro jednotliveho uzivatele se to akorat zhorsi! Predstavte si mit 2 a vice adres rozlisene jen diakritikou! Jinak hackycarky.cz mi na linuxu nejde http://www.flickr.com/photos/28927535@N06/2698294366/
24.7.2008 10:16:10   78.45.90.xxx 143
Na co taky ? na co bych měl zas vypisovat diakritiku do pole vkladajciho se adresa ? Vždyť je to naprosto k ničemu, ja nevim jeslt izas Češi potřebujou byt v něčem o něco lepší nebo co, ale nakonec to stejně zase poserou bo většina bude nespokojených.
24.7.2008 10:35:35   78.45.95.xxx 143
No to snad ne? K čemu mi je diakritika? Už teď když píšu třeba po icq, nebo maily přátelům. Málokdy používám diakritiku. Jedinou vyjímku tvoří diskuze, kde mi to přijde rozumější.. Doufám, že se tenhle standart nerozšíří.. Ještě k tomu kódování - stači, aby všichni přešly na jednotné kódování..
24.7.2008 10:49:45   195.22.40.xxx 143
k těm překlepům: před časem jsem někde četl, že existuje doména paypal.com která místo a latinkou má zapsané a cyrilicí, vypadají úplně stejně ale pokaždý je to úplně jiný znak, diakritika v českém DNS to je fakt blbost
24.7.2008 11:13:43   90.183.71.xxx 154
Proc hacky a carky, vzdyt se bez nich obejdeme, jsou naprosto redundantni. Kdyby byly tak moc potreba, tak tento text nikdo neprecte. Zkuste nekomu poslat SMS s domenou s hackama a carkama, jen pro "š" budete muset 7x zmacknout klavesu, k tomu me nikdo nedonuti! To je jen jeden priklad, jak je to na nic.
24.7.2008 17:55:27   81.201.54.xxx 153
Nehledě na to, že starší mobily diakritiku neumí a i tak se do SMSky s diakritikou vejde jen 60 znaků místo 160. Což je docela na pytel. Stejná SMS akorát s diakritikou Vás vyjde 3× dráž.

Takze je to fakt na prd a budu dal psat bez diakritiky :-)
25.7.2008 20:39:00   195.80.179.xxx 145
Ja by som bol za zrusenie diakritiky v jazyku ;)
26.7.2008 09:55:36   83.208.96.xxx 134
taky jsem proti ... vůbec se mi to nelíbí
18.8.2008 14:16:34   84.19.67.xxx 104
Ja bych na to sel uplne obracene - v zajmu usnadneni prace s tak vyznamnym fenomenem dneska jako je PC a internet zrusit diakritiku v ceskem jazyce ! Kdyz to slo pred Husem, proc by to neslo i dnes ?

Redakce si vyhrazuje právo odstranit neslušné a nevhodné příspěvky. Případné vyhrady na diskuze(zavináč)pctuning.cz

56 čtenářů navrhlo autorovi prémii: 28Kč Prémie tohoto článku jsou již uzavřené, děkujeme za váš zájem.
Tento web používá k poskytování služeb soubory cookie.