k47.cz

twitter RSS
««« »»»

Emoji?

13. 2. 2019 — k47

Unicode konsorcium pomalu propadá šílenství, senilitě a megalomanii. Tak to aspoň vypadá zvenčí, když člověk pozoruje iniciativu kolem stále se rozšiřující sbírky emoji znaků.

Unicode má vznešené poslání – vytvořit jednotné kódování pro všechny systémy písem, ideogramů a logogramů, která jsou nebo byla historicky používána, za účelem usnadnění komunikace. Pokud obě strany přísahají na unicode standard, text je jednoznačný. Když pošlu znak „ô“, adresát ho přečte jako „ô“, žádné nedorozumění nehrozí.

S emoji však zabředli do docela jiného rybníku. Najednou nejde jen o jednoznačnou reprezentaci psaných znaků, ale o reprezentaci každého pocitu, činu nebo předmětu, který je možné vyjádřit obrázkem. Jde o boj, který nikdy nemůžou vyhrát.

V poslední jedenácté revizi standardu přibylo 145 zcela nepostradatelných emoji symbolů (např. humr). Celé unicode katalogizuje 137439 znaků a z toho je 1212 emoji. Jedno celé procento všech užitečných znaků je vyplýtváno na obrázky. Kdyby jen existovala možnost online poslat přímo obrázek, ne jen jeho kódovanou proxy… Vtip je taky v tom, že složený znak může být delší než slovo, které je popisuje. Například „kouzelnice“ (10 bajtů) se v utf-8 formě emoji zapíše jako 0xF0 0x9F 0xA7 0x99 0xF0 0x9F 0x8F 0xBB 0xE2 0x80 0x8D 0xE2 0x99 0x80 0xEF 0xB8 0x8F (17 bajtů). Ve skutečnosti jde o pět znaků, základní znak, combining character, spojovník, symbol pro Venuši (♀) a nakonec znak signalizující, že ten předchozí se nemá vykreslit jako ♀, ale má se brát jako modifikátor pro základní emoji symbol a změnit bezpohlavního kouzelníka na kouzelnici-ženu. Jde o komplexní systém pro něco tak triviálního jako obrázek. Řekl někdo unicode mágům o ? Myslím, že je načase.

Původní várka emoji dávala smysl a jejich začlenění se neslo v souladu s duchem unicode – kodifikovat existující používané znaky. Emoji začalo život na japonských mobilech koncem devadesátých let. Každý operátor nabízel vlastní sadu symbolů a nebylo možné jednoznačně komunikovat napříč mobilními sítěmi. To je přesně role pro unicode – sjednotit & harmonizovat. Existující emoji piktogramy se dostaly do tabulek znaků a všechno bylo dobré. Ale pak unimágové začali přidávat vlastní symboly pro detektiva, golfistu, národní park, projektor, dýku, synagogu, jelena, kanoi, elfa, zombie nebo mikrob, a vydali se tak na cestu, která nemá konce, dokud každá existující myšlenka je zavedena do absurdně složitého kódového systému, který komplexitou hraničí s přirozeným jazykem.

Jak jde poznat z předchozích řádků, nejsem velký fanda obrázků maskovaných za písmena. Přinejhorším se může stát, že emoji bude výstřelek desátých let tohoto prohnilého století a se sklonkem dekády vyšumí do ztracena. Zůstane po něm jen věčný otisk ve standardech unicode. A když se pak někdo v daleké budoucnosti nevěřícně zeptá, co jsou zač všechny tyhle obrázky, nějaký stařešina s šedivým plnovousem odpoví: „Jo to byly desátý léta, všichni jsme se chovali jako naprostí idioti a přišlo nám to jako dobrý nápad.“


Ale na druhou stranu unicode obsahuje znak 𓂸 a tak je vše odpuštěno.

píše k47 & hosté, ascii@k47.cz