k47.cz

twitter RSS
««« »»»

Slyším hlasy

30. 5. 2019 — k47

Asi takhle: Ze srandy jsem nechal všechny texty na k47čce namluvit robotem.

Pokud je chcete poslouchat, můžete. U každého přetlumočeného článku se ukazuje odkaz na robota ve formě noty (♪) vedle data publikace pod titulkem. Je to nejen hrozně nepříjemné na poslech, ale i pomalejší než čtení vlastníma očima a nikomu nedoporučuji to poslouchat. Nicméně tahle eventualita tu teď je a protože jsem robotické čtení přidal do skriptu generující k47čku (a nemusím tedy už nic dělat), tu zůstane.

Stejnou funkci jsem na k47čku přidal už jednou, velice dávno, možná sedm let nazpátek a výsledek byl stejně neposlouchatelný. Svobodné text-to-speech programy, zdá se, zamrzly na úrovni konce devadesátých let & nezlepšily se ani o kousek. A přitom jsem doufal, že v době, kdy různé AI deep learning programy tvoří plátky reality k nerozeznání od skutečnosti, se nějaká ta technologie internetových gigantů profiltrovala i do rukou běžných smrtelníků. Trickle-down efekt je ve free softwaru jen iluze. Neexistuje nic, co bych mohl vzít & bez větší námahy použít.

Na internetu se povalují částečné implementace různých deep learning programů, připravené (s určitým netriviálním množstvím expertízy) být natrénované, aby nějak mluvily. Na to ale potřebují data. A aby mluvily česky potřebují korpus českých vět a to může představovat problém. Objevil jsem že nějaké existují, ale nedají se přímo stáhnout plebejcem mimo akademickou sféru & to může být pro mě, jako tragicky nevzdělaného, problém.

V korpusu mluvené češtiny se také nachází jedna zajímavé položka – záznamy prezidentských projevů. Bylo by super (pro určitou definici toho slova), kdyby články na k47čce namluvil robotický Zeman.


+1: Aktualizace září 2020: funkcionalitu jsem vypnul.

píše k47 & hosté, ascii@k47.cz