k47.cz    — každý den dokud se vám to nezačne líbit
foto Praha výběr povídky kultura | twitter FB


Statistický generátor textu

— k47 (CC by)

Jednoduchý statistický generátor textu založený na principu Markovova řetězce. Funguje tak, že ze vstupního textu, postaví model reprezentující, jaká slova jak často následují po daných n-gramech (konkrétně bi-gramech). Když je model hotový, stačí mu zadat počáteční n-gram, program podle zjištěných pravděpodobností ybere následující slovo. Tohle slovo se pak stane součástí aktuálního n-gramu, vybere se, co po něm bude následovat a takhle to pokračuje dál.


Zkusmo jsem generátor nakrmil všemi svými povídkami a jeho snažení se automaticky publikuje na twitterovém účtu @robopovidka


Podobnost s Laholátorem je čistě náhodná a zcela neúmyslná.

píše k47 & hosté, ascii@k47.cz