k47.cz    — každý den dokud se vám to nezačne líbit
foto Praha výběr povídky kultura | twitter FB


Statistický generátor textu

— k47 (CC by)

Jednoduchý statistický generátor textu založený na principu Markovova řetězce. Funguje tak, že ze vstupního textu, postaví model reprezentující, jaká slova jak často následují po daných n-gramech (konkrétně bi-gramech). Když je model hotový, stačí mu zadat počáteční n-gram, program podle zjištěných pravděpodobností ybere následující slovo. Tohle slovo se pak stane součástí aktuálního n-gramu, vybere se, co po něm bude následovat a takhle to pokračuje dál.


Zkusmo jsem generátor nakrmil všemi svými povídkami a jeho snažení se automaticky publikuje na twitterovém účtu @robopovidka


Podobnost s Laholátorem je čistě náhodná a zcela neúmyslná.

vstoupit do diskuze    sdílet na facebooku, twitteru, google+

štítky: #skripty «« »» #programování «« »» #obsah «« »» #programování #text #psaní #Scala

příbuzné články:
Java/Scala - práce s obrázky
Content-aware image cropping with Scala
Sleeping patterns
Conway's game of life
Scrabble
Scala - Zřetězené porovnávání 📷

sem odkazují:
Útok /prog/
Země mrtvých klaunů

píše k47 & hosté, ascii@k47.cz