k47.cz
výběr kolo foto makro povídky kultura
koronavirus TECH ▞▞ | twitter RSS
««« »»»

hypertweeter 6.0

3. 4. 2021 — k47

Vývoj hy­per­twee­teru po­kra­čuje hy­per­tem­pem. Minule jsem na­zna­čo­val za­čle­nění OCR a teď ve verzi šest tečka nula tam je. Je třeba na­in­sta­lo­vat tesseract a v kon­fi­gu­raci uvést adresu k pro­gramu. Pak se každý sta­žený ob­rá­zek pro­žene přes OCR a text se uloží do sou­borů imgs/*.txt, při­pra­ven pro grepnutí, kdyby bylo po­třeba.

Pak také došlo k vnitřní re­or­ga­ni­zaci kódu. Už na­bobt­nal do příliš vel­kých roz­měrů, ±1500 řádků, a bylo nutné ho jasně roz­dě­lit na kom­po­nenty. Jde pouze o in­terní zá­le­ži­tost, zvenku není vidět, ale je na­prosto ne­zbytná, aby se v tom někdo vyznal. Stejně tak není vidět změna se­ri­a­li­zač­ního for­mátu. Stan­dardní me­cha­nis­mus vy­kli­dil místo jed­no­du­ché al­ter­na­tivě bez po­u­žití re­flexe, která by měla být rych­lejší a na disku kom­pakt­nější. V dů­sledku téhle změny došlo k na­vý­šení limitu, kolik tweetů se ucho­vává v paměti, z 4000 na 20000. Minule uve­dené hle­dání teď může zajít víc do mi­nu­losti.

Další funkce je anti-ti­me­line. Když se povolí v kon­fi­gu­raci, klient pomalu začne sbírat tajmlajny lidí, kteří vás sle­dují. To se po­u­žívá dvěma způ­soby. Jednak se kom­pletní anti-ti­me­line dá zob­ra­zit na url /anti, druhak (přes java -jar tw.jar activity) slouží pro sta­tis­tiky o časech, kdy jsou lidé na druhé straně drátu ak­tivní. Jsou živí ráno, v po­ledne, večer nebo v noci? Od­po­věď může pomoct na­ča­so­vat zprávy do doby, kdy je uvidí co nejvíc očí.

Něco po­dob­ného jsem udělal už dávno – skript, který stáhne ti­me­line všech followerů na­jed­nou a vi­zu­a­li­zuje jejich denní ak­ti­vity. Jeden člověk ces­to­val kolem světa a bylo krásně vidět, jak se jeho denní rytmus pomalu po­souvá s tím, jak mění místo na pla­netě. V té době ale API twit­teru mělo po­měrně štědré limity a něco ta­ko­vého se dalo pro­vést na­jed­nou, bez čekání. Teď je si­tu­ace di­a­me­t­rálně od­lišná a proto jsem tempo na­sta­vil zá­měrně pomalé, aby ne­vzbu­dilo po­de­zření na „ne­ob­vyklou ak­ti­vitu“. (Kolik účtů vám soc-net aspoň jednou po­za­sta­vil, pro­tože se mu něco nezdá? Mě skoro všechny.) Hy­per­twee­ter za den se­sbírá anti-tajmlajny od asi 50 lidí.

Jo a na­ko­nec ještě za­čí­nám při­dá­vat ně­ja­kou ná­po­vědu. Pře­pí­nače --help nebo -h ukážou všechny způ­soby po­u­žití skriptu.

píše k47 & hosté, ascii@k47.cz