k47.cz

twitter RSS
««« »»»

hypertweeter 6.0

3. 4. 2021 — k47

Vývoj hypertweeteru pokračuje hypertempem. Minule jsem naznačoval začlenění OCR a teď ve verzi šest tečka nula tam je. Je třeba nainstalovat tesseract a v konfiguraci uvést adresu k programu. Pak se každý stažený obrázek prožene přes OCR a text se uloží do souborů imgs/*.txt, připraven pro grepnutí, kdyby bylo potřeba.

Pak také došlo k vnitřní reorganizaci kódu. Už nabobtnal do příliš velkých rozměrů, ±1500 řádků, a bylo nutné ho jasně rozdělit na komponenty. Jde pouze o interní záležitost, zvenku není vidět, ale je naprosto nezbytná, aby se v tom někdo vyznal. Stejně tak není vidět změna serializačního formátu. Standardní mechanismus vyklidil místo jednoduché alternativě bez použití reflexe, která by měla být rychlejší a na disku kompaktnější. V důsledku téhle změny došlo k navýšení limitu, kolik tweetů se uchovává v paměti, z 4000 na 20000. Minule uvedené hledání teď může zajít víc do minulosti.

Další funkce je anti-timeline. Když se povolí v konfiguraci, klient pomalu začne sbírat tajmlajny lidí, kteří vás sledují. To se používá dvěma způsoby. Jednak se kompletní anti-timeline dá zobrazit na url /anti, druhak (přes java -jar tw.jar activity) slouží pro statistiky o časech, kdy jsou lidé na druhé straně drátu aktivní. Jsou živí ráno, v poledne, večer nebo v noci? Odpověď může pomoct načasovat zprávy do doby, kdy je uvidí co nejvíc očí.

Něco podobného jsem udělal už dávno – skript, který stáhne timeline všech followerů najednou a vizualizuje jejich denní aktivity. Jeden člověk (myslím, že to byl ███████████████) cestoval kolem světa a bylo krásně vidět, jak se jeho denní rytmus pomalu posouvá s tím, jak mění lokaci na planetě. V té době ale API twitteru mělo poměrně štědré limity a něco takového se dalo provést najednou, bez čekání. Teď je situace diametrálně odlišná a proto jsem tempo nastavil záměrně pomalé, aby nevzbudilo podezření na „neobvyklou aktivitu“. (Kolik účtů vám soc-net aspoň jednou pozastavil, protože se mu něco nezdá? Mě skoro všechny.) Hypertweeter za den sesbírá anti-tajmlajny od asi 50 lidí.

Jo a nakonec ještě začínám přidávat nějakou nápovědu. Přepínače --help nebo -h ukážou všechny způsoby použití skriptu.

píše k47 & hosté, ascii@k47.cz